同时目前 有标注信息 上传格式仅支持 json(平台通用) 导入未标注的数据 本地导入 支持上传图片、压缩包 目前支持图片类型为jpg, png, bmp, jpeg,图片大小限制在14M以内。 图片长宽比在3:1以内,其中最长边小于4096px,最短边大于30px。
2.2已标注数据上传方式: 以Excel文件导入 Excel文件内数据格式要求为:首行为表头,将不录入数据集中,第一列和第二列分别作为模型输入文本和模型输出文本 每行是一组样本,输入文本不超过512个字符,输出文本不超过128个字符,超出的字符可正常保存,但可能无法参与训练。
通过压缩包上传时,需注意: 压缩包内的一个文本文件将作为一个样本上传。压缩包格式为.zip格式,压缩包内文件类型支持txt,编码仅支持UTF-8。 每组数据的字数建议不超过512个字符,超出将被截断。 通过Excel文件上传时,需注意: Excel文件内首行为表头,每行为一个样本,每个样本字符数不得超过512个字符,超出将被截断 文件格式支持xlsx格式,单次可上传100个文件。
压缩包格式为.zip格式,压缩包内文件类型支持txt,编码仅支持UTF-8 每组数据的数建议不超过512个字符,超出将被截断 通过TXT文本上传时,需注意: 文本文件内数据格式要求为 文本内容\n (即每行一个样本,使用回车换行),每一行表示一组数据,每组数据的数建议不超过512个字符,超出将被截断 文本文件类型支持txt,编码仅支持UTF-8,单次上传限制100个文本文件,最多可上传100万个文件
每一行表示一组数据,每组数据的字符数建议不超过4096个字符,超出将被截断;训练的字符数不超过512个字符,超出的字符可正常保存,但不参与训练。
4.NPM扩展包工作原理 NPM扩展包工作原理 本视频主要介绍NPM扩展包工作原理;
您可以使用3种方案上传数据,分别为: 本地导入 BOS目录导入 分享链接导入 本地导入 您可以通过以下三种方式进行本地数据的导入: 以压缩包的方式上传 以TXT文本文件方式上传 以Excel文件的方式上传 通过压缩包上传时,需注意: 压缩包内每一个txt文件为一个样本,文本文件编码须为UTF-8,每个样本字符数不得超过512个字符(包括汉字、数字、符号等),超出将被截断 压缩包的格式为zip;压缩包最大不超过
请确保将全部文本已通过txt文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 分享链接导入 需输入链接地址。
1、 创建模型 :选择您需要训练的语音识别接口,目前支持训练 短语音识别-中文普通话、短语音识别极速版、实时语音识别-中文、呼叫中心语音解决方案 接口。填写基础信息为您的模型进行命名和功能描述,并留下您的联系方式以便于我们和您联系。 2、 系统评估 :上传您业务场景中的 真实音频和对应的正确标注文本 (尽可能覆盖全部的场景), 客观科学地评估基础模型的识别率。
4096,超出将被截断。