压缩包格式为.zip格式,压缩包内文件类型支持txt,编码仅支持UTF-8 每组数据的数建议不超过512个字符,超出将被截断 通过TXT文本上传时,需注意: 文本文件内数据格式要求为 文本内容\n (即每行一个样本,使用回车换行),每一行表示一组数据,每组数据的数建议不超过512个字符,超出将被截断 文本文件类型支持txt,编码仅支持UTF-8,单次上传限制100个文本文件,最多可上传100万个文件
每一行表示一组数据,每组数据的字符数建议不超过4096个字符,超出将被截断;训练的字符数不超过512个字符,超出的字符可正常保存,但不参与训练。
您可以使用3种方案上传数据,分别为: 本地导入 BOS目录导入 分享链接导入 本地导入 您可以通过以下三种方式进行本地数据的导入: 以压缩包的方式上传 以TXT文本文件方式上传 以Excel文件的方式上传 通过压缩包上传时,需注意: 压缩包内每一个txt文件为一个样本,文本文件编码须为UTF-8,每个样本字符数不得超过512个字符(包括汉字、数字、符号等),超出将被截断 压缩包的格式为zip;压缩包最大不超过
请确保将全部文本已通过txt文件保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入。 分享链接导入 需输入链接地址。
1、 创建模型 :选择您需要训练的语音识别接口,目前支持训练 短语音识别-中文普通话、短语音识别极速版、实时语音识别-中文、呼叫中心语音解决方案 接口。填写基础信息为您的模型进行命名和功能描述,并留下您的联系方式以便于我们和您联系。 2、 系统评估 :上传您业务场景中的 真实音频和对应的正确标注文本 (尽可能覆盖全部的场景), 客观科学地评估基础模型的识别率。
4096,超出将被截断。
配置并查看函数日志 您可以将函数执行的日志存储至百度云日志服务,再根据日志服务中存储的函数日志来执行代码调试、故障分析、数据分析等操作。本文介绍如何使用控制台来为云函数配置日志存储,并查看函数执行的日志。
错误码 错误信息 描述 1 Unknown error 服务器内部错误,请再次请求, 如果持续出现此类错误,请在百度云控制台内 提交工单 反馈 2 Service temporarily unavailable 服务暂不可用,请再次请求, 如果持续出现此类错误,请在百度云控制台内 提交工单 反馈 3 Unsupported openapi method 调用的API不存在,请检查后重新尝试 4 Open
共享资源包 共享资源包 商品说明 共享资源包,是指您根据业务量级一次性付费购买的 点数包 , 可用于文字识别 OCR 下所有付费接口(核验类接口、智能文档平台除外) 。若您存在文字识别 OCR 多接口同时使用的需求,建议直接 购买共享资源包 ,可极大提升业务灵活性,后续若需使用新增付费接口,无需再购买专项资源包。
url对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效 请注意关闭URL防盗链 pdf_file 和 image/url 三选一 string - PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大