百度智能云

百度智能云百度智能云

适用场景

证照信息登记识别
各类证照信息的大批量图片文字识别,满足企业人员证照信息的登记识别,包括身份证、护照、户口本、银行卡等,提升办公效率。
财务票据归档
大量纸质文件及各类财务票据混合识别,提供结构化的返回结果,帮助企业进行电子归档和数字化管理。
会议记录转写
采访、面试、大型会议音频记录的准确识别转写,快速出稿,减少人工记录会议纪要的繁琐工作,提高会议精神传达效率。
通知新闻播报
通知、新闻资讯等长短文本的语音合成,提供多种声音,适用不同场景的播报,触达听众更直接。

服务优势

大批量的文件处理

支持500张图片/10小时音频/10万字文本的大批量文件处理,一键完成上传下载。

01

多类图片的混合转换

可提供多种类型图片的一次性混合识别,不需按类型分批多次上传。

02

render.title

多样的输出结果

对输入文件的格式、尺寸要求较宽松,支持更多样式的输出格式和内容组合形式。

03

丰富的最佳实践

由实践经验丰富的专家团队为您提供服务,根据输入的文件类型选择最优AI识别接口,实现最佳转换效果。

04

服务内容

图片文字识别服务

语音转文字服务

文字转语音服务

数据预处理

客户提供jpg/jpeg/png/bmp格式的图片,图片尺寸最小边大于15px;未加密的PDF文件,单个文件大小不超过10M。对图片进行压缩,保证base64后大小小于4M,图片尺寸满足接口要求。

数据转换

循环调用AI接口,将图片批量转换为文字,支持票据凭证、个人证照、企业资质、车辆物流等图片。

结果后处理

将识别结果拼接至同一个文本文件中,支持将每张图片的识别结果保存至同名的文档文件内,或将图片识别结果按照字段格式化的存储至excel文件中,每列一个字段每行一个文件的识别结果,结合图片文字位置信息,将一个或者多个空格进行还原。识别结果可以Excel、txt、doc、pdf等格式提供。

数据预处理

客户提供pcm/wav/amr/m4a格式的音频,采样率大于等于16000,16bit位深,单个文件大小不超过1500M。对音频采样率进行压缩,双声道转单声道,长音频分割成多个短音频。

数据转换

循环调用AI接口,将音频文件批量转换为文字。

结果后处理

将音频识别结果存储至excel文件中,每行一个文件的识别结果。识别结果可以Excel、txt、doc、pdf等格式提供。

数据预处理

客户提供Excel、txt、doc、pdf格式的文本文件,字数10万字以内。

数据转换

循环调用AI接口,将文字批量转换为音频。

结果后处理

识别结果以mp3、wav等格式提供。可将合成的音频拼接成一个或多个音频文件。

服务定价

background

图片文字识别服务

图片文字识别服务按照图片数量定价,分为500张、1000张、10000张三种规格。

500张

1000张

10000张

¥200/次

¥375/次

¥3000/次

background

语音转文字服务

语音转文字服务按照音频总时长定价,分为10小时、50小时、100小时三种规格。

10小时

50小时

100小时

¥200/次

¥1000/次

¥2000/次

background

文字转语音服务

文字转语音服务按照字符数量定价,每次服务10万字以内。

10万字

¥500/次

服务流程

服务流程

相关产品

立即联系您的专属顾问 免费咨询百度智能云专属顾问,为您量身定制服务方案 立即咨询
联系您的专属顾问 为您量身定制服务方案 立即咨询
未登录
需要实名认证