对于其他语种的视频,如果没有自动的机器翻译,则需要视频编辑者先提取英文字幕,翻译后,再手动添加中文字幕,流程十分繁冗复杂,因此字幕大师希望借助百度的机器翻译技术,实现既准确又便捷的翻译。 解决方案 使用百度通用文本翻译技术,可以轻松实现外语字幕的自动翻译,省去人工提取外语字幕,翻译后再 回填的繁琐流程,极大地提高了视频编辑者的工作效率。
对于文字识别结果,通过百度翻译接口、语音合成接口实现了翻译功能、语音合成播报等功能,以满足用户更多元化的需求。
借助百度文字识别和百度翻译服务,三星在Bixby视觉中加入了AR翻译的功能,一站式解决出国旅行途中各类文字提取翻译的问题,带来崭新的人际交互体验。 解决方案 Bixby视觉的实时翻译功能使用了百度的两项技术:文字识别和翻译 当用户将手机朝向要翻译的文字时,包含文字的图片通过百度文字识别接口发送给百度提取文字,提取好的文字通过百度翻译接口有百度翻译之后返回到手机上。
asr - 语音转文字 API访问域名 请求方式 POST 说明 online base url https://keyue.cloud.baidu.com/online AI客服发布后的请求地址 offline base url https://keyue.cloud.baidu.com AI客服测试调试地址 后缀接口 /core/v5/block/asr Authentication token
短语音识别 { headInfo : 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
详细获取方式参考: 准备工作 body参数 名称 类型 必填 中文名 说明 text string 是 文字 待转成音频的文字 per number 否 发音人 id 响应参数 名称 类型 必填 中文名 说明 time integer 是 时间 时间戳 data object 是 数据 数据对象,详见data 子数据 code integer 是 状态码 200为成功 msg string 是 状态信息
语音近场识别模型 有标点 支持自定义词库 1737 英语 英语模型 无标点 不支持自定义词库 1637 粤语 粤语模型 有标点 不支持自定义词库 1837 四川话 四川话模型 有标点 不支持自定义词库 返回数据参数详情 参数 类型 是否一定输出 描述 err_no int 是 错误码 err_msg int 是 错误码描述 sn int 是 语音数据唯一标识,系统内部产生,用于 debug result
使用产品 增值税发票识别 通用文字识别 自定义模板文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 OCR技术推动正保教育票据识别智能化 价值成果 1、利用百度OCR文字识别技术,实现票据内容识别服务自动化,识别准确率达到90%以上; 2、为自动化验证增值税发票真伪服务提供了关键、核心的技术支持,有效节省了人力成本,大大提升了服务标准和效率。
asr - 语音转文字 API访问域名 请求方式 POST 说明 online base url https://keyue.cloud.baidu.com/online AI客服发布后的请求地址 offline base url https://keyue.cloud.baidu.com AI客服测试调试地址 后缀接口 /core/v5/block/asr Authentication token
使用产品 通用文字识别 身份证识别 iOCR自定义模板文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 iOCR快速识别证件信息,让客户管理从此简单高效 价值成果 众联车宝旗下目前拥有100家4S店,在接入百度大脑iOCR自定义模板文字识别技术后,搭建了一套完整的售后平台管理系统。