语音翻译 语音翻译API集成语音识别、文本翻译、语音合成三大技术能力,可以将60秒以内的语音识别成文字并翻译成目标语言,支持译文语音播报。 优惠 人工智能品类特惠,语音翻译低至 7折! > 立即使用 接入文档 产品价格 功能介绍 应用场景 产品定价 产品优势 相关推荐 功能介绍 短语音识别 单次最长听译时间不超过60s,支持中、英、日、韩等45种语言的源语音识别。
gt; 立即使用 技术文档 产品价格 商务咨询 功能介绍 应用场景 产品定价 产品优势 相关推荐 功能介绍 实时识别 支持将音频流实时识别为文字,适用于长句语音输入,支持45种语言的语音识别 智能断句 根据语义进行智能断句,实时输出带有标点的语音识别结果和翻译结果 实时翻译 实时将语音转换为文本,并输出翻译结果,高质量低延迟 语音播报 语音结果输出,支持45种语言的语音播报 应用场景 直播翻译 会议翻译
实现文档对文档的快速翻译 了解详情 语音翻译 集成语音识别、文本翻译、语音合成三大能力于一体,可支持短语音识别、翻译及语音播报 了解详情 实时语音翻译 将音频流实时识别为文字并输出带有标点的语音识别结果和翻译结果 了解详情 图片翻译 集成文字识别和文本翻译,支持直接将图片中包含的文本内容识别并翻译成目标语言 了解详情 AI 同传 提供高质量、低延迟的机器同传服务解决方案 了解详情 翻译私有化部署
查看详情 > SDK下载 支持Android、iOS、Linux、Java、PHP、Python、C++、C#、Node.js多种编程语言 查看详情 > 即刻获得语音识别能力 注册即可领取产品免费体验套餐 立即使用 相关推荐 语音合成 基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求 通用场景文字识别
既可以部署在本地服务器,也支持部署到百度云服务器(搭配购买可享优惠) 一体机版 机器翻译服务器一体机,提供搭载了文字识别模型的GPU服务器,支持多种GPU型号、多个价格可供选择。
人脸离线识别SDK 提供设备端本地化的人脸检测与采集、多模态活体检测、人脸对比与识别等功能,可在无网络环境下离线完成身份验证、驾驶员状态分析、注意力检测、人脸属性分析等功能 优惠 人工智能品类特惠,新客专享首单低至6.1折起!
文档翻译 文档翻译应用高精度文档解析及机器翻译技术,支持Word/PPT/Excel/PDF等格式和200+语种互译。支持源语言自动检测,用户只需上传待译文档并指定语言方向、文档格式等参数,即可快速获得翻译后的文档。 优惠 人工智能品类特惠,文档翻译低至 7折!
超出部分按时长计费 收费标准 开始使用识别服务 注册即可领取产品免费体验套餐 立即使用 相关推荐 短语音识别极速版 将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景 语音自训练平台 使用业务场景文本语料,零代码自助训练语音识别语言模型,精准识别语音内容,有效提升业务领域识别准确率 音频文件转写 将批量上传的音频文件识别为文字,12小时内返回识别结果。
短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景 短文本在线合成 基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性 通用文字识别 多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一,可识别中、英、日、韩、法、俄、西、葡、德、意等20+种语言 翻译私有化部署
支持情感、语调的预测与表达 了解详情 离线语音合成 提供包括鸿蒙、linux在内的多端SDK,支持在无网或弱网环境下稳定语音播报与合成 了解详情 实时语音识别 基于端到端建模架构,支持精准时间戳输出,具备中英文及多地方言的语音实时识别能力 了解详情 音频文件转写 支持文件异步转写与多说话人分离,适用于音频质检、会议纪要、内容分析等多种语音理解场景 了解详情 呼叫中心语音解决方案 提供智能外呼、语音质检与内容分析的全链路