检验记录、发证单位等 短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景 短文本在线合成 基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性 文本翻译 提供200+语种互译的在线文本翻译服务,可广泛应用于移动端、PC网站、智能硬件等不同产品形态中,满足多领域、多场景的翻译需求。
实时语音翻译 实时语音翻译API支持中英日韩法西泰俄等45个语种,采用WebSocket协议的连接方式,能够将音频流实时识别为文字,支持智能断句,实时输出带有标点的语音识别结果和翻译结果,适用于直播翻译、会议翻译、跨国交流等场景。 优惠 人工智能品类特惠,实时语音翻译低至 7折!
卡证文字识别 结构化识别身份证、银行卡、营业执照等常用卡片及证照,支持营业执照信息的准确性核验;还可使用iOCR,定制个性化识别模型。广泛适用于身份认证、金融开户、征信评估等业务场景 新客 人工智能品类特惠,卡证文字识别低至1折!
产品列表 通用场景文字识别 多场景、多语种、高精度的整图文字检测和识别服务,可识别各类印刷和手写文档 了解详情 卡证文字识别 结构化识别身份证、银行卡、营业执照、户口本、护照等常用卡片及证照 了解详情 交通场景文字识别 结构化识别行驶证、驾驶证、车牌、VIN码、车辆合格证、机动车销售发票等 了解详情 财务票据文字识别 结构化识别财税报销、税务核算等场景涉及的10余种票据单据,支持混贴票据自动切分识别
注册即可一键领取免费测试资源 立即使用 相关推荐 教育场景文字识别 对教育场景所涉及的作业及试卷中公式、手写文字、题目内容等进行识别 卡证文字识别 对身份证、银行卡、营业执照、户口本等常用卡片及证照的文字内容进行结构化识别 财务票据文字识别 可识别财税报销、税务核算等场景涉及的10余种常见票据,支持混贴票据自动切分识别 医疗票据文字识别 结构化识别全国范围的医疗发票、医疗费用结算单、病案首页、保险单等单据
实现文档对文档的快速翻译 了解详情 语音翻译 集成语音识别、文本翻译、语音合成三大能力于一体,可支持短语音识别、翻译及语音播报 了解详情 实时语音翻译 将音频流实时识别为文字并输出带有标点的语音识别结果和翻译结果 了解详情 图片翻译 集成文字识别和文本翻译,支持直接将图片中包含的文本内容识别并翻译成目标语言 了解详情 AI 同传 提供高质量、低延迟的机器同传服务解决方案 了解详情 翻译私有化部署
文字识别离线SDK 面向无网或弱网环境下,在手机、摄像头、工控机等设备终端上集成文字识别能力,离线识别各类文档、卡证、票据等文本信息,毫秒级快速响应;支持Android、Windows、iOS、 Linux等多种主流平台 优惠 人工智能品类特惠,文字识别产品低至1折!
语音翻译 语音翻译API集成语音识别、文本翻译、语音合成三大技术能力,可以将60秒以内的语音识别成文字并翻译成目标语言,支持译文语音播报。 优惠 人工智能品类特惠,语音翻译低至 7折! > 立即使用 接入文档 产品价格 功能介绍 应用场景 产品定价 产品优势 相关推荐 功能介绍 短语音识别 单次最长听译时间不超过60s,支持中、英、日、韩等45种语言的源语音识别。
网络图片文字识别 针对网络图片进行专项优化,支持识别艺术字体或背景复杂的文字内容,还可返回文字的位置信息、行置信度、单字符内容和位置等 优惠 人工智能品类特惠,文字识别产品低至1折!
支持多种复杂背景下的文字扫描识别 服务稳定 依托百度智能云技术实力,提供高可靠性、弹性可伸缩、高并发承载的文字识别公有云服务,可用性高达99.9%以上 应用场景 词句翻译 题目搜索 词句翻译 扫描并识别书籍、刊物上的文字内容,将识别到的文字进行查询和翻译,实现快速文本翻译的用户体验 使用方式 公有云服务 提供文字识别的在线服务接口,可直接调用API或使用HTTP SDK对图片中的文字进行识别,接入便捷