月 购买数量 个 ¥330 立即购买 使用方式 公有云服务 提供各类文字识别的云端PaaS接口,可直接调用API或使用HTTP SDK对图片中的文字进行识别,可前往控制台免费试用 立即使用 API文档 私有化部署 部署至本地服务器,在局域网/内网中实现文字识别功能,无需连接公网,保障数据私密性,提供一体机和软件部署包两种私有化方案 申请试用 方案介绍 支持交流 新手指南 接入AI服务的基本介绍,包括账号认证
检查报告单据识别 针对医疗场景常见的检查报告相关单据进行结构化识别,包括医疗检验报告单、医疗诊断报告单2种常见单据,可应用于在线智能问诊、医患信息电子化录入等场景 优惠 人工智能品类特惠,文字识别产品低至1折!
印章识别 检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度,支持识别印章编码,可覆盖圆章、椭圆章、方章等常见类型的印章 优惠 人工智能品类特惠,文字识别产品低至1折!
首购专享 实时语音识别-中文普通话 将音频流实时识别为文字,并返回每句话的开始和结束时间 规格 10小时 购买方式 按小时购买 有效期 1年 限时1折 限购1单 ¥ 2 ¥ 20 立即购买 首购专享 实时语音识别-英语 将英文音频流实时识别为文字,并返回每句话的开始和结束时间 规格 10小时 购买方式 按小时购买 有效期 1年 限时1折 限购1单 ¥ 2 ¥ 20 立即购买 首购专享 短文本在线合成
使识别结果的表现方式贴合表述,更加可懂 大规模数据训练 语义停顿断句 智能匹配标点 应用场景 语音输入 通过语音识别直接输入文字,快速返回识别结果,适用于社交聊天、语音指令、游戏文字输入等多个场景 语音搜索 通过语音识别直接输入搜索内容,适用于音乐、电影、小说等内容搜索场景,让搜索输入更加便捷高效 人机对话 通过API接口将语音识别为文字,实现毫秒级响应,适用于聊天机器人、故事机等近场语音识别环境
使识别结果的表现方式贴合表述,更加可懂 应用场景 语音输入 语音搜索 人机对话 语音输入 摆脱按键操作,通过语音识别直接输入文字,快速返回识别结果,可应用于游戏文字输入、社交聊天、语音指令等多个场景,提高输入效率及体验 合作案例 产品优势 技术领先 采用领先国际的流式端到端建模方法SMLTA,近场普通话语音识别准确率可达98% 简单快速 采用最新识别解码技术,识别速度提升5倍以上,极速返回识别结果
支持夜间、弱光、高拍等复杂场景 文字识别离线SDK 面向无网或弱网环境下,在手机、摄像头、执法记录仪等设备终端上集成文字识别能力,离线识别各类文件、卡证、票据等文本信息
10QPS保证 7*24小时客服响应 购买选择 按共享资源包购买 规格 10万点 有效期 12 月 购买数量 个 ¥330 立即购买 使用方式 公有云服务 提供各类文字识别服务的云端服务接口,可直接调用 API 或使用 HTTP SDK 对图片中的文字进行识别 API文档 私有化部署 可部署至本地服务器,在局域网/内网中实现文字识别功能,无需连接公网,保障数据私密性,提供一体机和软件部署包两种私有化方案
将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景 了解详情 开启语音识别训练之路 公测免费模型训用 立即体验
多种调用方式 支持WebSocket API,支持Android、iOS、Linux SDK,可以在多种操作系统、多种设备终端上调用,快速上手,简单易用 毫秒级实时识别音频流 首包响应时间毫秒级,并实时展示中间文字结果,快速识别音频流 文字识别结果支持时间戳 识别返回的文字结果带有时间戳,展示VAD切分句子开始和结束时间,方便进行功能开发 应用场景 实时语音输入 视频直播字幕 演讲字幕同屏 实时会议记录