新客首购专享优惠,低至 0.2元/小时
实时语音识别
基于Deep Peak2的端到端建模,将中英文、方言的音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
  • 识别准确率领先
    近场中文识别准确率达98%
  • 服务稳定高效
    支持大流量并发与高效弹性扩展
  • 支持多设备终端
    支持流式 API与Android、iOS、HarmonyOS SDK

功能介绍

多语种多方言识别

除中文普通话、英文外,支持粤语、四川话和东北话等方言的识别

智能语言处理

使用大规模数据训练模型,智能纠错识别结果,并基于内容与停顿自动匹配标点 (,。!?)

毫秒级实时识别

首包响应时间毫秒级,并实时展示中间文字结果,快速识别音频流

文字识别结果支持时间戳

识别返回结果带有时间戳,展示VAD切分句子开始和结束时间,方便进行功能开发

多语种多方言识别

应用场景

实时语音输入
语音输入准确高效,解放双手,说话内容实时展示在屏幕上,聊天顺畅
实时语音输入
实时会议记录
会议场景中,每个说话人的语音可以实时记录,提升会议记录效率
实时会议记录
直播字幕
直播新玩法,主播说话可以直接将说话内容实时转写为字幕展示在屏幕上,或者可进行二次字幕编辑
直播字幕
课堂音频识别
对老师课堂内容实时记录,校方可以进行教学内容记录以及教学质量评估
课堂音频识别

产品价格

  • 小时包预付费

    适用于调用时长可预估的企业,完成企业认证即刻享有10小时免费调用时长

    时长

    1000小时

    有效期

    1年

    并发量

    50(支持扩容)

    技术支持

    7*24小时响应

    1800
    立即购买
    通用场景模型
  • 调用时长后付费

    适用于不便预估调用时长的企业,完成企业认证即刻享有10小时免费调用时长

    并发量

    50(支持扩容)

    服务稳定性

    99.9%

    技术支持

    7*24小时响应

    3元/小时
    开通付费
    通用场景模型
  • 模型训练

    适用于专业领域名词识别不准,需要对语音识别语言模型进行规模训练的客户

    自定义内容训练

    上传即训练

    效果提升

    专业评估精准提升

    立即应用

    模型上线专属使用

    立即训练
    通用场景模型
  • 定价说明

    本产品开通即享免费调用时长,使用完毕后可选择小时包预付费或按小时后付费两种计费方式,产生的计费调用时长优先消耗小时包额度,超出部分按时长计费

    收费标准
    通用场景模型
  • 免费版

    适用于测试对接和效果体验

    噪声识别

    背景音下精准识别

    多场景分析

    直播网课会议适用

    额度试用

    测试详情咨询商务

    申请测试
    音视频场景模型
  • 付费版

    适用于业务环境下持续、稳定使用

    噪声识别

    背景音下精准识别

    多场景分析

    直播网课会议适用

    定价咨询

    产品定价详询商务

    合作咨询
    音视频场景模型

相关推荐

短语音识别极速版
60秒语音快转文字,适用于输入、搜索、人机对话场景
语音自训练平台
零代码语料训练模型,精准提升行业识别率
音频文件转写
批量音频转写文字,适用于录音质检与总结

开始使用识别服务
注册享产品免费体验套餐