百度智能云语音识别m4aTotxt(扩展,批量)
l****4 · l****4 发布于2020-02-15 14:45 浏览:1711 回复:3

项目介绍

本程序为百度智能云的语音识别标准版的封装示例demo,可直接使用。

百度官方技术文档:https://ai.baidu.com/ai-doc/SPEECH/Ek39uxgre

百度智能云控制台(可以到这里申请appid、apikey、secretkey信息):https://console.bce.baidu.com/ai/#/ai/speech/overview/index

(目前百度智能云的语音识别标准版免费使用,调用次数无限制,欢迎使用哦)

官方除了标准版还有个极速版,极速版用完免费次数后需要收费。标准版速度不算特别快,不是秒回的,一分钟的文件识别大约需要2-3秒,对速度有要求的朋友情自行改为使用极速版。

本程序借助使用了开源工具ffmpeg和ffprobe,项目已附带目前官网下载的最新静态独立版本。

 

程序特色

  1. 默认仅支持苹果录音的m4a格式识别,单文件识别后写到单文件的txt中。

  2. 轻松支持格式扩展,预计可通过加一两句代码实现mp3,wav,amr等其他音频格式的语音识别(已经加了说明在代码中,扩展方便)

  3. 支持多文件批量识别,子目录文件识别。

  4. 全面支持中文文件名或目录。

  5. 支持展示识别结果,总体进度和总消耗时间。

  6. 支持长语音识别(无论多长都行),程序会自动拆分成60秒语音分别识别。(因为目前百度智能云限制单次识别最多60秒)

  7. 支持设定QPS(每秒调用次数)限制数,避免识别速度过快异常。(目前看免费版默认是QPS = 5)

  8. 还有其他各种特色等待你去挖掘哦~

 

欢迎来交流哦,源码已开源:

https://gitee.com/xueshanlinghu/baidu-yuyin-m4aTotxt

点赞  ( 0 )
收藏
评论(3)
共3条回复 最后由l****4回复于2020-03-02 14:21
#2郑****家回复于2020-02-17 17:00:50

1
#3郑****家回复于2020-02-17 17:22:03
#2 郑****家回复
0
#4l****4回复于2020-03-02 14:21:58
#3 郑****家回复
[图片]

看不到您的回复。。。。

0
TOP