百度智能云

搜索本产品文档关键词

所有文档

没有找到结果，请重新输入

EasyDL零门槛AI开发平台

经典版声音分类创建数据集

更新时间：2022-04-12

在训练之前需要在数据中心【创建数据集】

设计分类

每个标签就是对这个音频希望识别出的全部结果。标签的上限为1000种。
标签名由数字、中英文、中/下划线组成，长度上限256字符。

音频的具体格式要求

训练集音频需要和实际场景要识别的音频环境一致，举例：如果实际场景要识别的音频都是手机摄录的，那训练的音频也需要同样的场景获得，而不要采用网上随便下载的音频。
每个标签的音频需要覆盖实际场景里面的可能性，如不同环境下，训练集覆盖的场景越多，模型的泛化能力越强。
如果需要寻求第三方数据采集团队协助数据采集，可以加入官方QQ群（群号:679517246）联系群管咨询了解。
音频支持mp3, m4a, wav格式，单个音频大小在4M内且时长小于15s。

评价此篇文章

有帮助没帮助

声音分类整体说明

上传数据集