安装 1.在 官方网站 下载识别、合成 RESTful API C# SDK压缩工具包。 2.解压后,将 AipSdk.dll 和 Newtonsoft.Json.dll 中添加为引用。 新建交互类 Baidu.Aip.Speech.Tts是语音合成的交互类,为使用语音合成的开发人员提供了一系列的交互方法。
APP认证签名串生成 简介 API网关为API提供了APP认证方式,只有携带合法签名的请求,才能访问开启了APP认证的API。 当用户调用API时,需要使用已授权的APP对应的AccessKey、SecretKey对请求进行签名,并将签名串放置于X-Bce-Signature请求头中。 签名流程 签名流程及具体算法可参考: 签名流程 。
超参数配置参考 超参来源 目前BML脚本调参任务类型支持三种方法配置任务中网络的超参数,你可以沿用「脚本编辑」中设定的超参数,为获取更高的模型精度,也可以选择「自动超参搜索」对网络的超参数进行搜索。选择「已有超参搜索结果」时,可以在预训练模型和预训练网络相同的任务中,复用自动超参搜索结果,高效地训练出高精度模型。
从本地导入模型 在新建版本时可以导入本地模型。 前提条件 已创建模型,且该模型的模型来源为“本地上传”。 操作步骤 在左侧导航栏中选择“模型仓库”>“模型管理”。 在模型列表页中,单击“来源”为“本地上传”的模型所在行的“新建版本”,进入“新建版本”页面。 根据页面提示填写相关信息以及上传文件: 对于图像分类、物体检测在上传文件时以及提交时进行文件校验,如校验出错,请根据提示进行修改。
登录到 本平台 ,在左侧功能列数据标注中选择 众测标注 ,进入众测标注的主任务界面。 创建众测标注任务 在数据标注-众测标注页面中,选择“创建众测需求”。 在完成配置需求和个人信息的填写后,即可发起众测标注任务。
声音分类训练时长说明 训练时长与数据量、所选算法紧密相关。 目前 声音分类的训练时长主要影响因素为数据量 ,以下为内部测试的数据量与训练时长的对应关系,供参考: 数据量 训练时长 数十个音频 60min左右 数百个音频 90min左右 数千个音频 120min左右 数万个音频 150min以上
训练时长设置参考 运行环境说明 目前 BML 支持选择GPU P4、GPU P40、GPU V100三种运行环境,性能从高到低为V100>P40>P4。
从训练任务导入模型 在新建版本时可以从预置模型调参、Notebook、自定义作业中导入模型。 前提条件 存在成功的训练任务,已创建模型且并未发布。 操作步骤 在左侧导航栏中选择“模型仓库”>“模型管理”。 在模型列表页中,单击已创建的模型“Demo”所在行的“新建版本”,进入“新建版本”页面。 填写如图所示的信息并从下拉菜单中选择要导入的模型的名称和版本: 单击“提交”,完成模型导入。
音频文件转写极速版API-邀测 接口描述 支持提取视频、音频文件中的语音内容,极速返回识别结果及时间戳,适用于对实时性有一要求的内容分析、字幕生产、录音转写场景。
API 节点 整体概述 支持接入遵守RESTful架构规范并采用标准认证机制的API。API接入前需要已经完成服务化,确保所有接入的API均遵循RESTful架构规范,确保使用无状态的请求模型并通过HTTP标准方法(如GET、POST、PUT、DELETE)进行资源操作,同时接口使用标准的认证机制。