在微调的过程中,首先需要面对的就是数据集的准备和处理,通常需要 一组由单个输入提示和关联的所需输出(完整结果)构成的训练示例(至少提供几十到几百个)。 以下是数据集处理的通用步骤,希望对大家有帮助。
编辑企业安全组 操作场景 您可对已创建的企业安全组相关配置信息进行编辑,以满足业务调整和管理需求。 操作步骤 1.登陆进入 控制台安全组列表 2.在顶部选择 企业安全组 ,进入普通安全组列表页。 3.点击安全组名称,进入安全组详情页面。 4.可在“基本信息”处编辑普通安全组 名称、标签、描述 信息。也可在“访问规则”中对 访问规则 进行修改。
编辑普通安全组规则 操作场景 您可对已创建的安全组规则进行修改,以适应业务场景的变化。 操作步骤 1.登陆进入 控制台安全组列表 2.在顶部选择“普通安全组”,进入普通安全组列表页。点击安全组名称,进入安全组详情页面。 3.在目标安全组目标的操作栏点击“编辑”,对安全组规则信息进行修改。 4.完成修改后,点击 确定 生效。 相关文档 API: 更新普通安全组规则
创建数据集 { headInfo : , debugUrl :{ url : https://qianfan.baidubce.com/v2/dataset?Action=CreateDataset , href : , method : POST }, debugDesc : 本接口用于创建新的数据集,数据集创建完成后自带版本V1。
经典版声音分类创建数据集 在训练之前需要在数据中心【创建数据集】 设计分类 每个标签就是对这个音频希望识别出的全部结果。标签的上限为1000种。 标签名由数字、中英文、中/下划线组成,长度上限256字符。 音频的具体格式要求 训练集音频需要和实际场景要识别的音频环境一致,举例:如果实际场景要识别的音频都是手机摄录的,那训练的音频也需要同样的场景获得,而不要采用网上随便下载的音频。
经典版声音分类数据集管理API 本文档主要说明当您线下已有大量的已经完成分类整理的音频数据,如何通过调用API完成音频数据的便捷上传和管理。 数据集创建API 接口描述 该接口可用于创建数据集。
编辑机器人 概述 调用接口,可编辑外呼机器人 URL https://aiob-open.baidu.com/api/v1/robot/manage/edit HTTP Method POST 请求参数 HEADER 参数名称 是否必须 说明 示例 Authorization 是 参考「生成认证Token」文档 cc-api-auth-v1/5b050c050f5a4e74b8c20bf512e39c1d
编辑机器人 概述 调用接口,可编辑外呼机器人 URL https://aiob-open.baidu.com/api/v1/robot/manage/edit HTTP Method POST 请求参数 HEADER 参数名称 是否必须 说明 示例 Authorization 是 参考「生成认证Token」文档 cc-api-auth-v1/5b050c050f5a4e74b8c20bf512e39c1d
在数据集列表中确定需要操作的数据集,点击操作列的 “缓存预热” ,添加需要预热的数据路径,点击“确认”。 注意: 默认情况下,系统将预先缓存数据集的全部数据到本地。若指定数据集的一个或多个路径,则只缓存对应路径下的数据; 若指定为空则默认缓存所有路径。 RapidFS 仅支持对根路径即整个数据集进行预热,暂不支持子路径预热。 查看YAML 在CCE集群管理页面单击 云原生AI > 数据集 。
在集群管理页面单击 云原生AI > 数据集 。 在数据集管理页面中,可以查看已创建数据集及其相关信息,如果数据集较多,可以通过左上方“数据集名称”进行快速搜索。 7.在数据集列表中“数据集名称”列点击某一数据集名称,进入“数据集详情”页面,查看详细信息。