每组数据文本内容的字符数建议不超过4096,超出将被截断。
文件限制:链接地址要求为tar.gz/zip格式压缩包,文件类型支持jsonl、csv、xlsx、txt,同时压缩包源文件大小在1G以内。 平台已有数据集 支持选择相同数据格式的非空数据集版本。 支持选择相同数据格式的非空数据集版本。 FAQ挖掘 基于导入文档通过大模型服务自动挖掘生产问答对,需配置服务及应用。大模型挖掘问答对数量取决于您的语料文档字符数量。
干预数据列表 待处理、已采纳、不采纳 :所有问答数据将会按照处理状态(已采纳/不采纳/待处理)展示在不同的tab之下,其中: 待处理 为从不同来源获取的用户点赞点踩、历史对话数据或知识点挖掘数据,待处理的数据不对干预过程生效; 已采纳 为应用开发者手动标记为采纳的数据,已采纳并生效的数据会干预应用问答过程; 不采纳 为应用开发者手动标记为不采纳的数据,不对干预过程生效,通过操作修改问答对的属性,可以改变问答对已采纳
如选择 导出原始数据 ,则平台会将数据集以指定格式导出为文件,并保留字段的原始内容。 如选择 导出全部数据(不含标注信息) ,则平台将会将数据集回答(Response)字段内容去除,再以指定格式导出为文件。 对于有监督微调SFT,目前支持导出格式:.jsonl、.csv、.xlsx。 查看数据导出结果 发起数据导出任务后,您可在数据集 导出记录 查看对应的导出状态。
大模型调优 点击大模型调优,进入大模型调优界面,开启大模型的微调。 点击创建调优任务 开通付费。 选择7B局部调优!这个是最便宜的。 点击下一步! 然后等待开通调优任务,等待开通后就可以点击创建调优任务了。 点击创建调优任务。 设置命令和应用场景,然后点击创建并训练。 选择模型、微调方式、数据集,然后点击确定。 任务创建完成,正在训练。 训练中。 点击详情,可以查看训练的情况。
大模型调优 点击大模型调优,进入大模型调优界面,开启大模型的微调。 点击创建调优任务 开通付费。 选择7B局部调优!这个是最便宜的。 点击下一步! 然后等待开通调优任务,等待开通后就可以点击创建调优任务了。 点击创建调优任务。 设置命令和应用场景,然后点击创建并训练。 选择模型、微调方式、数据集,然后点击确定。 任务创建完成,正在训练。 训练中。 点击详情,可以查看训练的情况。
过滤条件宽度占比 报表中的过滤条件的宽度默认占据整行,可以通过设置「过滤条件宽度占比」,设置为 整行 或占据整行宽度的 1/2 、 1/3 、 1/4 。
饼图 概述 饼图,主要用于表现不同类目的数据在总和中的占比。每个的弧度表示数据数量的比例。
需具有以下任一权限: 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy 完全控制千帆大模型平台数据管理(除数据标注外)的权限:QianfanDataFullControlAccessPolicy 运维操作千帆大模型平台数据管理(除数据标注外)的权限:QianfanDataOperateAccessPolicy 鉴权说明 调用本文API,使用“基于安全认证AK
删除数据增强任务 接口描述 本接口用于删除数据增强任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。