众测标注
更新时间:2024-09-19
目录
什么是众测标注
本平台支持提交标注人力服务的需求发布至百度众测。
百度众测团队具备10年以上的数据服务经验和丰富的标注人力,尤其在大模型方面已在内部将经验和人员打磨优化,可为客户专业、准确、高效、安全地完成包括SFT、RM、模型评估等各类大模型数据标注任务,助力展开大模型建设。 平台支持统一纳管自训练模型的数据集,并支持自主版本迭代、数据查看、导入导出和删除等操作。
登录到本平台,在左侧功能列数据标注中选择众测标注,进入众测标注的主任务界面。
创建众测标注任务
在数据标注-众测标注页面中,选择“创建众测需求”。
在完成配置需求和个人信息的填写后,即可发起众测标注任务。
配置需求
填写自定义需求名称并完善以下信息:
- 对接方式为数据集:选择非空的未发布标注的数据集;标注模版根据数据集类型生成,对于文本对话(排序类)数据集,需要全部标注完才可以发起众测;数据量为自动生成的样本总量。
- 对接方式为线下数据:可选择文本对话(非排序)和文本对话(含排序)两种类型标注模版,需要您手动输入数据量,并上传本地文件(限制单个文件,支持zip、txt、jsonl、csv、xlsx等格式)
个人信息
在“个人信息”模块必填您的个人或公司名称、邮箱及联系方式。
以上信息均填写完成后,即可发起标注任务至众测平台,后续会有专员与您线下对接。
查看众测标注任务列表
当您创建完成众测标注需求后,可在此功能模块下查看到新建和历史的需求创建任务。
其中,同步状态为“数据同步成功”时,则表示数据已经同步到众测平台;当同步状态为“回传导入成功”时,则表示众测任务已完成,您可以到处理后的数据集中进行验收查看。
其他异常状态的众测标注任务,会有专职人员与您取得联系,您也可以填写工单进行反馈,我们会安排人员进行快速响应。