序列标注数据导入 创建数据集 您可以在BML中,选择“数据管理/标注”并点击按钮“创建数据集”,对话框中选择数据类型为“文本”,标注类型选择“序列标注”,同时您需要根据您的标注数据,选择此序列标注数据集的标注体系(详见文档《序列标注标注说明》)。注意:当前序列标注数据集不支持在线标注功能,您在序列标注数据集中仅能上传标注数据。
导入已标注数据 目录 导入已标注数据方式说明 从已有数据集导入已标注数据 查看已标注数据 导入已标注数据方式说明 如果您已有标注好的数据,支持快速导入到BML,方便直接进入后续训练环节。 实例分割任务向选定的数据集导入已标注好的数据目前支持一种方式: 将其他数据集已经标注好的数据导入 从已有数据集导入已标注数据 从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。
如需扩容,请 提交工单 申请 特别注意: 对同一数据集存在多个内容完全一致的图片,将会做去重处理。
短文本匹配数据标注 短文本匹配数据标注 打开短文本匹配数据集的标注页面,您可以看到全部未标注的数据 在页面右侧选择两个文本是相似还是不相似,便可完成标注
如需扩容,请 提交工单 申请 特别注意: 对同一数据集存在多个内容完全一致的图片,将会做去重处理。 为保证模型训练效果, 所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致。 单张图片中的标注框须限制在500个之内。 如有特殊需求,请通过 提交工单 咨询。
图像分类数据标注说明 目录 标注操作说明 标注技巧说明 上传图片 标注操作说明 在数据集查看详情页面可以点击开始标注,进入到标注页面。 添加标签 点击右侧添加标签,输入不同分类名称,完成标签添加。 标签格式说明:目前平台标签名称只支持数据/字母/下划线,暂时不支持中文 标注方式 根据左侧选定的当前图片,在右侧标签列表选择标签即可完成标注。
物体检测数据标注说明 目录 标注操作说明 标注技巧说明 上传图片 标注操作说明 在数据集查看详情页面可以点击开始标注,进入到标注页面。 添加标签 点击右侧添加标签,输入不同分类名称,完成标签添加。 标签格式说明:目前平台标签名称只支持数字/字母/下划线,暂时不支持中文 标注方式 根据左侧选定的当前图片,在左侧选择标注工具针对目标区域构建矩形框。
文本实体抽取数据标注 通过平台导入「无标注信息」的数据集后,可对无标注数据进行标注操作。 1. 创建标签 进入到待标注的数据集,您需要在右侧的标签栏中创建标签,点击「添加/搜索标签」后,即可输入标签名称,注意平台仅支持数字和字母的标签名 添加完标签后,可以添加标签的备注信息,如下图: 2.标注实体 您可以在文中划选需要标注的文本,然后在弹出的下落标签中选择需要标注的标签,如下图。
文本分类数据标注说明 文本标注 上传未标注文本后,进入到标注页面,您可以逐一查看每一篇未标注的文本,如下图: 设定分类对应的标签 创建标签后,即可以进行对文本的标注,在文本的上方标签字段处,会显示对应的分类标签,完成标注
众测标注 目录 什么是众测标注 创建众测标注任务 查看众测标注任务列表 什么是众测标注 本平台支持提交标注人力服务的需求发布至百度众测。 百度众测团队具备10年以上的数据服务经验和丰富的标注人力,尤其在大模型方面已在内部将经验和人员打磨优化,可为客户专业、准确、高效、安全地完成包括SFT、RM、模型评估等各类大模型数据标注任务,助力展开大模型建设。