百度机器学习BML

    数据标注

    实体-关系标注

    新建标注任务

    登录百度智能云管理控制台,进入“百度机器学习BML>数据标注”,点击列表上方的“新建标注任务”按钮:

    image.png

    在弹出的新建标注任务弹窗中输入必要的信息:

    image.png

    需输入的内容包括:
    标注任务名称(必填):标注任务名称由英文字符、数字和下划线组成,首尾不能是下划线,2-30个字符。
    标注场景(必填):选择“实体-关系”标注。
    数据保存路径(必填):待标注文件的存储路径。
    标注任务说明(选填):用于向标注人员介绍具体的标注规则,支持doc、docx、pdf格式。
    实体类别(选填):进行标注时用到的实体类别,例如“人名”、“公司名”等,若此处为空,可在标注时进入“标签管理”添加。
    关系类别(选填):进行标注时用到的关系类别,例如“父子”、“夫妻”等,若此处为空,可在标注时进入“标签管理”添加。
    需要审核(必填):可选是或否。如果标注完成后数据不需要审核,可选择“否”;如果需要审核,可选择“是”,用于对已标注信息进行二次确认。
    点击确定后可看到标注任务创建成功。

    image.png

    上传标注数据

    点击标注列表页的“上传”或标注任务详情页的“上传数据”,可向标注任务中添加数据。

    image.png

    数据上传支持“本地上传”和“从BOS中选择”
    上传形式支持“单文件”和“压缩包”,其中,单文件上传时,支持的文件类型为txt、doc、docx、pdf,单次可上传最多4篇文档,每篇文档大小不超过2M

    image.png

    也可从BOS中直接选择单个文件进行上传:

    image.png

    点击确定后进入标注任务详情页,等待数据上传及处理完毕后,可看到该文档。

    image.png

    进行数据标注

    进入标注任务详情页,可在数据总览页面点击“标注”,或点击“人工标注”页签进入标注页面:

    image.png

    实体-关系三元组标注以句子为单位,BML标注系统会自动将使用者上传的文档进行句子切分,默认分隔符为中英文句号,问号,叹号(。?!)
    在标注前需要点击标签管理,添加标注标签:

    image.png

    例如在本例中,我们在实体标签中添加“人名”标签,在“关系标签”中添加“叔侄”、“父子”、“夫妻”标签。

    image.png

    在标注时首先选中需要标注的内容,然后在弹窗中选择对应的标签,例如:

    image.png

    在标注过程中,需要分别选择实体一、关系和实体二,选好后,需要点击右侧的提交,方能使标注生效。

    image.png

    完成标注后可以点击“保存并到下一篇”按钮,完成本篇的标注。

    image.png

    进行数据审核

    点击“结果审核”页签,可对已完成的标注信息进行审核。如果标注全部正确,点击“通过”按钮,如果标注不正确,点击“不通过”按钮。 对于不通过的文档,可在人工标注页面重新进行标注。

    image.png

    查看标注任务相关信息

    点击“标注任务>任务管理”可看到标注任务的相关信息,包括任务进度、标注任务说明、待标注数据上传历史、结果导出历史等。

    image.png

    实体-属性标注

    新建标注任务

    登录百度智能云管理控制台,进入“百度机器学习BML>数据标注”,点击列表上方的“新建标注任务”按钮

    image.png

    在弹出的新建标注任务弹窗中输入必要的信息:

    image.png

    需输入的内容包括:
    标注任务名称(必填):标注任务名称由英文字符、数字和下划线组成,首尾不能是下划线,2-30个字符。
    标注场景(必填):选择“实体-属性”标注。
    数据保存路径(必填):待标注文件的存储路径。
    标注任务说明(选填):用于向标注人员介绍具体的标注规则,支持doc、docx、pdf格式。
    实体类别(选填):进行标注时用到的实体类别,例如“人名”、“公司名”等,若此处为空,可在标注时进入“标签管理”添加。
    属性类别(选填):进行标注时用到的关系类别,例如“职业”、“国籍”等,若此处为空,可在标注时进入“标签管理”添加。
    需要审核(必填):可选是或否。如果标注完成后数据不需要审核,可选择“否”;如果需要审核,可选择“是”,用于对已标注信息进行二次确认。
    点击确定后可看到标注任务创建成功。

    image.png

    上传标注数据

    点击标注列表页的“上传”或标注任务详情页的“上传数据”,可向标注任务中添加数据。

    image.png

    数据上传支持“本地上传”和“从BOS中选择” 上传形式支持“单文件”和“压缩包”,其中,单文件上传时,支持的文件类型为txt、doc、docx、pdf,单次可上传最多4篇文档,每篇文档大小不超过2M

    image.png

    也可从BOS中直接选择单个文件进行上传:

    image.png

    点击确定后进入标注任务详情页,等待数据上传及处理完毕后,可看到该文档。

    image.png

    进行数据标注

    进入标注任务详情页,可在数据总览页面点击“标注”,或点击“人工标注”页签进入标注页面:

    image.png

    实体-属性标注以句子为单位,BML标注系统会自动将使用者上传的文档进行句子切分,默认分隔符为中英文句号,问号,叹号(。?!)
    在标注前需要点击标签管理,添加标注标签:

    image.png

    例如在本例中,我们在实体标签中添加“人名”、“苹果”标签,在“属性标签”中添加“国籍”、“职业”、“颜色”标签。

    image.png

    在标注时首先选中需要标注的内容,然后在弹窗中选择对应的标签,例如:

    image.png

    在标注过程中,需要分别选择实体和属性,选好后,需要点击右侧的提交,方能使标注生效。

    image.png

    完成标注后可以点击“保存并到下一篇”按钮,完成本篇的标注。

    image.png

    进行数据审核

    点击“结果审核”页签,可对已完成的标注信息进行审核。如果标注全部正确,点击“通过”按钮,如果标注不正确,点击“不通过”按钮。 对于不通过的文档,可在人工标注页面重新进行标注。

    image.png

    查看标注任务相关信息

    点击“标注任务>任务管理”可看到标注任务的相关信息,包括任务进度、标注任务说明、待标注数据上传历史、结果导出历史等。

    image.png

    上一篇
    开通BOS服务并上传数据
    下一篇
    数据集