文本实体关系抽取介绍
更新时间:2020-12-03
简介
Hi,您好,欢迎使用百度EasyDL定制化训练和服务平台。
实体关系抽取是指从文本中抽取出预定义的实体类型及实体间的关系类型,得到包含语义信息的实体关系三元组,每个实体关系三元组由两个实体及其关系构成,如<实体关系,实体1,实体2>。文本实体关系抽取除了支持一对一之外还支持了一对多,多对一,多对多的情况:
- 一对多:“华扬联众数字技术股份有限公司于2017年8月2日在上海证券交易所上市”,含有一对多的属性三元组(华扬联众数字技术股份有限公司,上市时间,2017年8月2日)和(华扬联众数字技术股份有限公司,上市地点,上海证券交易所上市)
- 多对一:“上海森焱软件有限公司和上海欧提软件有限公司的注册资本均为100万人民币”,含有多对一的属性三元组(上海森焱软件有限公司,注册资本,100万人民币)和(上海欧提软件有限公司,注册资本,100万人民币)
- 多对多:“大华种业稻麦种子加工36.29万吨、销售37.5万吨;苏垦米业大米加工22.02万吨、销售24.86万吨”,含有多对多的属性三元组(大华种业,稻麦种子产量,36.29万吨)和(苏垦米业,大米加工产量,22.02万吨)
应用场景
- 用于行业知识图谱的构建
- 问答系统的结构化
- 知识库的问答推理
使用流程
训练模型的基本流程如下图所示,全程可视化简易操作,在数据已经准备好的情况下,最快几分钟即可获得定制模型。