多实体情感倾向分析
该接口已停止更新且即将下线,为避免影响您目前的业务使用,请您及时进行相关迁移工作
各接口用途说明
对包含有多个主体信息的文本,针对每一个系统识别到的主体,做自动情感倾向性判断(积极、消极、中性),并给出相应的置信度。您可以通过实体库扩展定制接口,补充需要系统自动识别的实体名单。
该能力共分为6个接口: 1个主接口,用于分析篇章中每个实体的情感倾向;5个实体库的定制化接口,用于自定义添加和维护实体词库,帮助定向提升实体情感分析的召回,如果您有补充定制实体词库的需求,可通过定制化接口实现实体库的补充。
主接口(实体抽取与情感倾向分析)
输入待分析文本,返回实体抽取结果,以及对抽取的实体的情感倾向分析结果。
请求示例
HTTP方法: POST
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
主接口请求格式
POST方式调用
注意:要求使用JSON格式的结构体来描述一个请求的具体内容。
body整体文本内容可以支持GBK和UTF-8两种格式的编码。
1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误
2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074
请求参数
参数 | 类型 | 是否必填 | 描述 |
---|---|---|---|
title | string | 是 | 标题(建议输入UTF-8),长度不超过400字节 |
content | string | 是 | 正文(建议输入UTF-8),长度不超过6000字节 |
type | number | 是 | 新闻类型,目前支持3种文章类型,1:娱乐;2:财经;3:体育 |
repository | string | 否 | 自定义需要抽取的实体库名称,由大写英文字母组成,默认为空 |
Body请求示例:
{
"content": "2018已经过去了,不过万达还没公布去年的业绩报告。不过从目前来看,2018年万达全年的业绩应该跟之前两年差不多。虽然万达广场的数量在增加,但是万达的负债依然非常高。王健林目前的套路就是卖掉不赚钱的项目准备过冬。其实王健林的核心资产万达广场还是赚钱。目前290多座万达广场,每年可以收到200多亿的租金。不过由于前期的投入巨大,而且大量的资金都是贷款,所以目前万达的利润非常低。2016年的时候万达的利润才7亿多,2017年也是持平。等于说万达这290多座广场,一共才给王健林赚了7个亿。许多人都听说过万达广场,不过如果你仔细研究就会发现,万达广场数量虽然多,但是大多数都是位于非核心区域的地方。广州目前的几座万达广场就没有位于广州的核心区域天河。这几个万达广场都是在广州偏远地方。北京跟上海的情况也一样,而深圳这个消费能力非旺盛的地方,目前居然没有万达广场。李嘉诚说过开商场其实没有秘密,最关键的就是位置。现在内地一二线城市好的位置,其实都被许多港商给拿走了。比如说北京的东方广场就是李嘉诚的。东方广场就位于北京长安街上王府井的旁边。另外北京的国贸背后的老板是马来西亚首富郭鹤年。上海两座位置最好的广场恒隆广场跟港汇广场也都是港商陈启宗的资产。另外上海著名的上海新天地的老板也是港商罗康瑞。成都的国金中心年收租6亿,背后的老板也是香港的吴宗权。目前收租前十的公司中,除了万达之后,大部分其实都是港资企业。因为大量好位置的地皮都被港资早早拿了,王健林其实也没有办法。李嘉诚等港商在80年代就回到内地来投资。当时内地对于资金非常渴望,许多土地都是白菜价便宜送的。王健林如今拿地的成本自然不一样,这也是为何王健林的万达之前会负债那么高的原因。因此王健林才需要以量取胜。不过王健林这290多座万达广场,却依然没办法以量取胜。因为一年万达才7个亿的利润,这还不如李嘉诚旗下一栋大楼的租金。这栋大楼就是正在香港重建的和记大厦。在香港的摩天大楼里面,和记大厦不算是最出名的。跟那些动辄七八十层的大楼相比,和记大厦只有40层。不过由于和记大厦的位置特别好,所以李嘉诚一直说和记大厦是打死也不卖的资产。和记大厦就位于香港的中环,在大楼办公可以遥望到整个维港的景色。李嘉诚退休之后,李泽钜对大楼进行了重建。重建之后的和记大厦也只有40层,不过租金却可以大大上涨。按照目前的计划,重建之后的和记大厦一年的租金收入将达到10亿。这已经超过了王健林一年的利润总和了。重建之后的和记大厦市值也将高达400亿元。李嘉诚旗下本来在中环有4栋大楼,除了和记大厦之外,还有中环中心,长实中心跟华人行。其中中环中心已经在两年之前卖掉了。不过剩下的这3栋大楼里面,和记大厦跟长实中心一定是不会卖的。和记大厦位置特别优越,而且目前正在重建。长实中心则是李嘉诚的总部所在,李嘉诚肯定不会把自己的总部给卖掉的。目前李嘉诚的这3栋大楼,总价值就超过了1千亿。王健林的整个万达集团现在也才值1千多亿。简单来说,李嘉诚如果卖掉这3栋大楼,就可以买下整个万达集团。不过李嘉诚肯定不会这么傻的,他这3栋大楼每年可以收租二三十亿。王健林的万达广场大多数都是贷款建成的,等于说如果买下万达集团,还得把万达的债务也买下。李嘉诚经营的策略就是一直低负债运行。整个长和的负债率才不到20%。这在全球的地产公司中几乎是一个奇迹。如果李嘉诚愿意的话,他现在完全可以做得比万达、恒大更好。不过现在是一个收缩的周期,如果现在发力太猛的话,等到行情下行的时候,可能就会出大事。李嘉诚手里的实业非常多,而且负债又非常少,所以许多人才说他才是真正的首富。290座万达一年才赚7个亿,比不上他一栋大楼的租金,真正隐形巨富,其实这几年李嘉诚在财富榜上已经被许多人给超越,然而他依然是隐形的首富。",
"title": "测试文章",
"type": 2
}
主接口返回说明
返回格式
JSON格式
默认返回内容为GBK编码
若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | number | 请求唯一标识码 |
title | string | 标题 |
content | string | 正文 |
items | array of object | 情感倾向分析结果数组,每个元素对应情感倾向分析的一个实体分析结果 |
+status | number | 0表示成功,1表示实体未出现在文档中 |
+pval_neg | number | 实体属于消极类别的概率 |
+pval_pos | number | 实体属于积极类别的概率 |
+sentiment | string | 实体情感分析结果,0表示消极,2表示积极 |
+entity | string | 实体名 |
返回示例
{
"content": "2018已经过去了,不过万达还没公布去年的业绩报告。不过从目前来看,2018年万达全年的业绩应该跟之前两年差不多。虽然万达广场的数量在增加,但是万达的负债依然非常高。王健林目前的套路就是卖掉不赚钱的项目准备过冬。其实王健林的核心资产万达广场还是赚钱。目前290多座万达广场,每年可以收到200多亿的租金。不过由于前期的投入巨大,而且大量的资金都是贷款,所以目前万达的利润非常低。2016年的时候万达的利润才7亿多,2017年也是持平。等于说万达这290多座广场,一共才给王健林赚了7个亿。许多人都听说过万达广场,不过如果你仔细研究就会发现,万达广场数量虽然多,但是大多数都是位于非核心区域的地方。广州目前的几座万达广场就没有位于广州的核心区域天河。这几个万达广场都是在广州偏远地方。北京跟上海的情况也一样,而深圳这个消费能力非旺盛的地方,目前居然没有万达广场。李嘉诚说过开商场其实没有秘密,最关键的就是位置。现在内地一二线城市好的位置,其实都被许多港商给拿走了。比如说北京的东方广场就是李嘉诚的。东方广场就位于北京长安街上王府井的旁边。另外北京的国贸背后的老板是马来西亚首富郭鹤年。上海两座位置最好的广场恒隆广场跟港汇广场也都是港商陈启宗的资产。另外上海著名的上海新天地的老板也是港商罗康瑞。成都的国金中心年收租6亿,背后的老板也是香港的吴宗权。目前收租前十的公司中,除了万达之后,大部分其实都是港资企业。因为大量好位置的地皮都被港资早早拿了,王健林其实也没有办法。李嘉诚等港商在80年代就回到内地来投资。当时内地对于资金非常渴望,许多土地都是白菜价便宜送的。王健林如今拿地的成本自然不一样,这也是为何王健林的万达之前会负债那么高的原因。因此王健林才需要以量取胜。不过王健林这290多座万达广场,却依然没办法以量取胜。因为一年万达才7个亿的利润,这还不如李嘉诚旗下一栋大楼的租金。这栋大楼就是正在香港重建的和记大厦。在香港的摩天大楼里面,和记大厦不算是最出名的。跟那些动辄七八十层的大楼相比,和记大厦只有40层。不过由于和记大厦的位置特别好,所以李嘉诚一直说和记大厦是打死也不卖的资产。和记大厦就位于香港的中环,在大楼办公可以遥望到整个维港的景色。李嘉诚退休之后,李泽钜对大楼进行了重建。重建之后的和记大厦也只有40层,不过租金却可以大大上涨。按照目前的计划,重建之后的和记大厦一年的租金收入将达到10亿。这已经超过了王健林一年的利润总和了。重建之后的和记大厦市值也将高达400亿元。李嘉诚旗下本来在中环有4栋大楼,除了和记大厦之外,还有中环中心,长实中心跟华人行。其中中环中心已经在两年之前卖掉了。不过剩下的这3栋大楼里面,和记大厦跟长实中心一定是不会卖的。和记大厦位置特别优越,而且目前正在重建。长实中心则是李嘉诚的总部所在,李嘉诚肯定不会把自己的总部给卖掉的。目前李嘉诚的这3栋大楼,总价值就超过了1千亿。王健林的整个万达集团现在也才值1千多亿。简单来说,李嘉诚如果卖掉这3栋大楼,就可以买下整个万达集团。不过李嘉诚肯定不会这么傻的,他这3栋大楼每年可以收租二三十亿。王健林的万达广场大多数都是贷款建成的,等于说如果买下万达集团,还得把万达的债务也买下。李嘉诚经营的策略就是一直低负债运行。整个长和的负债率才不到20%。这在全球的地产公司中几乎是一个奇迹。如果李嘉诚愿意的话,他现在完全可以做得比万达、恒大更好。不过现在是一个收缩的周期,如果现在发力太猛的话,等到行情下行的时候,可能就会出大事。李嘉诚手里的实业非常多,而且负债又非常少,所以许多人才说他才是真正的首富。290座万达一年才赚7个亿,比不上他一栋大楼的租金,真正隐形巨富,其实这几年李嘉诚在财富榜上已经被许多人给超越,然而他依然是隐形的首富。",
"items": [
{
"status": 0,
"pval_neg": 0.33771,
"sentiment": 2,
"pval_pos": 0.66229,
"entity": "李嘉诚"
},
{
"status": 0,
"pval_neg": 0.607452,
"sentiment": 0,
"pval_pos": 0.392548,
"entity": "万达"
},
{
"status": 0,
"pval_neg": 0.708763,
"sentiment": 0,
"pval_pos": 0.291237,
"entity": "万达集团"
},
{
"status": 0,
"pval_neg": 0.704533,
"sentiment": 0,
"pval_pos": 0.295467,
"entity": "王健林"
}
],
"log_id": 3315345474089367928,
"title": "测试文章"
}
实体库新增接口
对实体库的实体进行扩充,实体库有百度预置的部分类型实体,扩充并不是必要的。
请求示例
HTTP方法: POST
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
请求参数
参数 | 类型 | 是否必填 | 描述 |
---|---|---|---|
repository | string | 是 | 实体库名称,由大写英文字母组成 |
entities | array of string | 是 | 实体名列表,实体名为UTF-8格式,自定义实体库的上限是20个,单个实体库的内容上限是100个 |
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | number | 请求唯一标识码 |
{
"log_id": 8111004055035146270
}
实体库查询接口
请求示例
HTTP方法: POST
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
请求参数
无输入字段,请求空json{}即可
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | number | 请求唯一标识码 |
repositories | array of string | 实体库名称列表 |
{
"log_id": 8111004055035146270,
"repositories": ["repo1","repo2"]
}
实体库删除接口
请求示例
HTTP方法: POST
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
请求参数
参数 | 说明 | 描述 |
---|---|---|
repositories | string | 实体库名称,由大写英文字母组成 |
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | number | 请求唯一标识码 |
{
"log_id": 8111004055035146270
}
实体名单查询接口
请求示例
HTTP方法: POST
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
请求参数
参数 | 类型 | 是否必填 | 描述 |
---|---|---|---|
repository | string | 是 | 实体库名称,由大写英文字母组成 |
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | number | 请求唯一标识码 |
entities | array of string | 该实体库中的实体名单列表,UTF-8格式 |
{
"log_id": 8111004055035146270,
"entities": ["傅园慧","吴昕", "Jack"]
}
实体名单删除接口
请求示例
HTTP方法: POST
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
请求参数
参数 | 类型 | 是否必填 | 描述 |
---|---|---|---|
repository | string | 是 | 实体库名称,由大写英文字母组成 |
entities | array of string | 是 | 指定在该库中需要删除的实体名单,UTF-8格式 |
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | number | 请求唯一标识码 |
{
"log_id": 8111004055035146270,
}