关键词提取
更新时间:2023-11-06
接口描述
能够从文本中自动抽取若干个反映文本主题、话题、实体等方面的关键词或短语。
在线调试
您可以在示例代码中心中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
请求说明
请求示例
HTTP方法: POST
请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/txt_keywords_extraction
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
Body请求示例:
{
"text":[
"学习书法,就选唐颜真卿《颜勤礼碑》原碑与对临「第1节」"
],
"num":4
}
请求格式
POST方式调用
注意:要求使用JSON格式的结构体来描述一个请求的具体内容。
Body整体文本内容支持UTF-8格式编码。
若文本需要使用UTF-8格式编码,请在url参数中添加charset=UTF-8 (大小写敏感) 。
请求参数
参数 | 类型 | 是否必选 | 描述 |
---|---|---|---|
text | array[] | 是 | 原文本内容,最大65535字符(1个汉字=1个字符),建议在文本中同一词语的出现次数少于500次 |
num | int | 否 | 需要提取的关键词数量的最大值,取值为大于等于1的正整数,无num字段时返回全部关键词(提示:num取值较大时,返回的关键词数量可能小于num值) |
返回格式
JSON格式
返回编码格式与传入编码格式一致。
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | uint64 | 请求唯一标识码 |
results | array | 关键词提取结果的数组集合 |
+score | float | 关键词的置信度,数值范围[0,1] |
+word | string | 提取出的关键词 |
返回示例
{
"log_id":123123,
"results":[
{
"score":0.2669559478242008,
"word":"颜勤礼碑"
},
{
"score":0.25579790927326845,
"word":"书法"
},
{
"score":0.23924662247807055,
"word":"原碑"
},
{
"score":0.23799952042446024,
"word":"唐颜真卿"
}
]
}