文章分类
文章分类接口
接口描述
对文章按照内容类型进行自动分类,首批支持娱乐、体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基础技术支持。
目前支持的一级粗粒度分类类目如下:1、国际 2、体育 3、娱乐 4、社会 5、财经 6、时事 7、科技 8、情感 9、汽车 10、教育 11、时尚 12、游戏 13、军事 14、旅游 15、美食 16、文化 17、健康养生 18、搞笑 19、家居 20、动漫 21、宠物 22、母婴育儿 23、星座运势 24、历史 25、音乐 26、综合
在线调试
您可以在示例代码中心中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
请求说明
请求示例
HTTP方法: POST
请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/topic
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
Body请求示例:
{
"title":"欧洲冠军联赛",
"content": "欧洲冠军联赛是欧洲足球协会联盟主办的年度足球比赛,代表欧洲俱乐部足球最高荣誉和水平,被认为是全世界最高素质、最具影响力以及最高水平的俱乐部赛事,亦是世界上奖金最高的足球赛事和体育赛事之一。"
}
请求格式
POST方式调用
注意:要求使用JSON格式的结构体来描述一个请求的具体内容。
body整体文本内容可以支持GBK和UTF-8两种格式的编码。
1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误
2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074
请求参数
参数 | 类型 | 描述 | 是否必填 |
---|---|---|---|
title | string | 文章标题,最大80字节 | 必填 |
content | string | 文章内容,最大65535字节 | 必填 |
返回格式
JSON格式
默认返回内容为GBK编码
若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码
返回参数
参数 | 说明 | 描述 |
---|---|---|
item | object | 分析结果数组 |
+lv1_tag_list | array of objects | 一级分类结果(唯一) |
+lv2_tag_list | array of objects | 二级分类结果 |
++score | float | 类别标签对应得分,范围0-1 |
++tag | string | 类别标签 |
返回示例
{
"log_id": 3591049593939822907,
"item": {
"lv2_tag_list": [
{
"score": 0.877436,
"tag": "足球"
},
{
"score": 0.793682,
"tag": "国际足球"
},
{
"score": 0.775911,
"tag": "英超"
}
],
"lv1_tag_list": [
{
"score": 0.824329,
"tag": "体育"
}
]
}
}