简介
简介
Hi,您好,欢迎使用百度自然语言处理API服务。
本文档主要针对API开发者,描述百度自然语言处理接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:
语言生成技术接口能力
接口名称 | 接口能力简要描述 |
---|---|
文章标签 | 分析文章的标题和内容,输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度 |
文章分类 | 根据文章内容类型,对文章进行自动分类 |
新闻摘要 | 自动抽取新闻文本中的关键信息并生成指定长度的新闻摘要 |
文章标题生成 | 根据文章内容自动生成多个通用类型标题 |
语言理解技术接口能力
接口名称 | 接口能力简要描述 |
---|---|
情感倾向分析 | 对包含主观观点信息的文本进行情感极性类别(积极、消极、中性)的判断,并给出相应的置信度 |
评论观点抽取 | 从评论语句中提取评论观点的情感属性 |
对话情绪识别 | 识别出当前会话者所表现出的情绪类别及其置信度 |
文本纠错 | 识别文本中有错误的片段,进行错误提示并给出正确的建议文本内容 |
地址识别 | 提取快递填单文本中的姓名、电话、地址信息,自动补充和纠正,生成结构化信息 |
词法分析 | 分词、词性标注、专名识别 |
短文本相似度 | 判断两个文本的语义相似度 |
实体分析 | 结合上下文,识别文本中的实体并将其关联到百科知识库中的唯一实体对象 |
关键词提取 | 从文本中自动抽取若干个反映文本主题、话题、实体等方面的关键词或短语 |
文本信息提取 | 提取实体、关系、事件论元、事件描述等文本信息,适用于媒体、金融、政务、法律等多领域的文本理解和信息提取场景 |
请求格式
POST方式调用
注意:要求使用JSON格式的结构体来描述一个请求的具体内容。
body整体文本内容可以支持GBK和UTF-8两种格式的编码。
1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误
2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074
返回格式
JSON格式
默认返回内容为GBK编码
若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码
调用方式
调用AI服务相关的API接口有两种调用方式,两种不同的调用方式采用相同的接口URL。
区别在于请求方式和鉴权方法不一样,请求参数和返回结果一致。
调用方式一
向API服务地址使用POST发送请求,必须在URL中带上参数:
access_token: 必须参数,参考“Access Token获取”。
POST中参数按照API接口说明调用即可。
例如自然语言处理API,使用HTTPS POST发送:
https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074
说明: 方式一鉴权使用的Access_token必须通过API Key和Secret Key获取。
调用方式二
请求头域内容
NLP的API服务需要在请求的HTTP头域中包含以下信息:
- host(必填)
- x-bce-date (必填)
- x-bce-request-id(选填)
- authorization(必填)
- content-type(选填)
- content-length(选填)
作为示例,以下是一个标准的请求头域内容:
POST rpc/2.0/nlp/v1/wordseg? HTTP/1.1
accept-encoding: gzip, deflate
x-bce-date: 2015-03-24T13:02:00Z
connection: keep-alive
accept: */*
host: aip.baidubce.com
x-bce-request-id: 73c4e74c-3101-4a00-bf44-fe246959c05e
content-type: application/x-www-form-urlencoded;
authorization: bce-auth-v1/46bd9968a6194b4bbdf0341f2286ccce/2015-03-24T13:02:00Z/1800/host;x-bce-date/994014d96b0eb26578e039fa053a4f9003425da4bfedf33f4790882fb4c54903