语言处理技术

    简介

    简介

    Hi,您好,欢迎使用百度自然语言处理API服务。

    本文档主要针对API开发者,描述百度自然语言处理接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

    语言处理基础技术接口能力

    接口名称 接口能力简要描述
    词法分析 分词、词性标注、专名识别
    词向量表示 查询词汇的词向量,实现文本的可计算
    词义相似度 计算两个给定词语的语义相似度
    DNN语言模型 判断一句话是否符合语言表达习惯
    依存句法分析 自动分析文本中的依存句法结构信息
    短文本相似度 判断两个文本的语义相似度

    语言处理应用技术接口能力

    接口名称 接口能力简要描述
    文本纠错 识别文本中有错误的片段,进行错误提示并给出正确的建议文本内容
    文章标签 分析文章的标题和内容,输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度
    文章分类 根据文章内容类型,对文章进行自动分类
    新闻摘要 自动抽取新闻文本中的关键信息并生成指定长度的新闻摘要
    评论观点抽取 从评论语句中提取评论观点的情感属性
    对话情绪识别 识别出当前会话者所表现出的情绪类别及其置信度
    情感倾向分析 对包含主观观点信息的文本进行情感极性类别(积极、消极、中性)的判断,并给出相应的置信度
    多实体情感倾向分析 对包含有多个主体信息的文本,针对每一个系统识别到的主体,做自动情感倾向性判断
    地址识别 提取快递填单文本中的姓名、电话、地址信息,自动补充和纠正,生成结构化信息

    请求格式

    POST方式调用

    注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

    body整体文本内容可以支持GBK和UTF-8两种格式的编码。

    1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误

    2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    返回格式

    JSON格式

    默认返回内容为GBK编码

    若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

    调用方式

    调用AI服务相关的API接口有两种调用方式,两种不同的调用方式采用相同的接口URL。

    区别在于请求方式鉴权方法不一样,请求参数和返回结果一致。

    调用方式一

    向API服务地址使用POST发送请求,必须在URL中带上参数:

    access_token: 必须参数,参考“Access Token获取”。

    POST中参数按照API接口说明调用即可。

    例如自然语言处理API,使用HTTPS POST发送:

    https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    说明: 方式一鉴权使用的Access_token必须通过API Key和Secret Key获取。

    调用方式二

    请求头域内容

    NLP的API服务需要在请求的HTTP头域中包含以下信息:

    • host(必填)
    • x-bce-date (必填)
    • x-bce-request-id(选填)
    • authorization(必填)
    • content-type(选填)
    • content-length(选填)

    作为示例,以下是一个标准的请求头域内容:

    POST rpc/2.0/nlp/v1/wordseg? HTTP/1.1
    accept-encoding: gzip, deflate
    x-bce-date: 2015-03-24T13:02:00Z
    connection: keep-alive
    accept: */*
    host: aip.baidubce.com
    x-bce-request-id: 73c4e74c-3101-4a00-bf44-fe246959c05e
    content-type: application/x-www-form-urlencoded;
    authorization: bce-auth-v1/46bd9968a6194b4bbdf0341f2286ccce/2015-03-24T13:02:00Z/1800/host;x-bce-date/994014d96b0eb26578e039fa053a4f9003425da4bfedf33f4790882fb4c54903

    说明: 方式二鉴权使用的API认证机制authorization必须通过百度云的AK/SK生成。

    上一篇
    产品定价
    下一篇
    鉴权认证机制