语言处理技术

    DNN语言模型

    DNN语言模型接口

    接口描述

    本接口已于2017年5月25日升级,如果您需要查阅旧版接口文档,请查看中文DNN语言模型(旧版),但建议您尽快升级到新版接口。

    中文DNN语言模型接口用于输出切词结果并给出每个词在句子中的概率值,判断一句话是否符合语言表达习惯。

    请求说明

    请求示例

    HTTP方法:POST

    请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v2/dnnlm_cn

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

    Header如下:

    参数
    Content-Type application/json

    Body请求示例:

    {
        "text":"床前明月光"
    }

    请求格式

    POST方式调用

    注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

    body整体文本内容可以支持GBK和UTF-8两种格式的编码。

    1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误

    2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    请求参数

    参数 类型 描述
    text string 文本内容,最大256字节,不需要切词

    返回格式

    JSON格式

    默认返回内容为GBK编码

    若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

    返回参数

    参数 类型 说明
    log_id uint64 请求唯一标识码
    word string 句子的切词结果
    prob float 该词在句子中的概率值,取值范围[0,1]
    ppl float 描述句子通顺的值:数值越低,句子越通顺

    返回示例

    {
      "text": "床前明月光",
      "items": [
        {
          "word": "床",
          "prob": 0.0000385273
        },
        {
          "word": "前",
          "prob": 0.0289018
        },
        {
          "word": "明月",
          "prob": 0.0284406
        },
        {
          "word": "光",
          "prob": 0.808029
        }
      ],
      "ppl": 79.0651
    }
    上一篇
    词义相似度
    下一篇
    依存句法分析