语言处理技术

    地址识别

    地址识别接口

    接口描述

    针对快递、电商行业中客户在线提交的大量非结构化地址单据,该接口可以帮助精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业处理单据的效率。

    请求说明

    请求示例

    HTTP方法: POST

    请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/address

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

    Header如下:

    参数
    Content-Type application/json

    Body请求示例:

    {
        "text": "上海市浦东新区纳贤路701号百度上海研发中心 F4A000 张三"
    }

    请求格式

    POST方式调用

    注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

    body整体文本内容可以支持GBK和UTF-8两种格式的编码。

    1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误

    2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    请求参数

    参数 类型 是否必选 描述
    text string 待识别的文本内容,不超过1000字节

    返回参数

    参数 说明 描述
    log_id uint64 请求唯一标识码
    text string 原始输入的文本内容
    province string 省(直辖市/自治区)
    province_code string 省国标code
    city string
    city_code string 城市国标code
    county string 区(县)
    county_code string 区县国标code
    town string 街道(乡/镇)
    town_code string 街道/乡镇国标code
    person string 姓名,如果出现多个则按顺序输出
    detail string 详细地址
    phonenum string 电话号码,如果出现多个则按顺序输出

    返回格式

    JSON格式

    默认返回内容为GBK编码

    若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

    返回示例

    {
        "province": "上海市",
        "city": "上海市",
        "province_code": "310000",
        "log_id": 1420038644986026316,
        "text": "上海市浦东新区纳贤路701号百度上海研发中心 F4A000 张三",
        "town": "张江镇",
        "phonenum": "",
        "detail": "纳贤路701号百度上海研发中心F4A000",
        "county": "浦东新区",
        "person": "张三",
        "town_code": "310115125",
        "county_code": "310115",
        "city_code": "310100"
    }
    上一篇
    多实体情感倾向分析
    下一篇
    消费者评论分析