文本纠错
更新时间:2023-03-14
接口描述
识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别,纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。
文本纠错-高级版新增语法、专名、地址纠错能力,详见文档。
在线调试
您可以在示例代码中心中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
请求说明
请求示例
HTTP方法: POST
请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/ecnet
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
charset | UTF-8 |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
Body请求示例:
{
"text": "百度是一家人工只能公司"
}
请求格式
POST方式调用
注意:要求使用JSON格式的结构体来描述一个请求的具体内容。
body整体文本内容支持UTF-8格式的编码。
UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074
请求参数
参数 | 类型 | 描述 | 是否必填 |
---|---|---|---|
text | string | 待纠错文本,输入限制550个汉字 | 必填 |
返回格式
JSON格式
若输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码
返回参数
参数 | 说明 | 描述 |
---|---|---|
log_id | uint64 | 请求唯一标识码 |
+correct_query | string | 纠错后的文本 |
+score | double | 模型置信度打分。备注:若score返回为数字7,表示输入不合法,比如输入过长或过短。该情况没有纠错结果。 |
item | object | 分析结果 |
+vec_fragment | list | 替换候选片段信息 |
++ori_frag | string | 原片段 |
++correct_frag | string | 替换片段 |
++begin_pos | int | 片段起始 |
++end_pos | int | 片段结尾 |
返回示例
{
"item": {
"vec_fragment": [
{
"end_pos": 11,
"begin_pos": 5,
"correct_frag": "人工智能公司",
"ori_frag": "人工只能公司"
}
],
"score": 0.0,
"correct_query": "百度是一家人工智能公司"
},
"text": "百度是一家人工只能公司",
"log_id": 1607927786443355511
}