上传NLP分词词典

更新时间：2023-08-11

接口描述

支持用户通过api配置NLP分词词典

上传词典接口

请求路径

POST /api/bes/cluster/nlp_dict/update

请求参数

参数名	类型	是否必须	描述	示例值
x-Region	String	是	区域	bd
authorization	String	是	认证字符串，计算方法请参考生成认证字符串。	bce-auth-v1/{accessKey}/{timestamp}/{expirationPeriodInSeconds}/{signedHeaders}/{signature}

Body参数

参数名	类型	是否必须	描述	示例值
clusterId	是	String	集群id	572979545519558656
clusterId	是	String	代表nlp词典的配置模式，可选参数：upload_dict（上传词典文件）, text（输入文本）, reset_dict（重置词典）。
fileName	否	String	上传的词典文件名称，当配置模式选择上传词典文件（upload_dict）时必须填写。	test.txt
bucketName	否	String	BOS的Bucket的名称，当配置模式选择上传词典文件（upload_dict）时必须填写。	test_bucket
bucketKey	否	String	词典文件在BOS Bucket中的存储路径，当配置模式选择上传词典文件（upload_dict）时必须填写。	/test_path/.../test.txt
separator	否	String	上下文分隔符规则，默认值为tab。可选参数：tab、space(空格)。例如：（1）干预规则为tab：中华(tab)民(空格)国 -- 切词结果：中华，民(空格)国。（2）干预规则为空格：中华(tab)民(空格)国 -- 切词结果：中华，民，国
dictContent	否	String	直接输入文本作为词典，当配置方式选择输入文本（text）时必须填写。内容中可以使用"\n"代表分行符，使用"[]"作为短语干预符，使用"\t"、空格来代表上下文分隔符，且限制1000000个字符。	中华人民共和国\n中华 [人民共和国]\n中华\n人民\n共和国

请求示例

POST /api/bes/cluster/nlp_dict/update
{
  "clusterId": 1111111,
  "mode": "upload_dict",
  "fileName": "test.txt",
  "bucketName": "test_bucket",
  "bucketKey": "/test_path/.../test.txt",
  "separator": "tab"
}

响应参数

参数	必填	类型	描述
success	是	Boolean	标识请求是否成功，true/false
status	是	String	状态码
result	是	Object	词典详情

Result字段数据结构说明

参数	必填	类型	描述
code	是	String	错误码
message	是	String	请求详情

响应示例

{
    "success": true,
    "status": 200,
    "result": {
        "code": "Success",
        "message": ""
    }
}

错误详情

错误码（code）	请求详情（message)	描述
SUCCESS	-	请求成功
INVALID_ENTITY_TOO_LARGE	The dictContent exceeds the 1000000 character limit.	当配置方式选择输入文本（text）时，dictContent内容超过1000000字符限制
INVALID_ENTITY_TOO_LARGE	The dict file is too large.	当配置模式选择上传词典文件（upload_dict）时，词典文件超过10M
INVALID_CLUSTER_ID	The cluster id is not valid.	集群id不存在
CLUSTER_NEED_UPGRADE	The ES Version need more than 7.x.	ES至少需要7.x版本以上
CLUSTER_NEED_UPGRADE	The ES Node memory requires at least 64g.	ES节点内存配置至少需要64G
INVALID_PARAMETER	The value of request parameter is invalid, Please check the required field .	请求参数有误，请检查必填项或字段格式
INVALID_NLP_DICT_FILE	The dictionary file is not a txt file.	词典文件不是txt文件
PERMISSION_DENY	Permission deny.	权限不足，需要BES OPERATE权限
INVALID_FILE	The bucket or file not exist or banned.	bucket或文件不存在或不允许访问
UNKNOW	Unknow error.	未知错误

查看词典接口

请求路径

POST /api/bes/cluster/nlp_dict/update

请求参数

参数名	类型	是否必须	描述	示例值
x-Region	String	是	区域	bd
authorization	String	是	认证字符串，计算方法请参考生成认证字符串。	bce-auth-v1/{accessKey}/{timestamp}/{expirationPeriodInSeconds}/{signedHeaders}/{signature}

Body参数

参数名	类型	是否必须	描述	示例值
clusterId	String	是	集群id	572979545519558656

请求示例

POST /api/bes/cluster/nlp_dict/display
{
  "clusterId": 1111111
}

响应参数

参数	必填	类型	描述
success	是	Boolean	标识请求是否成功，true/false
status	是	String	状态码
result	是	Object	词典详情

Result字段数据结构说明

参数	必填	类型	描述
operationType	是	String	upload_dict（上传词典文件）, text（输入文本）
separator	是	String	上下文分隔符规则
fileName	是	String	若使用上传词典的方式，则此字段有值，代表上传词典的名称
dictContent	是	String	若使用输入文本的方式，则此字段有值，代表详细词典内容

响应示例

{
    "success": true,
    "status": 200,
    "result": {
        "operationType": "upload_dict",
        "separator": "tab",
        "fileName": "test.txt",
        "dictContent": null
    }
}

删除集群

获取操作历史信息

百度智能云

Elasticsearch BES

Elasticsearch BES

上传NLP分词词典

接口描述

上传词典接口

请求路径

请求参数

Header参数

Body参数

请求示例

响应参数

响应示例

错误详情

查看词典接口

请求路径

请求参数

Header参数

Body参数

请求示例

响应参数

响应示例