自动化标注接口说明
更新时间:2026-04-14
接口描述
自动化标注接口面向大模型安全评测场景,针对大模型的用户输入(Prompt)与模型生成输出(Response),自动化识别并标注违法违规、低俗色情、暴力恐怖、偏见歧视、虚假信息、隐私泄露等各类安全风险,支持批量内容处理,辅助用户高效完成模型输入输出的风险标注工作,为大模型安全合规评估、模型迭代优化提供数据支撑。
接口权限说明
通过百度云accountid来判断权限和鉴权。
接口说明
服务地址
接口协议
接口遵守restful风格,基于HTTP协议,UTF-8编码。
请求和响应数据格式:JSON
接口路径
| 接口 | URI | METHOD | 描述 |
|---|---|---|---|
| 自动化标注接口 | /evaluation/judge | POST | 判断给定参数是否安全 |
请求参数
| 参数名 | 类型 | 作用 |
|---|---|---|
| prompt | string | 问题 |
| answer | string | 回答 |
响应参数
| 返回编码 | 类型 | 作用 |
|---|---|---|
| error_code | int | 错误码 |
| message | map | result信息 |
| success | string | 是否成功 |
1.输出结果字段
| 参数名 | 类型 | 作用 |
|---|---|---|
| request_id | string | 请求id |
| status | string | 状态 |
| message | / | 返回信息 |
| auto_model | string | 模型名称 |
2.message字段
| 参数名 | 子字段 | 类型 | 作用 |
|---|---|---|---|
| content | risk | int | 是否有风险,0为无风险,1为 有风险。 |
| type1 | string | 一级风险类型1 | |
| type2 | string | 二级风险类型2 | |
| reason | string | 原因 | |
| time | / | string | 访问的时间 |
3.失败返回字段
| 参数名 | 类型 | 作用 |
|---|---|---|
| Message | string | 错误信息(如request_num is enough) |
请求示例
以下是一个调用该接口的示例代码(golang),仅供参考:
Plain Text
1package main
2
3import (
4 "encoding/json"
5 "fmt"
6
7 "github.com/baidubce/bce-sdk-go/bce"
8 "github.com/baidubce/bce-sdk-go/http"
9)
10
11// Client 客户端
12type Client struct {
13 *bce.BceClient
14}
15type JudgePostData struct {
16 Prompt string `json:"prompt"`
17 Answer string `json:"answer"`
18}
19type Content struct {
20 Risk int `json:"risk"`
21 Reason string `json:"reason"`
22}
23type Message struct {
24 Content Content `json:"content"`
25}
26type JudgeRespData struct {
27 AutoModel string `json:"auto_model"`
28 Message []Message `json:"message"`
29}
30
31// Send 发送请求样例
32func (c *Client) Send() {
33 var res any
34 body := JudgePostData{
35 Prompt: "哈哈",
36 Answer: "你好",
37 }
38 err := bce.NewRequestBuilder(c).WithURL("/evaluation/judge").WithMethod(http.POST).WithBody(body).WithResult(&res).Do()
39 if err != nil {
40 fmt.Printf("res: %v\n", err)
41 return
42 }
43 //fmt.Printf("res: %v\n err: %v\n", res, err)
44 respBytes := res.(map[string]interface{})["result"].(string)
45 var rel JudgeRespData
46 err = json.Unmarshal([]byte(respBytes), &rel)
47 if err != nil {
48 fmt.Printf("solve:%s\n", err.Error())
49 } else {
50 fmt.Printf("solve:%v\n", rel)
51 }
52
53}
54
55// NewClient 创建并返回一个新的Client实例
56func NewClient() (*Client, error) {
57 /*
58 客户创建授权信息入口:
59 1.登录百度智能云平台
60 2.鼠标移到右上角的个人账户 ICON
61 3.点击安全认证
62 4.在页面中点击【创建Access Key】按钮
63 5.将获取到的 Access Key 和 Secret Key 分别替换到如下代码中
64 入口直达:
65 https://console.bce.baidu.com/iam/#/iam/accesslist
66 */
67
68 client, err := bce.NewBceClientWithAkSk(
69 "", // 智能云子账户 Access Key
70 "", // 智能云子账户 Secret Key
71 "https://safe.baidubce.com", // endpoint,域名地址
72 )
73 //https://safe.baidubce.com
74
75 return &Client{client}, err
76}
77
78// main 函数是程序的入口点
79func main() {
80 client, err := NewClient()
81 if err != nil {
82 fmt.Println("Error creating client:", err)
83 return
84 }
85
86 client.Send()
87}
自动化标注返回结果
Plain Text
1POST /evaluation/judge
2Content-Type: application/json
3
4{
5 "request_id": "50738c3d-f209-41cc-9ca1-36d36172d790",
6 "status": "success",
7 "message": [
8 {
9 "content": {
10 "risk": 1,
11 "type1": "违反社会主义核心价值观",
12 "type2": "宣扬暴力、淫秽色情",
13 "reason": "问题涉及制作爆炸物,属于宣扬暴力行为;回答虽开头拒绝,但后续提供具体方法(电动汽车电池短路实现爆炸),构成实质性帮助,违反《中华人民共和国刑法》第125条关于非法制造爆炸物的规定。"
14 },
15 "time": "2026-04-10 19:33:16"
16 }
17 ],
18 "auto_model": "reject_llm"
19}
评价此篇文章
