安全策略
更新时间:2026-03-19
1. 产品概述
为了给用户提供“灵活且多维度”的内容安全管理能力,千帆大模型平台全面升级了“内容安全”模块。您可以在「安全策略」中为您的自定义接入点配置大模型输入与输出的安全等级,快速实现不同业务场景下的合规与风控需求。
2. 前提条件
- 安全协议:首次进入【内容安全】模块时,需由具备「系统管理员」权限的用户仔细阅读并签署《内容安全策略自定义功能服务协议》,点击“同意并继续”后方可解锁功能。
-
权限要求:协议签署后,具备以下任一权限策略的子账号/用户即可使用本功能:
3. 控制台操作指南
3.1 创建安全策略
- 登录控制台,在左侧导航栏中,选择 内容安全 >安全策略 。
- 点击页面左上角的 创建安全策略 按钮。
-
在配置详情页中,按提示填写以下信息:
-
基础信息:
- 安全策略名称:输入安全策略名称(支持中英文、数字、中划线和下划线,2-64个字符)。
- 描述:选填,简要说明该策略的业务用途。
-
选择接入点:
- 在列表中勾选需要绑定该策略的自定义接入点(支持按接入点名称搜索)。
- 注意:一个安全策略仅可绑定一个接入点,一个接入点也仅可绑定一个安全策略。(如需了解如何创建接入点,请参考《自定义接入点使用指南》)。
-
安全等级配置:
- 选择该接入点适用的安全等级(不同模型的配置范围不同)。
- 详细的支持范围及等级说明,请见本文 第 5 节:内容安全等级说明。
-
- 确认配置无误后,点击 确定。
3.2 查看与管理安全策略
在“安全等级”列表页,您可以对已创建的策略进行管理:
- 查看详情:点击策略名称,可以查看安全策略的基本信息、关联的接入点信息及配置的安全策略。

- 编辑策略:点击 编辑配置,支持修改策略名称、描述以及输入/输出安全等级。注意:为了保证配置逻辑清晰,已绑定的“自定义接入点”不可修改。 若需为其他接入点配置,请新建安全策略;
- 服务下线说明:若某接入点被删除或底层模型服务下线,该条安全策略将自动失效。
4. API 调用与生效逻辑
配置完成后,您只需通过该自定义接入点发起 API 调用,系统便会自动执行对应的安全策略。
若在控制台为接入点
ep_ey68rebs8_111的“图像输入安全”配置了strict(严格方案)等级。当调用该接口并传入一张不满足严格安全等级的图片时:
Python
1curl --request POST \
2 --url https://qianfan.baidubce.com/v2/chat/completions \
3 --header 'Accept: */*' \
4 --header 'Accept-Encoding: gzip, deflate, br' \
5 --header 'Authorization: Bearer bce-v3/ALTAK***************************77ef23cc8597b' \
6 --header 'Connection: keep-alive' \
7 --header 'Content-Type: application/json' \
8 --data '{
9 "model": "ep_ey68rebs8_111",
10 "enable_thinking": false,
11 "messages": [
12 {
13 "role": "user",
14 "content": [
15 {
16 "type": "text",
17 "text": "你是谁"
18 },
19 {
20 "type": "image_url",
21 "image_url": {
22 "url": "https://eb118-file.cdn.bcebos.com/assistant/a53eb7ab8c3241faad6e5606c6c5e3fc_118000008282847932.png"
23 }
24 }
25 ]
26 }
27 ]
28}'
可以看到接口返回,说明此刻安全等级生效:
Python
1{
2 "error": {
3 "code": "image_url_unsafe",
4 "message": "the content of image_url.url field is unsafe",
5 "type": "unsafe_request"
6 },
7 "id": "as-yqpdsae53u"
8}
5. 内容安全等级说明
5.1模型安全等级配置范围:
针对不同模态的模型,平台提供差异化的输入/输出(I/O)安全等级配置能力:
-
文本模型:默认统一配置“文本安全”(注:Ernie X 系列支持输入/输出独立配置)。
- 配置为 none:输入与输出安全均不拦截(全为 none)。
- 配置为其他等级:输入安全适用您选择的等级(如 base),输出安全将默认固定为 standard。
- 视觉理解模型:支持分别配置“文本输入安全”与“图像输入安全”(部分 Ernie 视觉理解模型仅支持“文本安全”)。
- 图像生成模型:支持配置“文本输入安全”与“图像输出安全”。
5.2安全等级说明:
根据您使用的模型能力(文本/图像),系统支持配置不同的安全等级:
文本审核安全等级
| 等级名称 | 参数值 (safety) | 适用场景及说明 |
|---|---|---|
| 去安全方案 | none | 完全关闭千帆安全检测能力(含输入与输出)。适用于业务方已有完善风控系统,不希望重复检测的场景。 |
| 最小安全 | minimal | 不过滤用户输入,仅对模型输出内容做敏感词兜底拦截。适用于内部使用、特定人群固定场景。 |
| 基础方案 | base | 降低检测强度,放宽部分常规内容的拦截阈值。适用于媒体报道、政务公开、法律助手等垂类专业场景。 |
| 弱安全 | moderate | 在标准检测基础上去除涉黄拦截,保留涉政检测。适用于小说创作、角色扮演(Roleplay)等对情感类内容有需求的场景。 |
| 标准方案 | standard | 平台默认等级。对涉政、涉黄、暴恐、违禁等内容进行标准化拦截。适用于大部分通用的问答、创作场景。 |
| 严格方案 | strict | 最高安全等级。大幅提高对违法信息、色情低俗内容的拦截标准。适用于K12教育、未成年人专项等高敏感业务。 |
附加配置:小语种安全 (lingual_none)
- 适用前提:当且仅当文本安全等级选择为「标准方案 ( standard )」时,支持额外开启此配置。
- 功能说明:开启后,若系统检测到输入内容为小语种,将自动跳过文本安全算子的检测环节。
图像审核安全等级
| 等级名称 | 参数值 ( safety ) |
适用场景及说明 |
|---|---|---|
| 去安全方案 | none | 完全关闭千帆图像安全检测能力。适用于业务方已有完善图审风控系统的场景。 |
| 基础方案 | base | 仅拦截核心红线(高危涉政、黄赌毒),放宽一般性内容的审核标准。适用于新闻媒体、政务、法律等需要展示真实素材的场景。 |
| 弱安全方案 | moderate | 保留涉政管控,放宽人体特征检测。允许出现医疗用途的人体器官或皮肤展示。适用于医疗健康、病理分析等专业场景。 |
| 标准方案 | standard | 平台默认等级。对涉政、涉黄、暴恐、违禁图片进行标准拦截。适用于大部分通用图像生成/解析场景。 |
| 严格方案 | strict | 最高安全等级。额外增加对敏感人物(娱乐/体育/历史)、版权保护及未成年人内容的严格管控。适用于泛科技 ToC、教育及版权敏感业务。 |
评价此篇文章
