安全策略

更新时间：2026-03-19

1. 产品概述

为了给用户提供“灵活且多维度”的内容安全管理能力，千帆大模型平台全面升级了“内容安全”模块。您可以在「安全策略」中为您的自定义接入点配置大模型输入与输出的安全等级，快速实现不同业务场景下的合规与风控需求。

2. 前提条件

安全协议：首次进入【内容安全】模块时，需由具备「系统管理员」权限的用户仔细阅读并签署《内容安全策略自定义功能服务协议》，点击“同意并继续”后方可解锁功能。
权限要求：协议签署后，具备以下任一权限策略的子账号/用户即可使用本功能：
- 「系统管理员」
- 「完全控制千帆大模型平台的权限」
- 「运维操作千帆平台内容安全的权限」
- (注：权限的详细介绍及分配方法，请参考角色与权限控制列表与账号创建与权限分配。)

3. 控制台操作指南

3.1 创建安全策略

登录控制台，在左侧导航栏中，选择 内容安全 >安全策略 。
点击页面左上角的 创建安全策略 按钮。
在配置详情页中，按提示填写以下信息：
- 基础信息：
  - 安全策略名称：输入安全策略名称（支持中英文、数字、中划线和下划线，2-64个字符）。
  - 描述：选填，简要说明该策略的业务用途。
- 选择接入点：
  - 在列表中勾选需要绑定该策略的自定义接入点（支持按接入点名称搜索）。
  - 注意：一个安全策略仅可绑定一个接入点，一个接入点也仅可绑定一个安全策略。（如需了解如何创建接入点，请参考《自定义接入点使用指南》）。
- 安全等级配置：
  - 选择该接入点适用的安全等级（不同模型的配置范围不同）。
  - 详细的支持范围及等级说明，请见本文 第 5 节：内容安全等级说明。

image (23).png

确认配置无误后，点击确定。

3.2 查看与管理安全策略

在“安全等级”列表页，您可以对已创建的策略进行管理：

查看详情：点击策略名称，可以查看安全策略的基本信息、关联的接入点信息及配置的安全策略。

image (24).png

编辑策略：点击 编辑配置，支持修改策略名称、描述以及输入/输出安全等级。注意：为了保证配置逻辑清晰，已绑定的“自定义接入点”不可修改。 若需为其他接入点配置，请新建安全策略；
服务下线说明：若某接入点被删除或底层模型服务下线，该条安全策略将自动失效。

4. API 调用与生效逻辑

配置完成后，您只需通过该自定义接入点发起 API 调用，系统便会自动执行对应的安全策略。

若在控制台为接入点 ep_ey68rebs8_111 的“图像输入安全”配置了 strict（严格方案）等级。当调用该接口并传入一张不满足严格安全等级的图片时：

                Python
                
            

                curl --request POST \
  --url https://qianfan.baidubce.com/v2/chat/completions \
  --header 'Accept: */*' \
  --header 'Accept-Encoding: gzip, deflate, br' \
  --header 'Authorization: Bearer bce-v3/ALTAK***************************77ef23cc8597b' \
  --header 'Connection: keep-alive' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "ep_ey68rebs8_111",
    "enable_thinking": false,
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "你是谁"
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://eb118-file.cdn.bcebos.com/assistant/a53eb7ab8c3241faad6e5606c6c5e3fc_118000008282847932.png"
                    }
                }
            ]
        }
    ]
}'
            

可以看到接口返回，说明此刻安全等级生效：

                Python
                
            

                {
    "error": {
        "code": "image_url_unsafe",
        "message": "the content of image_url.url field is unsafe",
        "type": "unsafe_request"
    },
    "id": "as-yqpdsae53u"
}
            

5. 内容安全等级说明

5.1模型安全等级配置范围：

针对不同模态的模型，平台提供差异化的输入/输出（I/O）安全等级配置能力：

文本模型：默认统一配置“文本安全”（注：Ernie X 系列支持输入/输出独立配置）。
- 配置为 none：输入与输出安全均不拦截（全为 none）。
- 配置为其他等级：输入安全适用您选择的等级（如 base），输出安全将默认固定为 standard。
视觉理解模型：支持分别配置“文本输入安全”与“图像输入安全”（部分 Ernie 视觉理解模型仅支持“文本安全”）。
图像生成模型：支持配置“文本输入安全”与“图像输出安全”。

5.2安全等级说明：

根据您使用的模型能力（文本/图像），系统支持配置不同的安全等级：

文本审核安全等级

等级名称	参数值 (safety)	适用场景及说明
去安全方案	none	完全关闭千帆安全检测能力（含输入与输出）。适用于业务方已有完善风控系统，不希望重复检测的场景。
最小安全	minimal	不过滤用户输入，仅对模型输出内容做敏感词兜底拦截。适用于内部使用、特定人群固定场景。
基础方案	base	降低检测强度，放宽部分常规内容的拦截阈值。适用于媒体报道、政务公开、法律助手等垂类专业场景。
弱安全	moderate	在标准检测基础上去除涉黄拦截，保留涉政检测。适用于小说创作、角色扮演（Roleplay）等对情感类内容有需求的场景。
标准方案	standard	平台默认等级。对涉政、涉黄、暴恐、违禁等内容进行标准化拦截。适用于大部分通用的问答、创作场景。
严格方案	strict	最高安全等级。大幅提高对违法信息、色情低俗内容的拦截标准。适用于K12教育、未成年人专项等高敏感业务。

附加配置：小语种安全 (lingual_none)

适用前提：当且仅当文本安全等级选择为「标准方案 ( standard )」时，支持额外开启此配置。
功能说明：开启后，若系统检测到输入内容为小语种，将自动跳过文本安全算子的检测环节。

图像审核安全等级

等级名称	参数值 ( safety )	适用场景及说明
去安全方案	none	完全关闭千帆图像安全检测能力。适用于业务方已有完善图审风控系统的场景。
基础方案	base	仅拦截核心红线（高危涉政、黄赌毒），放宽一般性内容的审核标准。适用于新闻媒体、政务、法律等需要展示真实素材的场景。
弱安全方案	moderate	保留涉政管控，放宽人体特征检测。允许出现医疗用途的人体器官或皮肤展示。适用于医疗健康、病理分析等专业场景。
标准方案	standard	平台默认等级。对涉政、涉黄、暴恐、违禁图片进行标准拦截。适用于大部分通用图像生成/解析场景。
严格方案	strict	最高安全等级。额外增加对敏感人物（娱乐/体育/历史）、版权保护及未成年人内容的严格管控。适用于泛科技 ToC、教育及版权敏感业务。

评价此篇文章

有帮助没帮助

模型广场

干预策略

百度智能云

百度千帆·大模型服务及Agent开发平台