接口说明

更新时间：2026-04-13

大模型安全护栏

大模型内容安全标准服务提供用户输入内容分析接口与底座大模型输出内容分析接口，端到端的保障大模型内容安全。

接口	描述
输入内容分析接口	该接口用于检测用户输入文本内容安全性，并针对高风险内容返回拒答提示，针对中低风险内容提供安全代答服务。
输出内容分析接口	该接口用于对底座大模型生成文本内容进行内容安全检测，由于大模型内容安全方案为输入安全+输出安全的多层构建方式，单独调用该接口效果无法保障，因此建议配合“输入内容分析接口”使用。
多模态审核接口	该接口用于检测大模型多模态场景如文生图、图生文、图文生图等场景，含文本、图片、视频、文档等内容是否安全

大模型安全评测服务提供自动化标注接口与内容改写接口。自动化标注接口通过代理访问裁判大模型，实现对输入参数——用户输入（Prompt）与模型生成输出（Response）的风险判断；内容改写接口可实现对测试数据的构造和改写，实现无限生成评测数据的效果。

接口	描述
自动标注接口	面向大模型安全评测场景，针对大模型的用户输入（Prompt）与模型生成输出（Response），自动化识别并标注违法违规、低俗色情、暴力恐怖、偏见歧视、虚假信息、隐私泄露等各类安全风险，支持批量内容处理，辅助用户高效完成模型输入输出的风险标注工作，为大模型安全合规评估、模型迭代优化提供数据支撑。
改写模型接口	面向大模型安全评测场景，支持对测试数据进行构造与改写，无限生成各类安全风险场景的评测数据，辅助扩充安全评测数据集，为大模型安全评估、模型测试优化提供数据支撑，与自动化标注接口协同构建完整评测体系。

接口

描述

自动标注接口

面向大模型安全评测场景，针对大模型的用户输入（Prompt）与模型生成输出（Response），自动化识别并标注违法违规、低俗色情、暴力恐怖、偏见歧视、虚假信息、隐私泄露等各类安全风险，支持批量内容处理，辅助用户高效完成模型输入输出的风险标注工作，为大模型安全合规评估、模型迭代优化提供数据支撑。

改写模型接口

面向大模型安全评测场景，支持对测试数据进行构造与改写，无限生成各类安全风险场景的评测数据，辅助扩充安全评测数据集，为大模型安全评估、模型测试优化提供数据支撑，与自动化标注接口协同构建完整评测体系。

接口访问权限：通过百度云accountid来判断权限

接口鉴权机制：通过百度云accountid来鉴权。

接口安全机制：为保障接口的安全性，我们采取了以下措施：

评价此篇文章

有帮助没帮助