大模型安全评测平台
以国家网信办等七部门联合公布的《生成式人工智能服务管理办法》和网安标委的《生成式人工智能服务安全基本要求》为基础,针对性构造AI评测框架、数据与标准,对大模型进行安全评测,检测安全漏洞,推动大模型安全风控升级,促进大模型生态健康发展的效果。
  • 海量题库
    无限构造数据风险类型全覆盖
  • 智能评测
    自动标注数据准确率98%以上
  • 开箱即用
    操作便捷适用不同AI应用

产品功能

构造评测数据

支持按不同风险分类、攻击类型生成评测数据;支持上传自定义评测数据

风险分类完备
无限构造数据
多种改写方式
了解详情

自动生成结果

对QA对进行自动化标注分析,综合判断回答是否安全;同时可根据评测结果自动生成完整评测报告

自动标注结果
生成评估依据
报告内容全面
了解详情

详细数据看板

针对评测数据结果进行可视化效果呈现,可通过数据统计快速定位风险

实时监测
按需查询
模型对比
了解详情

舆情风险监测

提供每日舆情热点事件,第一时间掌握国内外舆情动态及模型潜在舆情风险

高风险舆情
例行化评测
覆盖多领域
了解详情
构造评测数据

产品优势

  • 海量题库
    海量题库
    海量题库
    多模评测题目改写
    海量题库
    海量题库
    多模评测

    储备丰富多模态数据,支持多模场景评测

    题目改写

    提供改写大模型,构造无限量评测数据

  • 对抗攻击
    对抗攻击
    对抗攻击
    语义攻击行为攻击
    对抗攻击
    对抗攻击
    语义攻击

    评估模型安全性、鲁棒性与理解能力

    行为攻击

    保证指令执行过程中的安全性

  • 舆情监控
    舆情监控
    舆情监控
    舆情测试例行执行
    舆情监控
    舆情监控
    舆情测试

    根据舆情事件自动构造风险数据样本用于测试

    例行执行

    支持例行化执行舆情风险测试

  • 灵活适配
    灵活适配
    灵活适配
    自定义配置开箱即用
    灵活适配
    灵活适配
    自定义配置

    平台提供全开放、高灵活的待测模型配置能力

    开箱即用

    完成基础配置,即可 启动全流程自动化评测

应用场景

大模型备案服务
提供备案需要的内容安全自评估报告和评测题库
大模型备案服务
大模型安全运营
对模型进行常态化测试,及时发现风险漏洞精准防护
大模型安全运营
大模型深度检测
全方位评估大模型安全效果,出具评估报告
大模型深度检测