支持按不同风险分类、攻击类型生成评测数据;支持上传自定义评测数据
对QA对进行自动化标注分析,综合判断回答是否安全;同时可根据评测结果自动生成完整评测报告
针对评测数据结果进行可视化效果呈现,可通过数据统计快速定位风险
提供每日舆情热点事件,第一时间掌握国内外舆情动态及模型潜在舆情风险
储备丰富多模态数据,支持多模场景评测
提供改写大模型,构造无限量评测数据
评估模型安全性、鲁棒性与理解能力
保证指令执行过程中的安全性
根据舆情事件自动构造风险数据样本用于测试
支持例行化执行舆情风险测试
平台提供全开放、高灵活的待测模型配置能力
完成基础配置,即可 启动全流程自动化评测