2023年,基于文心大模型安全实践经验,百度安全推出以AI安全为核心的大模型安全解决方案,从大模型全生命周期视角出发,方案涵盖大模型训练/精调/推理、大模型部署、大模型业务运营等关键阶段所面临的安全风险与业务挑战,提供全流程的包含 数据安全与隐私保护 方案、模型保护方案、AIGC 内容合规方案、以及业务运营 风控 方案的安全产品与服务,同时结合以攻促防守的思路建立AIGC 内容安全蓝军评测能力,对大模型实现例行化的安全评估
数据回流功能,完成了 AI 应用生命周期的闭环,通过初试数据完成模型训练和服务部署,利用新采集的线上数据不断更新模型。通过该方式可以有效的解决线上数据特征漂移的问题。 当前在 BML 中,可以在视觉类应用中使用数据回流功能。
功能使用 智能预测功能的使用可参考 模型训练
API接口文档 接口功能描述 本接口用于删除数据集特定版本。
点击下一张图片/切换图片即可完成保存 注意,在标注过程中请不要标注太多背景信息,同时需要将图中的每个目标都进行标注 标注技巧说明 快速标注相同标签下的多张图片 如果一批图片的标签相同,建议使用右侧 标签置顶 的功能,把当前希望快速标注的标签置顶,同时点击锁定icon,这样在标注过程中只需在左侧画框即可。
开启跨源查询功能 跨源查询是指,多个不同的数据源之间的交叉查询,如一个 MySQL 数据源和一个 Oracle 数据源之间的数据交叉分析。详细说明见 跨源查询 。
开启自助取数功能 Sugar BI 的自助取数功能可以帮助您将所需要的数据以 CSV 形式下载到本地,详见 自助取数 。 在私有部署中要使用该功能,您需要额外安装部署一套存储系统,用来存储自助取数所生成的 CSV 文件,并且在 Sugar BI 的平台环境变量中加入启用配置(Sugar BI 的 4.0.1 及之后版本才支持)。
案例故事 核心诉求 1) 社交平台的繁荣强依赖用户不断生产内容,平台内容的安全性是对社区氛围、用户体验的重要保障,因此内容监管是社交平台必不可少的环节,仅仅通过平台的安全宣导措施远远不能杜绝违规内容,如何精准地过滤有风险的内容、最大化的降低平台的安全风险,是猫爪风控的当务之急; 2) 用户上传的内容数量巨大,每天需要判断数十万的疑似安全隐患的图像/文本内容,人工审核存在判断标准上的主观性差异,同时需要耗费大量的人力成本
流日志 流日志功能用于记录VPC中云服务器实例发送和接受的网络流信息,可以为用户提供流量分析、可视化、故障诊断/定位以及网络架构调优的能力。 通过流日志可保存故障现场,帮助快速定位网络故障,及时解决问题根源,比如可以快速定位云服务器不可访问是否为安全组或 ACL 设置不合理。
数据增强算子参考 适用于图像分类的数据增强算子 算子名 功能 ShearX 剪切图像的水平边 ShearY 剪切图像的垂直边 TranslateX 按指定距离(像素点个数)水平移动图像 TranslateY 按指定距离(像素点个数)垂直移动图像 Rotate 按指定角度旋转图像 AutoContrast 自动优化图像对比度 Contrast 调整图像对比度 Invert 将图像转换为反色图像 Equalize