百度二十余年安全对抗的总结与提炼,围绕百度【文心大模型】安全实践经验,推出以AI安全为核心的大模型安全解决方案,从大模型全生命周期视角出发,方案涵盖大模型训练/精调/推理、大模型部署、大模型业务运营等关键阶段所面临的安全风险与业务挑战,提供全套安全产品与服务,助力企业构建平稳健康、可信可靠的大模型服务。
大模型训练数据如何脱敏?如何解决敏感数据上云后的数据隐私保护? 在大模型的私有化预训练时,多个共建者之间的数据如何共享? 大模型精调与推理阶段,数据要素流通过程如何避免数据泄露?
大模型部署过程中可能受到对抗性攻击的威胁、以及攻击云服务器来窃取模型及其数据 部署的模型在传输和存储过程中可能被篡改 如何建立访问控制机制,确保可信用户/系统访问模型和相关资源。
用户输入的prompt存在违规、恶意引导等内容安全问题 大模型生成内容存在违法违规、偏见歧视、违反社会价值观、个人隐私、恐怖/极端主义等多模态内容安全问题。
大模型业务运营过程中出现的账号安全问题、权益侵占等业务安权问题 用户提问行为过程中也容易出现AIGC盗爬、垃圾提问、投毒反馈、频率突破、接口攻击等问题。
方案涵盖大模型全生命周期,包含训练/精调/推理、部署、业务运营等关键阶段所面临的安全风险与业务挑战,提供全套安全产品与服务,助力企业构建平稳健康、可信可靠的大模型服务。
百度安全可同时支持公有云、私有化两种场景下的横向联邦软件方案,使得数据不出域的情况下,完成大模型的预训练、精调,解决数据传输过程中被截获的风险;
百度安全通过完全硬件化的CPU+GPU保护方案保障模型和数据安全的方式,解决大模型在部署阶段面临的模型记忆泄露以及公有云场景下数据隐私保护问题;
针对大模型在公有云推理阶段数据隐私保护问题,百度点石隐私计算团队提供同态密码学软件解决方案,仅需要在客户端安装一个插件,利用同态密码学技术进行密态数据计算。
面向语言理解、语言生成等NLP场景,具备超强语言理解能力以及对话生成、文学创作等能力。创 新性地将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化。
基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力。
基于知识增强的跨模态语义理解关键技术,可实现跨模态检索、图文生成、图片文档的信息抽取等应用的快速搭建,落实产业智能化转型的AI助力。
大模型服务商与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施。
依托百度安全在数据安全及隐私保护方向领先的安全技术(MPC、TEE、DP)、AI技术(图像识别、自然语言处理)长期积累、以及模型保护和业务安全持续对抗,可有提供专业的大模型安全方案。
依托百度安全大模型安全保障实践工作总结,从大模型全生命周期视角出发,方案涵盖大模型训练/精调/推理、大模型部署、大模型业务运营在内全部关键阶段。
方案可以提供包含NLP自然语言大模型、CV大模型、跨模态大模型、行业大模型在内多种模型应用场景的安全防护,涵盖云上精调、私有化共建、以及安全咨询等多样的安全服务。