元数据面 数据湖系列之二 | 打造无限扩展的云存储系统,元数据存储底座的设计和实践 数据面 面向百度网盘的大规模数据面存储架构思考与设计 大模型存储 面向大模型的存储加速方案设计和实践 加速智能计算 释放数据价值 百度沧海 · 存储提供全面的存储服务,覆盖中心、边缘、混合云、多云等各类场景,能够为 AI 、HPC、大数据、存储分发、归档备份、混合云容灾备份等各类业务提供高可靠的存储服务。
方案价值与优势 宏观与微观综合分析 遥感解译提供城市宏观布局分析,时空大数据分析提供区域微观人群、职住、交通、产业等分析。 多模特征融合 遥感影像融合百度时空数据特征,提升模型精度和泛化能力。 支持自主训练 内置百度自研遥感解译预训练模型,支持在线标注、训练、发布模型,适应用户特定场景,零编程基础,简单易用。 自主可控 基于百度昆仑AI 芯片和飞桨深度学习框架构建,具有自主可控、安全可靠的优势。
整体采集量为87万条藏语语音,覆盖安多、康巴、卫藏三个藏语方言区,而藏区采集会面对安全风险大、质检难度高等重重挑战。百度团队联系到当地资源布点,并派遣项目经理在西藏,青海多地指导采集。整个周期共1个半月,最终交付数据92万条,验收合格率高于95%,满足客户交付要求。 手机厂商 某手机厂商新机型发布在即,采用人脸识别解锁技术,需采集多国人种人脸照片用于模型训练。
数据处理 支持数据清洗、数据增强、数据生成,提升数据质量。 模型开发 全功能开发 提供Notebook建模、作业建模、可视化建模等模型训练方法;提供特征库,实现特征共享和复用。 零代码开发 提供EasyDL图像、文本、语音、视频、结构化数据、场景建模等工具。 大模型开发 提供专属大模型开发工具,支持SFT全量更新、LoRA、Post-pretrain等训练方法。
持明细数据上的聚合cube模型,万亿数据集上毫秒级响应。 高可用、高可靠 无单点依赖,所有模块都可线性扩展;元数据和数据多副本存储,自动数据修复。 易用、工具丰富 提供数据集成入仓,数据仓库可视化分析,数据权限管理工具等。 客户案例 百度统计 流量与用户行为分析、网络推广效果分析、商业运营策略分析的重要工具。
城市管理多维可视化分析 依托大数据分析挖掘技术,为城市管理提供决策支持:城市治理成效专题、事件态势感知专题、城市资源分配专题、城市专项行动专题…… 方案价值与优势 城市事件采集智能化 基于百度人工智能优势,实现40+ 种城市管理事件算法的应用,为城市管理事件识别采集提供新动能。 事件分发处置智能化 基于百度数据服务中心,结合知识图谱能力,为事件分发处置智能提供历史参考依据,提升办事效率。
需要专业人员来“翻译”引导;现在,大模型把所有的政务知识和术语融会贯通,让每个人都有了专属的咨询、办事助手,用口语交流几分钟就把事情办好,让办事服务有了“唠家常”一样的全新体验 政府办公“新”动能 利用人工智能、大数据等数智技术手段,构建跨部门、跨层级、跨地域、跨系统、跨业务的协同工作平台,推动集约建设、资源共享、业务协同。
公路一张图 依托行业领先的一体化地图融合计算引擎、空间孪生引擎、实时孪生引擎、信息发布引擎和可视化渲染引擎5大核心引擎,快速实现大规模交通场景数字孪生,通过强大的二次开发能力和各类工具,支撑上层建管养运服业务应用开发,实现以“图”为抓手,整合业务数据,构建数字底座;以“图”应用为纽带,打破业务壁垒,充分挖掘数据价值。
装备健康管理与预测性维护平台 通过数据接入、数据治理、可视化建模技术,构建面向不同装备的健康管理与预测性维护业务中台,提供装备实时状态监控、故障诊断、隔离、性能和寿命预测等相关模型管理及应用开发服务,让装备真正做到状态维护和预测性维护。
社会治理大数据基础不牢 特色大数据研判分析应用不足 基层服务能力及共建共治不足 缺乏专业的数据运营团队 方案架构 围绕政治安全、社会治安、社会矛盾、公共安全、网络安全等5大风险防范,依托大数据和人工智能技术,用技术赋能市域社会治理,构建智辅决策中心、智防风险中心、智助服务中心、智促参与中心、智能指挥中心、智考评价中心等6大应用中心,连同矛盾调解中心、心理咨询中心、智安小区平台等3个亮点应用,实现市域治理体制现代化