新闻资讯

关注百度智能云最新动态，了解产业智能化最新成果

百度侯震宇：AI涌动，大模型驱动基础设施变革与创新

2024-06-24 09:57:52

当下，大模型大潮席卷而来。随着大模型参数的不断增长，对基础设施的要求也在不断增加，同时也带来了更多的产业机会。6月19日，在九合创投“十二周年年会”上，百度集团副总裁侯震宇以“大模型重构AI基础设施”为主题发表演讲。他强调，大模型快速发展对AI基础设施带来重构要求，也为产业发展带来了新机遇。

大模型发展三大趋势：多场景，多模态，更便宜

侯震宇认为，今年大模型领域呈现出几个显著的趋势：

其一，垂直领域的大模型应用如同加速的列车，一路疾驰。因为大模型本质上是提升效率的有力工具，只有真正深入到具体的行业之中，才能够充分发挥其巨大的作用。如今，大量的推理技术，包括MOE技术的出现，成功地让使用成本得以降低。尤其是在垂直领域中的应用更加经济实用，效果也更为出色，从而促使整体的应用不断加速。

其二，多模态迅速成为热门焦点。大量企业纷纷推出相关能力，极大地改变了我们的工作方式，也让整个应用场景变得愈发丰富多彩。毕竟，在我们如今的日常生活中，更多地处于图片、视频等多元化的信息环境之中。

其三，竞争提前进入白热化，“价格战”已然打响。对于百度而言，更是将两个主力模型免费开放。之所以做出这样的决策，百度更希望通过提供更加便宜且效果不俗的模型，真正推动大模型在实际应用中的落地生根，促进大模型应用的繁荣发展，从而形成产业的正向循环。

侯震宇表示，针对这三大趋势，要求基础设施做到极致高密、极致规模、极致互联，以应对大模型在多元化场景应用中海量数据的吞吐和计算。

大模型构建的“分水岭”下，哪些厂商能走到最后？

2020年，国际人工智能领域根据发展情况，提出Scaling Law定律，其核心观点指的是模型参数越大，模型效果就越好；正因如此，众多的大模型厂商纷纷遵循这一定律，不断地运用更多的数据，在更强大的算力基础设施上，训练出规模更大的模型，期望能够获得更为卓越的模型效果。

侯震宇强调：“大模型并非简单调用，其完整度高且参数大，拆分并行算法复杂、通讯量大，使AI基础设施发生根本性换代。同时，也催生液冷、光互联、光模块等相关产业繁荣发展。”

多芯异构，打造专业的AI基础设施

想要训练好出色的大模型，可能需要几万张甚至十万张卡来构建单一任务集群。这与几百张卡或者几千张卡运行几个任务的情况完全不同，因此规模必须要足够大。

在侯震宇看来，受制于国外芯片购买限制等因素，我国的大模型发展需要采取“能买到什么，就应该充分利用什么”的手段，因此需要将不同的GPU混合部署在一起，百度自主研发了专为大模型训练场景优化的百舸AI异构计算平台，实现万卡级别超大规模异构算力调度，兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片，支持客户以最小的切换成本完成算力适配。百舸3.0训练吞吐能力较之前提升30%，推理吞吐较之前提升60%，任务有效训练时长达到98%，带宽有效性可达95%。

算力驱动下，好的开发体验，孕育『智能涌现』

最后，侯震宇表示，“当GPU逐渐占据上风时，全新OS的出现恰逢其时。今年4月，百度发布了面向AI原生时代的智能计算操作系统——万源，为用户提供极简的开发体验，智能的系统内核和高效的异构算力。”通过对AI原生时代的智能计算平台进行抽象与封装设计，为用户屏蔽掉云原生系统与异构算力的复杂性，提升AI原生应用开发效率与体验。

“潮平两岸阔，风正一帆悬。”大模型驱动的基础设施正迎来前所未有的变革与机遇。随着垂直领域大模型应用加速、多模态技术崛起以及价格普惠的等趋势，其广泛应用将深刻改变我们的生活与工作方式，助力产业正向循环。

新闻资讯

百度侯震宇：AI涌动，大模型驱动基础设施变革与创新

相关产品