新闻资讯

关注百度智能云最新动态,了解产业智能化最新成果

百度侯震宇:AI涌动,大模型驱动基础设施变革与创新

2024-06-24 09:57:52

当下,大模型大潮席卷而来。随着大模型参数的不断增长,对基础设施的要求也在不断增加,同时也带来了更多的产业机会。6月19日,在九合创投“十二周年年会”上,百度集团副总裁侯震宇以“大模型重构AI基础设施”为主题发表演讲。他强调,大模型快速发展对AI基础设施带来重构要求,也为产业发展带来了新机遇。



大模型发展三大趋势:多场景,多模态,更便宜


侯震宇认为,今年大模型领域呈现出几个显著的趋势:

其一,垂直领域的大模型应用如同加速的列车,一路疾驰。因为大模型本质上是提升效率的有力工具,只有真正深入到具体的行业之中,才能够充分发挥其巨大的作用。如今,大量的推理技术,包括MOE技术的出现,成功地让使用成本得以降低。尤其是在垂直领域中的应用更加经济实用,效果也更为出色,从而促使整体的应用不断加速。


其二,多模态迅速成为热门焦点。大量企业纷纷推出相关能力,极大地改变了我们的工作方式,也让整个应用场景变得愈发丰富多彩。毕竟,在我们如今的日常生活中,更多地处于图片、视频等多元化的信息环境之中。


其三,竞争提前进入白热化,“价格战”已然打响。对于百度而言,更是将两个主力模型免费开放。之所以做出这样的决策,百度更希望通过提供更加便宜且效果不俗的模型,真正推动大模型在实际应用中的落地生根,促进大模型应用的繁荣发展,从而形成产业的正向循环。


侯震宇表示,针对这三大趋势,要求基础设施做到极致高密、极致规模、极致互联,以应对大模型在多元化场景应用中海量数据的吞吐和计算。


大模型构建的“分水岭”下,哪些厂商能走到最后?


2020年,国际人工智能领域根据发展情况,提出Scaling Law定律,其核心观点指的是模型参数越大,模型效果就越好;正因如此,众多的大模型厂商纷纷遵循这一定律,不断地运用更多的数据,在更强大的算力基础设施上,训练出规模更大的模型,期望能够获得更为卓越的模型效果。

侯震宇强调:“大模型并非简单调用,其完整度高且参数大,拆分并行算法复杂、通讯量大,使AI基础设施发生根本性换代。同时,也催生液冷、光互联、光模块等相关产业繁荣发展。”


多芯异构,打造专业的AI基础设施


想要训练好出色的大模型,可能需要几万张甚至十万张卡来构建单一任务集群。这与几百张卡或者几千张卡运行几个任务的情况完全不同,因此规模必须要足够大。

在侯震宇看来,受制于国外芯片购买限制等因素,我国的大模型发展需要采取“能买到什么,就应该充分利用什么”的手段,因此需要将不同的GPU混合部署在一起,百度自主研发了专为大模型训练场景优化的百舸AI异构计算平台,实现万卡级别超大规模异构算力调度,兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持客户以最小的切换成本完成算力适配。百舸3.0训练吞吐能力较之前提升30%,推理吞吐较之前提升60%,任务有效训练时长达到98%,带宽有效性可达95%。


算力驱动下,的开发体验,孕育『智能涌现


最后,侯震宇表示,“当GPU逐渐占据上风时,全新OS的出现恰逢其时。今年4月,百度发布了面向AI原生时代的智能计算操作系统——万源,为用户提供极简的开发体验,智能的系统内核和高效的异构算力。”通过对AI原生时代的智能计算平台进行抽象与封装设计,为用户屏蔽掉云原生系统与异构算力的复杂性,提升AI原生应用开发效率与体验。



“潮平两岸阔,风正一帆悬。”大模型驱动的基础设施正迎来前所未有的变革与机遇。随着垂直领域大模型应用加速、多模态技术崛起以及价格普惠的等趋势,其广泛应用将深刻改变我们的生活与工作方式,助力产业正向循环。