关注百度智能云最新动态,了解产业智能化最新成果
当下,大模型大潮席卷而来。随着大模型参数的不断增长,对基础设施的要求也在不断增加,同时也带来了更多的产业机会。6月19日,在九合创投“十二周年年会”上,百度集团副总裁侯震宇以“大模型重构AI基础设施”为主题发表演讲。他强调,大模型快速发展对AI基础设施带来重构要求,也为产业发展带来了新机遇。
大模型发展三大趋势:多场景,多模态,更便宜
其一,垂直领域的大模型应用如同加速的列车,一路疾驰。因为大模型本质上是提升效率的有力工具,只有真正深入到具体的行业之中,才能够充分发挥其巨大的作用。如今,大量的推理技术,包括MOE技术的出现,成功地让使用成本得以降低。尤其是在垂直领域中的应用更加经济实用,效果也更为出色,从而促使整体的应用不断加速。
其二,多模态迅速成为热门焦点。大量企业纷纷推出相关能力,极大地改变了我们的工作方式,也让整个应用场景变得愈发丰富多彩。毕竟,在我们如今的日常生活中,更多地处于图片、视频等多元化的信息环境之中。
其三,竞争提前进入白热化,“价格战”已然打响。对于百度而言,更是将两个主力模型免费开放。之所以做出这样的决策,百度更希望通过提供更加便宜且效果不俗的模型,真正推动大模型在实际应用中的落地生根,促进大模型应用的繁荣发展,从而形成产业的正向循环。
侯震宇表示,针对这三大趋势,要求基础设施做到极致高密、极致规模、极致互联,以应对大模型在多元化场景应用中海量数据的吞吐和计算。
大模型构建的“分水岭”下,哪些厂商能走到最后?
侯震宇强调:“大模型并非简单调用,其完整度高且参数大,拆分并行算法复杂、通讯量大,使AI基础设施发生根本性换代。同时,也催生液冷、光互联、光模块等相关产业繁荣发展。”
多芯异构,打造专业的AI基础设施
在侯震宇看来,受制于国外芯片购买限制等因素,我国的大模型发展需要采取“能买到什么,就应该充分利用什么”的手段,因此需要将不同的GPU混合部署在一起,百度自主研发了专为大模型训练场景优化的百舸AI异构计算平台,实现万卡级别超大规模异构算力调度,兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持客户以最小的切换成本完成算力适配。百舸3.0训练吞吐能力较之前提升30%,推理吞吐较之前提升60%,任务有效训练时长达到98%,带宽有效性可达95%。
算力驱动下,好的开发体验,孕育『智能涌现』
“潮平两岸阔,风正一帆悬。”大模型驱动的基础设施正迎来前所未有的变革与机遇。随着垂直领域大模型应用加速、多模态技术崛起以及价格普惠的等趋势,其广泛应用将深刻改变我们的生活与工作方式,助力产业正向循环。