本次分享将讲解如何结合 profiling 工具,发现训练与推理的性能瓶颈。

现在业界有一个很大的趋势是训练规模越来越大的模型。

这次分享讲解了单机单卡、单机多卡、多机多卡等场景下云原生 AI 的资源调度和管理方法。

百度百舸 · AI 异构计算平台,通过跟自动驾驶场景的深度结合,助力于自动驾驶业务快速发展和迭代。

基于国内顶级 AI 业务锤炼出的深厚经验以及丰富的技术积累,百度智能云正式发布云原生 AI 2.0

当前针对这些瓶颈的主要的加速方案和技术原理,介绍百度智能云在这方面的一些实践成果。

如何让硬件算力发挥最大效率,是所有资源运营商和用户非常关注的问题。

开发者和用户在模型上线第一时间就能切实享受到国产 AI 芯片带来的高效加速体验。
开源 vLLM-Kunlun Plugin,快速适配新模型、跑出极致性能
百度百舸2.0在AI计算、AI存储、AI容器等模块上,能力进行了增强,功能进行了丰富。
