具身智能竞速时刻,百度百舸提供全栈加速方案
GPT OSS 双模型上线,百度百舸全面支持快速部署
PD 分离推理的加速大招,百度智能云网络基础设施和通信组件的优化实践
训练系统的稳定性管理正经历着从「简单运维」到「精密工程」的深刻变革。
百度百舸 DeepSeek 企业套件上线,加速 DeepSeek 融入企业生产业务
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
围绕 AI 原生大背景下,百度智能云在基础公有云的计算、存储、网络以及云原生等产品和技术方面工作分享
如何让硬件算力发挥最大效率,是所有资源运营商和用户非常关注的问题。

本次分享将讲解如何结合 profiling 工具,发现训练与推理的性能瓶颈。

这次分享将端到端分析 AI 推理过程以及痛点,介绍业界典型的推理加速思路和具体方案。
