百度百舸新一代大规模分布式推理基础设施,以三大核心支柱破解大模型部署困局!
提升超长上下文本推理吞吐,百度百舸 ESS 技术报告新鲜奉上
开源 vLLM-Kunlun Plugin,快速适配新模型、跑出极致性能
唯有让超节点的部署和运行体验达到「和单机 8 卡机一样」高效、顺畅与稳定,才能尽早且持久兑现性能红利
在 25 年 8 月百度百舸将 Token 双流核心代码正式贡献至 SGLang 开源社区。
AI 计算首席科学家王雁鹏与十字路口主播 Koji 杨远骋展开一场深度对谈
基于 veRL 多模态混训的视频上下文并行,百度百舸提升具身智能强化学习效能
开源生产级 MTP 代码,百舸助力 DeepSeek-V3.2 推理服务 2 倍以上吞吐提升
全球首个超声多模态大模型!百度百舸支撑海豚智能实现高效训练与稳定服务
百度百舸第一时间支持 π0.5 模型微调,助力具身智能企业抢占研发先机