百度百舸基于昆仑芯 XPU 完成 GLM-4.x 在 SGLang 与 vLLM 上的适配落地
唯有让超节点的部署和运行体验达到「和单机 8 卡机一样」高效、顺畅与稳定,才能尽早且持久兑现性能红利
提升超长上下文本推理吞吐,百度百舸 ESS 技术报告新鲜奉上
具身智能竞速时刻,百度百舸提供全栈加速方案
百度智能云如何帮助大家打通大模型技术到商业落地的最后一公里,把握住智能时代的机遇。
基于 veRL 多模态混训的视频上下文并行,百度百舸提升具身智能强化学习效能
在 25 年 8 月百度百舸将 Token 双流核心代码正式贡献至 SGLang 开源社区。
百度百舸助力北京人形打造开源具身多模态大脑模型 Pelican-VL1.0
AI 计算首席科学家王雁鹏与十字路口主播 Koji 杨远骋展开一场深度对谈
2 天速通小米 MiMo Flash V2,vLLM-Kunlun Plugin 助力昆仑芯高效适配