百度百舸 Al Stack
百度百舸 AI Stack 专为中小企业打造,以轻量化底座、训推一体、统一运营为核心,提供一体化 AI 基础设施方案,助力企业快速构建智能算力设施。

百度百舸 AI Stack 轻量GPU云

百度百舸 AI Stack,是面向企业打造的轻量化 GPU 云平台。依托轻量化技术底座、训推一体化加速能力与统一管理控制台,聚焦中小规模算力需求场景,一站式提供支撑 AI 应用全生命周期的基础设施;支持自建服务托管、小型智算中心搭建、多云资源统一管控等部署模式,助力企业高效完成轻量化 AI 底座升级转型,实现智能算力快速落地、稳定可控、高效复用。

我们能提供

轻量化部署

三节点高可用部署,管控面支持 GPU 节点混部,通过轻量 BCC 实现细粒度虚拟机资源灵活供给。

集群推理能力

主流大模型 PD 分离一键部署,单卡吞吐提升 4 倍,适配 Agent 场景,支持 128K-200K 超长上下文推理。

软硬一体架构

平台搭载完善硬件监控体系,实时监测交换机、芯片等核心设备;依托 PD 分离核心能力,全面提升整体推理服务性能。

生态开放

支持基于客户现有第三方 K8S 集群完成平台部署与资源纳管,无缝对接存量集群环境。

轻量化部署

应用场景

存量算力价值释放
无需新建平台,统一纳管企业存量算力资源,实现利用率与运维效率双提升,助力降本增效。
国产化全栈兼容底座
兼容国产生态与多模型,一站式解决适配难题,加速 AI 业务合规落地。
业务级 AI 快速落地
适配碎片化定制化业务场景,提供高可靠、高精度推理支撑,低门槛实现业务智能化升级。