百度百舸 · AI异构计算平台

百度百舸 · AI异构计算平台,包含AI计算、AI存储、AI加速、AI容器四大核心套件,具有高性能、高弹性、高速互联、高性价比等特性。充分汲取了百度异构计算平台多年的技术积累,深度融合推荐、无人驾驶、生命科学、NLP等场景的实践经验,能为AI场景提供软硬一体解决方案,加速AI工程化落地。

  • 方案架构
  • 四大套件
  • 方案优势
  • 应用场景
  • 场景实践
  • 直播活动与文章
  • 相关产品
  • 立即咨询

平台架构

平台架构

四大套件

AI计算
AI存储
AI加速
AI容器
请选择
application-sence-image
AI计算

概述

百度太行提供了基于自研GPU硬件架构X-MAN的高性能实例,充分满足AI单机训练、分布式集群训练、AI推理部署等对算、存、传的性能诉求。

能力描述

异构计算

支持百度自研昆仑AI芯片,多规格商业GPU、FPGA。

X-MAN AI超级服务器

GPU多卡NVLink互联,集群RDMA网络通信。

百度太行弹性裸金属

统一计算架构,云产品无缝接入,性能零损耗。

application-sence-image
AI存储

概述

百度沧海是百度智能云的存储产品体系,基于AI存储架构,从数据上云、数据存储、数据处理和数据加速为计算提供全链条的支撑。

能力描述

高效管理

5级存储+最全生命周期,统一数据湖、智能生命周期管理;

海量高性能

统一海量数据平台,高性能存储、高速缓存极致性能;

智能处理

三大类30+种智能处理能力,存算一体为数据和业务增效。

application-sence-image
AI加速

概述

存训推一体化加速。通过对存储访问、模型训练和推理的加速进一步提速AI任务。

能力描述

数据湖存储加速RapidFS

利用内存与硬盘空间,搭建分布式缓存系统,加速数据集访问,训练效率提升5~10倍;

分布式训练加速AIAK-Training

通过通信加速和算子融合等技术,提升分布式训练的性能,在典型模型场景下吞吐提升50%~150%;

推理加速AIAK-Inference

通过图优化跟算子融合等技术,提升推理的是性能,在典型模型场景下时延降低40%~60%。

application-sence-image
AI容器

概述

AI容器提供GPU显存和算力的共享与隔离,集成PaddlePaddle、TensorFlow、Pytorch等主流深度学习框架,支持AI任务编排、管理等。

能力描述

GPU容器虚拟化

提供GPU资源共享、隔离,支持算力、显存编解码;

AI容器调度

支持Gang、Spread、Binpack调度,GPU架构感知调度;

加速引擎

支持千卡规模自研通信库;算子加速可提升数倍推理效率。

方案优势

高效率

提供AI超级服务器、RDMA网络、大吞吐低延时的并行文件系统、AI增强的容器调度等软硬协同方案,大大提升训练速度和推理效率。

高密度

支持GPU资源共享与隔离、架构感知调度,让容器以更细颗粒度调度使用GPU资源,提升异构资源的容器化部署密度,提升资源利用率。

良好易用性

内置PaddlePaddle、TensorFlow、Pytorch等多种主流深度学习框架,满足不同使用需求和习惯。

多场景部署

可根据业务需求在不同场景部署落地,公有云、IDC等场景均可输出AI异构计算平台的解决方案。

乐高式拼接

AI计算、AI存储、AI容器三大核心产品均可各自独立提供服务,并能够无缝兼容存量的基础设施。

应用场景

营销广告
营销广告

商品推荐、视频推荐、广告精准投放等场景的开发、训练和推理

无人驾驶
无人驾驶

环境感知、路径规划、行为决策与控制等场景中的开发、训练等

生物科技
生物科技

生物基因、药品研发等高性能、密集型计算场景的开发、训练、推理

语音语义
语音语义

问答系统、文本分析、智能翻译等场景的开发、训练和推理

计算机视觉
计算机视觉

人脸识别、静态图像识别、视频/监控识别、医疗影像诊断等场景的开发、训练、推理

场景实践

营销推荐
无人驾驶
请选择
application-sence-image
营销推荐

场景描述

以推荐、广告CTR为核心场景的电商、短视频等业务,面对千亿维稀疏特征、TB级参数模型,模型开发、训练、推理过程中有大量GPU使用场景,训练场景下有大量数据并行和模型并行,GPU之间通信非常频繁、存储吞吐量较高。

业务价值

相比于CPU训练集群,性价比提升5~40倍

多个模型,CTR提升显著

application-sence-image
无人驾驶

场景描述

无人驾驶训练包括感知、决策规划、定位等场景,其中感知场景GPU使用量较多,感知场景的点云与CV场景模型结构本身比较简单,但有千万到亿条海量训练数据,需要数据并行训练。感知环节输出样本,输入给预测+决策模型进行训练

业务价值

GPU资源利用率提升50%以上;

极大减少自建基础设施维护成本。

云智公开课

第一期
第二期
第三期
第四期
请选择
application-sence-image
第一期

课程主题

云原生 AI 的资源调度和 AI 工作流引擎设计分享

课程时间

12 月 8 日 16:00-17:00

直播亮点

了解单机单卡、多机多卡、多机多卡等场景下云原生 AI 的资源调度方法。

了解 AI 工作流引擎 PaddleFlow 打通底层资源和上层业务的架构和细节,提升 AI 工程效率。

application-sence-image
第二期

课程主题

「 AI训练 」加速原理解析与工程实践分享

课程时间

12 月 15 日 19:00-20:00

直播亮点

系统性了解各类 AI 模型训练方案下的 AI 训练瓶颈

全面掌握 AI 加速训练的各种方法的原理

了解百度百舸平台的 AI 训练加速套件 AIAK-Training 的工程实践效果

application-sence-image
第三期

课程主题

「 AI推理 」加速原理解析与工程实践分享

课程时间

12 月 22 日 19:00-20:00

直播亮点

了解 AI 推理加速的核心原理、评估指标以及相应的优化方法

了解百度百舸平台的 AI 推理加速套件 AIAK-Inference 的工程实践效果

application-sence-image
第四期

课程主题

视觉大模型训练与推理优化

课程时间

12 月 27 日 19:00-20:00

直播亮点

何结合 profiling 工具,发现训练与推理的性能瓶颈;

结合 GPU 产品特点,利用算子融合、低精度等技术,以及 Faster Transformer 最佳实践,提升性能并加快吞吐。

相关产品

  • 弹性裸金属服务器BBC

    百度太行提供了基于自研GPU硬件架构X-MAN的高性能实例,算力百分百用于真实业务,零损耗高性能,充分满足AI单机训练、分布式集群训练、AI推理部署等对算、存、传的性能诉求,极大提升企业端到端AI业务的部署效率。

  • 并行文件存储PFS

    百度沧海存储产品体系基于AI存储架构,从数据上云、数据存储、数据处理和数据加速为计算提供全链条的支撑。并行文件存储PFS,支持对象存储数据连接,实现冷热数据真正联通,成本降低60%以上,具备超高性能、超低延迟。

  • 容器引擎服务CCE

    容器引擎服务CCE(AI容器)提供GPU显存和算力的共享与隔离,集成PaddlePaddle、TensorFlow、Pytorch等主流深度学习框架,支持AI任务编排、管理等。帮助企业提高GPU资源利用率、提升AI训练速度,实现降本增效。

高性能低成本的异构计算平台,企业上云智能化创新最佳选择

未登录
需要实名认证