百度智能云

百度智能云百度智能云

产品架构

产品架构

最新功能

云原生AI
云原生AI
助力企业快速落地离线训练、在线推理等AI场景。
申请公测
云原生混部
云原生混部
全面提升资源利用率,助力企业降本30%+
申请公测

产品优势

稳定可靠

百度内部多年大规模容器集群实践经验,支撑了包括无人驾驶、金融、广告等众多核心业务。

01

高可用

提供跨可用区的能力,保障集群不受单一物理机房故障的影响。监测集群状态,自动化伸缩容器。

02

render.title

操作便捷

提供了一键式的资源和服务创建,同时无缝链接其他所需的百度智能云资源,用户只需关注业务层级的开发。

03

AI加速

结合Kubernetes对资源的调度和任务编排,提供多种深度学习框架的AI任务训练和应用部署能力。

04

产品功能

灵活的集群管理
根据需求,选择不同的地域创建和删除集群,提供多种服务器类型自由混布。
容器生命周期管理
支持全部原生k8s资源,提供丰富的网络、存储、调度、路由、权限配置。
云上服务深度整合
整合VPC,提供安全、高性能的部署方案;整合负载均衡BLB,提供容器的访问能力;整合云存储,提供持久化存储能力。
高性能弹性伸缩
集群扩缩容得到Kubernetes CA组件官方支持。支持多伸缩组,多个节点模板,更加灵活且符合开源原生的使用模式。
云原生AI
基于Kubernetes实现对PaddlePaddle、TensorFlow、Pytorch等深度学习框架的AI任务编排、管理,支持GPU资源显存和算力共享与隔离。
云原生混部
无损嵌入kubernetes集群,整合混部调度策略、单机内核隔离,资源运营大盘、智能应用画像等能力,对客户不同类型业务进行混合部署,全面提升资源利用率。

最佳实践

application-sence-image
PaddlePaddle Cloud深度学习

概述

集成PaddlePaddle Cloud,提供基于Kubernetes、Docker和paddlecloud的云端一键式分布式训练解决方案。

实践过程

训练环境准备

部署PaddlePaddle Cloud集群

提交分布式训练

联动Kubernetes创建训练任务,以及需要的内容。

开始分布式训练

使用Kubernetes Dashboard、Kubectl监控训练任务和容器状态。

客户案例

弹性、高可用的云端Kubernetes容器运行平台,助力系统架构微服务化、DevOps运维、AI应用深度学习容器化等场景。

  • 稳定可靠
  • 高可用
  • 操作便捷

使用指南

相关产品

云服务器BCC
云服务器BCC
高性能、高可靠、安全稳定的弹性计算服务
了解详情
私有网络VPC
私有网络VPC
灵活自定义地址空间、提供安全隔离的网络环境
了解详情
弹性公网IP EIP
弹性公网IP EIP
为用户访问公网提供IP及带宽服务
了解详情
负载均衡BLB
负载均衡BLB
均衡应用流量,消除故障节点,提高业务可用性
了解详情
容器镜像服务CCR
容器镜像服务CCR
分布式、全托管的容器镜像管理服务
了解详情
Prometheus监控服务
Prometheus监控服务
全托管、高可用、可扩展、易操作的Prometheus监控
CCE私有化版 免费咨询百度智能云专属顾问,为您量身定制产品推荐方案 立即咨询
CCE私有化版 为您量身定制产品推荐方案 立即咨询
未登录
需要实名认证