组件概述
更新时间:2022-07-14
组件概述
组件是百度智能云容器引擎CCE提供的扩展功能安装包,您可以根据您的业务需求选择安装所需的组件。您可以在此对组件进行安装、更新配置、卸载等操作。
可选安装的组件类型
目前组件支持云原生AI组件、混部组件,具体组件如下表所示:
组件名称 | 类型 | 组件介绍 |
---|---|---|
CCE GPU Manager | 云原生AI | 一系列GPU device plugin的集合,结合配套的scheduler可以实现复杂场景下的GPU资源调度能力。 |
CCE Deep Learning Frameworks Operator | 云原生AI | 主流深度学习框架operator组件,结合CCE AI Job Scheduler,可实现直接在CCE上进行深度学习模型训练。 |
CCE RDMA Device Plugin | 云原生AI | RDMA通信设备device plugin。 |
CCE AI Job Scheduler | 云原生AI | 任务调度组件,支持调度管理各种AI任务,结合CCE Deep Leaning Frameworks Operator,可实现直接在CCE上进行深度学习模型训练。 |
Fluid | 云原生AI | 基于Kubernetes场景下的的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI 应用等。 |
CCE Hybrid Manager | 混部调度 | 基于Kubernetes场景下在线、离线作业混部管理组件,通过将作业进行混部,利用在线作业剩余空闲资源运行离线作业,提高集群资源利用率。 |
集群默认安装的组件
CCE会在集群中默认安装一些组件。
这些组件都有各自承担的功能,一般不能删除。
具体组件列表如下,除非特殊说明,否则均部署于kube-system命名空间
CCE标准集群(自定义和托管集群)
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | CoreDNS | 所有集群 | Deployment coredns | 为集群内K8s Service等资源提供DNS配置 |
网络 | KubeProxy | 所有集群 | DaemonSet kube-proxy | 为K8s Service配置代理规则 |
网络 | VPC Native | 所有集群 | DaemonSet cce-cni-node-agent | 配置容器网络、路由等 |
网络 | IP Masq Agent | 所有集群 | DaemonSet cce-ip-masq-agent | 为集群访问节点IP和ClusterIP网段外地址时配置SNAT规则 |
网络 | Node Local DNS | 开启NodeLocalDNS选项的集群 | DaemonSet node-local-dns | 提供Node Local DNS支持 |
网络 | Calico Felix | 开启Network Policy Felix的集群 | DaemonSet cce-calico-felix | 为集群实现Network Policy |
流量接入 | CCE LB Controller | 所有集群 | Deployment cce-lb-controller | 为LoadBalancer Service配置BLB与EIP |
GPU | Nvidia Device Plugin | 所有集群 | DaemonSet nvidia-device-plugin-daemonset | 为集群配置GPU资源 |
节点管理 | Cloud Node Controller | 所有集群 | Deployment cce-cloud-node-controller | 为集群新加入的Node配置Label等属性 |
节点管理 | Node Feture Discovery | 所有集群 | Deployment nfd-master DaemonSet nfd-worker | 为集群Node添加一些硬件Label |
监控 | Telegraf | 所有集群(托管集群以二进制方式部署) | DaemonSet cce-telegraf | 采集监控数据 |
监控 | Kube State Metrics | 所有集群(托管集群以二进制方式部署) | StatefulSet kube-state-metrics | 采集监控数据 |
监控 | Metrics Server | 所有集群 | Deployment metrics-server metrics-server-scraper | 采集监控数据 |
CCE云边集群
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | Cloud Tunnel Core DNS | 所有集群 | Deployment cce-tunnel-coredns | 为云边通道提供DNS劫持服务 |
网络 | Core DNS Service Topology | 所有集群 | BatchDeployment coredns | 为集群每个边缘站点提供DNS服务 |
网络 | Cloud Edge Cluster Topology Server | 所有集群 | DaemonSet service-topology | 提供应用服务的流量拓扑能力 |
网络 | KubeProxy | 所有集群 | DaemonSet kube-proxy | 为K8s Service配置代理规则 |
网络 | Cloud Edge Cluster Calico | 所有集群 | DaemonSet calico-node | 为集群提供容器网络服务 |
网络 | Cloud Tunnel | 所有集群 | DaemonSet cloud-tunnel | 集群云边通道的中心服务 |
网络 | Edge Tunnel | 所有集群 | DaemonSet edge-tunnel | 集群云边通道的边缘服务 |
网络 | Cloud Edge Cluster BEC LB Controller | 所有集群 | Deployment load-balancer-controller | 为集群每个边缘站点提供LB访问服务 |
服务分组 | Cloud Edge Cluster Service Group Controller | 所有集群 | Deployment service-group-controller | 提供应用的服务分组能力 |
监控 | Cloud Edge Cluster Metrics Server | 所有集群 | Deployment metrics-server | 为集群提供监控数据查询服务 |
边缘自治 | EdgeHub | 所有集群 | Static Pod edgehub | 为集群提供边缘节点自治服务 |
GPU | Nvidia Device Plugin | 所有集群 | DaemonSet nvidia-device-plugin-daemonset | 为集群配置GPU资源 |
节点管理 | Cloud Node Controller | 所有集群 | Deployment cce-cloud-node-controller | 为集群新加入的Node配置Label等属性 |
CCE纯边集群
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | CoreDNS | 所有集群 | Deployment coredns | 为集群内K8s Service等资源提供DNS配置 |
网络 | KubeProxy | 所有集群 | DaemonSet kube-proxy | 为K8s Service配置代理规则 |
网络 | CCE Calico | 所有集群 | Deployment calico-kube-controllers DaemonSet calico-node |
集群网络插件 |
GPU | Nvidia Device Plugin | 所有集群 | DaemonSet nvidia-device-plugin-daemonset | 为集群配置GPU资源 |
GPU 共享集群
在CCE 标准集群的基础上,增加部署以下组件:
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
GPU | Kong Ming Nvidia GPU | 所有集群 | DaemonSet cce-gpu-share-device-plugin | 为集群配置GPU资源 |
Serverless集群
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | CCE Service Controller | 所有集群 | Deployment cce-service-controller | 为LoadBalancer Service配置BLB与EIP |