组件概述
更新时间:2024-03-28
组件概述
组件是百度智能云容器引擎CCE提供的扩展功能安装包,您可以根据您的业务需求选择安装所需的组件。您也可以对组件进行安装、更新配置、卸载等操作。
可选安装的组件类型
目前组件支持云原生AI组件、混部组件,具体组件如下表所示:
组件名称 | 类型 | 组件介绍 |
---|---|---|
CCE GPU Manager | 云原生AI | 一系列GPU device plugin的集合,结合配套的scheduler可以实现复杂场景下的GPU资源调度能力。 |
CCE Deep Learning Frameworks Operator | 云原生AI | 主流深度学习框架operator组件,结合CCE AI Job Scheduler,可实现直接在CCE上进行深度学习模型训练。 |
CCE RDMA Device Plugin | 云原生AI | RDMA通信设备device plugin。 |
CCE AI Job Scheduler | 云原生AI | 任务调度组件,支持调度管理各种AI任务,结合CCE Deep Leaning Frameworks Operator,可实现直接在CCE上进行深度学习模型训练。 |
Fluid | 云原生AI | 基于Kubernetes场景下的的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI 应用等。 |
CCE Ingress Controller | 网络 | 基于百度云应用型负载均衡产品(应用型BLB)实现K8S Ingress语义,提供七层网络负载均衡能力。 |
CCE Ingress Nginx Controller | 网络 | 使用Nginx作为反向代理、负载均衡器、HTTP缓存,根据Ingress资源配置动态更新Nginx配置文件。 |
NodeLocal DNSCache | 网络 | 通过在集群节点上作为 DaemonSet 运行 DNS 缓存代理来提高 DNS 解析性能。 |
CCE CSI BOS Plugin | 存储 | 支持在Pod中以PV/PVC方式挂载百度云BOS存储。 |
CCE CSI CDS Plugin | 存储 | 支持在Pod中以PV/PVC方式挂载百度云CDS存储,并支持动态创建PV。 |
CCE CSI PFS Plugin | 存储 | 支持在Pod中以PV/PVC方式挂载百度云PFS存储,并支持动态创建PV。 |
CCE Log Operator | 可观测 | 采集集群中的日志信息传输至日志服务(BLS)中进行持久化存储。 |
CCE Node Problem Detector | 可观测 | 实时检测节点上各种异常情况,并将检测结果上报至集群。 |
CCE Node Remedier | 可观测 | 节点自动维修系统,实现节点故障自愈。 |
CCE Image Accelerate | 镜像 | 为Kubernetes集群提供镜像加速能力,配合使用容器镜像服务CCR的镜像加速功能,实现镜像数据免全量下载和在线解压,大幅减少容器启动时间。 |
CCE P2P Accelerator | 镜像 | 支持大规模集群并发拉取GB级容器镜像,大幅提升镜像拉取速度。 |
CCE Descheduler | 调度 | 对集群中高负载节点上的 Pod 发起重调度。 |
CCE QoS Agent | 其他 | 容器服务质量(QoS)增强组件,提供丰富的单机资源隔离能力,提升集群资源利用率,提供稳定性保障。 |
集群默认安装的组件
CCE会在集群中默认安装一些组件。
这些组件都有各自承担的功能,一般不能删除。
具体组件列表如下,除非特殊说明,否则均部署于kube-system命名空间
CCE标准集群(自定义和托管集群)
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | CoreDNS | 所有集群 | Deployment coredns | 为集群内K8s Service等资源提供DNS配置 |
网络 | KubeProxy | 所有集群 | DaemonSet kube-proxy | 为K8s Service配置代理规则 |
网络 | VPC Native | 所有集群 | DaemonSet cce-network-agent | 配置容器网络、路由等 |
网络 | Calico Felix | 开启Network Policy Felix的集群 | DaemonSet cce-calico-felix | 为集群实现Network Policy |
流量接入 | CCE LB Controller | 所有集群 | Deployment cce-lb-controller | 为LoadBalancer Service配置BLB与EIP |
GPU | Nvidia Device Plugin | 所有集群 | DaemonSet nvidia-device-plugin-daemonset | 为集群配置GPU资源 |
节点管理 | Cloud Node Controller | 所有集群 | Deployment cce-cloud-node-controller | 为集群新加入的Node配置Label等属性 |
节点管理 | Node Feture Discovery | 所有集群 | Deployment nfd-master DaemonSet nfd-worker | 为集群Node添加一些硬件Label |
监控 | Telegraf | 托管集群 | DaemonSet cce-telegraf | 采集监控数据 |
监控 | Kube State Metrics | 所有集群 | StatefulSet kube-state-metrics | 采集监控数据 |
监控 | Metrics Server | 所有集群 | Deployment metrics-server metrics-server-scraper | 采集监控数据 |
CCE云边集群
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | Cloud Tunnel Core DNS | 所有集群 | Deployment cce-tunnel-coredns | 为云边通道提供DNS劫持服务 |
网络 | Core DNS Service Topology | 所有集群 | BatchDeployment coredns | 为集群每个边缘站点提供DNS服务 |
网络 | Cloud Edge Cluster Topology Server | 所有集群 | DaemonSet service-topology | 提供应用服务的流量拓扑能力 |
网络 | KubeProxy | 所有集群 | DaemonSet kube-proxy | 为K8s Service配置代理规则 |
网络 | Cloud Edge Cluster Calico | 所有集群 | DaemonSet calico-node | 为集群提供容器网络服务 |
网络 | Cloud Tunnel | 所有集群 | DaemonSet cloud-tunnel | 集群云边通道的中心服务 |
网络 | Edge Tunnel | 所有集群 | DaemonSet edge-tunnel | 集群云边通道的边缘服务 |
网络 | Cloud Edge Cluster BEC LB Controller | 所有集群 | Deployment load-balancer-controller | 为集群每个边缘站点提供LB访问服务 |
服务分组 | Cloud Edge Cluster Service Group Controller | 所有集群 | Deployment service-group-controller | 提供应用的服务分组能力 |
监控 | Cloud Edge Cluster Metrics Server | 所有集群 | Deployment metrics-server | 为集群提供监控数据查询服务 |
边缘自治 | EdgeHub | 所有集群 | Static Pod edgehub | 为集群提供边缘节点自治服务 |
GPU | Nvidia Device Plugin | 所有集群 | DaemonSet nvidia-device-plugin-daemonset | 为集群配置GPU资源 |
节点管理 | Cloud Node Controller | 所有集群 | Deployment cce-cloud-node-controller | 为集群新加入的Node配置Label等属性 |
CCE纯边集群
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | CoreDNS | 所有集群 | Deployment coredns | 为集群内K8s Service等资源提供DNS配置 |
网络 | KubeProxy | 所有集群 | DaemonSet kube-proxy | 为K8s Service配置代理规则 |
网络 | CCE Calico | 所有集群 | Deployment calico-kube-controllers DaemonSet calico-node |
集群网络插件 |
GPU | Nvidia Device Plugin | 所有集群 | DaemonSet nvidia-device-plugin-daemonset | 为集群配置GPU资源 |
GPU 共享集群
在CCE 标准集群的基础上,增加部署以下组件:
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
GPU | Kong Ming Nvidia GPU | 所有集群 | DaemonSet cce-gpu-share-device-plugin | 为集群配置GPU资源 |
Serverless集群
类型 | 名称 | 安装条件 | 工作负载名称和形态 | 功能 |
---|---|---|---|---|
网络 | CCE Service Controller | 所有集群 | Deployment cce-service-controller | 为LoadBalancer Service配置BLB与EIP |