前提条件 已安装CCE GPU Manager组件 已接入监控实例 需启用采集任务,具体参考文档: 接入监控实例并启用采集任务 使用方法 登录 容器引擎CCE控制台 。 点击左侧 集群管理 ,在 集群列表 中选择您需要的 集群名称 ,在右侧 操作>更多 中点击 Prometheus监控 ,即可跳转至 Prometheus监控服务 。
选择 产品导览>容器>容器引擎 ,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理>集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击 运维与管理>组件管理 。 在组件管理监控和日志tab中选择 CCE DeepTrack 组件单击“安装”。 点击“确定”按钮完成组件的安装。
选择” 产品服务>云原生>容器引擎CCE ”,单击进入容器引擎管理控制台。 单击左侧导航栏中的” 集群管理>集群列表 ”。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击” 运维与管理 > 组件管理 ”。 在组件管理列表中选择“ CCE NPU Manager ”组件单击” 安装 ”。 点击” 确认 ”按钮完成组件的安装。
选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击 云原生AI > 任务管理 。 在任务管理页面单击 新建任务 。
使用说明 登录百度智能云 容器引擎 CCE 控制台 ,在左侧导航栏选择 集群管理 > 集群列表 。 在 集群列表 页面,单击目标集群名称进入集群详情页,然后在左侧导航栏,选择 运维与管理 > 事件中心 。 在事件中心的事件列表中,默认可查询最近 1 小时内产生的事件。可通过列表上方的下拉列表筛选与特定命名空间和资源对象相关联的事件。
可以通过控制台打开自动发布功能,具体操作如下: 选择“产品服务>应用引擎BAE>BAE专业版”,进入“应用列表”页面。 单击环境名称,进入环境详情页面,打开“自动发布设置”开关。自动发布功能适用于所有代码管理方式。 “自动发布设置开关”仅针对当前环境有效,不影响其它环境的发布设置。 设置环境 设置页签主要实现添加环境变量、关联RDS或SCS、HTTPS监听协议及添加端口等功能。
请按照以下步骤进入集群审计页面,开始使用对应功能: 登录 容器引擎控制台 。 在左侧导航栏,选择 集群列表 。 在“集群列表”页面单击目标集群,进入集群管理页面。 在集群管理页面左侧导航栏中选择 安全管理-集群审计 ,开启集群审计功能,操作详情请参见 开启集群审计 。 进入审计操作总览页面,查看图表详情。
架构图 核心优势 安全容器是基于社区 Kata Containers 轻量虚拟机技术构建的安全容器运行时,主要核心优势如下: 基于轻量虚拟机,实现沙箱之间的超强隔离。 具有传统 runC 容器的应用兼容性。 在监控、日志、存储等方面有着与 runC 一致的使用体验。 使用门槛低,简单易用。
部署SGLang PD分离推理服务 本文介绍如何在容器引擎CCE中部署SGLang PD分离推理引擎,实现Qwen3-32B大模型的高性能推理服务。通过使用RDMA高速网络的GPU机型,充分发挥PD分离架构的性能优势。 背景知识 SGLang推理引擎 SGLang是一个高性能的大型语言模型与多模态模型服务推理引擎,通过前后端协同设计,提升模型交互速度与控制能力。
Nacos 迁移方案 概述 如果您计划使用微服务引擎 MSE 替代 Nacos 作为新的注册配置中心,MSE 提供了协议兼容方案,您只需更改应用中 nacos-client 的服务端接入地址,无需修改代码或调整 pom 依赖。本文将围绕服务注册与配置管理两大核心场景,详细阐述 MSE 接入的使用方法。 前提条件 已创建注册配置中心实例,详情参见 创建注册配置中心实例 。 场景一:服务注册 1.