管理环境配置参数 环境详情页面主要进行对环境参数进行管理,可以进行如下操作: 代码部署或创建RDS实例; 续费或升级配置; 实例重启; WebSSH登录 单击“部署”按钮进行代码部署,该代码部署功能和应用列表页签的“代码管理”功能相同。 点击“创建RDS实例”可以购买RDS数据库。购买RDS数据库的详细操作可参见 RDS操作指南 。 如果当前的环境配置即将到期且需要继续使用,请点击“续费”。
规则名称:规则的名称,要求唯一,且不可改变; 规则类型:规则的类型,支持基础、聚合、高级三种类型; 报警资源:规则应用于哪一类资源,目前包括:地域、集群、节点、应用、环境、部署组、实例、微服务部署组、微服务容器组; 筛选资源:默认规则应用于某类的所有资源,您可以点击编辑筛选条件,并在弹窗中筛选您想配置报警的资源: 筛选条件:由三部分组成:标签、操作符、值: 标签:对应上图表格中的列名,每个标签只能配置一个筛选条件
迭代部署:后台的升级迭代,沉淀了百度十几年来的技术优势,所有的变更全都一键自动完成,稳定高效,目前百度智能云上每周会有超过100+次变更,后端的全部操作做到用户无感,不会影响到用户服务,更无需停机进行后台维护。 监控 完善的运维与监控是云服务的关键,百度智能云的智能监控系统可以实现全方位的自动监控。
人体检测 检测图像中的所有人体,返回每个人体的矩形框位置;支持人体重叠、遮挡、截断、背面、侧面、动作变化等复杂场景。 适应轻度遮挡、轻度截断、背面、侧面、中低空斜拍等复杂场景, 实际应用中可根据接口输出的人体框概率分数进行过滤,排除掉分数低的误识别“无效人体” 。
架构 热活实例组 是所有热活实例组成员实例的逻辑集合: 主实例 热活实例组的基准实例,除了处理本实例上读写请求外,所有从实例的写请求都会转发到主实例上,所有从实例从主实例同步数据 。 从实例 本实例上读请求本地进行响应,写请求转发到主实例上,从主实例同步数据。 热活实例组中控 管理热活实例组生命周期, 负责部署, 配置流量转发, 监控相关组件工作等。
模型列表 模型列表提供模型管理能力,可查看所有已发布为模型的任务 查看模型 可通过下拉框筛选需要查看的任务类型 点击【查看】可查看模型详情,在模型详情页可查看当前模型下的全部版本、模型版本对应的任务、训练方式、版本描述以及导入时间 点击对应任务可跳转至当前模型对应的任务版本 如需将模型投入实际应用可选择导出模型源文件或将模型部署为离线SDK 仅有训练时导出类型选择为【导出源文件与离线SDK】的任务支持部署为离线
memory.oom_kill_priority 设置oom kill优先级,优先级越高优先杀死 int 5000 控制发生OOM时,cgroup内的进程组的kill模式 控制发生OOM时,cgroup内的进程组的kill模式:0: 不杀死进程组内所有的进程 1: 杀死进程组内所有的进程 memory.kill_mode 控制OOM kill模式,是否杀死进程组所有进程。
具体可用性检查项列表: 一级分类 二级分类 具体描述 集群组件&状态 组件部署状态 检查组件Pod的存活情况,正常运行才能有效提交训练任务和部署推理服务 节点状态 检查集群节点的运行情况,正常运行才能有效提交训练任务和部署推理服务 节点污点、封锁信息 检查节点的污点和封锁情况,保障信息正确以便更好使用训练任务的容忍能力 计算软件故障 持久化模式开启检查 检查加速芯片是否开启了持久化模式,未开启持久化会导致加速芯片功耗增加
容器镜像按需加载 支持用户在实例配置并灵活使用镜像加速规则并自动生成加速版本,通过配合容器引擎CCE集群部署相关组件,可以实现部署容器时拉取对应的镜像加速版本实现容器数据免全量下载和在线解压,极大的提升容器启动效率。 访问凭据 使用Docker客户端推送、拉取容器镜像时,必须使用访问凭据信息登录实例,您需要在客户端中执行 docker login 命令并输入用户名及密码。
用户继续执行以上步骤移入移出所有节点,以创造更多的扩容空间。 注意:PodCIDR 掩码不同的节点理论上可以存在于同一集群中,但还是建议用户将所有节点移入移出一遍,让节点拥有相同掩码的 PodCIDR。 master 采用静态Pod部署方式解决办法 在 2021-3-11 之后,controller manager 采用静态 Pod 方式部署,修改对应的配置文件即可完成 Pod 更新。