产品描述
产品介绍
运维编排服务(Operation Orchestration Service,简称OOS) 是全面云上自动化运维平台的核心能力,协助用户快速建设自动化运维能力,并提供运维任务管理的服务,帮助用户解决复杂运维操作的处理效率问题。支撑了包括批量操作、周期/事件/时间触发、跨产品编排复杂运维任务等典型应用场景。
核心概念
-
任务
任务是一个完整模板中的某个节点,定义了具体的操作动作,它可以是一个复杂运维操作的封装,也可以是其他云产品的一次接口调用,任务可以被撤销。
-
模板
一个YAML或JSON格式的文件,定义所需要编排的运维操作,一个模板通常包括一个或多个子任务。运维编排服务提供公共沉淀的运维任务模板,也具备用户根据其业务特点自定义模板能力。
-
执行
执行是使资源按照模板既定的“剧本”进行自动化操作的过程及结果,一次执行可以控制多台实例按照同一个模板排演,每一次执行都是一次真实的业务场景作业,使资源产生相应的变化。
-
执行模式
不同的编排任务执行方式用于满足更多的运维场景需要,主要分为以下几类:
- 自动执行:模板中定义的所有子任务依次自动执行。
- 手动执行:模板中定义的子任务需要人工手动点击执行后再执行
以下能力逐步开放中,敬请期待:
- 全自动执行:模板中所有子任务依次自行执行,不管子任务返回状态。
- 需要审批的执行:当执行到模版中定义的不可恢复性操作的子任务时(如删除、释放、停止类操作等),任务执行会切换为等待中状态,直到用户对该任务执行完成了的审批操作其才会进行下一步。
- 失败暂停:任意子任务失败后暂停当前任务。
- 单步执行:类似于调试(Debug)功能,当需要详细地了解每一个子任务的执行时,建议使用单步执行模式。
使用流程
应用场景
运维编排服务支持针对资源的多种运维场景,如:批量操作场景、定时运维场景、跨资源操作、根据事件触发的自动化场景等。
批量操作
当您需要针对多个云服务器BCC实例执行开机、关机、重启等常用操作,或者批量调整云服务器BCC实例周边资源(如磁盘、弹性公网IP等)的规格,均可以通过OOS的批量操作能力快速执行运维任务。
OOS为您内置了一些通用的批量操作模板,您无需开发,配置相关参数后便可直接使用。此外,您还可以通过创建私有的模版,把更契合您业务的运维场景固化为模版(如批量发送和执行远程命令、批量上传文件至指定实例、批量进行实例生命周期操作及属性修改等),便于后续快捷使用。欢迎您通过工单反馈更多运维场景,运维编排服务后续将逐步提供您需要的场景模版。
定时运维
当您需要周期地执行某项运维操作,可以通过定时运维功能把模版按照设置的周期定时自动执行。
报警事件运维
使用云监控BCM报警策略的监控和事件监听能力组件,自动跟踪监控数据的变化和监听事件,进行决策、触发处置动作,提升处理效率。例如:设置周期性的定时运维任务、联动云产品指标和事件告警触发运维模版等。
费用说明
运维编排服务本身不收费,但通过运维编排服务创建云服务器BCC实例、磁盘、弹性公网IP等资源,或者调整计费资源规格时,对应的资源会根据其原有收费标准进行收费,具体收费标准参见相关资源的定价。