故障类问题 作业运行失败怎么办? 可以在集群的作业列表中,找到运行失败作业的日志,分别为syslog、stderr、stdout三个日志。其中Syslog日志记录了作业运行的信息,stderr记录了作业运行失败的原因,stdout记录了作业运行的过程中输出的信息。通过查看stderr日志,找到作业运行失败的原因并进行修复,再次运行作业。 作业为什么会运行失败?
故障类问题 SMS服务的异常应急处理能力如何? 对开发者,SMS系统每年故障宕机时间小于4小时,系统具备热备机制,服务和数据实现分钟级切换和恢复。 对客户,异常自动识别和报警时间不超过5分钟,自动处理时间不超过1小时。当异常发生时,SMS将在最短时间内通知客户,并努力对服务的影响减到最小。
发起故障注入操作 接口描述 本接口用于发起故障注入操作。
返回参数 参数名称 类型 描述 flavorId String 套餐ID raids List< RaidModel > RAID信息列表,由 RaidModel 组成的集合 请求示例 GET /v1/flavorRaid/BBC-I1-01 HTTP/1.1 Host: bbc.bj.baidubce.com ContentType: application/json Authorization
查询用户故障注入白名单 接口描述 本接口用于查询用户故障注入白名单。
将实例移出故障注入白名单 接口描述 本接口用于将实例移出故障注入白名单。
将实例加入故障注入白名单 接口描述 本接口用于将实例加入故障注入白名单。
GetFlavorRaid ( testFlavorId ) ; err != nil { fmt . Println ( Get raid failed: , err ) } else { fmt . Println ( Get raid success, result: , res ) }
当值为true时,raidId和sysRootSize字段不生效 is_preserve_data = False #raid配置Id,可通过调用SDK的get_flavor_raid接口获得。
详情 使用以下代码可以查询指定套餐的RAID方式及磁盘大小: def get_flavor_raid ( self ) : #设置你要操作的instance_id flavor_id = 'your-choose-flavor-id' self . client . get_flavor_raid ( flavor_id = flavor_id )