集群管理常见问题
更新时间:2024-06-06
1. 常见问题
集群
错误 Code | 错误说明 | 解决方案 |
---|---|---|
MASTER_CREATE_FAILED | Master 节点创建/部署失败 | 1)如果是独立部署集群,请先至节点列表页 (集群列表->点击集群名->节点列表) 查看失败的 Master 节点进度展示,根据失败信息提示参考本文档解决问题,然后删除集群重新创建。 2) 如果是托管模式集群,请直接提工单解决,问题所属产品请选择:【容器引擎CCE】,工单所需提供信息请参考文末。 |
MASTER_DELETE_FAILED | Master 节点删除失败 | 1)如果是独立部署集群,请先至节点列表页 (集群列表->点击集群名->节点列表) 查看失败的 Master 节点进度展示,根据失败信息提示参考本文档解决问题,然后重新删除集群。 2) 如果是托管模式集群,请直接提工单解决,问题所属产品请选择:【容器引擎CCE】,工单所需提供信息请参考文末。 |
NODE_DELETE_FAILED | Worker 节点删除失败 | 请至节点列表页查看失败的 Worker 节点进度展示,根据失败信息提示参考本文档解决问题,然后重新删除集群。 |
ACCOUNT_INSUFFICIENT_BALANCE | 账户余额不足 | 请先充值 (余额100元以上),然后清理失败的资源,并重新创建。 |
FACE_AUTHENTICATION_NEEDED | 未进行高级人脸认证 | 下载百度智能云 APP,在 "我的-实名认证" 中完成人脸认证,然后重试。 |
UNDEFINED_ERROR | 未定义的错误 | 请直接提工单解决,问题所属产品请选择:【容器引擎CCE】,工单所需提供信息请参考文末。 |
节点
错误 Code | 错误说明 | 解决方案 |
---|---|---|
BCC_INSUFFICIENT | 已经成功发起虚机创建,但是创建失败,大概率是该地域该可用区没有对应类型和配置的虚机资源了 | 1) 删除失败的节点并更换可用区或机器配置重新创建。 2) 提工单解决,问题所属产品请选择:【云服务器BCC】,工单所需提供信息请参考文末,其中问题描述填:机器创建失败。 |
INSTANCE_NO_STOCK | 可用区内指定的机器没有库存 | 1) 删除失败的节点并更换可用区或机器配置重新创建。 2) 提工单解决,问题所属产品请选择:【云服务器BCC】,工单所需提供信息请参考文末,其中问题描述填:指定 instance 没有库存 (务必列出指定的机器实例类型和配置信息) |
INSTANCE_QUOTA_EXCEEDED | 用户账户下机器数量已经达到配额 | 提工单提升配额,问题所属产品请选择:【云服务器BCC】,工单所需提供信息请参考文末,其中问题描述填:提升 instance 配额 (可指定一个期望的数值)。 |
HOSTNAME_DUPLICATE_IN_VPC | 同 VPC 内出现相同的 hostname | 实例 hostname 是根据用户指定的实例名称按照一定的规则自动生成的 (如将实例名称改成全小写作为 hostname),可重新新建实例并另取实例名称或者不指定实例名称 (随机生成) 。 |
NODE_SSH_TIMEOUT | 节点 ssh 登录超时 | 请直接提工单解决,问题所属产品请选择:【容器引擎CCE】,工单所需提供信息请参考文末。 |
PREPAID_BCC_CANNOT_DELETED | 预付费的机器不允许删除 | 1) 如果是删除集群之后报的错,可先在节点列表页将失败节点移出集群,然后再执行删除集群。 2) 如果是删除节点之后报的错,可直接在节点列表页将失败节点移出集群。 |
ACCOUNT_INSUFFICIENT_BALANCE | 账户余额不足 | 请先充值 (余额100元以上),然后清理失败的资源,并重新创建。 |
INSUFFICIENT_IP_IN_SUBNET | 子网 IP 不足 | 清理失败的资源,更换子网重新创建。 |
VOLUME_NOT_AVAILABLE_IN_ZONE | 可用区内指定的 CDS 资源不足 | 1) 清理失败的资源,更换可用区或者 CDS 类型重新创建。 2) 如果对 CDS 不是强需,可清理失败的资源,然后不选择 CDS 重新创建 3) 提工单解决,问题所属产品请选择:【云服务器BCC】,工单所需提供信息请参考文末,其中问题描述填:机器创建失败,Volume.ZoneResourceNotAvailable. |
EIP_BY_TRAFFIC_BANDWIDTH_QUOTA_EXCEEDED | 按流量计费的 EIP 总带宽已经达到账户配额 | 1) 自行清理账户下不用的按流量计费的 EIP,释放被占用的带宽额度,然后删除失败的节点重新创建。 2) 提工单提升按流量计费的 EIP 总带宽配额,问题所属产品请选择:【弹性公网IP EIP】,工单所需提供信息请参考文末,其中问题描述填:提升按流量计费的 EIP 总带宽配额。 |
DELETE_INSTANCE_WITH_USER_CUSTOM_ROUTE | 待删除节点存在用户自定义的路由 | 在百度智能云控制台,进去 "私有网络VPC-路由表" 找到节点所在路由,确认无用后删除,然后再重试删除节点。 |
K8S_NODE_NOT_READY | 部署完成,但 K8S Node NotReady | 可使用 kubectl describe node 查看具体失败原因, 或 journalctl -u kubelet 查看具体日志。 |
UNDEFINED_ERROR | 未定义的错误 | 请直接提工单解决,问题所属产品请选择:【容器引擎CCE】,工单所需提供信息请参考文末。 |
更多集群管理常见问题持续补充中......
2. 工单注意事项
为了提高问题解决效率,节约您的时间,请严格按照以下约定提工单!
提工单链接:https://ticket.bce.baidu.com/?_=1603264688209/#/ticket/create
工单中需提供的信息:
- 地域名:如北京、广州、苏州、保定、香港、武汉等
- 集群 ID (如有):为失败信息中的 clusterID,如 c-xxxxxxx、cce-xxxxxxxx,问题所属产品非【容器引擎 CCE】时请勿提供
- CCE 节点 ID (如有):为失败信息中的 cceInstanceID,如 cce-xxxxxxxx-xxxxxxxx,问题所属产品非【容器引擎 CCE】时请勿提供
- 节点 ID (如有):为失败信息中的 instanceID,如 i-xxxxxxxx
- 订单 ID (如有):为失败信息中的 orderID
- 失败页面截图:问题所属产品非【容器引擎 CCE】时请勿提供
- 问题描述