d3jscanvas  内容精选
  • 训练容错 - 百舸异构计算平台AIHC | 百度智能云文档

    为了保障大规模分布式训练任务稳定运行,百舸异构计算平台提供了任务自动容错的能力,支持对训练任务进行异常感知、容错判断以及自动恢复。 功能说明 为了保障大规模分布式训练任务的稳定运行,百舸提供了容错监控、诊断定位和自动恢复的能力。

    查看更多>>

  • 查询pod详情 - 边缘计算节点BEC | 百度智能云文档

    容器等待状态详情 V1ContainerStateRunning 参数名称 类型 描述 startedAt DateTime 状态开始时间 V1ContainerStateTerminated 参数名称 类型 描述 containerID String 容器ID exitCode Integer 容器退出码 startedAt DateTime 容器状态开始时间 finishedAt DateTime 容器状态结束时间

    查看更多>>

d3jscanvas  更多内容