可在“产品服务>MapReduce>MapReduce-定时任务”页中查看已创建的任务。 点击已创建定时任务对应的“查看执行历史”可查看任务执行记录。 (可选)点击“停止”,可暂停该任务,点击“开启”,可重新启动该任务。 修改定时任务 对已创建的定时任务,您可修改时间策略和作业。
管理训练任务 使用场景 百舸AIHC平台集成了对训练任务进行停止、重跑、复制、删除的能力 停止训练任务 当您在任务提交后发现参数配置错误或者效果不符合预期,可以停止任务,释放资源。操作步骤如下: 任务运行阶段,停止训练任务,会保留Worker实例,仍然支持查看当前任务的日志、监控和Tensorboard数据。 任务启动、排队阶段,停止训练任务,会删除Worker实例。
具体的人工节点任务详情页的组成,详细参考 人工任务概述.md 通过字段权限 如果统一使用一个表单的视图,也可以通过节点【字段操作权限】,设置部分字段的显示、隐藏、只读、编辑状态微调实际展示的审批视图。 Step3 新建与设计流程 新建流程,并进入流程设计器设计流程。 设计器介绍 爱速搭提供可视化、拖拉拽进行业务流程的设计,整体流程设计器可以分成以下几个部分。
全量迁移是否完成请以任务状态是否进入增量迁移阶段为准。 查看增量同步详情 在迁移详情页面,点击 增量迁移 页签。 查看增量迁移状态、延迟时间与同步点。
获取训练任务调度诊断结果 描述 获取训练任务调度诊断的结果。
配置一个列表 该篇文档介绍如何配置通过接口展示一个表格组件。
训练任务事件 概述 任务事件包括了任务在启动/运行阶段,任务以及关联资源的变更情况,可以弥补资源监控在实时性和场景上的欠缺,有助于运维人员日常观察的任务变更以及定位问题。本文介绍如何查询训练任务的事件信息。 操作步骤 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择 训练任务 ,进入 任务列表 页面。
运行中 Pod 进入running状态,执行训练代码 失败 pod 失败退出 成功 pod 成功退出 异常 Pod 状态未知 任务状态 状态 说明 排队中 任务已创建,等待调度阶段(允许修改优先级),实例未创建或者所有实例状态为 排队中 启动中 Pod调度完成,实例的状态均为 启动中 或者包含部分 运行中 的状态 运行中 所有的Pod为 运行中 的状态; 停止中 用户操作停止任务,正在停止任务,正在将实例置为
删除一个Fabric网络 删除一个Fabric网络 接口描述 根据网络id删除一个fabric网络。 权限说明 请求发起人需要具有合法的AccessKeyID和SecretAccessKey才能发起请求。 注意事项 如果请求中没有用户验证信息(即匿名访问),返回 403 Forbidden ,错误信息: AccessDenied 。
查询训练任务所在节点列表 描述 查询训练任务所在节点的名称 请求结构 GET /api/v1/aijobs/{jobID}/nodes Host:aihc.bj.baidubce.com Authorization:authorization string ContentType: application/json 请求头域 除公共头域外,无其它特殊头域。