性能强劲 百度百舸·AI计算平台提供经过百度内部验证的AIAK加速能力,帮助您在AI计算场景下实现更快的性能,训练性能提升30%,推理性能提升60%,您可基于百度AI加速能力构建符合自身业务需求的训练任务,提升训练效率和效果。 稳定可靠 百舸平台内置集群容错能力,在长时间运行训练任务场景下,通过容错能力进行自动重启和重新调度,有效解决掉卡和任务hang问题,提升训练稳定性,保障训练任务不中断。
操作步骤 登录 百舸AI计算平台AIHC控制台 。 在左侧菜单栏选择 资源池 ,找到您想要查看的资源池名称,单击ID。 单击节点 管理页面 ,查看节点具体状态。 查看节点详情 操作步骤 登录 百舸AI计算平台AIHC控制台 。 在左侧菜单栏选择 资源池 。 单击 节点管理 页面。 找到您想要查看的节点名称,单击ID,进入节点详情页面。 查看基本信息。
geSize Integer 否 Query参数 每页路由表个数,取值范围为1~1000,缺省值为1000 keywordType String 否 Query参数 查询实例的关键字类型,tableName、vpcName,分别表示路由表名称、VPC名称 keyword String
按终端用户Name查询 query false string 响应头域 除公共头域外,无其它特殊头域。
源池类型:1、通用资源池:common,2、托管资源池:dedicatedV2 keywordType String 否 Query 参数 资源池模糊查询字段,可选 [ resourcePoolName, resourcePoolId, ],默认值为 resourcePoolName
响应参数 参数名称 类型 描述 name String 模型名称 id String 模型ID initSource String 模型创建时的来源UserUpload:用户上传 modelFormat String 模型格式 description String 描述 createdAt String 创建时间 updatedAt String 更新时间 owner String 所有者 ownerName
背景信息 集群可为CHPC计算提供计算资源、存储资源等,用于后续提交作业、调度作业、存储作业结果、查看作业结果。 创建和使用CHPC集群前请了解以下内容: 限制条件:一个地域下最多可创建3个集群,如需要创建多个集群,请提交工单。 费用说明:创建集群会产生一些费用,包括CHPC服务费用和其他资源费用。
产品介绍 介绍Sugar BI产品的主要功能和优势,并提供大屏示例和报表示例。 立刻开启 Sugar BI 免费试用 ,解锁更多行业组件与大屏模板!
任务通用环境变量 环境变量名 描述 AIHC_JOB_NAME 任务的名称 AIHC_TENSORBOARD_LOG_PATH Tensorboard日志路径(仅开启了Tensorboard的任务会默认注入) PyTorch环境变量 在PyTorch分布式训练框架中,Master和Worker扮演不同的角色并需要相互建立连接以进行通信。
实例 实例可以理解为一台虚拟的服务器,包含CPU、内存等最基础的计算组件,是云服务器呈献给您的实际操作实体。百舸中轻量计算的实例一般指的是BCC云服务器或BEC边缘云服务器实例,详情可查看 BCC实例 、 BEC边缘云服务器 。