雾计算服务器  内容精选
  • 管理实例 - 边缘计算节点BEC | 百度智能云文档

    管理实例 实例列表 通过点击“边缘云服务器=>实例管理”,可以查看实例列表。在该页面中,可以对实例进行多项操作,具体支持的操作可见下表。 操作步骤 1.登录 百度智能云BEC控制台 。 2.从以下路径进入到实例列表页面:边缘云服务器=>实例管理。 3.用户可以完成对实例的开启、重启、停止、删除、VNC远程、变更实例配置、创建自定义镜像、重装系统、重置密码操作。

    查看更多>>

  • 训练任务日志 - 百舸异构计算平台AIHC | 百度智能云文档

    训练任务日志 你可以查询训练任务日志 操作步骤 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择 训练任务 ,进入 任务列表 页面,找到您想要查看的任务,在单击日志图标 ,跳转节点日志页面。 任务日志页面 节点日志 在日志页面,您可以选择实例查看当前日志或者选择2个不同实例对日志进行参照对比。您可以对任务日志进行刷新或 开启自动刷新 。

    查看更多>>

雾计算服务器  更多内容
  • 训练任务事件 - 百舸异构计算平台AIHC | 百度智能云文档

    操作步骤 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择 训练任务 ,进入 任务列表 页面。

    查看更多>>

  • 强化学习训练加速 - 百舸异构计算平台AIHC | 百度智能云文档

    强化学习训练加速 简介 AIAK-RLHF是基于百舸异构计算平台面向大模型强化学习训练场景提供的最佳实践解决方案配套 AI 加速工具,帮助模型开发者高效完成大规模深度学习分布式训练,提升训练效率,在开源代码基础上,对ppo训练流程通过全混部方式进行加速。

    查看更多>>

  • 服务弹性伸缩 - 百舸异构计算平台AIHC | 百度智能云文档

    通过本功能,您可以根据业务负载的变化,自动调整推理服务实例的数量,以实现计算资源的动态管理,确保业务平稳运行并提高资源利用率。 使用前提 使用弹性扩缩容功能前,需要先配置采集任务和所需的弹性扩缩容组件,具体步骤如下: 在“Prometheus服务”中创建一个监控实例。若当前已有监控实例,则可跳过此步骤; 在 容器引擎CCE 中,将CCE集群接入此监控实例。

    查看更多>>

  • BEC服务等级协议SLA - 边缘计算节点BEC | 百度智能云文档

    节点月度实例服务费用: 客户在一个自然月中为节点中所有实例所支付的实例服务费用,如果客户一次性支付了多个月份的实例服务费用,则将按照所购买的月数分摊计算月度服务费用。 2. 服务可用性 2.1 服务可用性计算方式 (服务周期内节点所有实例应服务总时间 – 服务周期内节点实例服务不可用时间)/ 服务周期内节点所有实例应服务总时间。

    查看更多>>

  • GPUManager组件 - 百舸异构计算平台AIHC | 百度智能云文档

    前提条件 已接入监控实例 需启用采集任务,具体参考文档: 接入监控实例并启用采集任务 使用方法 登录 百舸异构计算平台AIHC控制台 。 在左侧导航栏 资源池 中选择您想要查看监控大盘的 资源池名称 ,并点击右侧操作中的 资源观测 。 跳转至 资源观测 页面,选择 GPUManager组件 。

    查看更多>>

  • 自动故障隔离功能管理 - 百舸异构计算平台AIHC | 百度智能云文档

    使用前提 当前仅支持产品类型为ebc、ehc的云服务器实例,暂不支持bcc和bbc产品类型。用户可以登陆 云服务器控制台 ,通过查询 实例规格 ,确定实例所属的产品类型。 操作指南 资源池开启自动故障隔离 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择资源池,进入资源池列表页面,点击 资源池名称 ,进入资源池详情页面。 自动故障隔离 选项,点击 修改 。

    查看更多>>

  • 管理训练任务 - 百舸异构计算平台AIHC | 百度智能云文档

    登录 百舸异构计算平台AIHC控制台 。 进入 训练任务 列表,选择需要停止的任务,在操作栏单击 停止 。 停止后资源将被释放,仍可查看日志、监控和Tensorboard信息。 复制训练任务 在大模型训练中,需要频繁调整参数以获得最佳训练效果,百舸控制台提供了任务复制功能。可快速复制当前任务信息,您可在当前任务基础上修改相关参数再次提交,提高模型训练效率。

    查看更多>>

  • 快速部署JuypterLab - 百舸异构计算平台AIHC | 百度智能云文档

    快速部署JuypterLab 准备资源 可根据资源规模、稳定性、灵活性等要求按需准备轻量计算实例或通用计算资源池,用于快速部署JuypterLab开发机。 AI计算资源 部署JupyterLab 在 工具市场>工具模版 选择JuypterLab模版,点击 部署工具 按钮快速部署工具。 根据模型开发调试需求,选择使用卡数量,至少需要选择1张卡,点击 确定 启动工具。

    查看更多>>