角色管理 创建角色 接口简介 创建角色 接口详情 请求地址 /openapi/v1/group/{groupKey}/role?
核心概念 集群 集群是CHPC管理的核心单元,包含节点、HPC调度器、域账号系统、应用软件、共享存储、弹性公网IP等资源,可提供强大的计算能力。 节点 每个节点是一台云服务器实例,是执行计算任务的基本单元。节点可按照使用用途细分为登录节点、管控节点和计算节点。 队列 队列是计算节点的组织单元,通常一个队列会配置相同的计算节点规格来处理同一种计算作业。
角色管理 获取角色列表 接口简介 获取角色列表 接口详情 请求地址 /openapi/v2/group/{groupKey}/role?
弹性高性能计算集群 弹性高性能计算集群 弹性高性能计算集群EHC是基于高性能RDMA网络,将多个裸金属服务器进行互联,每个裸金属服务器配置单独的RDMA网卡,可提供高带宽、低时延的通信能力,极大提升计算任务的加速比的计算集群,适用于超大模型训练、科学计算等大规模计算场景。百度智能云可提供业界主流RDMA技术路线,满足多场景计算需求。
边缘云服务器 BEC创建和删除实例模板 介绍在BEC里如何创建和删除实例模板。 BEC创建和删除边缘云服务器 介绍在BEC里如何创建和删除边缘云服务器。 BEC变更边缘云服务器配置 介绍在BEC里如何变更和批量变更边缘云服务器配置。 BEC实例组扩容 介绍在BEC里如何完成实例组扩容。 BEC重置密码和创建密钥对 介绍BEC实例密码的重置和密钥对的创建、查看、删除功能。。
登录/注册 个人中心 消息中心 退出登录 本次直播已结束,点击观看回放 如何灵活使用AppBuilder 长短期记忆能力 精选视频课程 讨论区 暂无数据 直播详情 直播内容 知识库、数据库和记忆功能的区别 AppBuilder长短期记忆能力介绍 记忆功能的应用场景介绍 实操:如何使用记忆打造一个基于智能手环的健康管理助手Agent 相关话题内容 产品文档-记忆
AIAK推理加速组件 概览 AIAK是面向人工智能任务提供的加速引擎,用于优化基于AI主流计算框架搭建的模型,能显著提升AI任务开发、部署的运行效率。 其中,AIAK推理加速套件是通过优化主流的AI框架,例如:Tensorflow、PyTorch产出的模型,降低在线推理延迟、提升服务吞吐,大幅增加异构资源使用效率的推理优化引擎,结合百度智能云的IaaS资源,可进一步提升用户AI场景下的计算效率。
即时拨测 探测任务相关 创建探测任务 请求结构 method:POST URL:/csm/api/v1/site/once/{protocolType}/taskCreate 请求参数 protocolType String 要创建的协议类型,全大写,可选: HTTP/HTTPS/PING/FTP/TCP/UDP/DNS 是 Path参数 userId String 用户id 是 RequestBody
快速入门 本文为您简要的介绍使用百度百舸·AI异构计算平台的准备工作和创建流程。在首次使用百度百舸·AI异构计算平台的情况下,帮助用户快速上手,在平台上完成创建资源池及队列、通过模版创建典型大模型训练任务、查看监控等关键流程。
尽量均衡 DP 间的采样样本长度; Packing 模式下,支持数据集按 packing 后的样本总计算量排序,尽量均衡 DP 间的计算量(在长序列场景下,由于样本长度差异较大,该问题可能更严重); 升级 Megatron 显存优化机制,在长序列等对显存要求极高的场景下,可用于精细的调整显存占用,包括: 支持流水线并行按 PP Stage 动态设置不同的 PP Layer 数目; 支持重计算功能按