产品描述
产品介绍
百度智能云云高性能计算(Cloud High Performance Compute,简称CHPC)基于百度智能基础设施,提供弹性、易运维的HPC平台服务。支持对集群、节点、作业、调度系统等进行运维及管理,客户可按实际业务需求使用计算资源。
核心概念
集群
集群是CHPC管理的核心单元,包含节点、HPC调度器、域账号系统、应用软件、共享存储、弹性公网IP等资源,可提供强大的计算能力。
节点
每个节点是一台云服务器实例,是执行计算任务的基本单元。节点可按照使用用途细分为登录节点、管控节点和计算节点。
队列
队列是计算节点的组织单元,通常一个队列会配置相同的计算节点规格来处理同一种计算作业。
调度器
调度器是集群用来调度计算节点的系统,使用户无需为作业配置特定的计算资源,而只需要声明作业所需要的资源规格并提交给调度器即可自动为作业分配可获取的计算资源。
自动扩缩容
自动扩缩容是指授权CHPC根据集群当前作业及节点状态,自动来进行扩容或者缩容计算资源的策略。当有大量等待作业时,CHPC则会扩容配置的节点规格,当存在某个计算节点长期空闲时,CHPC则会释放这个节点。
产品架构
云高性能计算产品架构示意图如下:
基础设施管理人员通过公网访问CHPC的控制台或者OpenAPi来统一使用CHPC服务。CHPC集群部署在用户的私有网络中,可支持扩展不同可用区或子网的计算节点,这些计算节点可配置访问共享存储空间,即文件存储产品。业务人员可通过公网或者云上跳转机访问集群的登录节点提交作业,作业的文件输入及输出可存储在云上对象存储或者百度网盘中。
产品优势
灵活配置
- 支持对接百度智能云多种云服务器规格,满足不同应用负载的算力需求。
- 支持多种调度器系统,满足不同的行业使用习惯需求。
弹性按需
- 在CHPC控制台快速创建基础设施资源及系统软件,在几分钟内即可提交作业开始计算。
- 按照业务对资源的需求波动,按需扩展或缩容集群。
高效管理
- 支持多种资源类型管理,包含集群、队列和节点等,全方位了解资源状态以及利用率。
- 控制台提供全面的操作日志,方便您了解集群动态。
产品特性
自动扩缩容
- 支持为集群配置多种自动可缩容配置,CHPC可根据任务及节点负载情况,动态调整集群资源。当有大量任务等待计算时,集群自动按照当前需求扩容节点。当节点长时间空闲时,集群缩容到配置的最小节点数量。
多种镜像和操作系统支持
- 提供多种操作系统,可根据需求灵活选择。
- 用户可基于集群中某个节点生成自定义镜像,通过该镜像创建新节点来获得更高效的扩容效率。
异构算力调度
- 支持调度多种计算资源类型,包括通用算力以及异构算力(例如GPU云服务器)。
应用场景
药物研发
药企或CRO可使用CHPC平台,快速部署药物分子模拟软件,亲和性检测软件,例如gromac或autodock,并利用集群弹性的计算资源,轻松加速、管理大量计算任务。
工业仿真
汽车企业能够利用CHPC的高性能计算集群来辅助分析复杂的车辆工程架构和力学结构,并通过大量数据模拟路面真实情况。CHPC可提供高规格的计算规格,全面加速仿真软件计算效率。