弹性高性能计算集群概述
更新时间:2024-07-05
弹性高性能计算集群概述
弹性高性能计算集群(Elastic Hyper-Computing Cluster,简称EHC)是基于高性能RDMA网络,将多个云服务器进行互联,EHC集群中的云服务器实例之间可通过RDMA网络高速互联,可提供高带宽、低时延的通信能力,极大提升计算任务的加速比的计算集群,不同EHC集群中的云服务器之间的RDMA网络相互隔离,可满足企业多业务部门之间的安全需求。
适用范围
- EHC集群适用支持高性能RDMA网络的实例,可参考EHC实例规格。
- 同一EHC集群可支持不同实例规格加入。
应用场景
- 大模型训练
- 高性能计算
产品特性
- 高速网络通信:在同一EHC集群中支持实例以高带宽网络进行通信,通过RDMA协议可极大降低通信时延与开销。
- 安全可控:不同EHC集群中的实例的高性能RDMA网络互相隔离,满足企业多业务部门、测试与生产环境的合规与安全要求。
- 高扩展性:EHC集群最大可支持扩展到千台实例规模,满足业务通过scale out方式提高应用性能。
- 即开即用:创建EHC实例后百度智能云会为您分配并配置好用于通信的系统配置,如IP(如图1,系统会分配25网段用于高性能网络通信)、无损网络配置等,您无需关注复杂的网络运维即可使用高性能网络,登陆实例OS也可查看高性能网络设备和其身份,如图二所示。