新闻资讯

关注百度智能云最新动态,了解产业智能化最新成果

核心业务上云,如何释放国产 CPU 极致性能?专有云 ABC Stack 给出答案

2025-02-12 10:00:46

经过专有云 ABC Stack 的全方位优化,国产 CPU 同规格的虚拟机所能承载的业务 TPS 可提升近 70%。且由于屏蔽了内存和缓存的访问不一致问题,各虚拟机的CPU 使用效率也趋于一致,满足核心业务场景对高性能与高稳定性的双重需求。


在某金融行业客户的「一云多芯」平台中,配置了海光、鲲鹏等芯片。实施以上优化方案,客户的国产 CPU 专有云整体性能显著提升:业务平均 TPS 增加 36%,核心业务平均 TPS 增加 64%,实现了业务全面上国产化 CPU 云的目标。



国产 CPU 已经广泛部署于政府和企业 IT 基础设施中。现阶段,为了成功地实现业务迁移,部署的国产 CPU 整体算力总量通常会高于 Intel/AMD CPU 算力总量,以确保算力的充足供应。


然而,对于性能有着极致要求的一些关键业务,简单地依靠「以数量换性能」的方式无法达到性能指标,使得这些业务难以迁移至国产 CPU 平台。


1. 国产 CPU 性能优化,释放极致性能,降低部署总量


为了帮助用户的业务可以全面迁移至国产 CPU 平台,专有云 ABC Stack 推出了国产 CPU 性能优化方案。


通过硬件配置优化、多核资源调度优化等释放 CPU 性能,满足关键业务的极致性能要求。不仅如此,经过优化后的国产 CPU 平台整体能力和 CPU 资源利用率均获得进一步提升,有效减少了国产 CPU 部署总量。



1.1.    面向国产 CPU 的服务器配置和调度优化,打造极致性能


专有云 ABC Stack 通过硬件初始化时 CPU 设置、内存的配比与布局等,提升 CPU 平台的整体能力。通过 CPU 资源调度,比如 CPU 绑核、NUMA 亲和策略等,实现业务对国产 CPU 云的极致性能体验。


在硬件初始化阶段,国产 CPU 服务器的 NUMA 模式通常默认关闭,在服务器上线前开启 NUMA 后,ABC Stack 能感知不同 CPU 芯片的拓扑结构,并自动采用性能最优的 NUMA 配置策略。在内存配比和布局上,不同型号服务器的内存插法存在差异,ABC Stack 针对特定平台优化内存与 CPU 的布局,启用多通道调度可大幅提高内存访问带宽。


在 CPU 资源调度策略上,如果一个应用程序需要跨 Core、跨 L3 缓存、跨 NUMA 等资源进行访问,则会因为通信延迟等原因导致性能下降。对于性能敏感的业务,可以将应用绑定至特定的 Core 和对应的 L3 缓存、NUMA 中,以便获得 CPU 的极致性能。


经过专有云 ABC Stack 的全方位优化,国产 CPU 同规格的虚拟机所能承载的业务 TPS 可提升近 70%。且由于屏蔽了内存和缓存的访问不一致问题,各虚拟机的CPU 使用效率也趋于一致,满足核心业务场景对高性能与高稳定性的双重需求。


1.2.    为不同级别业务匹配调度策略,提升整体效能,降低资源部署总量


在使用绑定资源的调度策略后,将有可能产生一些 CPU 资源碎片,这会影响云平台整体的资源使用效率。


在专有云 ABC Stack 中,用户可直接启用或关闭内置于云平台管理界面的多种 CPU 性能优化参数,使得承载性能不敏感业务的虚拟机可以部署于资源碎片中。


例如,核心业务采用极致性能方案,对所有 CPU 资源进行深度绑定以确保性能最大化;一般业务则可选择性地启用 NUMA 亲和或 L3 亲和策略以满足业务性能需求;性能要求较低的业务则可关闭所有性能优化措施,充分利用碎片化资源,从而最大化提升云平台的资源利用率。


通过精细化的资源划分与分配策略,国产 CPU 云平台的服务器部署总量可节省近20% ,并实现更优性能与更高资源利用率。


2. 典型案例:核心业务 TPS 提升 64%,业务全面迁移至国产 CPU 云平台


某金融行业客户在 2022 年基于专有云 ABC Stack 构建了「一云多芯」的全栈自主创新专有云平台,配置了海光、鲲鹏等芯片。近年来,在业务全面迁移至国产 CPU 云的要求下,该客户开展了更大规模的业务迁移工作。


对此,百度智能云为客户引入国产 CPU 性能优化方案,通过从底层硬件到上层业务的系统化分析与梳理,对云平台进行了全方位性能强化:


  •   · 底层硬件配置优化:对客户现有服务器硬件进行全面调研与配置优化,通过调整内存布局、使能多 NUMA 等,充分释放硬件性能;

  •   · 业务流量深度分析:结合客户业务流量特性与规划,完成业务优先级分级,为虚拟机部署策略和调优方案提供精准依据;

  •   · 资源调度策略定制:按照业务分级,为不同业务的虚拟机配置专属资源调度策略,确保资源利用率与性能需求平衡。

通过实施以上优化方案,客户的国产 CPU 专有云整体性能显著提升:业务平均 TPS 增加 36%,核心业务平均 TPS 增加 64%,帮助客户实现业务全面上国产化 CPU 云的目标,满足各类业务的性能需求,提升了云平台的资源利用率。