简介：本文详细解析了如何通过DRBD实现存储级同步、Corosync提供集群通信框架、Pacemaker完成资源管理，构建零数据丢失的MySQL高可用集群，涵盖架构设计、配置要点及故障处理。

一、技术选型背景与核心价值

在金融交易、电商订单等关键业务场景中，MySQL数据库的持续可用性直接影响业务连续性。传统主从架构存在数据同步延迟风险，而共享存储方案（如SAN）存在单点故障隐患。DRBD（Distributed Replicated Block Device）+Corosync+Pacemaker的组合方案通过分布式块设备同步、集群通信框架和智能资源管理，实现了存储层复制、应用层监控、服务自动切换的完整闭环，可达到RTO<30秒、RPO=0的技术指标。

1.1 DRBD存储同步机制

DRBD作为内核模块工作在块设备层，通过TCP/IP协议实现主备节点的实时数据同步。其核心优势在于：

异步/半同步/同步三种复制模式可选
支持在线设备重配置（如切换复制协议）
内置数据校验机制确保一致性
与LVM无缝集成实现灵活卷管理

1.2 Corosync集群通信层

Corosync作为集群消息总线，提供：

成员关系管理（节点加入/退出检测）
可靠组播通信（保证消息顺序）
心跳检测机制（默认500ms间隔）
令牌环算法防止网络分区

1.3 Pacemaker资源管理器

Pacemaker通过CRM（Cluster Resource Manager）实现：

资源约束定义（位置/顺序/共存规则）
故障自动处理策略（重启/迁移/停止）
状态机驱动的决策引擎
丰富的资源代理（支持MySQL、VIP、DRBD等）

二、集群架构设计要点

2.1 网络拓扑规划

建议采用双网架构：

存储网络：万兆专用网络（DRBD同步使用）
心跳网络：独立千兆交叉连接
业务网络：负载均衡器分发请求

2.2 存储配置方案

典型LVM+DRBD配置示例：

# 主节点操作
pvcreate /dev/sdb
vgcreate vg_mysql /dev/sdb
lvcreate -L 200G -n lv_mysql vg_mysql
# 配置DRBD资源
resource mysql_data {
  protocol C;
  syncer { verify-alg sha256; }
  device /dev/drbd0;
  disk /dev/vg_mysql/lv_mysql;
  meta-disk internal;
  on node1 { address 192.168.1.1:7789; }
  on node2 { address 192.168.1.2:7789; }
}

2.3 资源约束定义

Pacemaker约束规则示例：

<constraints>
  <rsc_location id="mysql_on_node1" rsc="mysql_service" node="node1" score="100"/>
  <rsc_colocation id="colocate_mysql_vip" score="INFINITY" rsc-role="Started" with-rsc="vip_mysql"/>
  <rsc_order id="order_drbd_mysql" first="drbd_mysql" then="mysql_service" kind="Mandatory"/>
</constraints>

三、实施步骤详解

3.1 环境准备

系统级配置要求：

关闭防火墙或开放必要端口（22,7789,5405）
统一时间同步（chrony/ntpd）
配置SSH免密登录
调整内核参数（net.core.rmem_max等）

3.2 DRBD部署流程

安装软件包：
```
yum install drbd-utils kmod-drbd -y
```

初始化资源：

drbdadm create-md mysql_data
drbdadm up mysql_data

验证同步状态：

cat /proc/drbd
# 应显示 cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate

3.3 Pacemaker集群配置

创建基础集群：

pcs cluster setup --name mysql_cluster node1 node2
pcs cluster start --all
pcs cluster enable --all

配置DRBD资源：

pcs resource create drbd_mysql ocfdrbd \
drbd_resource=mysql_data op monitor interval=30s

创建MySQL服务资源：

pcs resource create mysql_service systemd:mysqld \
op monitor interval=20s \
meta failure-timeout=60s

配置虚拟IP：

pcs resource create vip_mysql ocfIPaddr2 \
ip=192.168.1.100 cidr_netmask=24 op monitor interval=10s

四、运维管理最佳实践

4.1 监控指标体系

建议监控以下关键指标：

DRBD同步状态（drbd-overview）
Pacemaker操作历史（crm_mon -1f）
MySQL复制延迟（SHOW SLAVE STATUS）
集群网络延迟（ping -c 10）

4.2 故障处理流程

典型故障场景处理：

节点宕机：
- Pacemaker自动触发fence操作
- 存活节点接管服务
- 恢复后重新加入集群
脑裂场景：
- 配置STONITH设备强制断电
- 检查corosync.conf的two_node: 1设置
- 手动仲裁确定活跃节点
存储同步中断：
- 检查网络连通性
- 调整drbd.conf的resync-rate参数
- 必要时执行drbdadm detach/attach

4.3 升级维护策略

建议采用以下维护流程：

将资源迁移至备用节点
执行节点维护操作（内核升级等）
重新加入集群并验证状态
切换回原主节点验证功能

五、性能优化建议

5.1 DRBD性能调优

关键参数调整：

# /etc/drbd.d/global_common.conf
global {
  usage-count no;
  disk-flushes no;  # 非关键数据可禁用
  md-flushes no;
}
common {
  syncer {
    rate 100M;
    al-extents 257;
  }
}

5.2 MySQL参数配置

针对集群环境的优化建议：

[mysqld]
innodb_flush_log_at_trx_commit=1
sync_binlog=1
skip-name-resolve
thread_cache_size=64

5.3 网络优化措施

启用TCP BBR拥塞控制算法
调整net.ipv4.tcp_keepalive_*参数
实施QoS保障关键流量

六、方案局限性分析

存储瓶颈：DRBD同步可能成为性能瓶颈，建议：
- 使用万兆网络
- 考虑异步复制模式（允许少量数据丢失）
- 实施读写分离架构
脑裂风险：需严格配置：
- 双网络心跳
- STONITH设备
- 合理的quorum策略
扩展性限制：
- 仅支持两节点架构
- 水平扩展需结合分片方案

七、替代方案对比

方案	RTO	成本	复杂度
DRBD+Pacemaker	30s	中	高
MGR+Group Replication	5s	低	中
Galera Cluster	10s	高	高
共享存储+VIP	60s	高	中

本方案在数据一致性要求严苛、预算有限的场景中具有显著优势，特别适合金融、电信等行业的核心业务系统。

八、实施路线图建议

试点阶段（1-2周）：
- 搭建单节点测试环境
- 验证基础功能
- 制定回滚方案
预生产阶段（3-4周）：
- 部署双节点集群
- 执行压力测试
- 完善监控体系
生产迁移（1周）：
- 业务低峰期切换
- 并行运行验证
- 逐步增加负载

通过以上系统化的实施方法，可确保MySQL集群达到99.99%以上的可用性目标，有效支撑关键业务系统的连续运行需求。

基于DRBD+Corosync+Pacemaker构建MySQL高可用集群：技术解析与实施指南