Synology HA 集群结合 SHR 部署全攻略:从准备到落地的实操指南
一、先搞懂:HA 与 SHR 的协同逻辑(避免部署误区)
在开始部署前,需明确 HA 集群与 SHR 的核心关系 ——SHR 是 “存储池类型”,负责磁盘冗余与容量管理;HA 是 “高可用架构”,负责双服务器同步与故障切换,两者协同的关键规则的官方定义如下:
1. HA 与 SHR 的核心分工
组件  | 核心作用  | 在部署中的定位  | 关键约束  | 
HA 集群  | 双服务器(活动 / 无源)同步数据,故障切换  | 架构基础,保障服务连续性  | 两台服务器需同系列 / 兼容型号,网络通畅  | 
SHR 存储池  | 灵活组合不同容量磁盘,提供 RAID 冗余  | 存储载体,承载用户数据与服务  | 仅支持在活动服务器创建,同步至无源  | 
2. 部署核心原则(官方强调,必遵守)
- 先建 SHR,再配 HA:需在 “活动服务器” 先创建 SHR 存储池,再将无源服务器加入 HA 集群,避免 HA 同步后无法创建符合要求的 SHR;
 
- SHR 规则不变:HA 集群中的 SHR 仍遵循原有规则(如 SHR-1 需≥2 块盘,SHR-2 需≥3 块盘),无额外限制;
 
- 同步而非复制:HA 会将活动服务器的 SHR 存储池 “实时同步” 到无源服务器,而非在无源服务器单独创建 SHR—— 无源服务器的存储池由同步生成,无需手动操作。
 
二、部署带 SHR 的 HA 集群:5 项核心准备工作
部署前需确认硬件、软件、网络均满足要求,避免因兼容性问题导致返工,具体准备事项如下:
1. 硬件准备(核心:双服务器 + 兼容磁盘)
硬件类型  | 官方要求  | 推荐配置  | 
服务器(2 台)  | 需为 Synology 同系列 / 兼容型号(如 DS1823xs+×2、RS2423RP+×2);CPU / 内存规格一致  | 2 台 DS1823xs+(8 盘位,支持 SHR 扩容)  | 
磁盘(≥2 块 / 服务器)  | 需在 Synology 兼容性列表内;活动与无源服务器的磁盘 “数量、容量、型号建议一致”(非强制,但同步更稳定)  | 4 块 4TB SATA 硬盘(2 块 / 服务器,用于 SHR-1)  | 
网络设备  | 1 台千兆 / 万兆交换机(连接集群 IP);2 根专用网线(心跳线,直连两台服务器)  | 万兆交换机(提升同步速度);CAT6 网线(心跳线)  | 
其他  | UPS(可选,防止部署中断电);外接硬盘(用于备份)  | Synology UPS(支持 NAS 断电同步关机)  | 
2. 软件与系统准备
- DSM 版本:两台服务器需安装相同版本的 DSM(≥7.0,官方推荐 7.2 及以上,兼容性更好);
 
- 必要套件:提前在活动服务器安装 “Synology High Availability” 套件(后续配置 HA 需用);
 
- 固件更新:进入 DSM“控制面板→更新和还原”,确保两台服务器的 DSM 固件均为最新,避免版本差异导致同步失败。
 
3. 网络配置准备(HA 核心,不能错)
HA 集群需两套网络:“业务网络”(用户访问服务)和 “心跳网络”(服务器间同步),提前规划如下:
网络类型  | 配置要求  | 示例配置  | 
业务网络(集群 IP)  | 为 HA 集群设置 1 个 “集群 IP”(用户访问用);两台服务器各设 1 个 “管理 IP”(配置用)  | 集群 IP:192.168.1.100;活动管理 IP:192.168.1.101;无源管理 IP:192.168.1.102  | 
心跳网络(直连)  | 用专用网线直连两台服务器的空闲网口(如网口 2);无需配置 IP,系统自动分配  | 直连 DS1823xs + 的网口 2 与另一台的网口 2  | 
4. SHR 兼容性确认(避免存储池创建失败)
- 支持的 SHR 类型:HA 集群支持所有 SHR 类型,包括 SHR(单盘 / 双盘)、SHR-1(单冗余)、SHR-2(双冗余);
 
- 磁盘数量限制:单台服务器的磁盘数量需满足 SHR 要求(如 SHR-1≥2 块,SHR-2≥3 块);
 
- 磁盘容量建议:虽 SHR 支持不同容量磁盘,但为 HA 同步效率,建议活动与无源服务器的磁盘容量一致(如均为 2 块 4TB)。
 
5. 数据备份(防部署失误)
- 若服务器已有数据,需通过 “Hyper Backup” 备份到外接硬盘或远程 NAS;
 
- 导出未来需部署的服务配置(如文件共享权限、用户账号),避免 HA 部署后重新配置。
 
三、带 SHR 的 HA 集群部署:6 步详细实操(官方流程)
部署需严格按 “初始化服务器→创建 SHR 存储池→配置 HA 集群→同步验证” 的顺序操作,每一步均需确认无误后再推进:
步骤 1:初始化两台服务器(确保系统一致)
- 初始化活动服务器(第一台):
 
- 用网线连接服务器到交换机,通过 “Synology Assistant” 发现设备;
 
- 双击设备,按向导安装 DSM(选择提前下载的对应版本固件);
 
- 完成安装后,设置管理员账号、密码,禁用 “自动更新”(先统一版本,部署后再开启)。
 
- 初始化无源服务器(第二台):
 
- 重复上述步骤,安装与活动服务器完全相同版本的 DSM;
 
- 设置相同的管理员账号密码(HA 配置需统一认证);
 
- 暂不创建任何存储池或套件(后续由 HA 同步活动服务器的配置)。
 
步骤 2:在活动服务器创建 SHR 存储池(核心存储载体)
- 进入存储管理器:
 
登录活动服务器 DSM,点击 “主菜单→存储管理器→存储池→创建”。
- 选择 SHR 类型:
 
- 在 “RAID 类型” 列表中,选择 “Synology Hybrid RAID(SHR)”;
 
- 2 块盘:默认 SHR-1(单冗余,推荐,兼顾容量与安全);
 
- 3 块及以上:可选择 SHR-2(双冗余,适合重要数据);
 
- 选择磁盘并确认:
 
- 勾选活动服务器中用于 SHR 的磁盘(如 2 块 4TB 硬盘);
 
- 系统会显示 “预计可用容量”(如 2 块 4TB SHR-1 可用约 4TB),确认无误后点击 “下一步”。
 
- 完成创建:
 
- 勾选 “启用硬盘休眠”(可选,节能),点击 “应用”;
 
- 等待存储池创建完成(耗时约 5-10 分钟,取决于磁盘数量),状态显示 “正常”。
 
步骤 3:配置 HA 集群(关联双服务器)
- 安装 HA 套件:
 
进入活动服务器 “套件中心”,搜索 “Synology High Availability”,点击 “安装”(若已安装跳过)。
- 启动 HA 配置向导:
 
- 点击 “主菜单→Synology High Availability→创建→创建 High Availability 集群”;
 
- 点击 “下一步”,系统提示 “需准备第二台服务器”,确认无源服务器已初始化后点击 “下一步”。
 
- 连接无源服务器:
 
- 系统会验证两台服务器的兼容性,通过后进入 “网络配置” 页面。
 
- 配置 HA 网络:
 
- 心跳网络:选择两台服务器用于直连的网口(如均为 “网口 2”),系统自动配置心跳通道;
 
- 选择同步内容(含 SHR 存储池):
 
- 系统默认勾选 “所有存储池”(即活动服务器的 SHR 存储池)、“用户配置”“套件数据”;
 
- 确认勾选 “SHR 存储池”(核心,否则无源服务器无存储数据),点击 “下一步”。
 
- 确认并启动 HA 创建:
 
- 勾选 “我已了解风险并备份数据”,点击 “应用”,启动 HA 集群创建。
 
步骤 4:等待 HA 同步完成(SHR 存储池同步关键)
- 同步过程:系统先同步用户配置与套件(约 5-10 分钟),再同步 SHR 存储池(耗时取决于存储池容量,如 4TB 数据约 1-2 小时);
 
- 状态查看:进入 “Synology High Availability→集群”,查看 “同步进度”(如 “60%(已同步 2.4TB / 共 4TB)”);
 
- 注意事项:同步期间活动服务器正常提供服务,无源服务器不可单独访问;避免断电或断开网线,否则同步失败需重新开始。
 
步骤 5:验证 SHR 存储池在 HA 中的状态
同步完成后,需确认 SHR 在两台服务器中均正常:
- 活动服务器:进入 “存储管理器→存储池”,SHR 存储池状态 “正常”,RAID 类型显示 “SHR-1”;
 
- 无源服务器:无需登录(HA 中无源不提供管理入口),通过活动服务器 “Synology High Availability→存储”,查看无源服务器的存储池状态 “同步完成”,与活动服务器一致。
 
步骤 6:部署后基础配置(确保服务可用)
- 创建存储空间:在活动服务器 “存储管理器→存储空间”,从 SHR 存储池划分存储空间(如创建 “Data” 存储空间,格式选 Btrfs);
 
- 配置共享文件夹:进入 “控制面板→共享文件夹”,在 “Data” 存储空间创建 “FileShare” 共享文件夹,设置用户权限;
 
- 测试服务访问:用电脑访问 HA 集群 IP(192.168.1.100),能正常打开共享文件夹,说明服务已可用。
 
四、部署后必做:3 项核心验证(HA+SHR 均正常)
部署完成后需从 “HA 高可用”“SHR 存储”“服务连续性” 三个维度验证,确保系统稳定:
1. 验证 HA 集群高可用(故障切换测试)
- 手动切换角色:
 
登录活动服务器 “Synology High Availability→管理→手动切换角色”,点击 “确定”;
- 观察状态:原活动服务器变为 “无源”,原无源服务器变为 “活动”,耗时约 1-3 分钟;
 
- 检查心跳线:
 
拔掉两台服务器的心跳线,集群状态显示 “警告(心跳线断开)”,但服务仍由活动服务器提供;重新插回心跳线,状态恢复 “正常”。
2. 验证 SHR 存储池稳定性(冗余测试)
- 查看 SHR 状态:
 
进入活动服务器 “存储管理器→存储池”,SHR 存储池 “健康状态” 为 “正常”,“冗余状态” 为 “有冗余”(SHR-1);
- 模拟磁盘故障(可选,谨慎操作):
 
关闭活动服务器,拔掉一块 SHR 磁盘,重启后:
- HA 集群会同步 “SHR 降级” 状态到无源服务器;
 
- 更换新磁盘后,SHR 自动修复,修复完成后状态恢复 “正常”。
 
3. 验证服务连续性(数据读写测试)
- 数据写入:通过集群 IP 上传 10GB 文件到共享文件夹,上传过程中执行 HA 角色切换,文件上传未中断;
 
- 数据读取:切换角色后,下载刚上传的 10GB 文件,速度正常,无数据损坏;
 
- 套件测试:若安装了 “Synology Drive”,切换角色后仍能正常同步文件,说明套件服务也稳定。
 
五、常见问题解答(基于官方文档延伸)
问题 1:创建 SHR 存储池时提示 “磁盘不兼容”,怎么办?
原因:磁盘不在 Synology 兼容性列表,或磁盘已被格式化过;
解决:
- 登录 Synology 官网 “兼容性列表”,确认磁盘型号支持;
 
- 在 “存储管理器→硬盘”,右键点击磁盘选择 “擦除”(清除原有格式),再重新创建 SHR。
 
问题 2:HA 同步 SHR 存储池时提示 “同步失败”,如何处理?
原因:网络带宽不足、磁盘 IO 过高、无源服务器磁盘异常;
解决:
- 检查心跳线是否用 CAT6 及以上网线,交换机是否为千兆;
 
- 暂停活动服务器的高 IO 服务(如备份),重新启动 HA 同步;
 
- 进入活动服务器 “存储管理器→硬盘”,确认无源服务器磁盘状态 “正常”。
 
问题 3:SHR 磁盘故障后,HA 集群会自动处理吗?
官方回复:会,流程如下:
- 活动服务器 SHR 磁盘故障→状态变为 “降级”,HA 同步该状态到无源服务器;
 
- 更换新磁盘到活动服务器→SHR 自动修复,修复完成后 HA 同步 “正常” 状态到无源;
 
- 整个过程中,HA 集群始终提供服务,无中断。
 
总结:带 SHR 的 HA 集群部署核心要点
带 SHR 的 Synology HA 集群部署的核心是 “先建 SHR 存储,再搭 HA 架构”,关键在于:
- 硬件需兼容(同系列服务器、兼容磁盘),网络需分离(业务 + 心跳);
 
- SHR 存储池仅在活动服务器创建,由 HA 同步到无源,无需重复操作;
 
- 部署后必做故障切换与 SHR 冗余测试,确保高可用与存储稳定。
 
通过本文步骤,你可兼顾 HA 的 “服务不中断” 与 SHR 的 “灵活磁盘组合”,搭建适合企业的高可用存储系统。若需进一步优化(如添加 SSD 缓存、部署 Docker 服务),可参考 Synology 官方进阶文档,或基于现有 HA+SHR 架构逐步扩展。