一、HA 集群同时关闭的 3 个核心原则(避免致命误操作)

HA 集群的 Active 与 Passive 服务器通过实时同步维持数据一致性,关闭操作需遵循 “数据优先、有序执行、硬件保护” 三大原则,这是区别于单节点 NAS 关闭的关键:

1. 原则 1:必须先确保数据完全同步

Active 服务器的业务数据(如共享文件夹、iSCSI LUN)需实时同步至 Passive 服务器,若未完成同步直接关闭,会导致双节点数据不一致 —— 下次启动时,Passive 服务器因缺失增量数据,无法正常接管业务,甚至需全量重新同步(耗时数小时至数天)。
核心要求:关闭前需确认 HA 集群 “同步状态” 为 “已同步”,无 “同步中”“同步失败” 标识。

2. 原则 2:禁止直接物理断电(仅允许软件触发关闭)

直接拔掉电源或按硬件电源键强制关机,会跳过 DSM 系统的 “存储池卸载”“服务停止” 流程:
  • 存储池风险:RAID 阵列未正常卸载,可能导致数据块校验错误,下次启动需耗时修复(严重时无法修复);
  • 服务风险:SMB、iSCSI 等服务强制中断,客户端未保存的操作会丢失;
  • 集群配置风险:HA 集群角色信息未写入磁盘,下次启动可能触发 “角色冲突”。
正确方式:通过 DSM 界面或 SSH 执行 “正常关闭” 命令,待系统提示 “可安全断电” 后,再断开电源。

3. 原则 3:关闭顺序无强制要求,但需 “同步确认状态”

与 “故障切换” 不同,同时关闭双节点无需严格区分 Active 与 Passive 的关闭顺序,但需确保:
  • 先关闭的节点(如 Passive)不会触发另一节点的 “故障切换”(因关闭是主动操作,需提前暂停集群角色检测);
  • 两节点均完成 “软件关闭” 后,再执行物理断电,避免单节点先断电导致另一节点误判故障。

二、同时关闭前的 5 项前置准备工作(必做,避免数据风险)

关闭操作前需完成以下准备,覆盖 “业务通知、数据保护、状态检查”,确保流程无遗漏:
准备事项
具体操作要求
验证方法
1. 通知客户端停机时间
提前 1-2 小时通知所有访问 HA 集群的用户(如企业员工、外部合作方),告知停机窗口(建议 30 分钟以上,预留处理时间),暂停文件读写、iSCSI 挂载等操作
1. 通过企业 IM、邮件发送通知;2. 登录 DSM→“控制面板→通知中心” 发送系统公告,提醒客户端断开连接
2. 检查 HA 集群同步状态
登录 Active 服务器的 “Synology High Availability” 套件,确认 “同步状态” 为 “已同步”,“最后同步时间” 为当前时间(或 5 分钟内),无 “同步错误” 日志
1. 进入 HA 套件→“同步” 标签页,查看 “同步进度” 为 100%;2. 点击 “日志→同步日志”,确认最新记录为 “数据同步完成”
3. 备份关键数据(可选但推荐)
对核心业务数据(如数据库备份、重要共享文件夹)执行 “增量备份”,存储至第三方设备(如外接硬盘、异地 NAS),避免关闭过程中突发故障导致数据丢失
1. 打开 “Hyper Backup” 套件;2. 选择已创建的备份任务,点击 “立即备份”;3. 备份完成后,确认 “状态” 为 “成功”
4. 暂停所有业务服务与套件
关闭 SMB、iSCSI、NFS 等业务服务,停止依赖存储的套件(如 Synology Drive、Photos、Surveillance Station),避免关闭时服务占用资源导致流程卡顿
1. 暂停服务:   - 进入 “控制面板→文件服务”,取消勾选 “启用 SMB 服务”“启用 iSCSI Target”;2. 停止套件:   - 进入 “套件中心→已安装”,对目标套件点击 “操作→停止”
5. 确认硬件环境安全
检查双节点服务器的电源连接(确保接入 UPS,避免关闭过程中突发停电)、网线连接(记录 Heartbeat 与业务网口的连接位置,方便重启时复原)
1. 查看 UPS 指示灯,确认处于 “在线” 状态;2. 拍照记录服务器背面的网口、电源接口连接方式

三、分步操作:同时关闭 HA 集群 Active 和 Passive 服务器(DSM 7.2 为例)

基于官方推荐流程,同时关闭需通过 “软件触发关闭→确认系统关机→物理断电” 三步完成,每步需同步操作双节点,确保状态一致:

步骤 1:登录 HA 集群,确认集群状态正常

  1. 通过集群 IP(如 192.168.1.200)登录 DSM(优先登录 Active 服务器,可同时管理双节点);
  1. 打开 “Synology High Availability” 套件,再次确认:
    • “集群状态” 为 “正常”,无 Heartbeat 连接异常、存储池警告;
    • “Passive 服务器” 状态为 “在线”,无离线标识;
  1. 若存在 “同步中” 状态,等待同步完成(如 10GB 数据约需 10-20 分钟),再进入下一步。

步骤 2:触发双节点软件关闭(两种方法,按需选择)

Synology 官方提供 “通过 HA 套件关闭整个集群” 和 “分别关闭单节点” 两种方法,前者更高效,推荐优先使用:

方法 1:通过 HA 套件 “关闭整个集群”(推荐,一键同步关闭)

  1. 在 Active 服务器的 HA 套件中,点击左侧导航栏 “集群”;
  1. 点击右上角 “操作→关闭整个集群”,弹出确认窗口;
  1. 窗口提示 “将同时关闭 Active 和 Passive 服务器,是否继续?”,勾选 “我已确认所有客户端已断开连接,且数据已同步”;
  1. 点击 “确定”,系统开始执行关闭流程:
    • 第一步:暂停 HA 集群角色检测(避免单节点先关闭触发故障切换);
    • 第二步:卸载双节点的存储池(保护 RAID 结构);
    • 第三步:停止双节点的 DSM 系统服务;
    • 第四步:依次触发 Passive、Active 服务器的软件关机;
  1. 等待约 5-10 分钟,观察双节点的 “状态指示灯”:当指示灯从 “闪烁” 变为 “熄灭”(或仅电源灯常亮,具体参考机型手册),表示软件关闭完成。

方法 2:分别关闭 Passive 与 Active 服务器(备用,适用于 HA 套件故障场景)

若 HA 套件无法正常启动,可手动分别关闭双节点,顺序建议 “先 Passive 后 Active”:
  1. 关闭 Passive 服务器:
    • 通过 Passive 节点的节点 IP(如 192.168.1.202)登录 DSM;
    • 点击 DSM 桌面右上角 “用户名→关机”,选择 “关机”(非 “重启”);
    • 确认 “是否立即关机”,点击 “确定”,等待指示灯熄灭;
  1. 关闭 Active 服务器:
    • 等待 Passive 服务器完全关闭后,通过 Active 节点的节点 IP(如 192.168.1.201)登录 DSM;
    • 重复 “用户名→关机” 操作,触发 Active 服务器软件关机;
  1. 确认双节点指示灯均熄灭,软件关闭完成。

步骤 3:执行物理断电(最后一步,确保安全)

软件关闭完成后,再进行硬件断电操作,避免系统未完全关机导致损坏:
  1. 断开双节点服务器的电源插头(或关闭 UPS 对应输出端口);
  1. (可选)断开 Heartbeat 与业务网口的网线(若需搬迁设备,按之前拍照的连接方式记录,方便重启时复原);
  1. 贴标签标识:在双节点服务器上贴 “已关闭,重启需按 HA 流程启动” 标签,避免其他人员误启动。

四、关闭后的 2 项关键验证与重启注意事项

关闭操作完成后,需记录状态并掌握正确的重启流程,为后续恢复服务做准备:

1. 关闭后的状态验证(避免遗漏操作)

  1. 硬件状态检查:确认双节点的电源灯、网口灯均已熄灭,无任何设备处于通电状态;
  1. 操作记录:记录关闭时间、操作人、关闭前的同步状态(如 “2024-10-20 15:30,同步 100%,无异常”),便于后续故障溯源。

2. 重启时的 3 个核心注意事项(确保集群正常恢复)

待维护 / 搬迁完成后,重启需遵循 “先硬件通电→再软件启动→最后恢复服务” 的顺序,重点注意:
  • 通电顺序:优先给 Passive 服务器通电(等待 2-3 分钟,让其进入待机状态),再给 Active 服务器通电,避免双节点同时启动导致角色冲突;
  • 同步检查:Active 服务器启动后,登录 HA 套件,确认 “Passive 服务器” 自动加入集群,“同步状态” 从 “待同步” 变为 “已同步”(增量同步约 1-5 分钟,全量同步需更久);
  • 服务恢复:同步完成后,再重新启用 SMB、iSCSI 服务和相关套件,通知客户端恢复访问(避免服务启动过早导致数据读写异常)。

五、常见问题 FAQ(解决关闭过程中的高频故障)

Q1:触发关闭时提示 “数据同步未完成,无法关机”,怎么办?

A:这是系统保护机制,需先等待同步完成,步骤如下:
  1. 进入 HA 套件→“同步” 标签页,查看 “同步进度”(如 “已同步 60%,剩余 20 分钟”);
  1. 等待进度达 100%,确认日志显示 “数据同步完成”;
  1. 若同步长期停滞(超过 30 分钟),检查 Heartbeat 连接是否正常(参考 “Heartbeat 连接异常排查”),修复后重新触发同步,完成后再执行关闭。

Q2:误操作直接断电,重启后 HA 集群显示 “存储池未就绪”,怎么处理?

A:强制断电导致存储池损坏,需执行修复:
  1. 登录 Active 服务器→“存储管理器→存储池”;
  1. 选中 “未就绪” 的存储池,点击 “操作→修复”;
  1. 系统自动检测并修复 RAID 校验错误(耗时取决于存储池大小,1TB 约需 30 分钟);
  1. 修复完成后,进入 HA 套件,确认 “同步状态” 恢复正常,再进行后续操作。

Q3:通过 HA 套件 “关闭整个集群” 后,Passive 服务器未响应,指示灯仍亮,怎么办?

A:可能是 Passive 服务器服务未完全停止,处理步骤:
  1. 通过 Passive 节点的 IP 尝试登录 DSM,若能登录,手动执行 “用户名→关机”;
  1. 若无法登录,长按 Passive 服务器的 “电源键”(约 5 秒),触发 “强制软关机”(区别于直接断电,系统会尝试卸载存储池);
  1. 等待指示灯熄灭后,再执行物理断电,避免重复故障。

Q4:关闭后重启,双节点均显示 “Active 角色”,出现脑裂,怎么解决?

A:重启时双节点同时启动导致角色冲突,需手动恢复:
  1. 先关闭其中一台节点(建议关闭原 Passive 节点);
  1. 登录保留的 Active 节点→“HA 套件→集群→管理→修复脑裂”;
  1. 按提示 “保留当前节点为 Active,移除另一节点”,修复后再启动原 Passive 节点,使其自动加入集群并同步数据。

总结

Synology HA 集群同时关闭 Active 和 Passive 服务器的核心是 “安全优先、数据同步前置”—— 禁止直接物理断电,需通过 DSM 软件触发关闭,确保存储池正常卸载、数据完全同步。操作流程需严格遵循 “准备→软件关闭→物理断电” 三步,重启时注意通电顺序与同步检查,避免角色冲突和数据损坏。本文的分步操作与故障处理方案均基于 Synology 官方指南,可直接用于生产环境,帮助用户在维护场景中高效、安全地完成双节点关闭。


Synology HA 集群如何同时关闭 Active 和 Passive 服务器?安全操作指南

新闻中心

联系我们

技术支持

  • ·

    Synology 无法访问共享文...

  • ·

    Synology NAS Win...

  • ·

    如何用 DiXiM Media ...

  • ·

    Synology DSM常规设置...

  • ·

    Active Backup fo...

  • ·

    Synology NAS打开Of...

  • ·

    Synology Migrati...

  • ·

    Synology Office多...

相关文章

地址:北京市海淀区白家疃尚品园             1号楼225

北京群晖时代科技有限公司

微信咨询

新闻中心