Synology SHA集群SSH关闭教程:详细步骤+故障排查+安全注意事项(DSM全版本适配)
在企业级数据存储场景中,Synology SHA(High Availability)高可用集群通过活动服务器与无源服务器的实时数据同步,实现服务连续性保障。但在硬件维护、系统升级等场景下,需安全关闭整个集群——若直接断开电源,可能导致数据同步中断、元数据损坏等风险。当DSM图形界面无法操作时,通过SSH关闭SHA集群成为核心应急方案。本文基于Synology官方技术文档,从集群认知、前置准备、实操步骤、结果验证到故障排查,全面拆解SSH关闭SHA集群的技术要点,适配DSM 6.2及以上版本,为运维人员提供标准化操作指南。
一、SHA集群核心认知:为何需通过SSH规范关闭?
在执行关闭操作前,需先明确SHA集群的架构特性,理解规范关机的底层逻辑。
1. SHA集群的基本构成与运行机制
SHA集群由两台兼容的Synology服务器组成,核心架构包含两大节点与两类连接:
- 活动服务器(Active Server):正常状态下承担所有服务处理与数据存储,是集群的核心节点;
- 无源服务器(Passive Server):处于 standby 模式,实时接收活动服务器的同步数据,故障时自动接管服务;
- 心跳连接(Heartbeat Connection):专用私有网络连接,用于节点状态监测与数据复制,要求延迟低于1ms、带宽不低于500Mbps;
- 集群连接(Cluster Connection):通过交换机实现节点与客户端的通信,保障用户访问连续性。
2. 违规关机的3大风险
直接关闭单节点电源或强制断电,会触发以下问题:
- 数据不一致:心跳连接中断导致同步进程异常终止,无源服务器数据与活动服务器出现偏差;
- 服务启动失败:下次开机时集群需重新校验数据完整性,可能因元数据损坏无法正常组建集群;
- 资源锁定:未释放的文件锁会导致部分共享文件夹无法访问,需手动修复权限。
3. SSH关闭的核心优势
相比图形界面关机,SSH方式更适用于以下场景:
- DSM Web界面崩溃或无法访问;
- 远程维护时无图形化操作环境;
- 批量运维中需通过脚本自动化执行关机流程。
二、关闭前的4项核心准备工作(必做检查)
SSH关闭SHA集群需满足权限、网络、状态三大前提,操作前需完成以下检查,避免执行失败。
1. 权限与账户准备
- 需拥有集群超级管理员账户(如admin),且该账户已启用SSH访问权限;
- 确认账户具备`root`权限获取资格——DSM默认允许管理员通过`sudo`命令提升权限。
2. 集群状态预检查
通过DSM图形界面或SSH提前确认集群状态,异常时需先排查再关机:
1. 登录DSM→打开「Synology High Availability」套件;
2. 查看「状态」区域:需显示“正常”,无“分裂脑(split-brain)”等错误提示;
3. 检查数据同步进度:确保无源服务器同步状态为“已完成”,避免同步中途关机;
4. 确认服务运行状态:关闭非核心服务(如Docker容器、虚拟机),减少关机数据处理压力。
3. SSH服务启用与配置
若未启用SSH服务,需通过DSM图形界面提前配置(仅首次操作需执行):
1. 登录活动服务器的DSM→进入「控制面板→终端机和SNMP→终端机」;
2. 勾选「启用SSH服务」,建议修改默认端口22为自定义端口(如2222),降低暴力破解风险;
3. 点击「应用」保存设置,此时集群节点的SSH服务均被启用(SHA集群会同步核心系统配置)。
4. 工具与环境准备
- 本地终端工具:Windows推荐PuTTY、Xshell,macOS/Linux直接使用系统终端;
- 网络连通性:确保本地设备与SHA集群节点在同一局域网,或通过VPN实现远程访问;
- 应急方案:准备集群最新快照或备份文件,若关机失败可通过备份恢复数据。
三、通过SSH关闭SHA集群的6步标准流程
以下步骤需在活动服务器上执行(无源服务器会随集群指令同步关闭),每步均需严格按要求操作并确认结果。
步骤1:建立SSH连接
1. 打开终端工具(以PuTTY为例),在「Host Name」输入活动服务器的IP地址(如192.168.1.100);
2. 在「Port」输入已配置的SSH端口(默认22或自定义的2222),连接类型选择「SSH」;
3. 点击「Open」,首次连接会弹出密钥确认窗口,选择「Yes」进入登录界面。
步骤2:登录管理员账户
终端提示「login as:」时,输入超级管理员账户名(如admin),按Enter键;
接着输入账户密码(输入时无字符显示,输完直接按Enter),若提示「Welcome to DSM」,表示登录成功。
步骤3:获取root权限
输入以下命令并按Enter,申请提升至root权限:
```bash
sudo -i
```
系统会再次要求输入管理员密码,输入后按Enter,终端提示符从「$」变为「」,表示已成功获取root权限(核心操作必须以root身份执行)。
步骤4:执行集群关闭命令
输入官方指定的SHA集群关闭命令,该命令会自动协调两节点同步关机:
```bash
synoha --shutdown-ha
```
按下Enter后,终端会显示关闭进程提示(如「Shutting down HA cluster...」),默认关闭过程需600秒(10分钟),期间切勿中断SSH连接或强制退出终端。
步骤5:等待关闭完成
关闭过程中,集群会执行三大操作:
1. 停止所有运行中的服务(如文件服务、备份任务);
2. 完成最后一次增量数据同步,确保两节点数据一致性;
3. 依次关闭无源服务器与活动服务器的系统进程。
当终端显示「HA cluster shutdown successfully」时,表示关闭操作完成。
步骤6:断开SSH连接
输入退出命令关闭终端会话:
```bash
exit
```
或直接点击终端窗口的关闭按钮,此时SSH连接已安全断开。
四、关闭结果的3重验证方法
为确保集群完全关闭且无异常,需从网络、物理状态、系统层面进行多维度验证。
1. SSH连接验证
重新尝试通过SSH连接活动服务器与无源服务器,若提示「Connection refused」或「No route to host」,说明节点SSH服务已停止,符合关机预期。
2. 物理状态验证
- 观察服务器指示灯:电源灯从常亮变为熄灭,硬盘指示灯停止闪烁;
- 监听设备声音:服务器风扇停止转动,无硬盘读写噪音,确认硬件完全断电。
3. DSM界面验证
在浏览器中输入集群IP或DSM访问地址(如http://192.168.1.100:5000),若无法打开登录页面,进一步证明集群已成功关闭。
五、高频故障排查:8大问题解决方案
执行过程中若出现连接失败、命令报错等问题,可按以下方案针对性解决。
1. 问题:SSH连接提示「Connection timed out」
- 原因:SSH端口未开放、网络不通或服务器未开机;
- 解决:① 检查DSM的SSH服务是否启用;② 用ping命令测试节点IP连通性(如`ping 192.168.1.100`);③ 确认防火墙未拦截自定义SSH端口(需在「控制面板→安全→防火墙」添加端口规则)。
2. 问题:输入`sudo -i`提示「permission denied」
- 原因:当前账户无管理员权限或未加入sudoers组;
- 解决:① 确认使用的是超级管理员账户(非普通用户);② 登录DSM图形界面,进入「控制面板→用户与群组」,检查账户是否勾选「管理员权限」。
3. 问题:执行`synoha --shutdown-ha`提示「command not found」
- 原因:DSM版本过低或SHA套件未正常安装;
- 解决:① 确认DSM版本为6.2及以上(旧版本需升级);② 检查「套件中心」中「Synology High Availability」套件是否处于「已安装」状态,异常时重新安装。
4. 问题:关闭过程超过10分钟仍未完成
- 原因:存在未停止的高负载服务或数据同步阻塞;
- 解决:① 按「Ctrl+C」中断当前命令;② 执行`synoha --status`查看阻塞进程;③ 手动停止占用资源的服务(如`synoservice --stop pkgctl-Docker`),重新执行关闭命令。
5. 问题:关闭后无源服务器未断电
- 原因:心跳连接异常导致指令未同步;
- 解决:① 确认活动服务器已成功关闭;② 等待5分钟后手动关闭无源服务器电源(此时数据已同步完成,无损坏风险)。
6. 问题:重启后集群无法组建
- 原因:关机前数据同步未完成;
- 解决:① 登录活动服务器DSM;② 打开「Synology High Availability」套件,执行「修复集群」操作,系统会自动校验并同步数据。
7. 问题:SSH连接提示「Host key verification failed」
- 原因:节点IP不变但系统重装,导致密钥不匹配;
- 解决:① Windows用户删除PuTTY的历史密钥缓存;② macOS/Linux执行`ssh-keygen -R 192.168.1.100`(替换为节点IP),清除旧密钥后重新连接。
8. 问题:关闭后部分文件无法访问
- 原因:关机时文件锁未释放;
- 解决:① 重启集群进入DSM;② 通过SSH执行`chmod -R 755 /volume1/共享文件夹名称`,修复权限后重试访问。
六、安全注意事项与后续操作指南
1. 核心安全禁忌
- 禁止直接关闭单节点电源:必须通过`synoha --shutdown-ha`命令同步关机,避免数据分裂;
- 禁止在同步过程中中断操作:关闭指令执行期间,SSH连接中断可能导致集群处于“半关机”状态;
- 禁止使用普通关机命令:`shutdown -h now`等系统命令仅关闭单节点,会破坏集群一致性。
2. 维护后的开机流程
关闭集群完成维护后,需按以下顺序开机:
1. 先接通无源服务器电源,等待其进入待机状态;
2. 再接通活动服务器电源,开机后集群会自动重组;
3. 登录DSM确认「Synology High Availability」套件显示“正常”,数据同步状态为“已完成”。
3. 日常运维建议
- 定期备份集群配置:通过「Hyper Backup」备份SHA集群设置,避免故障后重新配置;
- 监控心跳连接:在「Synology High Availability」套件中实时查看心跳连接延迟与带宽,异常时及时排查网络;
- 升级系统与套件:保持DSM与SHA套件为最新版本,修复已知的关机兼容性问题。
总结
通过SSH关闭Synology SHA集群的核心是“规范指令+状态校验”——借助`synoha --shutdown-ha`官方命令,可实现两节点的同步安全关机,避免违规操作导致的数据风险。运维人员需严格遵循“准备检查→SSH连接→权限提升→命令执行→结果验证”的标准化流程,遇到问题时通过连接测试、进程排查等方法快速定位解决。
若您在操作中遇到“特定DSM版本关闭命令差异”“集群分裂后关机处理”等复杂场景,可参考Synology官方文档(https://kb.synology.cn/zh-cn/DSM/tutorial/How_to_shut_down_SHA_cluster_via_SSH)获取型号适配细节,或提供您的集群型号(如DS3622xs+)与具体问题,我帮您定制排查方案。
需要我为您整理一份《SHA集群SSH关闭操作checklist》吗?包含前置检查项、命令速查表、故障排查流程图,方便您运维时快速核对,确保操作零失误?

地址:北京市海淀区白家疃尚品园 1号楼225
北京群晖时代科技有限公司
