Synology VMM 高可用性设置教程:步骤、前提与故障解决
在使用 Synology Virtual Machine Manager(简称 VMM)部署虚拟机时,单台 NAS 的硬件故障(如硬盘损坏、电源故障)可能导致虚拟机突然中断,影响业务或家庭使用 —— 而 “高可用性(HA)” 功能正是为解决这一问题而生:通过两台 NAS 组成集群,当主 NAS 故障时,虚拟机可自动切换到备用 NAS 运行,实现 “零中断” 或 “低中断” 保障。但很多用户不清楚 “VMM 高可用性怎么设置”“需要什么条件才能搭 HA”,本文基于 Synology 官方知识库,系统梳理 Virtual Machine Manager 高可用性的设置要点,从准备工作到实操配置,再到功能验证,帮你快速搭建稳定的 VMM HA 环境。
一、先搞懂:VMM 高可用性(HA)的核心作用与适用场景
在开始配置前,需明确 VMM HA 的核心价值与适用场景,避免盲目搭建:
- 核心作用:通过 “主 - 备 NAS 集群” 实现虚拟机故障转移 —— 当运行虚拟机的 “主 NAS” 出现硬件故障(如主板故障、网络中断)或系统崩溃时,VMM 会自动将虚拟机迁移到 “备用 NAS”,并恢复运行,最大程度减少服务中断时间(通常中断时间<1 分钟);
- 适用场景:① 企业部署关键业务虚拟机(如文件服务器、ERP 系统);② 家庭搭建长期运行的媒体中心(如 Jellyfin 虚拟机);③ 对虚拟机稳定性有较高要求,不接受单节点故障导致服务停摆的场景;
- 不适用场景:① 仅单台 Synology NAS(HA 需至少两台);② 虚拟机对实时性要求极高(如工业控制),无法接受毫秒级中断;③ 未配置共享存储(HA 依赖共享存储存储虚拟机数据)。
二、必满足:VMM 高可用性设置的前提条件(硬件 / 软件 / 存储)
VMM HA 对硬件、软件、网络、存储有严格要求,所有条件必须同时满足,否则无法启用 HA 功能。具体要求如下表所示:
条件类型 | 具体要求 | 备注 |
硬件要求 | 1. 至少两台相同型号的 Synology NAS(如两台 DS923+,不支持不同型号混组,如 DS923 + 与 DS723+);2. 每台 NAS 至少 2GB 内存(推荐 4GB 及以上,虚拟机数量多时需 8GB+);3. 每台 NAS 至少 1 个千兆以太网口(推荐 2 个,分别用于 “集群通信” 和 “虚拟机网络”,避免带宽冲突);4. 每台 NAS 硬件状态正常(无硬盘错误、无电源警告,可通过 DSM “资源监视器” 检查)。 | 型号必须完全一致,包括 CPU 型号、主板版本,否则集群创建会失败 |
软件要求 | 1. 两台 NAS 均安装相同版本的 DSM 系统(如均为 DSM 7.2-64570 Update 3,不支持不同 DSM 版本混组);2. 两台 NAS 均安装相同版本的 Virtual Machine Manager(如均为 VMM 4.6.0-1020,需从 DSM “套件中心” 下载,确保版本同步);3. 两台 NAS 均启用 “SSH 服务”(可选,用于排查故障,非强制,但建议开启)。 | DSM 与 VMM 版本必须完全一致,升级时需先升级备用 NAS,再升级主 NAS |
网络要求 | 1. 两台 NAS 处于同一局域网(如均连接到同一路由器的 LAN 口,IP 地址在同一网段,如 192.168.1.10 和 192.168.1.11);2. 两台 NAS 需配置静态 IP 地址(避免 DHCP 分配导致 IP 变化,影响集群通信);3. 两台 NAS 之间网络连通性正常(无防火墙拦截,可通过 “ping” 命令测试,如在 A NAS ping B NAS 的 IP,需能正常响应)。 | 建议用网线直连两台 NAS 的专用网口(如网口 2),作为 “集群私有通信链路”,提升稳定性 |
存储要求 | 1. 需配置共享存储(用于存储虚拟机磁盘文件,HA 依赖共享存储实现虚拟机数据同步),支持两种类型: - Synology iSCSI LUN(推荐,需在其中一台 NAS 创建 iSCSI 目标与 LUN,另一台 NAS 挂载); - Synology Shared Folder(仅支持小型虚拟机,性能低于 iSCSI LUN,不推荐用于多虚拟机场景);2. 共享存储容量需≥所有虚拟机磁盘容量总和(预留 20% 空间,避免容量不足导致 HA 失效);3. 共享存储需授予两台 NAS “读写权限”(确保两台 NAS 均可访问虚拟机数据)。 | 共享存储是 HA 的核心,若共享存储故障,HA 功能也会失效,建议用 RAID 5/6 保护共享存储 |
三、分步配置:Virtual Machine Manager 高可用性搭建流程
VMM HA 配置需按 “准备共享存储→创建 VMM 集群→启用 HA 功能→配置虚拟机 HA” 的顺序操作,全程需使用管理员账户(普通用户无集群配置权限),每一步均标注关键操作点与验证方法:
步骤 1:准备共享存储(以 iSCSI LUN 为例,推荐方案)
共享存储需先在 “主 NAS”(任选一台,后续可调整角色)创建,再由 “备用 NAS” 挂载,确保两台 NAS 均可访问:
- 在主 NAS 创建 iSCSI 目标与 LUN:
- 登录主 NAS 的 DSM 桌面,打开「控制面板→存储管理器→iSCSI」,切换到「iSCSI 目标」标签页,点击「创建」;
- 输入 iSCSI 目标名称(如 “VMM_HA_Target”),点击「下一步」,默认勾选 “启用 CHAP 认证”(可选,提升安全性,记录 CHAP 用户名和密码),点击「下一步」完成目标创建;
- 切换到「iSCSI LUN」标签页,点击「创建」,选择 “块级 LUN”,点击「下一步」;
- 选择存储位置(需为 RAID 保护的存储池,如 “Storage Pool 1”),输入 LUN 名称(如 “VMM_HA_LUN”),设置容量(如 100GB,需满足虚拟机需求),点击「下一步」;
- 关联到刚创建的 iSCSI 目标(“VMM_HA_Target”),点击「下一步」完成 LUN 创建,此时主 NAS 的 iSCSI LUN 已就绪。
- 在备用 NAS 挂载 iSCSI LUN:
- 登录备用 NAS 的 DSM 桌面,打开「控制面板→存储管理器→iSCSI」,切换到「iSCSI 发起程序」标签页,点击「新增」;
- 输入主 NAS 的 IP 地址(如 192.168.1.10)和 iSCSI 目标名称(“VMM_HA_Target”),若启用了 CHAP 认证,输入 CHAP 用户名和密码,点击「确定」;
- 点击「连接」,待状态显示 “已连接” 后,切换到「存储池」标签页,可看到挂载的 iSCSI LUN(显示为 “外部 LUN”),说明共享存储准备完成。
步骤 2:创建 VMM 集群(将两台 NAS 组成 HA 节点)
VMM 集群是启用 HA 的基础,需将两台 NAS 添加为 “集群节点”,统一管理资源:
- 在主 NAS 打开 VMM 并初始化集群:
- 主 NAS 桌面打开「Virtual Machine Manager」,首次使用需同意用户协议,进入主界面后,点击左侧菜单栏「集群」,选择「创建集群」;
- 输入集群名称(如 “VMM_HA_Cluster”),选择 “集群存储”(即步骤 1 创建的 iSCSI LUN “VMM_HA_LUN”),点击「下一步」;
- 配置 “集群网络”:选择用于集群通信的网口(如 “eth1”,建议用专用网口),设置集群 IP 地址(如 192.168.1.12,需与两台 NAS 在同一网段,且未被占用),点击「下一步」。
- 添加备用 NAS 为集群节点:
- 在 “添加节点” 页面,输入备用 NAS 的 IP 地址(如 192.168.1.11)、DSM 管理员用户名和密码,点击「验证」;
- 验证通过后,系统会自动检查备用 NAS 的硬件、软件版本(需与主 NAS 一致,否则提示 “版本不匹配”),检查通过后点击「下一步」;
- 配置备用 NAS 的 “集群网络”:选择与主 NAS 相同的网口类型(如 “eth1”),确保集群通信链路一致,点击「下一步」;
- 确认集群配置信息(节点 IP、存储、网络),点击「应用」,系统开始创建集群(约 5-10 分钟,期间两台 NAS 会重启 VMM 服务,不可中断);
- 集群创建完成后,左侧「集群」页面会显示 “正常” 状态,节点列表包含两台 NAS,说明集群搭建成功。
步骤 3:启用 VMM 高可用性功能
集群创建后需手动启用 HA,设置故障转移参数:
- 在 VMM 集群页面,点击顶部「高可用性→启用高可用性」;
- 设置 “故障转移阈值”:即主 NAS 连续无响应多久后触发转移(默认 30 秒,推荐 20-60 秒,过短可能误触发,过长会延长中断时间);
- 设置 “虚拟机启动顺序”:若有多个虚拟机,可调整启动优先级(如 “文件服务器” 优先于 “测试虚拟机”),确保关键服务先恢复;
- 勾选 “启用自动恢复”(可选,主 NAS 故障恢复后,虚拟机是否自动迁回主 NAS,推荐关闭,避免二次中断);
- 点击「应用」,系统开始启用 HA(约 2-3 分钟),启用后集群页面会显示 “高可用性:已启用”,说明 HA 功能就绪。
步骤 4:为虚拟机启用 HA(关键步骤,否则无法故障转移)
集群 HA 启用后,需为现有或新建虚拟机单独开启 HA,否则虚拟机不参与故障转移:
- 新建虚拟机时启用 HA:
- 在 VMM 中点击「虚拟机→创建」,按向导配置虚拟机(操作系统、CPU、内存、磁盘);
- 在 “存储” 步骤,选择步骤 1 创建的共享存储(“VMM_HA_LUN”)作为虚拟机磁盘位置(必须选共享存储,本地存储无法支持 HA);
- 在 “高可用性” 步骤,勾选 “启用高可用性”,点击「下一步」完成创建,新建虚拟机默认会加入 HA 列表。
- 为现有虚拟机启用 HA:
- 先关闭现有虚拟机(运行中的虚拟机无法修改 HA 设置),在 VMM 虚拟机列表中右键目标虚拟机,选择「编辑设置」;
- 切换到「高可用性」标签页,勾选 “启用高可用性”,点击「存储」标签页,确认虚拟机磁盘已位于共享存储(若在本地存储,需先迁移到共享存储:右键虚拟机→「迁移→存储迁移」,选择共享存储);
- 点击「确定」,重启虚拟机,此时虚拟机已支持 HA 故障转移。
四、功能验证:手动触发故障转移,确认 HA 生效
配置完成后需验证 HA 是否正常工作,避免真正故障时失效,推荐两种验证方法:
方法 1:手动模拟主 NAS 故障(安全验证,推荐)
- 在 VMM 集群页面,查看当前 “主节点”(节点列表中标记 “主” 的 NAS,如 192.168.1.10);
- 右键主节点,选择「模拟故障转移」(VMM 提供的安全模拟功能,无需断电,不会损坏数据);
- 系统会提示 “即将触发故障转移,虚拟机将迁移到备用节点”,点击「确认」;
- 观察虚拟机状态:迁移过程中虚拟机状态会显示 “迁移中”(约 10-30 秒),迁移完成后显示 “运行中”,且节点变为备用节点(如 192.168.1.11);
- 验证虚拟机可用性:通过远程桌面或应用访问虚拟机,确认服务正常(如文件服务器可访问、应用可打开),说明 HA 生效。
方法 2:物理断电主 NAS(真实场景验证,需谨慎)
- 确认虚拟机正在主 NAS 运行(如通过 VMM 查看虚拟机 “运行节点” 为 192.168.1.10);
- 断开主 NAS 的电源(模拟硬件故障);
- 观察备用 NAS:约 30 秒(故障转移阈值时间)后,备用 NAS 会自动检测到主节点故障,开始启动虚拟机;
- 待虚拟机启动完成(约 1-2 分钟,取决于虚拟机系统),访问虚拟机确认服务正常,说明 HA 在真实故障场景下有效。
五、常见问题:VMM 高可用性配置失败与解决方案
在配置过程中,用户常遇到 “集群创建失败”“HA 启用报错”“故障转移失效” 等问题,以下是官方推荐的解决方案:
问题 1:添加集群节点时提示 “版本不匹配”
- 原因:两台 NAS 的 DSM 版本或 VMM 版本不一致(如主 NAS 是 DSM 7.2,备用 NAS 是 DSM 7.1);
- 解决方案:① 登录两台 NAS 的 DSM,进入「控制面板→更新与还原」,将 DSM 升级到相同版本;② 打开「套件中心→已安装」,将 VMM 升级到相同版本;③ 升级后重启两台 NAS,重新添加节点。
问题 2:启用 HA 时提示 “共享存储不可访问”
- 原因:① 备用 NAS 未挂载 iSCSI LUN;② 共享存储权限不足;③ 网络中断导致 LUN 连接失效;
- 解决方案:① 登录备用 NAS,检查「存储管理器→iSCSI」,确认 LUN 状态为 “已连接”;② 在主 NAS「iSCSI 目标」中,确认备用 NAS 的 IP 已添加到 “允许访问的 IP” 列表;③ 用 ping 命令测试两台 NAS 之间的网络连通性,排除防火墙拦截。
问题 3:故障转移后虚拟机无法启动
- 原因:① 虚拟机磁盘未位于共享存储(仍在本地存储);② 共享存储故障(如 LUN 损坏);③ 虚拟机配置与备用 NAS 硬件不兼容;
- 解决方案:① 确认虚拟机磁盘位置:在 VMM 虚拟机「编辑设置→存储」中,检查是否为共享存储;② 检查共享存储状态:在主 NAS「存储管理器」中,确认 iSCSI LUN 无错误;③ 确认两台 NAS 型号一致,避免硬件不兼容(如 CPU 不支持的指令集)。
六、注意事项:保障 VMM 高可用性长期稳定运行
- 定期同步软件版本:升级 DSM 或 VMM 时,需先升级 “备用节点”,再升级 “主节点”,避免版本不一致导致集群分裂;
- 监控共享存储状态:共享存储是 HA 的核心,需定期检查 LUN 容量(避免满容量)和健康状态(通过「存储管理器→硬盘」查看,及时更换故障硬盘);
- 避免同时重启两台节点:维护时需先重启备用节点,待其恢复后再重启主节点,确保集群始终有一台节点在线;
- 备份虚拟机配置:定期在 VMM 中导出虚拟机配置(「虚拟机→导出配置」),避免 HA 故障时无法恢复虚拟机;
- 限制虚拟机数量:每台 NAS 支持的 HA 虚拟机数量取决于内存和 CPU 性能(如 4GB 内存建议不超过 3 台虚拟机),过多会导致故障转移卡顿。
总结