在Proxmox VE中设置包含3个节点的高可用性集群
2026-04-30
Proxmox 虚拟环境(Proxmox VE 或 PVE)是一款基于 Debian 的开源虚拟化平台,可为虚拟机和容器的管理提供强大而可靠的性能。凭借其直观易用的网页界面,Proxmox 简化了虚拟化基础设施的管理工作,从而提升 IT 运维效率。它支持集群管理和高可用性(HA)。在存储方面,Proxmox 不仅支持 LVM、NFS 和 iSCSI 等常见存储方案,还支持 GlusterFS 和 Ceph 等集群式存储解决方案。
什么是 Proxmox 高可用性?
Proxmox HA 是 Proxmox 虚拟环境中的高可用性功能。该系统可确保您的虚拟机(VM)和容器持续运行——即使您的某台服务器发生故障。当您为某台虚拟机或容器启用高可用性后,Proxmox 会在集群中的所有节点上监控其运行状态。一旦承载该虚拟机的节点离线,系统便会自动在另一台健康的节点上重启该工作负载。
此过程速度很快——通常不到两分钟——且无需人工干预。其核心组件包括:
HA 管理器:监控受保护的虚拟机/容器,并使用 CRM(集群资源管理器)模型处理故障转移。
Corosync:管理集群节点之间的通信,以保持节点同步。
隔离机制:确保故障节点被隔离,从而防止其损坏共享数据。
通过这些组件协同工作,Proxmox 高可用性(HA)功能可在不依赖复杂脚本或第三方工具的情况下,自动从硬件故障中恢复。
要求
Proxmox VE 提供内置的高可用性(HA)功能,但启用 HA 需满足以下先决条件:
一个正常运行的集群,至少包含三个节点(以满足投票机制并防止脑裂情况发生)。
共享存储的使用。
冗余服务器硬件,例如双电源、ECC内存、RAID等。
依赖知名品牌可靠的服务器硬件。
看门狗:如有硬件看门狗则使用硬件看门狗;否则可作为备用方案使用 Linux 内核的软件看门狗。
可选的硬件隔离设备。
创建包含3个节点的集群
1. 登录 Proxmox VE,然后依次进入 数据中心 > 集群 > 创建集群。

2. 设置名称并指定网络,然后点击创建。

集群名称:设置集群名称,注意创建后无法更改。
集群网络:指定集群的网络,其默认值为主机名解析得到的IP地址。
3. 等待“创建集群”任务完成,您将看到第一个集群已创建成功。您可以确认此时集群节点部分已包含名为“proxmox”的首个节点。


4. 集群创建完成后,您可以向该集群添加其他节点。请导航至 数据中心 > 集群 > 加入信息。

5. 点击“复制信息”,以便在向集群添加其他节点时,后续使用这些详细信息。

6. 要继续配置您的第二个节点,请依次进入数据中心 > 集群 > 加入集群,然后将之前复制的信息粘贴到指定字段中。
信息:粘贴之前复制的信息。
对等节点地址: 集群中另一节点的IP地址将自动填写。
密码:输入已加入集群的节点的 root 密码。
指纹:自动填充。
集群网络:默认值为从主机名解析出的IP地址,代表集群网络。
请注意,加入集群需要更新证书颁发机构(CA)信息并重启 pve-cluster 服务,此过程可能导致页面短暂无响应。请勿担心,稍等片刻后刷新浏览器并重新登录即可。
要查看集群信息,请转到集群节点。您将发现已有两个节点列出。
如果您还有其他节点需要添加到集群中,请重复上述步骤。
配置高可用性
1. 在 数据中心 部分,依次进入 高可用性(HA) > 组 > 创建,以新建一个高可用性(HA)组。

2. 进入高可用性组(HA Group)的配置界面:
ID:为家庭自动化组指定一个名称。
受限: 仅允许资源在属于此高可用性组的节点上运行。
无故障回切:如果当前正在运行资源的节点发生故障,高可用性(HA)系统会将这些资源迁移到其他健康的节点上。请选择在原节点恢复后是否将资源重新迁移回该节点。通常建议启用此选项,以避免触发过多的资源迁移操作,从而导致网络带宽和磁盘I/O压力增大。
备注: 添加任何其他说明或信息。
节点列表:指定应包含在此高可用性(HA)组中的PVE节点。对于每个节点,您可以分配一个优先级。较高的优先级表示更倾向于在此节点上运行资源。在确定优先级时,请考虑各节点的性能特性。
3. 设置完成后,您可以在列表中查看已创建的高可用性组。
向高可用性配置中添加资源
1. 转至 数据中心 > 高可用性 > 资源 > 添加,然后选择资源类型(虚拟机/容器)。
2. 进入资源添加界面:
虚拟机:从下拉列表中选择所需的云服务器(CT)或虚拟机(VM)资源。
最大重启次数:指定资源启动失败时的最大重启尝试次数。
最大重定位次数:在达到最大重启限制后,指定可向下一节点重定位的最大次数。
组:从下拉列表中选择资源应运行的高可用性(HA)组。
请求状态:选择资源所需的运行状态,可选项如下:
已启动:高可用性(HA)确保资源保持在已启动状态。
已停止:高可用性(HA)确保资源保持在已停止状态。
已忽略:家庭自动化系统将忽略此资源,且不会对其执行任何操作。
已禁用:高可用性(HA)确保资源保持在已停止状态,且不会尝试迁移到其他节点。
备注:资源的其他说明或注释。
3. 添加资源后,您会注意到家庭自动化(HA)状态发生变化,表明资源已成功添加。
验证高可用性(HA)功能
为验证高可用性(HA)功能是否正常工作,您可以模拟节点故障:关闭正在运行该虚拟机的节点,随后将观察到看门狗机制触发重启。稍等片刻后,您将看到该虚拟机已迁移到另一节点并正在其上运行。
简化您的 Proxmox VE 保护
尽管 Proxmox 高可用性支持虚拟机自动故障切换至其他节点,但为获得双重保障,您最好选择专业的 Proxmox 备份与灾难恢复解决方案。
Vinchin备份与恢复 是一款功能强大的Proxmox VE 环境保护解决方案,提供高级备份功能,包括虚拟机自动备份、无代理备份、局域网/无局域网备份、异地副本、高效数据缩减、云归档等,并严格遵循3-2-1黄金备份架构,全面保障您的数据安全与完整性。
在恢复方面,Vinchin 备份与恢复软件提供即时虚拟机恢复功能,可通过直接运行备份中的虚拟机,将恢复时间目标(RTO)缩短至 15 秒。您还可选择文件级细粒度恢复,从 Proxmox VE 虚拟机备份中提取特定文件。
此外,数据加密和防勒索软件保护为您提供双重保障,保护 Proxmox VE 虚拟机备份。您还可以轻松将数据从 Proxmox 主机迁移至其他虚拟化平台,反之亦然。
只需按照以下 4 个步骤即可备份您的 Proxmox 虚拟机:
1. 选择备份对象。

2. 选择备份目标位置。

3. 配置备份策略。

4. 审核并提交任务。

Vinchin 备份与恢复软件已被数千家企业选用,您也可以立即开始使用这一功能强大的系统,享受为期15天的全功能免费试用!此外,您还可联系我们并留下您的需求,我们将根据您的IT环境为您提供相应解决方案。
下载免费试用版
适用于多种数据备份
* 15天全功能免费安全下载
Proxmox 高可用性(HA)常见问题解答
问题1:如果集群失去法定票数(quorum),会发生什么?
集群将停止进行任何更改,直至法定数量恢复;在获得多数投票节点重新上线之前,不会启动任何新资源。
Q2:我能否在集群中混合使用不同的 CPU 型号?
可以——但需在每台虚拟机的硬件设置中为其 cpu-type 选项进行配置,以确保即使 CPU 存在细微差异,实时迁移也能顺利进行。
Q3:故障转移期间如何处理资源预留?
在每台主机上保留未使用的备用容量,其比例应与预期最坏情况下的负载变化相匹配;在必要时使用受限组/优先级设置。
结论
高可用性(High Availability)是 Proxmox VE 的一项关键功能。当发生硬件故障时,它可自动将虚拟机和容器故障转移至集群中的其他节点。这对于保障系统持续运行、确保关键服务始终可用至关重要。
您可以选择 Vinchin 备份与恢复软件,轻松备份和恢复您的 Proxmox VE 虚拟机。立即免费试用,切勿错过!