eviden-logo

Evidian > SafeKit:全合一 SANless 高可用性与应用程序集群软件 > 镜像集群中的块级别和文件级别的数据复制

镜像集群中的块级别和文件级别的数据复制

Evidian SafeKit

实时文件复制和应用程序故障转移

镜像集群是一种主动-被动(active-passive)的高可用性解决方案,通过在双节点集群中部署镜像模块来构建。应用程序在主服务器上运行,如果主服务器发生故障,应用程序将在辅助服务器上自动重启。

凭借其实时文件复制功能,这种架构特别适用于为拥有关键数据的后端应用程序提供高可用性,以防止故障发生。

Microsoft SQL Server、PostgreSQL、MariaDB、Oracle、Milestone、Nedap、Docker、Podman、Hyper-V 和 KVM 解决方案都是镜像模块的示例。您可以基于 generic mirror.safe 模块为您的应用程序创建自己的镜像模块。

请注意,Hyper-V 和 KVM 镜像模块会复制整个虚拟机,包括应用程序和操作系统。它们不需要虚拟 IP,因为虚拟机的重启会自动处理虚拟机物理 IP 地址的故障转移。

SafeKit 镜像集群如何工作?

第 1 步:实时复制

服务器 1 (PRIM) 运行应用程序。客户端连接到一个 虚拟 IP 地址。SafeKit 通过网络实时复制文件内部的修改。

在镜像集群中以字节级别进行的文件复制

复制是同步的,与异步复制相反,发生故障时不会丢失数据。
您只需在 SafeKit 中配置要复制的目录名称。对磁盘组织没有先决条件。目录可以位于系统磁盘中。

第 2 步:自动故障切换

当服务器 1 发生故障时,服务器 2 接管。SafeKit 自动切换虚拟 IP 地址并在服务器 2 上重启应用程序。
应用程序在服务器 2 上找到 SafeKit 复制的最新文件。应用程序继续在服务器 2 上运行,并通过本地修改其文件,这些文件不再复制到服务器 1。

镜像集群中的故障切换

故障切换时间等于故障检测时间(默认为 30 秒)加上应用程序启动时间。

第 3 步:自动故障恢复

故障恢复涉及在修复导致服务器 1 故障的问题后,重新启动服务器 1。
SafeKit 自动重新同步文件,仅更新在服务器 1 停止期间在服务器 2 上修改过的文件。

镜像集群中的故障恢复

故障恢复过程不会干扰应用程序,应用程序可以继续在服务器 2 上运行。

第 4 步:恢复正常

重新集成后,文件再次处于镜像模式,如第 1 步所示。系统恢复到高可用性模式,应用程序在服务器 2 上运行,SafeKit 将文件更新复制到服务器 1。

镜像集群中恢复正常运行

如果管理员希望应用程序在服务器 1 上运行,他/她可以在适当的时间手动执行“交换”(swap)命令,或通过配置自动执行。

如何配置 SafeKit 镜像集群 (Mirror Cluster)?

SafeKit Web 控制台:高可用配置仪表盘,显示镜像集群的心跳网络、虚拟 IP 设置和实时目录同步。

SafeKit Web 控制台提供了一个直观的界面,用于为您关键应用编排高可用性。只需几个步骤,您即可配置 SafeKit 镜像集群以确保业务连续性:

  • 应用故障转移 (Macros 选项卡): 定义在发生故障时需要自动重启的具体应用服务。
  • 心跳网络: 集群节点使用的专用通信路径,用于持续监控彼此的健康状况和可用性,并同步故障转移决策。
  • 虚拟 IP 管理: 设置虚拟 IP (VIP),以便在故障转移后实现客户端的透明重连。
  • 实时复制: 选择关键目录,进行基于主机的同步字节级数据复制。
  • 检查器 (Checkers): 监控应用的运行状况,并在检测到进程故障时触发自动恢复。

SafeKit 集群包含一个专用的脑裂检查器 (split-brain checker),用于解决网络隔离问题,无需第三方仲裁机 (witness machine) 或额外的心跳网络。了解更多关于 集群中的停电和网络隔离 的信息。

如何监控 SafeKit 镜像集群 (Mirror Cluster)?

SafeKit Web 控制台:2 节点镜像集群的实时监控,显示具有活动数据复制功能的 PRIM 和 SECOND 状态。

SafeKit 管理控制台为您的高可用性基础设施提供统一视图。它允许管理员实时监控集群的运行状态并追踪数据同步情况。

对于 2 节点镜像集群,控制台会清晰地显示每台服务器的角色:

  • PRIM (主节点): 当前运行应用程序并管理虚拟 IP 的活动节点。它负责写入本地存储并向次要节点进行实时复制。
  • SECOND (次要节点): 接收同步字节级更新的待命节点。如果主节点发生故障,它已准备好立即接管。
  • ALONE (独立) 状态: 当集群仅在单个节点上运行(例如在维护期间或发生故障后)时,该状态会发出视觉告警,提示冗余暂时丢失。
  • 再同步进度: 当故障节点恢复时,其状态在后台数据重新整合期间会变为橙色,确保在“恢复正常”阶段不会出现停机。

除了简单的状态图标外,该界面还提供一键式故障转移编排,允许您在计划内维护时手动交换角色(主/次),且不会中断用户活动。

🔍 SafeKit 高可用性导航中心

探索 SafeKit:功能特性、技术视频、文档资料及免费试用
资源类型 描述 直接链接
关键特性 为什么选择 SafeKit 实现简单且经济高效的高可用性? 查看为何选择 SafeKit 实现高可用性
部署模式 全合一 SANless HA:无共享软件集群 查看 SafeKit 全合一 SANless HA
合作伙伴 SafeKit:合作伙伴高可用性方案的标杆 查看为何 SafeKit 是合作伙伴的 HA 标杆
HA 策略 SafeKit:基础设施(VM)级 vs. 应用程序级高可用性 查看 SafeKit HA 与冗余:VM 级 vs. 应用级
技术规格 SafeKit 集群的技术限制 查看 SafeKit 高可用性限制条件
概念验证 SafeKit:高可用性配置与故障转移演示 查看 SafeKit 故障转移教程
架构 SafeKit 镜像集群(Mirror Cluster)工作原理(实时复制与故障转移) 查看 SafeKit 镜像集群:实时复制与故障转移
架构 SafeKit 场集群(Farm Cluster)工作原理(网络负载均衡与故障转移) 查看 SafeKit 场集群:网络负载均衡与故障转移
竞争优势 对比:SafeKit vs. 传统高可用性(HA)集群 查看 SafeKit vs. 传统 HA 集群对比
技术资源 SafeKit 高可用性:文档、下载与试用 查看 SafeKit HA 免费试用与技术文档
预配置解决方案 SafeKit 应用模块库:开箱即用的 HA 解决方案 查看 SafeKit 高可用性应用模块