Windows或Linux集群的心跳机制,失效备援和仲裁机制

Evidian SafeKit

Windows和Linux集群的心跳机制与失效备援是怎样的

同步两台服务器和发现服务器失效的基础机制就是心跳,它是在被一对服务器共享的网络上的监控数据流。

SafeKit软件支持同两台服务器的共享网络数量一致的心跳数量。心跳机制是用来实施Windows和Linux集群的。它整合在镜像集群架构中的。

在通常的操作中,两台服务器通过心跳渠道交换它们的状态(主的,次的,资源状态)并同步它们的启动和停止应用程序。尤其当因为软件失效或手工操作时导致的一个失效备援时,用来停止应用的脚本,在次服务器上执行前,首先在主服务器上执行。这样,对应于一个应用程序完全停止,次服务器上的复制数据总处于一个安全状态。

如果本地服务器无法接受到任何心跳数据,就会认为另一台服务器已经停机,这样,本地服务器会切换到ALONE状态。如果次要服务器进入ALONE状态,这个应用失效备援会由次要服务器上的应用重新启动来完成。尽管不是必要的,但最好有两个心跳渠道在两个不同的网络间同步两个服务器,用以区分网络故障和服务器故障。

服务器在两个远程机房时的集群仲裁问题

大多情况下,一个保障数据中心的关键应用的HA集群会被安装在两个不同地区的两个机房的两台服务器上,用以支持整个机房发生灾难。

如果两个机房同时发生短暂网络掉线,裂脑(split brain)问题就会出现。两个服务器都可能会重新启动关键应用。

在使用一个硬件恢复集群时,这个现象必须避免发生,因为双执行意味着并发访问共享磁盘和关键应用数据的潜在的损坏。 这就是为什么仲裁集群要用第三个仲裁服务器实现,甚至远程硬件重置去避免对关键应用的并发执行。

不幸的是这个新的仲裁设备会给整体集群架构增加费用和复杂性。而且系统对冻结操作系统不免疫:当操作系统从冻结恢复时,会有双重的应用执行,即使使用了上述机制。

合作伙伴,与SafeKit共赢

这种平台无关的解决方案很适合转售关键应用程序的合作伙伴,以及希望提供易于部署给许多客户的冗余和高可用性选项的合作伙伴。

根据合作伙伴在很多国家的成功案例,SafeKit已被证明是更为简单的解决方案,实现冗余和高可用性的建筑管理,视频管理,访问控制,SCADA软件……

楼宇管理软件(BMS)

视频管理软件(VMS)

电子访问控制软件(EACS)

SCADA软件(行业)

使用SafeKit的简单的集群仲裁

使用SafeKit HA软件,Windows和Linux集群内的仲裁不要求第三台仲裁服务器,仲裁硬盘或远程硬件重置。一个简单的网络检查器对于SafeKit仲裁就足够了

无论如何SafeKit HA集群支持对关键应用的双重执行而不破坏数据。

裂脑-Windows或Linux集群的心跳机制,失效备援和仲裁机制

如果发生操作系统冻结或网络离线,而没有在仲裁上的网络检查器,主服务器将在独立状态下继续运行应用。次要服务器将重新启动应用并将进入一个独立状态。复制的路径将被隔离,每个运行的应用将在他们自己的路径的自己的数据中工作。

当网络重新连接后,两台服务器中一个应用必须被牺牲地关掉。在关掉一台服务器的应用后,该操作会使数据从另一台服务器上重新导入。重新导入后,数据又立刻重新处于在首要和次要服务器之间的镜像模式。

所有这些操作都是自动的。心跳,恢复和仲裁管理都融入于SafeKit产品的集群中,且对SafeKit的用户是透明的。因此,无特殊技能的用户可以在两台标准服务器的当地或远程服务器上进行SafeKit部署。而且,其配置同于Windows或Linux集群。

SafeKit 演示

SafeKit 网络会议

Microsoft SQL Server 集群

Apache 集群

Hyper-V 集群

我们的 SafeKit 案例

  • 航空交通控制系统供应商Copperchase公司在机场配置SafeKit高可用。

    航空交通控制 [+]

    航空交通控制系统供应商Copperchase公司在机场配置SafeKit高可用

    他们在Windows上配置了超过20个SafeKit集群。

    业务发展经理Tony Myers说:

    "通发展航空交通管控,Copperchase成为了最关键的业务活动之一。我们非常需要我们的应用时刻可以运行。我们通过SafeKit找到一个满足我们需求的简单而全面的集群方案。这个软件将一个负载均衡,实时数据复制与无数据丢失和自动失效备援结合了起来。这就是为什么,Copperchase将SafeKit配置在英国和我们所在的30多个国家的机场的航空交通控制系统中。"


  • 软件销售商Wellington IT将SafeKit高可用配置到爱尔兰和英国的Credit Unions的银行应用中。

    银行 [+]

    软件销售商Wellington IT将SafeKit高可用配置到爱尔兰和英国的Credit Unions的银行应用中

    他们与Oracle在Linux和AIX上配置了超过25个SafeKit集群。

    销售经理Peter Knight说:

    "对于Credit Unions在爱尔兰和英国的众多所在地的银行来说,业务连续和灾难恢复是一个重大问题。我们发现了SafeKit这个简单的和强健的解决方案, 用以获得高可用性和同步复制两个服务器而不丢失数据。使用这个软件方案后,我们不再依赖于一个特殊的而且昂贵的硬件集群方案。 这是一个为软件销售商提供的应用高可用性能的完美工具。"


  • 巴黎运输公司(RATP)为巴黎地铁1号线的中控室选择了SafeKit高可用性和负载均衡。

    运输 [+]

    巴黎运输公司(RATP)为巴黎地铁1号线的中控室选择了SafeKit高可用性和负载均衡

    他们在Windows和Linux上配置了20个SafeKit集群

    项目经理Stephane Guilmin说:

    "RATP的巴黎地铁1号线的自动化是一个重要的工程,它要求中控室的设计能够抵御IT失效。SafeKit有三个符合我们要求的独特长处。第一,SafeKit是一个单纯的软件方案不需要使用SAN和网络盒上用于负载均衡的共享硬盘。这样可以简单地将我们的服务器放在不同的机房中。

    而且,这个集群方案与我们的Windows和Unix平台是相同的。SafeKit提供了三个我们需要的功能:服务器之间的负载均衡,事故后的自动失效备援和数据实时复制。"


  • 软件集成Systel公司为其火灾和医疗急救呼叫中心配置了SafeKit高可用方案。

    健康护理 [+]

     

    软件集成Systel公司为其火灾和医疗急救呼叫中心配置了SafeKit高可用方案

    超过30个SafeKit集群方案被安装在SQL服务器的Windows上。

    总裁Marc Pellas说:

    "SafeKit非常符合软件销售商的需求。它的主要长处是通过软件选项提供高可用性,这可以添加到我们自己的软件套装平台上。我们不再依赖于一个特殊的,昂贵的,安装和维护都困难的硬件集群方案,而且还能根据客户的环境而不同。使用SafeKit,我们的火灾呼叫中心使用着整体的软件集群方案,与所有我们客户使用的相同,从而增加了使用者的亲和性,我们掌握其安装售后支持。"


  • 法国军队(DGA)的ERP系统使用了SafeKit的高可用和负载均衡。

    政府 [+]

    法国军队(DGA)的ERP系统使用了SafeKit的高可用和负载均衡

    他们在Windows和Linux上配置了14个SafeKit集群。

    系统管理员Alexandre Barth说:

    "我们的生产团队不费吹灰之力在14个Windows和Linux集群上配置了SafeKit方案。高可用和负载均衡使我们的关键业务得以安全。这个产品的长处第一是集群的安装和管理很简单,其次,对于不同运营系统的方案一致。"

     


SafeKit 比较

做正确的选择

在市场上有很多种类的高可用方案,这些方案中,SafeKit的特点就是下面所介绍的简便性。您可以下载这个高可用性手册来选择适合您的关键应用的解决方案。

软件集群vs硬件集群

当您建立一个集群服务器时,有两个选择:一个像SafeKit的软件集群,或是一个硬件集群。相比之下SafeKit的实施会简单得多。

无共享vs硬盘共享集群

SafeKit是一个不共享集群而非硬盘共享集群。由于不需配置共享硬盘,服务器可以很容易地安装在远程计算机房,同时不需要SAN和可复制的硬盘阵列。

虚拟高可用 vs应用高可用

虚拟高可用在虚拟机级别上实现高可用,而应用高可用在应用级别实现高可用。在虚拟高可用和应用高可用之间做选择,请阅读这篇文章

文件复制vs硬盘复制

不同于硬盘复制,在使用文件复制时,您仅仅需要确定您想实时复制的文件的路径就可以了。SafeKit是一个基于文件复制的方案。因此不需要配置特殊的硬盘就能够实现全部复制。

同步复制vs异步配置

如果您选择了SafeKit的同步复制而非异步复制,那么失效备援发生时您就不会再有任何的数据丢失。

没有网络先决条件的网络负载平衡

在VMware里,SafeKit是微软NLB的多播或单播的替代品,它不需要特殊的网络配置。并且,它可以在Windows,和Linux上运行。

SafeKit的高可用性架构