KVM : le cluster de haute disponibilité le plus simple avec réplication temps réel, reprise sur panne et partage de charge de VMs entre deux serveurs redondants sans disque partagé

Evidian SafeKit

Comment mettre en œuvre une haute disponibilité de Linux KVM avec réplication temps réel, reprise automatique sur panne et partage de charge de machines virtuelles entre deux serveurs redondants sans disque partagé ?

Réplication, reprise sur panne et partage de charge de VMs KVM avec un cluster SafeKit entre deux serveurs redondants

Evidian SafeKit apporte la haute disponibilité à KVM entre deux serveurs redondants. Cet article explique comment mettre en œuvre rapidement un cluster KVM sans disque partagé et sans compétences spécifiques. Le module de haute disponibilité kvm.safe et un essai gratuit sont offerts dans le tab installation ci-dessous.

Notez que SafeKit est un produit générique. Vous pouvez mettre en œuvre avec le même produit la réplication en temps réel et le basculement de nouveaux répertoires de fichiers et services, de bases de données, de conteneurs docker, de machines virtuelles Hyper-V ou KVM complètes, d'applications Cloud. Voir d'autres exemples de modules miroirs ici.

Cette solution de clustering est reconnue comme la plus simple à mettre en œuvre par nos clients et partenaires. Cette solution résout

  • les pannes matérielles (20% des problèmes), incluant la panne complète d'une salle informatique,
  • et les erreurs humaines (40% des problèmes) grâce à sa simplicité d'utilisation, incluant une console Web d'administration très simple pour configurer, contrôler et surveiller les clusters,
  • mais elle ne résout pas les défaillances logicielles (40% des problèmes), incluant le passage d'update serveur par serveur,
  • et le temps de reprise en cas de panne dépend du temps de reboot des VMs.

Si vous voulez une solution complète avec un temps de reprise rapide, considérez la haute disponibilité au niveau de l'application et lisez cet article VM HA vs Application HA.

Notez que la solution présentée ici permet une réplication et une reprise au niveau des machines virtuelles. Mais SafeKit propose également une solution de réplication et de reprise au niveau des conteneurs (Docker).

Principe

La réplication des machines virtuelles est synchrone et temps réel entre deux serveurs KVM. Seules les modifications apportées à l'intérieur des fichiers composant une machine virtuelle sont répliquées. Notez que SafeKit implémente une réplication synchrone en temps réel et non la réplication asynchrone traditionnelle. Cette fonctionnalité est importante pour la haute disponibilité de KVM car avec une réplication asynchrone, il y a perte de données sur un basculement comme expliqué dans cet article: réplication synchrone versus réplication asynchrone.

Lorsqu'un serveur KVM tombe en panne, il y a un basculement automatique des machines virtuelles (VMs) tournant sur ce serveur vers l'autre serveur. Et lorsque le serveur défaillant est redémarré, il y a une réintégration automatique des fichiers représentant les VMs sans les arrêter sur le serveur actif.

Chaque machine virtuelle est répliquée et redémarrée automatiquement indépendamment. Certaines machines virtuelles peuvent s'exécuter sur le premier serveur KVM et sont répliquées et redémarrées sur le deuxième serveur KVM. D'autres machines virtuelles peuvent s'exécuter sur le deuxième serveur KVM et sont répliquées et redémarrées sur le premier serveur KVM. L'équilibrage de charge des machines virtuelles entre les deux serveurs est contrôlé par l'administrateur via la console Web SafeKit. En cliquant sur un bouton, l'administrateur peut déplacer une VM d'un serveur KVM à l'autre.

La solution ne nécessite aucun disque partagé et aucune configuration spéciale de Windows. Seuls 2 serveurs Windows sont nécessaires. Le logiciel SafeKit est installé sur les deux serveurs.

Fonctionnalités

  • Pas de disque partagé
  • Réplication de données temps réel et continue d'une machine virtuelle avec basculement automatique
  • Solution très simple à mettre en œuvre
  • Cluster actif actif avec plusieurs VMs et une réplication de données croisée en temps réel entre 2 serveurs
  • Console web centralisée et ergonomique pour gérer toutes les VMs
  • Offre intéressante pour un revendeur sans intégration avec les applications
  • Intéressant pour les solutions HA qui ne peuvent pas être intégrées au niveau de l'application (application+OS dans une machine virtuelle répliquée par SafeKit)
  • Solution simple pour la haute disponibilité d'une application Kubernetes sur site: mettre Minikube + containers + base etcd + OS dans une VM répliquée par SafeKit; pas besoin d'installer un cluster Kubernetes sur site
  • Intéressant pour les applications s'exécutant sur un OS non pris en charge et intégré dans une machine virtuelle KVM répliquée par SafeKit

Notez que cette solution est limitée à la réplication et au basculement de 25 machines virtuelles.

Notez également que SafeKit est capable de resynchroniser automatiquement un serveur KVM défaillant sans aucune opération manuelle et sans arrêter les VMs. C'est un facteur de différenciation important lorsqu'on compare SafeKit à des solutions de réplication dont le basculement ne marche qu'une fois : le serveur en panne ne peut être réintégré dans le cluster qu'avec des opérations manuelles complexes et non automatisées.

Version d'essai gratuit + module kvm.safe et procédure d'installation étape par étape de SafeKit sur deux serveurs Linux KVM redondants

Installation de SafeKit pour la haute disponibilité de KVM avec réplication temps réel synchrone et tolérance aux pannes entre deux serveurs redondants

Prérequis

  • vous avez besoin de KVM installé sur 2 nœuds

Installation du package sur Linux

Sur les deux serveurs Linux

  • Installez la version gratuite de SafeKit sur 2 nœuds Linux avec les services KVM installés sur les deux nœuds
  • Après le téléchargement du package safekit_xx.bin, exécutez-le pour extraire le rpm et le script safekitinstall, puis exécutez le script safekitinstall
  • Répondez oui à la configuration automatique du pare-feu
  • Téléchargez le module Linux

    Le module contient les fichiers userconfig.xml, start_prim et stop_prim décrits dans le tab Internes
  • Mettez kvm.safe sous /opt/safekit/Application_Modules/demo/ (créez le répertoire de démonstration s'il n'existe pas)

Note   Guide de l'utilisateur disponible ici

Continuez avec l'onglet Configuration (ci-dessus)

Différentiateurs de la solution de haute disponibilité SafeKit par rapport à la concurrence

Différentiateurs clés entre la haute disponibilité au niveau machine virtuelle et au niveau application
HA de VMs avec le module Hyper-V ou KVM de SafeKit HA d'application avec les modules applicatifs de SafeKit
Application HA
Dislike  Réplique trop de données (App+OS) Like  Réplique seulement les données applicatives
Dislike  Reboot de la machine virtuelle sur l'hyperviseur 2 si l'hyperviseur 1 crash: temps de reprise dépendant du reboot de l'OS Like  Temps de reprise rapide avec redémarrage de l'application sur OS2 en cas de panne de VM1 : autour d'1 mn ou moins (voir RTO/RPO ici)
Dislike  Pas de checker applicatif et de reprise sur panne logicielle Like  Checker applicatif et reprise sur panne logicielle
Dislike  Risque d'arrêt lors des upgrades du système d'exploitation ou de l'application (image unique) Like  Update en douceur de OS1 ou OS2 ou App (deux images)
Like  Solution générique pour n'importe quelle application / OS Like  Intégration avec des modules applicatifs de haute disponibilité
Différenciateurs clés entre SafeKit vs Microsoft Hyper-V cluster et VMware HA
SafeKit avec le module Hyper-V ou le module KVM Microsoft Hyper-V Cluster & VMware HA
SafeKit with Hyper-V 2012 R2
Like  Pas de disque partagé - réplication temps réel synchrone à la place avec 0 perte de données Dislike  Disque partagé et baie de disques externe spécifique
Like  Sites distants = pas de SAN pour la réplication Dislike  Sites distants = baies de disques répliquées à travers un SAN
Like  Aucune compétence informatique spécifique pour configurer le système Dislike  Compétence informatique spécifique pour configurer le système

Notez que les solutions Hyper-V/SafeKit et KVM/SafeKit sont limitées à la réplication et au basculement de 25 machines virtuelles.

Comparaison d'architectures de haute disponibilité

Fonctionnalité

Cluster SafeKit

Autres clusters

Cluster logiciel vs cluster matériel > Un cluster simple avec SafeKit installé sur deux serveurs
Like  Un cluster logiciel simple avec le package SafeKit installé sur deux serveurs
Cluster matériel avec stockage externe Boîtiers de load balancing ou serveurs proxy dédiés

Dislike  Un cluster matériel complexe avec du stockage externe ou des boîtiers de load balancing
Cluster de type "shared nothing"" vs cluster à disque partagé > SafeKit est un cluster de type shared-nothing: simple à déployer même dans des sites distants
Like  SafeKit est un cluster sans partage de type "shared-nothing": simple à déployer même sur des sites distants
Un cluster à disque partagé est complexe à déployer
Dislike  Un cluster à disque partagé est complexe à déployer
Haute disponibilité applicative vs Haute disponibilité de machines virtuelles complètes >
Like  La haute disponibilité applicative supporte les pannes matérielles et logicielles avec un temps de reprise rapide (RTO autour d'1 mn ou moins)
Upgrade en douceur de l'application et de l'OS possible serveur par serveur (les versions N et N+1 peuvent coexister)
La haute disponibilité de machines virtuelles (VM) complètes supporte seulement les pannes matérielles avec un reboot de la VM et un temps de reprise indéfini
Dislike  La haute disponibilité de machines virtuelles complètes (VM) supporte seulement les pannes matérielles avec un reboot de la VM et un temps de reprise dépendant du reboot de l'OS.
Upgrade en douceur impossible
Haute disponibilité vs tolérance aux fautes > SafeKit high availability vs fault-tolerance

Like  Aucun serveur dédié avec SafeKit. Chaque serveur peut être le serveur de reprise de l'autre serveur.
Exception logicielle avec redémarrage dans un autre environnement OS.
Upgrade en douceur de l'application et de l'OS possible serveur par serveur (les versions N et N+1 peuvent coexister)
Fault tolerance system

Dislike  Serveur secondaire dédié à l'exécution de la même application synchronisée au niveau instruction.
Exception logicielle sur les 2 serveurs en même temps.
Upgrade en douceur impossible
Réplication synchrone vs réplication asynchrone >
Like  SafeKit met en œuvre une réplication temps réel synchrone sans perte de données en cas de panne
Avec une réplication asynchrone, il y a une perte de données en cas de panne
Dislike  Avec une réplication asynchrone, il y a une perte de données en cas de panne
Réplication de fichiers au niveau octet vs réplication de disque au niveau du bloc > SafeKit met en œuvre la réplication de fichiers au niveau octet et se configure simplement avec des répertoires à répliquer même sur le disque système
Like  SafeKit met en œuvre la réplication de fichiers temps réel au niveau octet et se configure simplement avec les répertoires applicatifs à répliquer même dans le disque système
La réplication de disque au niveau du bloc est complexe et nécessite de mettre les données de l'application dans un disque spécial
Dislike  La réplication de disque au niveau bloc est complexe à configurer et nécessite de mettre les données de l'application dans un disque spécial
Heartbeat, reprise sur panne et quorum pour éviter 2 serveurs maîtres > Pour éviter 2 serveur maîtres, SafeKit propose un simple split brain checker configuré sur un routeur
Like  Pour éviter 2 serveur maîtres, SafeKit propose un simple "split brain checker" configuré sur un routeur
Pour éviter 2 serveur maîtres, les autres clusters demande une configuration complexe avec une 3ième machine, un disque de quorum spécial, un reset hardware distant
Dislike  Pour éviter 2 serveur maîtres, les autres clusters demandent une configuration complexe avec une 3ième machine, un disque de quorum spécial, une interconnexion spéciale
Adresse IP virtuelle
primaire/secondaire, load balancing réseau, basculement sur panne >
Aucune configuration réseau particulière n'est requise dans un cluster SafeKit pour l'équilibrage de la charge réseau
Like  Aucun serveur proxy dédié et aucune configuration réseau particulière ne sont requis dans un cluster SafeKit pour mettre en œuvre des adresses IP virtuelles
Une configuration réseau spéciale est requise dans d'autres clusters pour l'équilibrage de la charge réseau
Dislike  Une configuration réseau spéciale est requise dans d'autres clusters pour mettre en œuvre des adresses IP virtuelles. A noter que SafeKit propose un vérificateur d'état adapté aux équilibreurs de charge

Clients du logiciel de haute disponibilité SafeKit dans tous les domaines d'activité

  • Le fournisseur de solutions pour le contrôle aérien, Copperchase, déploie SafeKit pour la haute disponibilité de ses systèmes dans les aéroports.

    Transport aérien [+]

    Le fournisseur de solutions pour le contrôle aérien, Copperchase, déploie SafeKit pour la haute disponibilité de ses systèmes dans les aéroports.

    Plus de 20 clusters SafeKit sont déployés sur Windows.

    Tony Myers, Directeur Business Développement témoigne :

    "En développant des applications pour le contrôle du trafic aérien, Copperchase est dans l'une des activités les plus critiques qui existent. Nous avons absolument besoin que nos applications soient disponibles tout le temps. Nous avons trouvé avec SafeKit une solution simple et complète de clustering qui répond parfaitement à nos besoins. Ce logiciel combine en un seul produit l'équilibrage de charge, la réplication de données en temps réel sans perte de données et le basculement automatique en cas de panne. C'est pourquoi, Copperchase déploie SafeKit dans les aéroports pour le contrôle du trafic aérien au Royaume-Uni et dans les 30 pays où nous sommes présents."


  • L'éditeur de logiciel Wellington IT spécialisé dans les banques coopératives déploie la solution de haute disponibilité SafeKit en Irlande et au Royaume-Uni avec son progiciel.

    Banque [+]

    L'éditeur de logiciel Wellington IT spécialisé dans les banques coopératives déploie la solution de haute disponibilité SafeKit en Irlande et au Royaume-Uni avec son progiciel.

    Plus de 25 clusters SafeKit sont déployés sur Linux avec Oracle.

    Peter Knight, Directeur Commercial témoigne :

    "La continuité d’activité et la résistance au désastre sont une préoccupation majeure pour nos clients utilisant notre application bancaire Locus déployée dans de nombreuses banques en Irlande et au Royaume-Uni. Nous avons trouvé avec SafeKit une solution simple et robuste pour assurer la haute disponibilité et la réplication synchrone et sans perte des données entre deux serveurs. Avec cette solution logicielle, nous ne sommes pas dépendants d’une solution de clustering matérielle spécifique et coûteuse. C’est un outil parfait pour fournir une option de haute disponibilité à une application développée par un éditeur logiciel."


  • La RATP choisit la solution de haute disponibilité et de load balancing SafeKit pour son poste de commande centralisé de la ligne 1 du métro parisien.

    Transport métropolitain [+]

    La RATP choisit la solution de haute disponibilité et de load balancing SafeKit pour son poste de commande centralisé de la ligne 1 du métro parisien.

    20 clusters SafeKit sont déployés sur Windows et Linux.

    Stéphane Guilmin, Responsable de projets témoigne :

    "Projet majeur au sein de la RATP, l’automatisation de la ligne 1 du métro 1 parisien impose que le poste commande centralisé (PCC) soit conçu pour résister aux pannes informatiques. Avec le produit SafeKit, nous avons trouvé trois avantages distinctifs répondant à ce besoin. Il s’agit d’abord d’une solution purement logicielle qui ne nous contraint pas à utiliser des disques partagés sur un SAN et des boitiers réseau de partage de charge. Nous pouvons très simplement séparer nos serveurs dans des salles machines distinctes. Ensuite, cette solution de clustering est homogène pour nos plateformes Windows et Linux. Et SafeKit nous apporte les trois fonctions dont nous avons besoin : le partage de charge entre serveurs, la reprise automatique sur panne et la réplication en temps réel des données."

    Et également, Philippe Marsol, responsable d'intégration, Atos BU Transport, témoigne :

    “SafeKit est un produit simple et puissant pour la haute disponibilité des applications. Nous avons intégré SafeKit dans nos projets critiques comme la supervision de la ligne 4 du métro Parisien (dans le PCC / Poste de Commande et de Contrôle) ou la ligne 1 et 2 à Marseille (dans le CSR / Centre de Supervision du Réseau). Grâce à la simplicité du produit, nous avons gagné du temps dans l'intégration et la validation de la solution et nous avons eu également des réponses rapides à nos questions avec une équipe Evidian réactive."


  • L'intégrateur de logiciels Systel déploie la solution de haute disponibilité SafeKit dans les centres d'appels des pompiers et du SAMU.

    Santé [+]

    L'intégrateur de logiciels Systel déploie la solution de haute disponibilité SafeKit dans les centres d'appels des pompiers et du SAMU.

    Plus de 30 clusters SafeKit sont déployés sur Windows avec SQL Server.

    Marc Pellas, Président Directeur Général témoigne :

    "SafeKit répond parfaitement aux besoins d'un éditeur logiciel. Son principal avantage est d'introduire la haute disponibilité via une option logicielle qui s'ajoute à notre propre suite logicielle multi-plateformes. Ainsi, nous ne sommes pas dépendants d'une solution de clustering matériel spécifique, coûteuse, complexe à installer, difficile à maintenir et différente suivant les environnements clients. Avec SafeKit, nos centres de pompiers sont déployés avec une solution de clustering logiciel intégrée avec notre application, uniforme chez tous nos clients, simple pour les utilisateurs et que nous maîtrisons totalement de l'installation jusqu'au support après vente."


  • La haute disponibilité de l'ERP de l'armée Française est réalisée avec SafeKit à la DGA.

    Gouvernement [+]

    La haute disponibilité de l'ERP de l'armée Française est réalisée avec SafeKit à la DGA.

    14 clusters SafeKit sont déployés sur Windows et Linux.

    Alexandre Barth, Administrateur système témoigne :

    "Notre équipe de production a mis en œuvre sans difficulté la solution SafeKit sur 14 clusters Windows et Unix. Notre activité critique est ainsi sécurisée avec des fonctions de haute disponibilité et de partage de charge. Les avantages de ce produit sont d'une part la simplicité de mise en œuvre et d'administration des clusters et d'autre part, l'uniformité de la solution face aux systèmes d'exploitation hétérogènes."


Démonstrations de solutions de haute disponibilité avec SafeKit

Webinaire SafeKit

Ce webinaire présente en 10 minutes Evidian SafeKit.

Dans ce webinaire, vous comprendrez :

  • les clusters ferme et miroir
  • les économies par rapport aux solutions de clustering matériel
  • les meilleurs cas d'utilisation
  • le processus d'intégration d'une nouvelle application

Cluster Microsoft SQL Server

Cette vidéo montre la configuration d'un module miroir avec réplication temps réel synchrone et reprise sur panne.

La réplication de fichiers et le basculement sont configurés pour Microsoft SQL Server mais fonctionnent de la même manière pour d'autres bases de données.

Essai gratuit ici

Cluster Apache

Cette vidéo montre une configuration d'un module ferme avec équilibrage de charge et reprise sur panne.

L'équilibrage de charge et le basculement sont configurés pour Apache mais fonctionnent de la même manière pour d'autres services Web.

Essai gratuit ici

Cluster Hyper-V

Cette vidéo montre un cluster Hyper-V avec des réplications complètes de machines virtuelles.

Les machines virtuelles peuvent s'exécuter sur les deux serveurs Hyper-V et elles sont redémarrées en cas de panne.

Essai gratuit ici

Formation gratuite en ligne au logiciel de haute disponibilité SafeKit

Modules SafeKit pour des solutions de haute disponibilité plug&play

Modules SafeKit pour des solutions de haute disponibilité plug&play

Partage de charge réseau et reprise sur panne : cliquez sur les boutons bleus

Modules fermes

Windows

Linux

Nouvelle application
IIS -
Apache
Amazon AWS ferme
Microsoft Azure ferme
Google GCP ferme
Cloud ferme générique

Réplication de fichiers temps réel et reprise sur panne : cliquez sur les boutons bleus

Modules miroirs

Windows

Linux

Nouvelle application
Microsoft SQL Server -
Oracle
MariaDB
MySQL
PostgreSQL
Firebird
Hyper-V -
KVM -
Docker -
Elasticsearch -
Milestone XProtect -
Genetec SQL Server -
Hanwha Wisenet SSM -
Nedap AEOS -
Amazon AWS miroir
Microsoft Azure miroir
Google GCP miroir
Cloud miroir générique