Kubernetes K3S : le cluster de haute disponibilité le plus simple entre deux serveurs redondants

La solution pour Kubernetes K3S

Evidian SafeKit apporte la haute disponibilité à Kubernetes entre deux serveurs redondants. Cet article explique comment implémenter rapidement un cluster Kubernetes K3S sur 2 nœuds sans stockage externe NFS, sans base de données de configuration externe et sans compétences spécifiques.

Notez que SafeKit est un produit générique. Vous pouvez implémenter avec le même produit la réplication en temps réel et le basculement de répertoires et de services, de bases de données, d'applications Docker, Podman, de machines virtuelles Hyper-V ou KVM complètes, d'applications dans le Cloud (voir la liste des modules).

Cette solution de clustering est reconnue comme la plus simple à mettre en œuvre par nos clients et partenaires. La solution SafeKit est la solution parfaite pour exécuter des applications Kubernetes K3S sur site et sur 2 nœuds.

Nous avons choisi K3S comme moteur Kubernetes car il s'agit d'une solution légère pour l'IoT et le Edge computing.

Le module miroir k3s.safe implémente :

2 maîtres/agents K3S actifs exécutant des pods
la réplication de la base de données de configuration de K3S (MariaDB)
la réplication des volumes persistants (implémentée par la classe "NFS client dynamic provisionner storage class: nfs-client")
l'adresse IP virtuelle, le basculement automatique, la restauration automatique après panne

Comment ça marche ?

Le tableau suivant explique comment la solution fonctionne sur 2 nœuds. D'autres nœuds avec des agent K3S (sans SafeKit) peuvent être ajoutés pour une scalabilité horizontale.

Composants Kubernetes K3S
Noeud SafeKit PRIM	Noeud SafeKit SECOND
K3S (master et agent) exécute des pods sur le nœud primaire	K3S (master et agent) exécute des pods sur le nœud secondaire
Le serveur NFS s'exécute sur le nœud primaire avec : une IP virtuelle/port NFS un export de partage NFS des volumes persistants K3S	Les volumes persistants sont répliqués de manière synchrone et en temps réel par SafeKit sur le nœud secondaire
Le serveur MariaDB s'exécute sur le nœud primaire avec : une IP virtuelle/port MariaDB la base de données de configuration de K3S	La base de configuration est répliquée de manière synchrone et en temps réel par SafeKit sur le nœud secondaire

Une solution simple

SafeKit est la solution de haute disponibilité la plus simple pour exécuter des applications Kubernetes sur 2 nœuds et sur site.

SafeKit	Avantages
Réplication synchrone en temps réel pour les volumes persistants	Pas de stockage NAS/NFS externe pour les volumes persistants
Seulement 2 nœuds pour la haute disponibilité de Kubernetes K3S	Pas besoin de 3 nœuds comme avec la base de données etcd
Même produit simple pour l'adresse IP virtuelle, la réplication, le basculement, la restauration après panne, l'administration, la maintenance	Évitez les différentes technologies pour l'IP virtuelle (metal-lb, BGP), la haute disponibilité des volumes persistants, la haute disponibilité de la base de données de configuration
Prend en charge la reprise après sinistre avec deux nœuds distants	Éviter le stockage NAS répliqué

Partenaires, le succès avec SafeKit

Cette solution indépendante de la plateforme est idéale pour un partenaire revendant une application critique et qui souhaite proposer une option de redondance et de haute disponibilité simple à déployer auprès de nombreux clients.

Avec de nombreuses références dans de nombreux pays gagnées par des partenaires, SafeKit s'est avéré être la solution la plus simple à mettre en œuvre pour la redondance et la haute disponibilité des logiciels de gestion des bâtiments, vidéosurveillance, contrôle d'accès, systèmes SCADA...

Etape 1. Réplication de données temps réel et continue

Cette étape correspond à la figure suivante. Le serveur 1 (PRIM) exécute les composants Kubernetes K3S décrits dans le tableau précédent. Les utilisateurs sont connectés à l'adresse IP virtuelle du cluster miroir. SafeKit réplique les fichiers ouverts par les composants Kubernetes K3S. Seules les modifications faites par les composants à l'intérieur des fichiers sont répliquées en continue à travers le réseau, limitant ainsi le trafic.

Avec la réplication de données temps réel de SafeKit, seuls les noms des répertoires de fichiers sont à configurer dans le module miroir. Les répertoires à répliquer peuvent être localisés dans le disque système. SafeKit implémente une réplication synchrone sans perte de données en cas de panne contrairement à une réplication asynchrone.

Etape 2. Basculement automatique

Lorsque le serveur 1 est défaillant, SafeKit bascule l'adresse IP virtuelle du cluster sur le serveur 2 et redémarre automatiquement les composants Kubernetes K3S. Les composants retrouvent les fichiers répliqués à jour grâce à la réplication continue synchrone réalisée par SafeKit entre le serveur 1 et le serveur 2. Les composants Kubernetes K3S poursuivent leur exécution sur le serveur 2 en modifiant localement leurs fichiers qui ne sont plus répliqués vers le serveur 1.

Le temps de basculement est égal au temps de détection de la panne (time-out configuré à 30 secondes par défaut) et au temps de relance des composants. Sur la machine secondaire, il n'y a pas de temps lié au remontage du système de fichiers ou au passage des procédures de recovery du système de fichiers, comme avec les solutions de réplication de disques.

Etape 3. Réintégration après panne

A la reprise après panne du serveur 1 (réintégration du serveur 1), SafeKit resynchronise automatiquement les fichiers de ce serveur à partir de l'autre serveur. Seuls les fichiers modifiés sur le serveur 2 pendant l'inactivité du serveur 1 sont resynchronisés. La réintégration du serveur 1 se fait sans arrêter l'exécution des composants Kubernetes K3S sur le serveur 2.

Si SafeKit a été proprement arrêté sur le serveur 1, alors à son redémarrage, seules les zones modifiées à l'intérieur des fichiers sont resynchronisées suivant des bitmaps de modification.

Si le serveur 1 a crashé (power off), les bitmaps de modification ne sont pas sûres et elles ne sont donc pas utilisées. Tous les fichiers qui ont été modifiés depuis le moment de l'arrêt sont resynchronisés.

Etape 4. Retour à la normale avec réplication de données temps réel

Après la réintégration, les fichiers sont à nouveau en mode miroir comme à l'étape 1. Le système est en haute disponibilité avec les composants Kubernetes K3S qui s'exécutent sur le serveur 2 et avec comme secours le serveur 1. Les modifications des composants dans les fichiers sont répliquées en temps réel du serveur 2 vers le serveur 1.

Si l'administrateur souhaite que les composants Kubernetes K3S s'exécutent en priorité sur le serveur 1, il peut exécuter une commande de basculement, soit manuellement à un moment opportun, soit automatiquement par configuration.

Guide d'installation rapide de SafeKit avec Kubernetes K3S

2. D'abord sur les deux nœuds

Sur 2 nœuds Linux Ubuntu 20.04, en tant que root :

Assurez-vous que le nœud a accès à Internet (peut-être via un proxy)
Copiez k3sconfig.sh, k3s.safe et le package safekit_xx.bin dans un répertoire et placez-vous dedans (cd)
Renommer le fichier .bin en "safekit.bin"
Assurez-vous que k3sconfig.sh et safekit.bin sont exécutables.
Modifiez le script k3sconfig.sh en personnalisant les variables d'environnement en fonction de votre environnement (dont l'adresse IP virtuelle)
Exécuter sur les deux nœuds : ./k3sconfig.sh prereq

Le script va :

Installer les packages Debian requis : alien, nfs-kernel-server, nfs-common, mariadb-server
Sécuriser MariaDB
Créer des répertoires pour la réplication de fichiers
Préparer le serveur NFS pour le partage des répertoires répliqués
Installer SafeKit

3. Sur le premier nœud

Exécutez sur le premier nœud : ./k3sconfig.sh first

Le script va :

Créer la base de données de configuration K3S et l'utilisateur k3s
Créer le fichier de stockage des volumes persistants (fichier fragmenté) et le formater en tant que système de fichiers xfs
Créer la configuration du cluster safekit et l'appliquer
Installer et configurer le module k3s.safe sur le cluster
Démarrer le module k3s en tant que "prim" sur le premier nœud
Télécharger, installer et démarrer k3s
Télécharger et installer la charte Helm nfs-subdir-external-provisioner
Afficher le jeton K3S (à utiliser lors de la phase d'installation du deuxième nœud)


/opt/safekit/safekit –H "*" state
---------------- Server=http://10.0.0.20:9010 ----------------
admin action=exec
--------------------- k3s State ---------------------

  Local  (127.0.0.1)    : PRIM (Service : Available)(Color : Green)
Success
---------------- Server=http://10.0.0.21:9010 ----------------
admin action=exec
--------------------- k3s State ---------------------

  Local  (127.0.0.1)    : SECOND (Service : Available)(Color : Green)
Success

7. Tests

Arrêtez le nœud PRIM en faisant défiler son menu contextuel et en cliquant sur Stop.
Vérifiez qu'il y a un basculement sur le nœud 2 qui doit devenir ALONE (vert).
Et avec des lignes de commande sous Linux, vérifiez le basculement des services (arrêtés sur le nœud 1 dans le script stop_prim et démarrés sur le nœud 2 dans le script start_prim). MariaDB et K3S devraient s'exécuter sur le nœud 2.

Si ALONE (vert) n’est pas atteint sur le nœud 2, analysez pourquoi avec le journal du module du nœud 2.

cliquez sur node2 pour afficher le journal du module.
exemple de journal de module SQL Server où le nom du service dans start_prim n'est pas valide. Le processus sqlserver.exe est surveillé mais comme il n'est pas démarré, à la fin le module s'arrête.

Si tout va bien, lancez un démarrage du nœud 1, qui resynchronisera les répertoires répliqués depuis le nœud 2.

Si les choses vont mal, arrêtez le nœud 2 et forcez le démarrage en tant que primaire du nœud 1, qui redémarrera avec ses données localement saines au moment de l'arrêt.

Plus d'informations sur les tests dans le Guide de l'utilisateur.

8. Essayez le cluster avec une application Kubernetes telle que WordPress

Vous avez l'exemple d'une installation WordPress : un portail web avec une base de données implémentée par des pods.

Vous pouvez déployer votre propre application de la même manière.

WordPress est automatiquement hautement disponible :

avec ses données (php + base de données) dans des volumes persistants répliqués en temps réel par SafeKit
avec une adresse IP virtuelle pour accéder au site WordPress pour les utilisateurs
avec basculement automatique et réintégration automatique

Remarques:

Le chart WordPress définit un service à load balancer qui écoute sur les ports <service.port> et <service.httpsport>.
WordPress est accessible via l'url : http://<virtual-ip>:<service.port>.
L'IP virtuelle est gérée par SafeKit et automatiquement basculée en cas de panne.
Par défaut, K3S implémente des load balancers avec Klipper.
Klipper écoute sur <virtual ip>:<service.port> et achemine les paquets TCP/IP vers l'adresse IP et le port du pod WordPress qu'il a sélectionné.

$ export KUBECONFIG=/etc/rancher/k3s/k3s.yaml
$ helm repo add bitnami https://charts.bitnami.com/bitnami
$ helm install my-release bitnami/wordpress --set global.storageClass=nfs-client --set service.port=8099,service.httpsPort=4439

10. Si nécessaire, configurez un checker splitbrain

Voir ci-dessous "Quels sont les différents scénarios en cas d'isolement réseau dans un cluster ?" pour savoir si vous devez configurer un checker splitbrain.
Dans la configuration du module, cliquez sur Advanced configuration (voir image) pour modifier userconfig.xml.

Déclarez le checker splitbrain en ajoutant dans la section <check> de userconfig.xml :

<service>
  ...
  <check>
   ...
   <splitbrain ident="witness" exec="ping" arg="IP du witness"/>
  </check>

Appliquez la configuration avec Save and apply pour redéployer le fichier userconfig.xml modifié sur les deux nœuds (le module doit être arrêté sur les deux nœuds à l'étape Save and apply).

Paramètres :

ident="witness" identifie le témoin (witness) avec un nom de ressource : splitbrain.witness. Vous pouvez modifier cette valeur pour identifier le témoin.
exec="ping" fait référence au code ping à exécuter. Ne modifiez pas cette valeur.
arg="witness IP" est un argument pour le ping. Changez cette valeur avec l'IP du témoin (un élément robuste, typiquement un routeur).

Lorsqu'il y a un isolement réseau, le comportement par défaut est :

comme les heartbeats sont perdus pour chaque nœud, chaque nœud passe en ALONE et exécute l'application avec son adresse IP virtuelle (double exécution de l'application modifiant ses données locales),
lorsque l'isolement est réparé, un nœud ALONE est obligé de s'arrêter et de resynchroniser ses données depuis l'autre nœud,
à la fin, le cluster est PRIM-SECOND (ou SECOND-PRIM selon la détection d'adresse IP virtuelle en double faite par Windows).

Lorsqu'il y a un isolement du réseau, le comportement avec un split-brain checker est :

un split-brain checker a été configuré avec l'adresse IP d'un témoin (typiquement un routeur),
le split-brain agit lorsqu'un serveur passe de PRIM à ALONE ou de SECOND à ALONE,
en cas d'isolement du réseau, avant de passer en ALONE, les deux nœuds testent l'adresse IP,
le nœud qui peut accéder à l'adresse IP passe à ALONE, l'autre passe à WAIT,
lorsque l'isolement est réparé, le nœud WAIT resynchronise ses données et devient SECOND.

Remarque : Si le témoin est en panne ou déconnecté, les deux nœuds passent à WAIT et l'application n'est plus en cours d'exécution. C'est pourquoi vous devez choisir un témoin robuste comme un routeur.

Pourquoi un réseau LAN/VLAN entre sites distants ?

Basculement automatique de l'adresse IP virtuelle avec 2 nœuds dans le même sous-réseau.
Bonne bande passante pour la resynchronisation (étape 3) et bonne latence pour la réplication synchrone (typiquement un aller-retour de moins de 2 ms).

Alternative

Utilisez un équilibreur de charge pour l'adresse IP virtuelle si les 2 nœuds sont dans 2 sous-réseaux (supporté par SafeKit, notamment dans le cloud).
Utilisez des solutions de backup avec réplication asynchrone pour un réseau à latence élevée.

Architectures de clustering avancée

Plusieurs modules peuvent être déployés dans le même cluster. Ainsi, des architectures de clustering avancées peuvent être mises en œuvre :

un cluster qui mixte ferme et miroir avec le déploiement d’un module ferme et d’un module miroir dans le même cluster,
un cluster actif/actif avec réplication en déployant plusieurs modules miroirs sur 2 serveurs,
un cluster Hyper-V ou un cluster KVM avec réplication temps réel et reprise de machines virtuelles complètes entre 2 hyperviseurs actifs,
un cluster N-1 avec le déploiement de N modules miroirs sur N+1 serveurs.

Différenciateurs clés d'un cluster miroir avec réplication et reprise sur panne

Cluster miroir d'Evidian SafeKit avec réplication de fichiers temps réel et reprise sur panne
Économisez avec 3 produits en 1 En savoir plus >	Le logiciel de haute disponibilité SafeKit sur Windows et Linux permet d'économiser sur : les stockages partagés ou répliqués externes coûteux, les boîtiers de load balancing, les éditions entreprise des OS et des bases de données SafeKit offre toutes les fonctionnalités de clustering par logiciel : réplication de fichiers temps réel synchrone, surveillance des défaillances serveur / réseau / logiciel, redémarrage automatique de l'application, adresse IP virtuelle basculée en cas de panne pour rerouter les clients
Configuration très simple En savoir plus >	La configuration du cluster est très simple et réalisée au moyen de modules applicatifs. De nouveaux services et de nouveaux répertoires répliqués peuvent être ajoutés à un module applicatif existant pour compléter une solution de haute disponibilité Toute la configuration des clusters se fait à l'aide d'une console d'administration web centralisée simple Il n'y a pas de contrôleur de domaine ou d'Active Directory à configurer comme avec Microsoft cluster
Réplication synchrone En savoir plus >	La réplication en temps réel est synchrone sans perte de données en cas de panne Ce n'est pas le cas avec une réplication asynchrone
Retour d'un serveur tombé en panne totalement automatisé (failback) En savoir plus >	Suite à une panne lorsqu'un serveur reboot, le retour du serveur tombé en panne se fait de manière totalement automatique dans le cluster avec une resynchronisation de ses données et sans arrêter l'application sur le seul serveur restant Ce n'est pas le cas avec la plupart des solutions de réplication particulièrement celles avec une réplication au niveau base de données. Des opérations manuelles sont requises pour resynchroniser le serveur défaillant. Il peut être même nécessaire d'arrêter l'application sur le seul serveur restant
Réplication de n'importe quel type de données En savoir plus >	La réplication fonctionne pour les bases de données mais aussi pour n'importe quel fichier qui doit-être répliqué Ce n'est pas le cas pour la réplication au niveau base de données
Réplication de fichiers vs réplication de disque En savoir plus >	La réplication est basée sur des répertoires de fichiers qui peuvent être localisés n'importe où (même dans le disque système) Ce n'est pas le cas avec la réplication de disque où une configuration spéciale de l'application est nécessaire pour placer les données applicatives dans un disque spécial
Réplication de fichiers vs disque partagé En savoir plus >	Les serveurs peuvent être placés dans deux sites distants Ce n'est pas le cas avec les solutions à disque partagé
Sites distants et adresse IP virtuelle En savoir plus >	Toutes les fonctionnalités de clustering SafeKit fonctionnent pour 2 serveurs sur des sites distants. La réplication requiert un réseau de type LAN étendu (latence = performance de la réplication synchrone, bande passante = performance de la resynchronisation après panne). Si les deux serveurs sont connectés au même réseau IP via un réseau local étendu entre deux sites distants, l'adresse IP virtuelle de SafeKit fonctionne avec une redirection au niveau 2 Si les deux serveurs sont connectés à deux réseaux IP différents entre deux sites distants, l'adresse IP virtuelle peut être configurée au niveau d'un load balancer avec le "health check" de SafeKit.
Split brain et quorum En savoir plus >	La solution fonctionne avec seulement 2 serveurs et pour le quorum (isolation réseau entre 2 sites), un simple split brain checker vers un routeur est offert pour supporter une seule exécution de l'application critique Ce n'est pas le cas pour la plupart des solutions de clustering où un 3^ième serveur est nécessaire pour le quorum
Cluster actif/actif En savoir plus >	Le serveur secondaire n'est pas dédié au redémarrage du serveur primaire. Le cluster peut être actif-actif en exécutant deux modules miroirs différents Ce n'est pas le cas avec un système fault-tolerant dans lequel le secondaire est dédié à l'exécution de la même application synchronisée au niveau instruction
Solution de haute disponibilité uniforme En savoir plus >	SafeKit implémente un cluster miroir avec une réplication et une reprise sur panne. Mais il implémente aussi un cluster ferme avec load balancing et reprise sur panne. Ainsi une architecture N-tiers peut-être rendue hautement disponible et load balancée avec la même solution sur Windows et Linux (même installation, configuration, administration avec la console SafeKit ou les commandes en ligne). Ceci est unique sur le marché Ce n'est pas le cas avec une architecture mixant des technologies différentes pour le load balancing, la réplication et la reprise sur panne
RTO / RPO En savoir plus >	SafeKit met en œuvre un redémarrage rapide de l'application en cas de panne : autour d'1 mn ou moins Un redémarrage rapide de l'application n'est pas assuré avec une réplication complète de machines virtuelles. En cas de panne d'un hyperviseur, une machine virtuelle doit être rebootée sur un nouvel hyperviseur avec un temps de redémarrage lié au reboot de l'OS comme avec VMware HA ou Hyper-V cluster

Différenciateurs clés d'un cluster ferme avec équilibrage de charge et reprise sur panne

Cluster ferme d'Evidian SafeKit avec load balancing et reprise sur panne
Pas de load balancer, ni de serveur proxy dédié, ni d'adresse Ethernet multicast spéciale En savoir plus >	La solution ne nécessite pas de load balancer, ni de serveur proxy en amont de la ferme pour implémenter le load balancing. SafeKit est installé directement sur les serveurs applicatifs à load balancer. Le load balancing est basé sur une adresse IP virtuelle/adresse MAC Ethernet standard et fonctionne avec des serveurs physiques et des machines virtuelles sur Windows et Linux sans configuration réseau spéciale Ce n'est pas le cas avec les load balancers réseau Ce n'est pas le cas avec les proxys dédiés sur Linux Ce n'est pas le cas avec une adresse Ethernet multicast spéciale sur Windows
Toutes les fonctionnalités de clustering En savoir plus >	La solution inclut toutes les fonctionnalités de clustering : adresse IP virtuelle, load balancing sur adresse IP client ou sur sessions, surveillance des défaillances serveurs / réseaux / logicielles, redémarrage automatique de l'application avec un temps de reprise rapide, une option de réplication avec un module miroir Ce n'est pas le cas avec les autres solutions de load balancing. Elles sont capables de réaliser le load balancing mais elle n'inclut pas une solution de clustering complète avec des scripts de redémarrage et un redémarrage automatique de l'application en cas de défaillance. Elles n'offrent pas l'option de réplication La configuration du cluster est très simple et réalisée au moyen de modules applicatifs. Il n'y a pas de contrôleur de domaine et d'Active Directory à configurer sur Windows. La solution fonctionne sur Windows et Linux
Sites distants et adresse IP virtuelle En savoir plus >	Si les serveurs sont connectés au même réseau IP via un réseau local étendu entre des sites distants, l’adresse IP virtuelle de SafeKit fonctionne avec un équilibrage de charge au niveau 2 Si les serveurs sont connectés à des réseaux IP différents entre des sites distants, l'adresse IP virtuelle peut être configurée au niveau d'un load balancer à l'aide du "health check" de SafeKit. Ainsi, vous pouvez profiter de toutes les fonctionnalités de clustering de SafeKit, notamment la surveillance et la reprise automatique de l'application critique sur les serveurs applicatifs
Solution de haute disponibilité uniforme En savoir plus >	SafeKit implémente un cluster ferme avec load balancing et reprise sur panne. Mais il implémente aussi un cluster miroir avec réplication et reprise sur panne. Ainsi une architecture N-tiers peut-être rendue hautement disponible et load balancée avec la même solution sur Windows et Linux (même installation, configuration, administration avec la console SafeKit ou avec les commandes en ligne). Ceci est unique sur le marché Ce n'est pas le cas avec une architecture mixant des technologies différentes pour le load balancing, la réplication et la reprise sur panne

Différenciateurs clés de la technologie de haute disponibilité SafeKit

Cluster logiciel vs cluster matériel
En savoir plus >

Un cluster logiciel simple avec le package SafeKit installé sur deux serveurs

Un cluster matériel complexe avec du stockage externe ou des boîtiers de load balancing

Cluster de type "shared nothing"" vs cluster à disque partagé
En savoir plus >

SafeKit est un cluster sans partage de type "shared-nothing": simple à déployer même sur des sites distants

Un cluster à disque partagé est complexe à déployer

Haute disponibilité applicative vs Haute disponibilité de machines virtuelles complètes
En savoir plus >

La haute disponibilité applicative supporte les pannes matérielles et logicielles avec un temps de reprise rapide (RTO autour d'1 mn ou moins)
La haute disponibilité applicative nécessite de définir des scripts de redémarrage par application et des dossiers à répliquer (modules applicatifs SafeKit).

La haute disponibilité de machines virtuelles complètes (VM) supporte seulement les pannes matérielles avec un reboot de la VM et un temps de reprise dépendant du reboot de l'OS.
Pas de scripts de redémarrage à définir avec des machines virtuelles complètes en haute disponibilité (modules SafeKit hyperv.safe ou kvm.safe). Les hyperviseurs sont actif/actif avec simplement plusieurs machines virtuelles.

Haute disponibilité vs tolérance aux fautes
En savoir plus >

Chaque serveur peut être le serveur de reprise de l'autre serveur.
Exception logicielle avec redémarrage dans un autre environnement OS.
Upgrade en douceur de l'application et de l'OS possible serveur par serveur (les versions N et N+1 peuvent coexister)

Serveur secondaire dédié à l'exécution de la même application synchronisée au niveau instruction.
Exception logicielle sur les 2 serveurs en même temps.
Upgrade en douceur impossible

Réplication synchrone vs réplication asynchrone
En savoir plus >

SafeKit met en œuvre une réplication temps réel synchrone sans perte de données en cas de panne

Avec une réplication asynchrone, il y a une perte de données en cas de panne

Réplication de fichiers au niveau octet vs réplication de disque au niveau du bloc
En savoir plus >

SafeKit met en œuvre la réplication de fichiers temps réel au niveau octet et se configure simplement avec les répertoires applicatifs à répliquer même dans le disque système

La réplication de disque au niveau bloc est complexe à configurer et nécessite de mettre les données de l'application dans un disque spécial

Heartbeat, reprise sur panne et quorum pour éviter 2 serveurs maîtres
En savoir plus >

Pour éviter 2 serveur maîtres, SafeKit propose un simple "split brain checker" configuré sur un routeur

Pour éviter 2 serveur maîtres, les autres clusters demandent une configuration complexe avec une 3^ième machine, un disque de quorum spécial, une interconnexion spéciale

Adresse IP virtuelle
primaire/secondaire, load balancing réseau, basculement sur panne
En savoir plus >

Aucun serveur proxy dédié et aucune configuration réseau particulière ne sont requis dans un cluster SafeKit pour mettre en œuvre des adresses IP virtuelles

Une configuration réseau spéciale est requise dans d'autres clusters pour mettre en œuvre des adresses IP virtuelles. A noter que SafeKit propose un vérificateur d'état adapté aux équilibreurs de charge

Advanced configuration

Mirror module / pptx
- start_prim / stop_prim scripts
- userconfig.xml
- Heartbeat (<hearbeat>)
- Virtual IP address (<vip>)
- Real-time file replication (<rfs>)
- How real-time file replication works?
- Mirror's states in action
Farm module / pptx
- start_both / stop_both scripts
- userconfig.xml
- Farm heartbeats (<farm>)
- Virtual IP address (<vip>)
- Farm's states in action

Checkers / pptx
- userconfig.xml
- errd checker
- intf and ip checkers
- custom checker
- splitbrain checker for a mirror module
- tcp, ping, module checkers
- Checkers in action

Partage de charge réseau et reprise sur panne
Windows farm	Linux farm
Generic farm >	Generic farm >
Microsoft IIS >	-
NGINX >
Apache >
Amazon AWS farm >
Microsoft Azure farm >
Google GCP farm >
Other cloud >

Kubernetes K3S : le cluster de haute disponibilité le plus simple entre deux serveurs redondants

Avec la réplication temps réel et le basculement automatique fournis par Evidian SafeKit

Comment le logiciel Evidian SafeKit met en œuvre simplement la haute disponibilité de Kubernetes K3S entre deux serveurs redondants ?

La solution pour Kubernetes K3S

Comment ça marche ?

Une solution simple

Partenaires, le succès avec SafeKit

Logiciel de gestion des bâtiments (BMS)

Logiciel de gestion vidéo (VMS)

Contrôle d'accès électroniques (EACS)

Logiciels SCADA (Industrie)

Comment fonctionne le cluster miroir de SafeKit avec Kubernetes K3S ?

Etape 1. Réplication de données temps réel et continue

Etape 2. Basculement automatique

Etape 3. Réintégration après panne

Etape 4. Retour à la normale avec réplication de données temps réel

Essai gratuit de SafeKit + module miroir pour Kubernetes K3S + guide d'installation rapide

1. Téléchargez les packages

2. D'abord sur les deux nœuds

3. Sur le premier nœud

4. Sur le deuxième nœud

5. Vérifiez que le module SafeKit k3s est en cours d'exécution sur les deux nœuds

6. Démarrez la console Web SafeKit pour administrer le cluster

7. Tests

8. Essayez le cluster avec une application Kubernetes telle que WordPress

9. Support

10. Si nécessaire, configurez un checker splitbrain

Quels sont les différents scénarios en cas d'isolement réseau dans un cluster ?

Un seul réseau

Deux réseaux avec un réseau de réplication dédié

Un seul réseau et un checker split-brain

Utilisation typique avec SafeKit

Pourquoi une réplication de quelques Tera-octets ?

Pourquoi une réplication < 1 000 000 fichiers ?

Pourquoi un basculement ≤ 32 VMs répliquées ?

Pourquoi un réseau LAN/VLAN entre sites distants ?

Modules SafeKit pour des solutions de redondance et de haute disponibilité plug&play

Partage de charge réseau et reprise sur panne

Architectures de clustering avancée

Réplication de fichiers temps réel et reprise sur panne

Webinaire SafeKit (Anglais)

Clients de SafeKit dans tous les domaines d'activité

Meilleurs cas d'utilisation [+]

Gestion vidéo, contrôle d'accès, gestion des bâtiments [+]

Télévision numérique [+]

Finance [+]

Industrie [+]

Transport aérien [+]

Banque [+]

Transport métropolitain [+]

Santé [+]

Gouvernement [+]

Différentiateurs de la solution de haute disponibilité SafeKit par rapport à la concurrence

Cluster miroir d'Evidian SafeKit avec réplication de fichiers temps réel et reprise sur panne

Cluster ferme d'Evidian SafeKit avec load balancing et reprise sur panne

Evidian SafeKit 8.2

Toutes les nouvelles fonctionnalités par rapport à la 7.5 décrites dans le release notes

Packages

Licence d'essai gratuit d'un mois

Documentation technique

Information produit

Training

Modules et installation rapide

SafeKit 8.2 Training

Introduction

Installation, Console, CLI

Advanced configuration

Troubleshooting

Support