Cliquez sur le module Windows ou Linux pour comprendre et essayer la solution
Modules miroirs (réplication et reprise sur panne)
Windows
Linux
Microsoft SQL Server
-
Oracle
MySQL
PostgreSQL
Firebird
Hyper-V
-
Milestone XProtect (basé sur Microsoft SQL Server)
-
Hanwha SSM (basé sur PostgreSQL Server)
-
Module miroir générique
Modules fermes (partage de charge et reprise sur panne)
Windows
Linux
Module IIS
-
Module Apache
Module ferme générique
Solutions Cloud [+]
Click on the mirror/farm architecture to understand and try the solution
Cloud
Real-time replication and failover cluster
Load balancing and failover cluster
Amazon AWS
Microsoft Azure
Google GCP
Generic Architecture
Clients [+]
Vidéo surveillance [+]
Dans les systèmes de vidéosurveillance, Evidian SafeKit implémente une haute disponibilité avec une réplication synchrone et un basculement sur panne pour :
Harmonic utilise SafeKit comme une offre de haute disponibilité logicielle OEM dans ses solutions de télédiffusion à travers la TNT, les satellites, le câble et les réseaux IP.
Bernard Etienne, Responsable de production témoigne :
“La Compagnie Européenne de Garanties et Cautions gère des applications métiers critiques qui doivent rester disponibles face aux pannes matérielles et logicielles. En effet, nos applications déterminent si une caution peut être délivrée à un particulier contractant un prêt dans une banque ou à une entreprise qui a besoin d’une garantie sur un investissement. Nous avons retenu le produit SafeKit d’Evidian pour assurer la haute disponibilité de nos applications métiers pour 3 raisons principales. C’est un produit simple qui se met en œuvre sur deux serveurs standards. Il ne nécessite pas d’investir des composants matériels spécifiques et coûteux. Et c’est un produit riche qui permet de surveiller finement nos applications métiers et les reprendre en cas de panne matérielle et logicielle.”
« Les entreprises automatisées que nous équipons s’appuient sur l’ERP SYDEL UNIVERS. Il n’est pas envisageable que notre ERP soit hors de service à cause d’une panne informatique. Sinon c’est l’ensemble de l’activité de l’entreprise qui s’arrête. Nous avons choisi la solution de haute disponibilité Evidian SafeKit car c’est une solution simple d’utilisation. Elle se met en œuvre sur des serveurs standard et ne contraint pas à utiliser des disques partagés sur un SAN et des boitiers réseau de partage de charge. Elle permet d’écarter les serveurs dans des salles machines distinctes. De plus, la solution est homogène pour les plateformes Linux et Windows. Et elle apporte 3 fonctionnalités : le partage de charge entre serveurs, la reprise automatique sur panne et la réplication temps réel des données. »
Transport aérien [+]
Le fournisseur de solutions pour le contrôle aérien, Copperchase, déploie SafeKit pour la haute disponibilité de ses systèmes dans les aéroports. Plus de 20 clusters SafeKit sont déployés sur Windows. Tony Myers, Directeur Business Développement témoigne : « En développant des applications pour le contrôle du trafic aérien, Copperchase est dans l’une des activités les plus critiques qui existent. Nous avons absolument besoin que nos applications soient disponibles tout le temps. Nous avons trouvé avec SafeKit une solution simple et complète de clustering qui répond parfaitement à nos besoins. Ce logiciel combine en un seul produit l’équilibrage de charge, la réplication de données en temps réel sans perte de données et le basculement automatique en cas de panne. C’est pourquoi, Copperchase déploie SafeKit dans les aéroports pour le contrôle du trafic aérien au Royaume-Uni et dans les 30 pays où nous sommes présents. »
Et également, Philippe Marsol, responsable d’intégration, Atos BU Transport, témoigne :
“SafeKit est un produit simple et puissant pour la haute disponibilité des applications. Nous avons intégré SafeKit dans nos projets critiques comme la supervision de la ligne 4 du métro Parisien (dans le PCC / Poste de Commande et de Contrôle) ou la ligne 1 et 2 à Marseille (dans le CSR / Centre de Supervision du Réseau). Grâce à la simplicité du produit, nous avons gagné du temps dans l’intégration et la validation de la solution et nous avons eu également des réponses rapides à nos questions avec une équipe Evidian réactive. »
Marc Pellas, Président Directeur Général témoigne :
« SafeKit répond parfaitement aux besoins d’un éditeur logiciel. Son principal avantage est d’introduire la haute disponibilité via une option logicielle qui s’ajoute à notre propre suite logicielle multi-plateformes. Ainsi, nous ne sommes pas dépendants d’une solution de clustering matériel spécifique, coûteuse, complexe à installer, difficile à maintenir et différente suivant les environnements clients. Avec SafeKit, nos centres de pompiers sont déployés avec une solution de clustering logiciel intégrée avec notre application, uniforme chez tous nos clients, simple pour les utilisateurs et que nous maîtrisons totalement de l’installation jusqu’au support après vente. »
Alexandre Barth, Administrateur système témoigne :
« Notre équipe de production a mis en œuvre sans difficulté la solution SafeKit sur 14 clusters Windows et Unix. Notre activité critique est ainsi sécurisée avec des fonctions de haute disponibilité et de partage de charge. Les avantages de ce produit sont d’une part la simplicité de mise en œuvre et d’administration des clusters et d’autre part, l’uniformité de la solution face aux systèmes d’exploitation hétérogènes. »
La haute disponibilité applicative de SafeKit supporte les pannes matérielles, logicielles et les erreurs humaines avec un temps de reprise rapide
La haute disponibilité de machines virtuelles complètes (VM) supporte seulement les pannes matérielles avec un reboot de la VM et un temps de reprise indéfini si le reboot OS dysfonctionne
Pour éviter 2 serveur maîtres, SafeKit propose un simple "split brain checker" configuré sur un routeur
Pour éviter 2 serveur maîtres, les autres clusters demandent une configuration complexe avec une 3ième machine, un disque de quorum spécial, une interconnexion spéciale
Les répertoires répliqués peuvent être dans le disque système
Multiples heartbeats et adresses IP virtuelles supportés
Offre des checkers logiciels, matériels et réseaux configurables
Pour le quorum, ne nécessite pas de disque spécial ou de troisème machine ou de lien spécifique entre les 2 serveurs
Basculement automatique des services avec un temps de reprise de l'ordre d'une minute
Réintégration automatique d'un serveur après panne (aucune opération manuelle)
Une console très simple pour déployer la solution et la maintenir ensuite pour le client final
Supporte les erreurs humaines (40% des causes d'indisponibilité) grâce à sa simplicité
Supporte les défaillances logicielles (40% des causes d'indisponibilité) : régression sur les mises à jour logicielles (les versions N et N + 1 peuvent coexister), système d'exploitation gelé, bug logiciel
Supporte les défaillances du matériel et de son environnement (20% des causes d'indisponibilité), y compris la panne complète d'une salle informatique avec 2 nœuds dans deux sites distants
Quel est le temps de reprise (RTO) [+]
Le RTO (Recovery Time Objective) est le temps pendant lequel l'application est indisponible en cas de panne. Le RTO de la solution miroir de SafeKit est de l'ordre de 1 mn.
Pour une panne matérielle dans un cluster miroir, RTO = timeout des heartbeats (par défaut 30 s, peut être modifié dans userconfig.xml) + délai pour redémarrer les services .
Pour une défaillance logicielle ou un basculement administrateur, RTO = le temps d'arrêter (proprement) les services + le temps de les redémarrer.
Soyez prudent, avec des solutions qui redémarrent une machine virtuelle complète en cas de panne, le RTO est imprévisible car des opérations manuelles peuvent être nécessaires après un crash matériel pour redémarrer la machine virtuelle.
Quelle est la perte de données (RPO) [+]
Le RPO (Recovery Point Objective) reflète la perte de données en cas de panne. Le RPO de la solution miroir de SafeKit est 0 car la réplication est synchrone et temps réel.
Attention, avec la réplication asynchrone, le RPO n'est pas 0 et il y a perte de données en cas de panne lorsque l'application redémarre sur le serveur secondaire.
Supporte de multiples voies de surveillance sur de multiples réseaux pour détecter la panne d'un serveur
Supporte de multiples adresse IP virtuelles
Offre des checkers logiciel, matériel et réseau configurables
Offre le cluster miroir avec réplication temps réel synchrone et reprise sur panne
Basculement automatique avec un temps de reprise de l'ordre de quelques secondes
Réintégration automatique d'un serveur après panne (aucune opération manuelle)
Une console très simple pour déployer la solution et la maintenir ensuite pour le client final
Supporte les erreurs humaines (40% des causes d'indisponibilité) grâce à sa simplicité
Supporte les défaillances logicielles (40% des causes d'indisponibilité) : régression sur les mises à jour logicielles (les versions N et N+1 peuvent coexister), système d'exploitation gelé, bug logiciel
Supporte les défaillances du matériel et de son environnement (20% des causes d'indisponibilité), y compris la panne complète d'une salle informatique avec 2 nœuds dans deux sites distants
Quel est le temps de reprise (RTO) [+]
Le RTO (Recovery Time Objective) est le temps pendant lequel l'application est indisponible en cas de panne. Le RTO de la solution ferme de SafeKit est de l'ordre de quelques secondes sur panne matérielle.
Pour une panne matérielle, RTO = timeout sur la détection de panne via les voies de surveillance (par défaut quelques secondes) : après le timeout, les filtres de load balancing sont reconfigurés.
Pour une défaillance logicielle ou un basculement administrateur, RTO = le temps d'arrêter (proprement) les services + le temps de les redémarrer.
Ce tutoriel montre comment utiliser la console SafeKit la première fois après le téléchargement du package SafeKit. Vous verrez comment mettre en place les adresses IP des serveurs dans le clsuter, comment définir un répertoire répliqué et une adresse IP virtuelle. L'onglet Configuration est démontré.
Éditer les scripts de reprise
Dans un cluster de haute disponibilité, l'application critique doit redémarrer automatiquement. Ce tutoriel montre comment éditer les scripts de démarrage et d'arrêt dans la console SafeKit pour inclure le démarrage et l'arrêt de l'application critique. L'onglet Configuration est démontré.
Monitorer un cluster de haute disponibilité
Ce tutoriel montre ce qui se passe dans la console SafeKit quand un serveur tombe en panne. L'onglet Monitor est démontré.
Configurer un réseau de réplication
Ce tutoriel montre comment configurer un réseau de réplication dédié dans la console. L'onglet Configuration est démontré.
Résolution de problèmes avec la console
Lorsque la console SafeKit présente un serveur rouge, cela signifie que la solution n'est plus hautement disponible. Ce tutoriel montre comment gérer un problème dans un cluster et comment redémarrer un module de haute disponibilité. L'onglet Control est démontré.
Configurer le timeout d'un heartbeat
Le timeout d'un heartbeat détermine combien de temps un serveur secondaire attend lorsqu'il y a un incident sur le serveur principal avant de redémarrer une application. Le timeout est par défaut à 30 secondes et est réglé sur 15 secondes dans cette vidéo. L'onglet Advanced Configuration est démontré.
Ajouter un checker ping
Ce tutoriel montre comment ajouter un checker ping vers un routeur externe dans un module de haute disponibilité. Si le routeur n'est pas accessible par un serveur, le module passe à l'état rouge WAIT sur ce serveur. Lorsque le routeur est à nouveau accessible, le module sur le serveur redémarre automatiquement et passe à un état vert. L'onglet Advanced Configuration est démontré dans cette vidéo.
Réplication de fichiers temps réel et reprise sur panne avec l'application Microsoft Paint (module miroir)
Ce tutoriel montre le fonctionnement d'un cluster miroir sur l'exemple de Microsoft Paint.
Load balancing Apache et reprise sur panne (module ferme)
Ce tutoriel montre le fonctionnement d'un cluster ferme sur l'exemple d'Apache. Cette démonstration fonctionne sur Windows ou Linux. La configuration, le load balancing et la reprise sur panne sont démontrés dans cette vidéo.
Cluster Microsoft SQL Server avec réplication et reprise sur panne (module miroir)
Ce tutoriel montre le fonctionnement d'un cluster miroir sur l'exemple de Microsoft SQL Server. La configuration, la réplication de la base de données en temps réel et le basculement automatique sont démontrés dans cette vidéo.
Cluster Hyper-V avec réplication, reprise sur panne et partage de charge (N modules miroirs)
Ce tutoriel montre le fonctionnement de 2 modules miroirs sur 2 VMs dans un cluster Hyper-V. La configuration, la réplication en temps réel des 2 VMs, le basculement automatique, la migration d'une machine virtuelle et l'équilibrage de charge des 2 machines virtuelles sur les 2 serveurs sont démontrés dans cette vidéo.