Un PCA / PRA pour l’entreprise

CERIEL s’est fixée pour objectif d’accompagner les entreprises dans l’élaboration de leurs PCA / PRA. Les principes, évoqués par William SYDNEY SMITH dans ses billets, ont permis d’élaborer une solution que nous vous présentons sur nos blogs : l’Hyperdisponibilité.

N’hésitez pas…

Bonne année et bonne lecture !

Benoit CHALMETON, responsable marketing digital et communication de CERIEL

Road Tour Hyperdisponibilité : un PCA / PRA testé en live

Avez-vous déjà testé l’efficacité de votre solution de PCA ou de PRA ? Notre équipe se déplace et vous fait vivre en direct le fonctionnement d’un PCA / PRA. Il existe un grand nombre de solutions PCA et de PRA sur le marché. Qu’elles utilisent un logiciel dans le Cloud ou « on premise » (installé chez vous), qu’elles s’appuient sur deux exploitations (production – secours) ou sur une seule (cluster), elles ont un point commun : elles sont présentées et vendues sur papier ou sur Powerpoint mais rarement testées en situation réelle sur vos installations. Leur efficacité est souvent mise à mal lorsqu’un incident se produit. En 2018, nous sommes allés à votre rencontre pour vous montrer « en live » une solution qui fonctionne. Nous réitérons cette expérience en 2019. Pour cela, nous simulons devant vous un certain nombre d’incidents et situations critiques sur deux data centers mobiles. Ensuite, nous observons ensemble la réaction de la solution d’hyperdisponibilité. En attendant notre retour près de chez vous dès le second trimestre, nous vous livrons quelques explications et réflexions. A très bientôt, je l’espère. Bonne année et bonne lecture ! Benoit CHALMETON, responsable marketing digital et communication de CERIEL

Hyperdisponibilité : exemples de transformation

Pictogramme Hyperdisponibilité PCA PRA

 

Exemples de transformation

 

PRA transformation

 

Un grand nombre d’entreprises ont déjà abordé le sujet du PRA ; parfois depuis bien longtemps. Les solutions mises en place le plus souvent reposent sur une approche simple : une data center de production protégé par un data center de secours.

 

 

Hyperdisponibilité changer la donne principes

 

Avec l’HYPERDISPONIBILITÉ l’organisation des ressources change. Et, l’ensemble de celles-ci seront vues comme s’il n’y avait qu’une seule exploitation, qu’une seule administration d’un seul data Center.

Nous vous proposons d’étudier un exemple de transformation d’un Data Center unique, dans une PME, effectuée au moment du renouvellement du matériel.

 

 

Hyperdisponibilité transformer l'existant

 

L’existant est représenté ici par trois ESX avec une baie de disques et une solution de sauvegarde.

Jusqu’à maintenant, l’entreprise ne pouvait pas envisager de mettre en œuvre un PRA qui aurait représenté un investissement équivalent au Data Center de production.

Avec l’HYPERDISPONIBILITÉ, nous pouvons proposer un budget qui comprendrait la mise en œuvre d’une solution de PCA/PRA sur deux salles avec un minimum d’investissement.

 

 

Hyperdisponibilité les moyens

 

Dans la solution qui nous intéresse, les deux salles seront sur le même site géographique de l’entreprise, à une distance inférieure à 100 mètres.

La diminution du nombre de serveurs est rendue possible par une très faible consommation de CPU des ESX et un nombre réduit de machines virtuelles, environ une soixantaine.

Les processeurs de dernière génération vont permettre d’apporter plus de puissance sur deux ESX qu’avec la solution actuelle.

Le prix de la mémoire permet aussi de prévoir une grande capacité mémoire par serveur afin de s’assurer qu’un serveur seul pourra prendre en charge 100% des VMs.

Les liens entre les deux salles seront en 10 Gigabits Ethernet et en 16 Gigabits FC.

 

 

Hyperdisponibilité réorganisation

 

Supprimer un ESX = les processeurs retenus pour la nouvelle configuration doivent au total (pour deux serveurs Bi pro) dégager plus de performance que la somme des processeurs des trois ESX existants.

La capacité mémoire de chaque ESX doit permettre l’exploitation de 100% des VMs.

 

 

Hyperdisponibilité réorganisation

 

Par exemple, s’il y avait eu 3 ESX de chaque côté, dans un seul cluster. En cas de panne d’un des ESX, le vCenter et DRS auraient pris le relais pour répartir les VMs qui étaient hébergées sur cette ESX et les répartir en fonction de la charge, sur un ou plusieurs ESX dans la même salle ou sur les deux salles.

La fonction Hyperswap aurait quant à elle géré les modifications de liens.

 

 

Hyperdisponibilité mise en cluster

 

La mise en cluster des deux ESX et la mise en cluster des deux SAN vont permettre d’utiliser la fonctionnalité de la baie Storwize : l’Hyperswap.

La solution d’HYPERDISPONIBILITÉ peut alors être installée et paramétrée.

Le fonctionnement de l’HYPERDISPONIBILITÉ est simple :

Grâce aux liens entre les deux salles, les écritures sur les disques sont opérées de manière simultanée sur les DEUX salles. L’une est réalisée en primaire, la seconde en auxiliaire.

Les caches sont flashés afin d’assurer une situation identique de manière synchrone sur les deux baies de disques.

Ensuite, les fonctionnalités de VMWARE et de la fonction HYPERSWAP des baies Storwize vont permettre de gérer les différentes situations pour atteindre un RPO = 0 et un RTO = 0.

 

 

Hyperdisponibilité conclusions

 

 

Sur le même sujet, découvrez sur nos blogs :

Le data center face aux risques

PCA / PRA Quelques réflexions

PCA / PRA Organisation

PCA / PRA Optimiser les solutions et les investissements

Des technologies au secours de l’entreprise

L’hyperdisponibilité

Hyperdisponibilité une solution testée et éprouvée

Hyperdisponibilité : exemples de fonctionnement

Hyperdisponibilité : exemples de fonctionnement

Pictogramme Hyperdisponibilité PCA PRA

 

Exemples de fonctionnement de l’hyperdisponibilité

 

Hyperdisponibilité Fonctionnement exploitation croisée

 

L’exemple pris, d’une exploitation croisée, repose sur deux ESX seulement. L’objectif est double : mettre en évidence à la fois la capacité de cette solution à s’adapter à toutes tailles d’entreprise mais aussi d’aller assez finement dans le fonctionnement de l’HYPERDISPONIBILITÉ.

Le fonctionnement de l’HYPERDISPONIBILITÉ est simple :

Grâce aux liens entre les deux salles, les écritures sur les disques sont opérées de manière simultanée sur les DEUX salles. L’une est réalisée en primaire, la seconde en auxiliaire.

Les caches sont flashés afin d’assurer une situation identique de manière synchrone sur les deux baies de disques.

Ensuite, les fonctionnalités de VMWARE et de la fonction HYPERSWAP des baies de stockage Storwize vont permettre de gérer les différentes situations de panne ou de perte de ressources suite à un sinistre pour atteindre un RPO = 0 et un RTO = 0.

 

 

Hyperdisponibilité Fonctionnement exploitation croisée

 

 

La panne sur un des deux serveurs va enclencher une série de réactions de la part du vCenter et du SAN de la salle 2.

 

 

Hyperdisponibilité Fonctionnement exploitation croisée

 

 

L’ESX de la salle 1 tombe en panne. Les liens entre le SAN de la salle 1 et l’ESX de la salle 1 sont coupés. Les liens entre l’ESX 2 de la salle 2 et le SAN de la salle 1 restent actifs.

Le vCenter réagit et déplace les VMs de la salle 1 vers l’ESX de la salle 2. Les liens entre les VMs déplacées et les SAN sont les mêmes que ceux de l’ESX 2.

100% de la charge de travail sont pris en charge par l’ESX de la salle 2.

Aucune intervention humaine n’a été nécessaire.

Les utilisateurs qui travaillaient sur une application hébergée sur l’ESX 1 ont pu subir un très court temps de blocage de l’exploitation (inférieur à une minute), si l’application hébergée sur l’ESX 1 n’était pas exploitée en fault tolérance. La mise en oeuvre de la fonction fault tolérance de VMware pour une VM permet d’assurer un RTO = 0 pour cette VM seulement.

 

 

Hyperdisponibilité Fonctionnement exploitation croisée

 

La panne sur l’ESX de la salle 1 a été solutionnée par le service de maintenance du constructeur. Il est remis en fonction. La fonction HYPERSWAP de la baie de disques de la salle 2 détecte de nouveau le serveur de la salle 1.

Le vCenter retrouvant l’ESX 1, grâce à la fonction DRS de VMWARE, rebascule les VMs attribuées à la salle 1. En même temps, l’HYPERSWAP redéfinit les liens des VMs basculées vers la salle 1.

Le retour à la normale se fait sans intervention humaine.

 

 

Hyperdisponibilité Fonctionnement exploitation croisée

 

La baie de disques de la salle 1 devient indisponible suite à une panne bloquante. Toutefois, l’ESX 1 reste opérationnel.

 

 

Hyperdisponibilité Fonctionnement

 

Le lien primaire est perdu mais l’exploitation continue grâce au lien auxiliaire du SAN de la salle 2.

Le lien auxiliaire est passé primaire. L’hyperswap crée un lien auxiliaire sur le SAN de la salle 2.

Il n’y a eu aucune interruption perçue par les utilisateurs.

Il n’y a eu aucune intervention humaine.

 

 

 

Hyperdisponibilité Fonctionnement

 

Lorsque la baie de disques de la Salle 1 est remise en fonction, l’HYPERSWAP la détecte et lance un processus de réplication vers le SAN de la salle 1 afin de la mettre à niveau.

Un fois ce processus terminé, les liens primaire/auxiliaire sont rétablis afin d’assurer le retour à la normale.

Aucune intervention humaine n’est nécessaire.

 

 

Sur le même sujet, découvrez sur nos blogs :

Le data center face aux risques

PCA / PRA Quelques réflexions

PCA / PRA Organisation

PCA / PRA Optimiser les solutions et les investissements

PCA / PRA  Des technologies au service de l’entreprise

L’hyperdisponibilité

Hyperdisponibilité une solution testée et éprouvée

Hyperdisponiblité : exemples de transformation