PCA PRA Des technologies au secours de l'entreprise




  1. Pictogramme Hyperdisponibilité PCA PRA

     

    Comment améliorer les ressources face aux exigences du PCA ?

    Comment réduire la complexité et le coût d’un PRA ?

    C’est par le choix des technologies que l’on pourra atteindre la meilleure optimisation du PCA / PRA.

     

    La résilience optimale d’un data center

    Elle peut être obtenue en mariant trois approches déjà largement adoptées par le marché :

    • Le serveur lame :

    Il permet de réduire le nombre d’occurrences de panne des éléments communs à tous les serveurs en les mutualisant.

    Le châssis serveur lame va donc prendre en charge, avec redondance, les missions :

    • d’alimentation électrique,
    • des ventilateurs,
    • de l’accès au réseau,
    • de l’accès au SAN
    • La mutualisation de serveurs avec un hyperviseur :

    Cette approche permet de réduire les investissements matériels. Plus important : certaines fonctions de l’hyperviseur vont permettre d’assurer le fonctionnement de toutes les machines virtuelles même en cas de perte de l’une d’entre elles.

     

    • La mutualisation des volumes disques avec le SAN :

    Elle permet de mettre en œuvre une protection de disque de haut niveau. Le contrôleur disque disposera de deux canisters distincts (en actif actif) avec chacun de 2 à 4 liens possibles vers les serveurs.

    Les alimentations électriques seront redondées.

    Les principes de protection disque seront pratiquement tous disponibles au choix de l’entreprise (stratégies RAID – 1, 5, 6, 10).

     

     

    Apport de l’arithmétique :

     

    apport arithmétique

    Sur un serveur lame contenant 3 serveurs, le nombre d’alimentations électriques est réduit de moitié voire de 2/3 en fonction de la stratégie de protection. Alors, le taux de panne diminue pour le même nombre de serveurs.

    Cette approche sera la même pour les ventilateurs, les adaptateurs réseaux et les disques.

    Soit statistiquement, 3 fois moins de pannes.

     

    Exemple d’améliorations de la disponibilité apportées par les technologies :

     

    Gains de la mutualisation dans un chassis serveur lame

     

    Apport des différentes technologies

     

    Apport des différentes technologies

     

    Serveur lame et disques mutualisés

    Une fois ce triptyque réalisé, le data center pourra être schématisé de la manière suivante :

     

    serveur lame disques mutualisés

     

    serveur lame

     

    Le PCA se résume alors à sa plus simple expression :

    c’est la solution matérielle qui prend intégralement en compte les missions de protection contre les pannes.
    Cette approche permet d’équiper les entreprises qui requièrent un haut niveau de résilience du data center ; hors considération du PRA.

     

    En général, l’architecture classique d’un PRA est la suivante :

     

    PRA architecture classique ou croisée

     

    Le mode croisé étant le plus optimisé. Il est basé sur une approche de convergence et de SAN.

    En hyperconvergence, avec ou sans SDD, ce schéma est modifié. Il prend alors en compte la répartition des volumes et des VMs au niveau des serveurs.

    Les principes de réplication et de bascule étant plus complexes, nous ne les schématisons pas dans ce billet.

     

    Nous avons bâti une architecture fonctionnelle qui permet de mettre en œuvre à la fois un PCA de haut niveau et un PRA instantané tout en respectant les contraintes budgétaires de l’entreprise.

    Ce schéma permet de mettre en avant les principes que nous proposons de mettre en œuvre au mieux et en fonction du budget.

     

    Budget d’un PRA en rapport avec les objectifs à atteindre

     

    Comme nous l’avons vu précédemment, aujourd’hui un redémarrage du data center peut être réalisé selon les objectifs d’entreprise de plusieurs manières :

     

    Organisation PRA

     

    C’est par l’organisation des ressources du data center et par la recherche d’une architecture fonctionnelle la mieux adaptée à l’entreprise et aux objectifs de RTO / RPO que le budget du PCA / PRA sera optimisé.

     

     

    Architecture fonctionnelle optimisée pour un PCA / PRA

     

    cluster VM et disques

     

    PCA

    • Si un ESX tombe en panne, l’hyperviseur se charge de transférer les VM de celui-ci vers les autres ESX, qu’ils soient dans la même salle ou non.
    • Une baie de disques tombe en panne. L’écriture auxiliaire passe instantanément en primaire.

     

    PRA

    • Si la salle 1 cesse de fonctionner ou n’est plus accessible via le réseau, alors la salle 2 prend en charge la totalité des activités.

     

    Au cas où une seconde salle n’aurait pas encore été créée, les investissements minimums à réaliser sont les suivants :

    • Un boitier (de chaque côté) permettant de gérer les disques existants de l’entreprise et prenant en charge les fonctionnalités nécessaires à la gestion des différents scénarii (panne de serveur, panne de disque, perte totale d’une des deux salles et retour à la normale),
    • Le switch FC s’il n’était pas déjà présent dans le cœur de réseau,
    • Un lien entre les deux salles : en fonction de la distance, la mise en œuvre de ce lien sera plus ou moins compliquée :
      • Dans le même bâtiment = PCA sur deux salles,
      • Dans deux bâtiments différents implantés sur le même site,
      • Dans deux salles séparées géographiquement dans la même agglomération,
      • Dans deux salles séparées géographiquement par plusieurs dizaines de kilomètres et deux agglomérations différentes = PRA
    • Les prestations de mise en œuvre de la solution.

     

    Sur le même sujet, découvrez sur nos blogs :

    Le data center face aux risques

    PCA / PRA Quelques réflexions

    PCA / PRA Organisation

    PCA / PRA Optimiser les solutions et les investissements

    L’hyperdisponibilité

    Hyperdisponibilité une solution testée et éprouvée

    Hyperdisponibilité : exemples de fonctionnement

    Hyperdisponibilité : exemples de transformation