Meilleures pratiques pour tester un environnement de reprise haute disponibilité

Meilleures_pratiques_pour_tester_un_environnement_de_reprise_haute_disponibilite.jpgLorsque vous investissez dans un environnement à haute disponibilité avec un serveur IBM Power (aussi connu sous les noms d’AS/400 et IBM i) vous savez que vous disposez d’une machine performante, robuste, fiable, polyvalente et sécurisée. Malgré les avantages incontestables des serveurs Power, ils ne sont pas infaillibles et les infrastructures dans lesquels ils fonctionnent non plus.  

Vous avez donc besoin de vous prémunir contre les différents types de sinistres qui peuvent affecter vos installations informatiques, que ce soit une inondation, un feu ou un bris de matériel.

Bien qu’un environnement à haute disponibilité apporte un certain de niveau de tranquillité quant à l’accès aux services, tester l’environnement de reprise demeure critique. Certaines entreprises se fient aveuglément à la fiabilité de leurs systèmes et négligent les tests de reprise. En fait, on estime qu’à peine 10 % d’entre elles effectuent régulièrement les examens de maintenance nécessaires au bon fonctionnement de leur environnement de reprise.

Faites-vous partie de ce 10% ou du 90% dont les capacités de production sont à risque en raison de lacunes dans leur plan de reprise ?

Tester et retester pour améliorer son plan de reprise

Si les grandes entreprises comme les banques et les compagnies d’assurances sont déjà sensibles à l’importance de tester régulièrement leur plan de relance, il en est tout autrement pour celles de plus petite taille dont les priorités gravitent surtout autour de la croissance.

Le manque de temps, de ressources, le besoin constant de disponibilité des systèmes informatiques, les coûts liés aux tests et la peur de perdre des données précieuses au cours des simulations sont autant de raisons qui justifient le report des tests pourtant indispensable. Cette attitude est souvent renforcée par une mauvaise compréhension de la marche à suivre pour mettre en place un plan de test et de reprise.

Idéalement, une compagnie devrait tester l’intégralité de son système de reprise au moins une fois par année afin d’éviter que le scénario de relance ne soit obsolète. 

Il faut comprendre que le système de reprise fonctionne en suivant les procédures d’un scénario programmé, c’est-à-dire un plan de sauvetage élaboré et peaufiné par un administrateur chaque fois qu’un test complet est réalisé.

Étant donné que l’infrastructure informatique évolue constamment, il faut toujours tenir compte des nouvelles fonctionnalités intégrées, des nouvelles connexions et des nouvelles applications. Ces variables complexifient les procédures en cas de problèmes et doivent absolument être testées afin d’éviter le pire.

 

2 types de tests essentiels pour un environnement de haute disponibilité

1. Le test complet

L’administrateur procède à une bascule complète des systèmes de production vers le système de relève.

Ce type de test doit être minutieusement planifié afin qu’il ne perturbe pas la production et que l’ensemble des systèmes puissent être rebasculés dans les temps impartis pour le test. Au cours de ce test, le comportement de l’ensemble des composantes de l’environnement est analysé afin de détecter d’éventuels problèmes à résoudre.

Ces simulations permettent de développer de nouvelles solutions et d’enrichir le plan de relève afin de garantir une meilleure sécurité de toutes les composantes informatiques.

 

2. Les tests à blanc

Ces examens sont moins dispendieux et contraignants pour les entreprises, car ils sont seulement effectués sur le système de relève. Ils simulent une reprise qui n’interrompt pas la production, mais qui permet quand même de vérifier, en partie, le bon fonctionnement du scénario d’urgence.

Il s’agit d’une option intéressante pour les entreprises qui peuvent difficilement se permettre d’interrompre leurs activités afin de mener des tests plus complets. Aussi, ces tests sont plus rapides à effectuer que les tests complets, ils peuvent donc être effectués plus régulièrement.

 

Mieux vaut prévenir que guérir...

Lorsqu’il est question des systèmes de production d’une entreprise, l’optimisme ne peut être l’approche à privilégier. Au contraire, même si vous pouvez espérer le meilleur, vous devriez être prêt pour le pire.

Ceci est d’autant plus critique dans les environnements à haute disponibilité, qui par définition, sont implantés dans les entreprises qui ont le plus besoin de compter sur leurs systèmes 24/7. 

Assurez-vous d’avoir un plan de relève qui a été testé pour différents scénarios et si vous avez des doutes, demandez de l’aide avant d’être en situation de désastre.

 

5 étapes vers une infrastructure TI plus organisée et fonctionnelle

 

Vous avez aimé cet article? Abonnez-vous  au blogue!

 

Crédit photo : © OleGunnar - Fotolia.com