Des systèmes critiques peuvent-ils encore ne pas être redondés ?

On a regroupé, pour s'amuser un peu, quelques articles de la presse faisant état de pannes informatiques, aux conséquences parfois très lourdes pour les entreprises. Voici un petit échantillon :

"L'aéroport de Londres bloqué par une panne serveur"

http://www.lemondeinformatique.fr/actualites/lire-l-aeroport-de-londres-bloque-par-une-panne-serveur-59602.html?utm_source=mail&utm_medium=email&utm_campaign=Newsletter

"Amende record pour Bank of Scotland suite à une panne informatique"

http://www.lemondeinformatique.fr/actualites/lire-amende-record-pour-bank-of-scotland-suite-a-une-panne-informatique-59208.html

"La panne informatique de Goldman Sachs qui coûte très cher"

http://www.challenges.fr/entreprise/20130821.CHA3155/goldman-sachs-seme-le-trouble-sur-les-places-boursieres.html

"Wall Street : le Nasdaq suspend ses cotations à cause d'un bug informatique"

http://www.latribune.fr/bourse/actualite/20130823trib000781362/wall-street-le-nasdaq-suspend-ses-cotations-a-cause-d-un-bug-informatique.html?utm_source%3Dbuffer%26utm_campaign%3DBuffer%26utm_content%3Dbuffera93cf%26utm_medium%3Dtwitter

"Le système informatique de la banque est tombé en panne hier : Mauvaise surprise pour les clients de la BMCI"

http://www.maghress.com/fr/liberation/13035

"Panne informatique à la banque Vontobel"

http://www.ictjournal.ch/fr-CH/News/2014/01/07/Black-out-a-la-banque-Vontobel.aspx?agent=browser

"Le serveur SMTP de Free est en panne"

http://www.numerama.com/magazine/30569-le-serveur-smtp-de-free-est-en-panne.html

"Belkin : des milliers de routeurs en panne à cause d'un serveur de contrôle"

http://www.clubic.com/connexion-internet/actualite-731905-panne-routeurs-belkin-service-cloud-centralisation.html

"La panne de moteur de Deezer"

http://www.lefigaro.fr/musique/2014/08/04/03006-20140804ARTFIG00244-la-panne-de-moteur-de-deezer.php

"La Banque Nationale encore en panne"

http://www.lesaffaires.com/secteurs-d-activite/services-financiers/la-banque-nationale-encore-en-panne/540556

 

On aurait pu en collecter bien d'autres. Parmi ces pannes il y a quelques bugs de logiciel : le vilain bug qui transforme des ordres d'achat en ordres de vente chez un courtier, par exemple. Mais la plupart des pannes citées sont dues à l'arrêt d'un ou plusieurs serveurs. On s'étonne tout de même que des serveurs critiques ne soient pas redondés et ne basculent pas en quelques secondes sur un serveur "jumeau" qui prend le relais. Nous précisons que nous avons exclu de notre liste les pannes dues à des attaques malveillantes.

Nous connaissons des industriels qui ont mis en place des infrastructures critiques complètement redondées, avec des bases de données tenues à jour à la seconde près, tout au plus avec quelques secondes ou minutes de décalage, de façon à ce qu'un système tombant brutalement en panne bascule sur son système de secours sans perte de données.

On lit dans certains des articles répertoriés ci-dessus que certaines banques se préparent ou sont en train d'investir des centaines de millions d'Euros dans la refonte de leur infrastructure pour qu'elle soit mieux sécurisée, et que le NATS (National Air Traffic Services britannique) est associé à un plan de mise à niveau des systèmes de gestion du trafic aérien européen, projet qui serait d'un montant de trois milliards d'Euros. On peut se réjouir de ces projets, mais on réalise aussi que ces organismes avaient probablement privilégié durant des années la croissance et les nouvelles fonctionnalités, sans investir en parallèle dans la solidité du système d'information. En effet lire que la panne d'un malheureux serveur paralyse tout un business pendant plusieurs heures, on ne peut s'empêcher de penser que ces aspects de robustesse avaient été négligés.