Nous nous sommes réveillés un vendredi matin dans un monde en plein chaos : les avions ne pouvaient plus voler, il était impossible de diffuser en direct, les comptes bancaires étaient inaccessibles et les hôpitaux étaient paralysés. Tout cela était dû à des PC Windows affichant le redoutable "écran bleu de la mort" – incapables de s'allumer.
La cause?
Crowdstrike, une compagnie de sécurité numérique intégrée à Windows, avait envoyé une seule mise à jour logicielle la nuit précédente. L'impact a été immédiat et le plan de reprise a nécessité un retour à une version antérieure du logiciel CrowdStrike. Le lendemain de l'interruption, Microsoft a annoncé que plus de huit millions d'appareils Windows avaient été touchés.
Alors, quelle est la cause exacte de cette défaillance ? Selon les informations publiques fournies par CrowdStrike et Microsoft, CrowdStrike a envoyé une mise à jour de routine à son logiciel de sécurité fonctionnant dans une partie hautement protégée du système d'exploitation Windows (OS). Cette mise à jour aurait fait exploser le système, le rendant non fonctionnel.
Alors qu'il existe de nombreuses explications détaillées sur ce qui a échoué et pourquoi cela a eu un tel impact, j'aimerais me concentrer sur les implications plus larges d'un incident comme celui-ci, surtout en matière de fiabilité de l'écosystème informatique et de son impact considérable sur la société et l'économie.
L'industrie doit se poser de nouvelles questions
-
Sur le risque de réputation pour Microsoft : Bien que le logiciel de sécurité de CrowdStrike soit à l'origine du problème, nombreux sont ceux qui blâment Microsoft. Qu'est-ce que cela signifie pour la réputation de Microsoft et quel risque cela représente-t-il pour eux ?
-
Sur la vulnérabilité du système: Comment l'équipe Microsoft a-t-elle permis qu'une simple mise à jour d'une seule organisation puisse corrompre le système d'exploitation Windows de manière aussi spectaculaire ? Quelles mesures l'équipe Microsoft va-t-elle prendre pour s'assurer que ce type de défaillance ne se reproduise plus jamais ? Existe-t-il d'autres logiciels tiers ayant un potentiel d'impact aussi important ?
-
Sur l'imputabilité: CrowdStrike et Microsoft sont-elles responsables des coûts supplémentaires et des perturbations causées par cet incident ? Les gouvernements du monde entier tiendront-ils ces entreprises pour responsables ?
-
Sur l'importance de la diversification technologique: Comme les ordinateurs MAC, Linux et Chrome n'ont pas été touchés, cet incident souligne l'importance d'avoir de la diversité dans ses écosystèmes technologiques. Les organisations devraient-elles imposer plusieurs systèmes d'exploitation pour éviter les points de défaillance uniques ?
-
Sur les processus d'approbation des mises à jour: Il fut un temps où les organisations examinaient soigneusement les mises à jour et les correctifs par l'intermédiaire d'un comité consultatif sur les changements (CCC). Avec l'essor des applications SaaS, ce processus n'est plus respecté et souvent contourné. Devrions-nous revenir à un processus d'approbation plus formel ?
-
Sur les stratégies de sécurité: Les entreprises de sécurité sont contraintes de neutraliser les nouveaux risques de logiciels malware aussi rapidement que possible. Cette stratégie doit-elle être réévaluée à la suite de cet incident ?
On doit mieux comprendre ce nouveau risque
Une des recommandations mises de l'avant pour résoudre le problème était de revenir à une version antérieure du logiciel CrowdStrike. Windows dispose d'une fonction appelée System Restore qui vous permet de ramener les fichiers système de votre ordinateur à un point antérieur dans le temps. Malheureusement, cette approche nécessite une méthode alternative afin de charger le système d'exploitation, il ne s'agit donc pas d'un processus automatisé – il faut être présent sur l'ordinateur. Compte tenu du nombre d'appareils concernés, il s'agit d'une solution peu pratique.
Une citation bien connue dit : "Ce qui ne vous tue pas vous rend plus fort". L'espoir est que nous avons maintenant identifié une toute nouvelle catégorie de risque. Cet incident nous fournit à tous un autre vecteur de risque contre lequel nous devons nous prémunir.
Après cette perturbation majeure, nous devons réfléchir à ces questions essentielles et prendre des mesures concrètes pour renforcer notre infrastructure informatique. Notre résilience en tant qu'économie mondiale en dépend.
Pour rn savoir plus sur l'importance cruciale de la récupération en cas de catastrophe informatique, découvrez cet article de Salman Alibhai de Compugen.
Vous êtes prêt.es à passer à l'étape suivante?
Si vous voulez en savoir plus sur l'amélioration de votre sécurité et de vos stratégies de reprise, réservez un appel exploratoire avec Compugen. À titre d'allié technologique, notre équipe évaluera votre écosystème de logiciels de sécurité et de récupération et examinera votre plan de préparation pour s'assurer que vous êtes bien équipé pour faire face à tout désastre informatique.
Cet article est republié à partir de LinkedIn.