Qu’est-ce qui s’est passé ?

Le 20 octobre 2025, AWS a connu une panne d’envergure mondiale qui a affecté des centaines de services essentiels — réseaux sociaux, jeux vidéo, e-commerce, banques, objets connectés. 

La région particulièrement touchée : US-EAST-1 (Virginie-Nord, États-Unis), zone stratégique de l’infrastructure AWS. 

Selon AWS : des « taux d’erreurs accrus et des latences importantes pour plusieurs services ». 

Les causes identifiées

1. Dysfonctionnement du DNS et des équilibreurs de charge

L’origine technique a été localisée : un bug dans le système d’automatisation de la gestion DNS utilisé par DynamoDB (base de données d’AWS) : un enregistrement DNS vide dans US-EAST-1 n’a pas été réparé automatiquement. 

En parallèle, un sous-système chargé de surveiller la santé des network load balancers a déclenché une cascade de dysfonctionnements. 

2. Effet domino et dépendance centrale

Parce que tant de services dépendent d’AWS pour l’hébergement, le stockage et la distribution, ce qui semble être un problème « interne » s’est propagé à l’ensemble de l’écosystème. 

Par ailleurs, cette panne souligne la fragilité d’une infrastructure aujourd’hui très centralisée chez quelques grands fournisseurs de cloud. 

Impact pour les entreprises et utilisateurs

Pourquoi c’est un problème stratégique

Bonnes pratiques et enseignements pour les entreprises

  1. Prévoir un plan de continuité multi-cloud ou au minimum multi-région si vous êtes sur AWS.
  2. Surveiller les dépendances cachées : si un micro-service cloud s’écroule, quels en sont les effets secondaires ?
  3. Mettre en place des tests de résilience (chaos testing, basculations planifiées) pour vérifier que vos systèmes tiennent en cas de panne.
  4. Évaluer régulièrement vos fournisseurs cloud et leur stratégie de redondance.
  5. Communiquer rapidement et clairement en cas d’incident : transparence = confiance.

En résumé

La panne d’AWS d’octobre 2025 est un rappel brutal que même les infrastructures dites « cloud » ne sont pas infaillibles. Elle montre que la haute disponibilité ne s’achète pas par défaut : elle se conçoit, se planifie, se teste. Pour les entreprises digitales : penser résilience est désormais un impératif.