Was ist passiert?

Am 20. Oktober 2025 erlebte AWS einen Ausfall mit weltweiter Tragweite, der Hunderte essenzieller Dienste betraf — soziale Netzwerke, Videospiele, E-Commerce, Banken, vernetzte Geräte. 

Besonders betroffen war die Region US-EAST-1 (Nord-Virginia, USA), eine strategische Zone der AWS-Infrastruktur. 

Laut AWS: „erhöhte Fehlerraten und erhebliche Latenzen bei mehreren Diensten". 

Die identifizierten Ursachen

1. Fehlfunktion von DNS und Load Balancern

Die technische Ursache wurde lokalisiert: ein Bug im DNS-Automatisierungssystem, das von DynamoDB (der Datenbank von AWS) genutzt wird – ein leerer DNS-Eintrag in US-EAST-1 wurde nicht automatisch repariert. 

Parallel dazu löste ein Subsystem zur Überwachung des Zustands der Network Load Balancer eine Kaskade von Fehlfunktionen aus. 

2. Dominoeffekt und zentrale Abhängigkeit

Da so viele Dienste für Hosting, Speicher und Distribution auf AWS angewiesen sind, breitete sich das, was nach einem „internen" Problem aussah, im gesamten Ökosystem aus. 

Zudem unterstreicht dieser Ausfall die Fragilität einer Infrastruktur, die heute stark bei wenigen großen Cloud-Anbietern zentralisiert ist. 

Auswirkungen auf Unternehmen und Nutzer

Warum das ein strategisches Problem ist

Best Practices und Lehren für Unternehmen

  1. Einen Multi-Cloud-Kontinuitätsplan oder zumindest einen Multi-Region-Plan einrichten, wenn Sie auf AWS sind.
  2. Versteckte Abhängigkeiten überwachen: Wenn ein Cloud-Mikrodienst zusammenbricht, welche Nebeneffekte hat das?
  3. Resilienz-Tests einrichten (Chaos Testing, geplante Umschaltungen), um sicherzustellen, dass Ihre Systeme einem Ausfall standhalten.
  4. Ihre Cloud-Anbieter und deren Redundanzstrategie regelmäßig bewerten.
  5. Im Vorfallsfall schnell und klar kommunizieren: Transparenz = Vertrauen.

Zusammenfassung

Der AWS-Ausfall vom Oktober 2025 ist eine schroffe Erinnerung daran, dass selbst sogenannte „Cloud"-Infrastrukturen nicht unfehlbar sind. Er zeigt, dass Hochverfügbarkeit nicht standardmäßig gekauft wird – sie wird konzipiert, geplant und getestet. Für digitale Unternehmen gilt: Resilienz zu denken, ist heute ein Muss.