Che cosa è successo?
Il 20 ottobre 2025 AWS ha subito un guasto di portata mondiale che ha colpito centinaia di servizi essenziali — social network, videogiochi, e-commerce, banche, oggetti connessi.
La regione particolarmente colpita: US-EAST-1 (Virginia del Nord, Stati Uniti), zona strategica dell’infrastruttura AWS.
Secondo AWS: «tassi di errore elevati e latenze importanti per diversi servizi».
Le cause individuate
1. Malfunzionamento del DNS e dei bilanciatori di carico
L’origine tecnica è stata localizzata: un bug nel sistema di automazione della gestione DNS utilizzato da DynamoDB (database di AWS): un record DNS vuoto in US-EAST-1 non è stato riparato automaticamente.
Parallelamente, un sottosistema incaricato di monitorare lo stato dei network load balancer ha innescato una cascata di malfunzionamenti.
2. Effetto domino e dipendenza centrale
Poiché tanti servizi dipendono da AWS per l’hosting, lo storage e la distribuzione, quello che sembra un problema «interno» si è propagato all’intero ecosistema.
Inoltre, questo guasto evidenzia la fragilità di un’infrastruttura oggi molto centralizzata presso pochi grandi fornitori di cloud.
Impatto per le aziende e gli utenti
- Milioni di utenti hanno segnalato interruzioni di accesso o tempi di risposta molto lenti su piattaforme come Snapchat, Reddit, Fortnite, banche e oggetti connessi.
- Per le aziende clienti di AWS, questo guasto significava: perdita di fatturato, interruzione di servizi critici, perdita di fiducia.
- Un campanello d’allarme per l’ecosistema: nemmeno i giganti del cloud sono al riparo da un malfunzionamento importante.
Perché è un problema strategico
- Concentrazione dell’infrastruttura cloud: AWS domina con circa il 30% del mercato cloud; un guasto di questa portata mostra che un singolo punto di rottura può avere effetti globali.
- Effetto cascata: un bug in un sottosistema interno (DNS, bilanciamento) può degradare l’intero servizio.
- Bisogno di resilienza: molte aziende non avevano un piano di emergenza esterno o multi-cloud pronto a subentrare.
- Reputazione & fiducia: per AWS come per i clienti, l’affidabilità è un elemento chiave del modello di business.
Buone pratiche e insegnamenti per le aziende
- Prevedere un piano di continuità multi-cloud o almeno multi-regione se sei su AWS.
- Monitorare le dipendenze nascoste: se un micro-servizio cloud crolla, quali sono gli effetti collaterali?
- Mettere in atto test di resilienza (chaos testing, switch pianificati) per verificare che i tuoi sistemi reggano in caso di guasto.
- Valutare regolarmente i tuoi fornitori cloud e la loro strategia di ridondanza.
- Comunicare in modo rapido e chiaro in caso di incidente: trasparenza = fiducia.
In sintesi
Il guasto di AWS dell’ottobre 2025 è un brutale richiamo al fatto che nemmeno le infrastrutture cosiddette «cloud» sono infallibili. Dimostra che l’alta disponibilità non si acquista di default: si progetta, si pianifica, si testa. Per le aziende digitali: pensare alla resilienza è ormai un imperativo.
Concretamente, per un negozio online, questo passa attraverso una manutenzione con monitoraggio 24/7 e backup esternalizzati e un intervento d’urgenza capace di intervenire non appena il sito diventa inaccessibile.