
Gyökerek és következmények
A leállást egy rejtett versenyhelyzet váltotta ki a DynamoDB DNS-kezelő rendszerében, amelynek következtében hibás, üres DNS-rekordok keletkeztek a szolgáltatás regionális végpontján. Emiatt minden ehhez kapcsolódó IP-cím törlődött, és azok az alkalmazások, amelyeknek a DynamoDB-re volt szükségük, nem érték el a szolgáltatást. Ez nemcsak az ügyfeleket, hanem az AWS belső működését is blokkolta.
Az AWS-leállás hullámhatásai
A hibás DNS-rekord láncreakciót indított el az AWS teljes rendszerében, amelyet az automatikus helyreállítás sem tudott orvosolni. Végül csak kézi beavatkozással sikerült a rendszert újraindítani. Az Amazon világszerte letiltotta a hibás DNS-automatizációt, szigorúbb ellenőrzéseket vezetett be, javította a túlterhelés elleni védelmet, és egy új tesztrendszert is beindított a hasonló hibák elkerülése érdekében.
Bocsánatkérés és ígéretek
Az Amazon elnézést kért az érintett ügyfelektől, hangsúlyozva, hogy elkötelezettek a szolgáltatások megbízhatóságának további javítása mellett. Kiemelték, hogy tanulnak az esetből, és mindent megtesznek annak érdekében, hogy ilyen fennakadás többé ne forduljon elő.
