Egyetlen szoftverhiba indította el azt a hatalmas üzemzavart, amely megbénította az Amazon Web Services (AWS) hálózatát, világszerte milliókat érintve. A több mint 15 órán át tartó leállás alatt a Downdetector szolgáltatásnál 17 millió hibajelzést regisztráltak, több mint 3 500 vállalat szolgáltatásai váltak elérhetetlenné. A legtöbb bejelentés az Egyesült Államokból, az Egyesült Királyságból és Németországból érkezett; a leginkább érintett alkalmazások a Snapchat, az AWS és a Roblox voltak. Különösen fontos kiemelni, hogy ez az eset a Downdetector történetének egyik legnagyobb internetes leállása közé tartozik.
Mi történt a háttérben?
A gyökérok az AWS DynamoDB DNS-menedzsment rendszerében fellépő szoftverhiba, úgynevezett versenyhelyzet (race condition) volt. Ez a rendszer többek között azzal foglalkozik, hogy időszakonként DNS-konfigurációkat állít elő a hálózaton belüli végpontok számára, ezzel biztosítva a terheléselosztók stabilitását. Ebben a helyzetben két folyamat időzítése ütközött: amint a második folyamat befejezte a legújabb konfiguráció alkalmazását, elindította a korábbi, elavult tervek törlését. Közben az első folyamat – bár jelentős késéssel – mégis lefuttatta egy régi terv érvényesítését, ami felülírta a frissebbet. Az ellenőrzés, amely elvileg kiszűrte volna az elavult terv alkalmazását, ekkorra a késés miatt már hatástalanná vált. Ez a láncolat ahhoz vezetett, hogy minden IP-cím eltűnt a regionális végpontról, a rendszer pedig inkonzisztens állapotba került, amit már csak manuális beavatkozással lehetett helyreállítani.
Mi volt a hiba következménye?
Az AWS us-east-1 régiójában a DynamoDB-re támaszkodó szolgáltatások nem tudtak kapcsolódni: ez nemcsak az ügyfeleket, hanem a cég belső rendszereit is érintette. Mindezek dacára a DynamoDB helyreállítása után is jelentős hálózati torlódás jelentkezett: az EC2 virtuális gépszolgáltatás új példányai ugyan elindultak, de a hálózati állapotok terjedésének késése miatt nem csatlakoztak megfelelően. Ez a torlódás továbbgyűrűzött az AWS terheléselosztóira, ami további kapcsolódási hibákat okozott. Olyan kulcsfontosságú szolgáltatások is érintettek voltak, mint a Redshift, a Lambda, a Fargate vagy az AWS Support Center.
Különösen fontos kiemelni, hogy a rendelkezésre álló infrastruktúra jelentős része az AWS us-east-1 régióban összpontosul. Ez a régió történelmileg a legrégebben működő, egyben a legnagyobb terhelést viselő csomópont. Mivel az alkalmazások világszerte gyakran ide irányítják az azonosítási, állapot- vagy metaadat-forgalmukat, egy regionális hiba globális problémákhoz vezethet. A jelen helyzet arról is tanúskodik, hogy a DNS megbízható feloldása kritikus fontosságú, hiánya pedig dominószerű hibákat okoz a láncolt szolgáltatásokban. Ebből az következik, hogy nem elsősorban a hibák teljes kizárása a cél, hanem a kritikus egyeduralkodó pontok felszámolása, a régiók közötti redundancia bevezetése és a felkészültség növelése elengedhetetlen a felhőszolgáltatások jövőjében.
A YouTube és a Meta jelentős perekben veszítettek a közösségi médiafüggőség miatt, amelyek komoly változásokat indíthatnak el az online platformokon...
Egy ködös téli napon Austin repülőterén három évvel ezelőtt majdnem katasztrófa történt: egy FedEx teherszállító gép hajszál híján egy utasokkal teli Southwest Airlines gépnek ütközött, miután mindkettő ugyanarra a kifutóra kapott engedélyt...
🛰 Érdemes megemlíteni, hogy a GPS és más hasonló rendszerek már eddig is forradalmasították, milyen egyszerűen és pontosan lehet meghatározni bármilyen földi pontot...
🕵 Az FBI igazgatója, Kash Patel személyes Gmail-fiókját iráni kapcsolatokkal rendelkező Handala hackercsoport törte fel, és a szerzett információkat – köztük fotókat, privát dokumentumokat, valamint levelezéseket – nyilvánosságra hozták...
🙁 Bár az új Pixel 10a március óta elérhető, súlyos hibákkal eddig nem találkoztak a magyar felhasználók, néhány apróbb, idegesítő problémával azonban továbbra is számolni kell – ahogy az már megszokott egy frissen piacra dobott telefonnál...
A közelmúltban a digitális óriások eltökélten haladtak afelé, hogy működésüket teljes egészében megújuló energiára állítsák át, ezzel is hozzájárulva a klímaváltozás elleni harchoz...
Érdemes megvizsgálni, hogy mennyire éri meg az új iPhone 17E-t választani, ha nagyjából hasonló áron, akár még jobb alternatívák is léteznek a korábbi iPhone-modellek között...
Az elektrosztatikus jelenségeket mindenki ismeri: ha lufit dörzsölsz a hajadhoz, a hajszálak szétállnak, vagy egy szőnyegen végigsétálva apró kisülésekkel sokkolsz másokat...
Tipikus példa arra, amikor az MI nemcsak gyorsít, hanem új szintre emeli a gyógyszerkutatást: az amerikai gyógyszeróriás, az Eli Lilly, 1000 milliárd forintos (2,75 milliárd USD) szerződést kötött a hongkongi Insilico Medicine-nel, hogy világszerte elérhetővé tegyék a mesterséges intelligencia által fejlesztett gyógyszereket...
A mikroműanyagok kutatása közben gyakran használt nitril- és latexkesztyűk jelentősen torzíthatják a laboreredményeket – legalábbis ez derül ki a Michigani Egyetem friss vizsgálatából...