Az Amazon nagy fúziója az MI-szuperszerverekkel

Az Amazon nagy fúziója az MI-szuperszerverekkel
Tipikus eset, amikor a technológiai verseny nem az egyediség felé visz, hanem a legjobb, működő mintát másolják a nagyok. Nem véletlen, hogy az Amazon legújabb Trainium3 UltraServer rendszere első ránézésre szinte teljesen úgy néz ki, mint az Nvidia GB200 NVL72 szerverei. Az MI-forradalom negyedik évébe lépve az infrastruktúra-háború résztvevői egyre inkább egy irányba haladnak – mind ugyanazt akarják: maximális teljesítményt szabványos, moduláris megoldásokkal.

Az egységes dizájn előnyei és szükségszerűsége

Az Amazon már elképesztő mennyiségben vetett be Nvidia-féle GB200 és GB300 NVL72 rackeket. Az új Trainium3 UltraServer racksorai zavarba ejtően hasonlítanak ezekhez, és a közeljövőben, a Trainium4 érkezésével az Amazon egyenesen bejelentette, hogy saját fejlesztésű számítási kártyái ugyanabba a vázba, az MGX-vázba (MGX chassis) csúsztathatók majd, mint az Nvidia gyorsítói. Ez üzletileg is indokolt: az AWS szintjén minden egyedi alkatrész csak bonyolultságot szül, ezért mindent egyetlen moduláris rendszerbe öntenek. Pontosan emiatt született például a Meta és az Amazon részvételével a Nyílt Számítási Projekt (Open Compute Project) – a legnagyobbak számára a szabványosítás már létkérdés.

Nemcsak a rackek néznek ki ugyanúgy – a rendszerek belsejében a számítási és hálózati elrendezések is egyre inkább egységesednek. A Trainium3 például négy Trainium3 gyorsítót, egy Graviton processzort és két Nitro adatfeldolgozó egységet párosít egy blade-be – korábban AWS-vasakban csak Intel processzorok voltak. Hasonló logikát követ az AMD, ahol egy Venice CPU, négy MI400 GPU és párosított, intelligens hálózati kártya alkot egy egységet. Egyetlen eltérés, hogy az AMD duplaszéles racket használ. Az Nvidia GB300 szervereiben ez két Grace CPU-val párosul, de a logika szinte ugyanaz.

A kulcs a részletekben rejlett: hálózati architektúra

Az Amazon Trn3 UltraServerei 36 számítási blade-del dolgoznak, amelyek két MGX-stílusú rackben helyezkednek el. Így összesen 144 gyorsító dolgozik együtt az új, NeuronSwitch nevű összekötő hálózaton keresztül, szerverenként mintegy 20 kapcsolóval. A pontos topológiát egyelőre nem árulta el az AWS, de a megközelítés ismerős: ezek az összekapcsoló hálózatok teszik lehetővé, hogy akár 72 vagy 144 chip erőforrásai egyetlen, rackméretű szuperszámítógépként működjenek.

Az Nvidia GB200 vagy GB300 NVL72 esetében 18 kapcsoló dolgozik 9 modulba szerelve, az AMD pedig 12 darab, 102,4 Tb/s sebességű Ethernet-kapcsolóval dolgozik hat dupla blade-ben.

A protokollok terén többféle megközelítés él: az AWS saját NeuronSwitch-ét használja, az AMD az UALink-et Ethernetre alagútba csomagolja, míg az Nvidia az NVLinket és az NVSwitch-et futtatja. Ez azonban nem marad sokáig így: az Amazon már jelezte, hogy a következő generációs Trainium4 gyorsítóiban mind az UALinket, mind az NVLink Fusion megoldásokat használni fogja.

Miért jobb a kapcsolóalapú architektúra?

A korábbi Trainium2 rendszerek még 2D és 3D torusz topológiát alkalmaztak – ezek hálós szerkezetben kapcsolják össze a gyorsítókat. Bár Nafea Bshara (az AWS Annapurna Labs társalapítója) szerint bizonyos munkaterhelésekhez ezek kiválók, a mai nagyméretű modellek igényeihez már jobb megoldás a kapcsolóalapú architektúra. Az előtöltési (prefill) fázisban ugyan nem játszik óriási szerepet a kapcsoló, de a tokenenkénti dekódolásnál kifizetődő, mert az egyidejűséget és a memóriaelérést maximalizálja, miközben a késleltetést is alacsonyan tartja.

Van hátulütője is: a bonyolultság nő, mert a hagyományos mesh nem igényel kapcsolót, míg a kapcsolóalapú megoldások igen – cserébe mégis kevesebb az „ugrás”, így csökken a késleltetés. 144 gyorsító fölé azonban még nem sikerült jelentősen skálázni.


Google: a kakukktojás

A mezőnyből csak a Google lóg ki: hetedik generációs Ironwood rendszerei továbbra is 2D és 3D toruszokat használnak, így egyetlen klaszterben 9216 TPU-t kapcsolhatnak össze. Mindezt optikai átvitellel oldják meg, aminek magasabb energiafogyasztását azonban ellensúlyozza a kapcsolók hiánya.

A „Chocolate Factory” kifejezetten optikai áramkörkapcsolókat alkalmaz, ami egy telefonközponthoz hasonló: a gépeket felhasználásonként dinamikusan újra lehet csatlakoztatni, és ha egy TPU meghibásodik, egy gombnyomással le lehet választani, majd újat a helyére kötni.

Összefoglalásként megjegyezhető, hogy az MI-szuperszerverek világa rekordgyorsasággal szabványosodik. Az óriásvállalatok ugyanazokat a működési elveket és fizikai kialakításokat veszik át, hogy a legnagyobb teljesítményt hozzák ki mindabból, amit az MI-korszak infrastruktúrája nyújtani képes – miközben az innováció határai a rackek belső világába költöznek.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 20:50

A lenyűgöző égi csoda, amely vetekszik a Teremtés oszlopaival

💫 Lenyűgöző felvételt közölt a Gemini Obszervatórium fennállásának 25. évfordulóján: a fotón az NGC 6820 jelű emissziós köd és az NGC 6823 nyílt csillaghalmaz ragyog, mintha a híres Teremtés oszlopai (Pillars of Creation) párját látnánk...

MA 20:33

A legsúlyosabb ciklon csapott le: ezrek otthona dőlt romba, százak haltak meg

💧 A legsúlyosabb természeti katasztrófa rázta meg Sri Lankát, ahol heves ciklon pusztított; a hegyvidéki tartományokban még mindig földcsuszamlások és áradások fenyegetik a lakosságot...

MA 20:20

A monstrum Doogee V Max LR: telefon vagy szerszámosláda?

A Doogee V Max LR egészen új szintre emeli a strapatelefon fogalmát: nemcsak elképesztően masszív, de igazi energiabajnok is a 20500 mAh-s akkumulátorával...

MA 20:02

Az elveszett indián falvak előkerültek – tényleg igaza volt John Smithnek?

🌍 Emellett a Rappahannock folyó mentén, Virginiában végzett ásatások során végre sikerült azonosítani azokat az ősi indián falvakat, amelyeket a Jamestownból ismert John Smith több mint 400 éve említett...

MA 19:49

A Simogo új csomagja visszarepít az iPhone-játékok aranykorába

🎮 A mobiljátékok világában ma már ritkaságszámba mennek az igazán kreatív indie alkotások, de volt idő, amikor az App Store-nak köszönhetően a kis fejlesztőcsapatok is hatalmas közönséghez tudták eljuttatni ötleteiket...

MA 19:34

Az elveszett szavak nyomában: miért fordíthatatlan néha a nyelv?

Több nyelvet beszélve feltűnhet, hogy bizonyos szavakat egyszerűen képtelenség lefordítani. Egy japán tervező vágyódik a mono no aware iránt, amely egyfajta letisztult, időtlen szépség – angolul, sőt magyarul sincs rá igazán megfelelő szó...

MA 19:17

Az évszázad játéka visszatért – kezdődik a láz!

Az év vége felé közeledve senki sem unatkozik, hiszen a legendás játék, amely hosszú évek óta sokak toplistáján szerepel, most újra hódít...

MA 18:51

Az olcsó boltok ára a szegények bőrére megy

Az Egyesült Államokban rengeteg család támaszkodik olyan bolthálózatokra, mint a Family Dollar vagy a Dollar General, hiszen ezek a boltok ígérik a legalacsonyabb árakat alapvető háztartási cikkekből...

MA 18:33

Az okosszemüveg, amely rémálommá vált: 13 év Google Glass után

Amikor a Google Glass 13 évvel ezelőtt megjelent, az egész világ álmodozni kezdett arról, milyen lesz, ha számítógép költözik az arcunkra...

MA 18:18

Az ABCC4 titkos hálózata: új trükk a sejtszabályozásban

Amikor egy sejt kívülről üzenetet kap, egy ciklikus AMP (cAMP) nevű molekulával közvetíti ezt a jelzést...

MA 17:50

Az újszülöttek B-hepatitisz oltása kikerülhet a kötelezőkből

Az Egyesült Államok járványügyi központjának (CDC) oltási tanácsadó bizottsága az eddigi gyakorlattól eltérően már nem javasolja egységesen, hogy minden újszülött kapjon hepatitis B elleni oltást születése után...

MA 16:49

Vége lehet Hollywood aranykorának az új Netflix–Warner Bros.-óriással?

🎥 Nehéz elhinni, de a Netflix és a Warner Bros. közötti friss felvásárlási megállapodás máris felforgatta a teljes hollywoodi piacot...

MA 16:34

A házi csodachip: több mint ezerszeres ugrás a garázslaborban

Fontos kérdés, hogy meddig juthat el egy lelkes egyetemista, ha házilag, garázsban barkácsolja össze saját integrált áramköreit...

MA 16:18

A pénzed turbója: egyszerű lépések a gyorsabb célokért

Rendszeres pénzügyi stressz: nem kell mindent túlbonyolítani A pénzügyek kezelése rengeteg ember számára jár állandó lelkiismeret-furdalással: folyamatosan azt sugallják, hogy a megtakarításon, a befektetésen és persze az adók optimalizálásán is dolgozni kell...

MA 16:04

Az Xgimi Horizon 20 Max: Luxusmozi és gamer élmény egy projektorban

Ebből következően érdemes megérteni, hogy a hordozható projektorok piacán is megjelentek a valódi prémium modellek...

MA 15:50

Az oroszországi aranyáldozatok rejtélye: 2400 éves kincs került elő

🏁 A dél-uráli Vysokaya Mogila sírmezőn egyedülálló, 2 400 éves áldozati komplexumot tártak fel orosz régészek, amely új fényt vet a nomádok temetkezési rítusaira...

MA 15:35

Az ingatlanpiac, amely még Warren Buffettet is szabályszegésre csábította

Érdekes felvetés, hogy még a legendás Warren Buffett is hajlandó volt felrúgni saját, kőbe vésett szabályait a mostani ingatlanpiaci körforgásban...

MA 15:04

Az óriás Doogee V Max Play: túlélőmobil vagy hordozható tégla?

A Doogee V Max Play nem aprózta el a strapatelefon fogalmát: ez a készülék méretével, tömegével és funkciókínálatával messze túlmutat a rutinos túrázók és kalandorok elvárásain...

MA 14:17

Az afrikai sertéspestis miatt öt spanyol labor került gyanúba

🐷 Spanyolországban pánikot okozott az afrikai sertéspestis felbukkanása, ezért a hatóságok öt laboratóriumban is vizsgálatot folytatnak, hogy kiderítsék, honnan indult ki a fertőzés...