2025. 12. 07., 19:02

Az Amazon nagy fúziója az MI-szuperszerverekkel

Az Amazon nagy fúziója az MI-szuperszerverekkel
Tipikus eset, amikor a technológiai verseny nem az egyediség felé visz, hanem a legjobb, működő mintát másolják a nagyok. Nem véletlen, hogy az Amazon legújabb Trainium3 UltraServer rendszere első ránézésre szinte teljesen úgy néz ki, mint az Nvidia GB200 NVL72 szerverei. Az MI-forradalom negyedik évébe lépve az infrastruktúra-háború résztvevői egyre inkább egy irányba haladnak – mind ugyanazt akarják: maximális teljesítményt szabványos, moduláris megoldásokkal.

Az egységes dizájn előnyei és szükségszerűsége

Az Amazon már elképesztő mennyiségben vetett be Nvidia-féle GB200 és GB300 NVL72 rackeket. Az új Trainium3 UltraServer racksorai zavarba ejtően hasonlítanak ezekhez, és a közeljövőben, a Trainium4 érkezésével az Amazon egyenesen bejelentette, hogy saját fejlesztésű számítási kártyái ugyanabba a vázba, az MGX-vázba (MGX chassis) csúsztathatók majd, mint az Nvidia gyorsítói. Ez üzletileg is indokolt: az AWS szintjén minden egyedi alkatrész csak bonyolultságot szül, ezért mindent egyetlen moduláris rendszerbe öntenek. Pontosan emiatt született például a Meta és az Amazon részvételével a Nyílt Számítási Projekt (Open Compute Project) – a legnagyobbak számára a szabványosítás már létkérdés.

Nemcsak a rackek néznek ki ugyanúgy – a rendszerek belsejében a számítási és hálózati elrendezések is egyre inkább egységesednek. A Trainium3 például négy Trainium3 gyorsítót, egy Graviton processzort és két Nitro adatfeldolgozó egységet párosít egy blade-be – korábban AWS-vasakban csak Intel processzorok voltak. Hasonló logikát követ az AMD, ahol egy Venice CPU, négy MI400 GPU és párosított, intelligens hálózati kártya alkot egy egységet. Egyetlen eltérés, hogy az AMD duplaszéles racket használ. Az Nvidia GB300 szervereiben ez két Grace CPU-val párosul, de a logika szinte ugyanaz.

A kulcs a részletekben rejlett: hálózati architektúra

Az Amazon Trn3 UltraServerei 36 számítási blade-del dolgoznak, amelyek két MGX-stílusú rackben helyezkednek el. Így összesen 144 gyorsító dolgozik együtt az új, NeuronSwitch nevű összekötő hálózaton keresztül, szerverenként mintegy 20 kapcsolóval. A pontos topológiát egyelőre nem árulta el az AWS, de a megközelítés ismerős: ezek az összekapcsoló hálózatok teszik lehetővé, hogy akár 72 vagy 144 chip erőforrásai egyetlen, rackméretű szuperszámítógépként működjenek.

Az Nvidia GB200 vagy GB300 NVL72 esetében 18 kapcsoló dolgozik 9 modulba szerelve, az AMD pedig 12 darab, 102,4 Tb/s sebességű Ethernet-kapcsolóval dolgozik hat dupla blade-ben.

A protokollok terén többféle megközelítés él: az AWS saját NeuronSwitch-ét használja, az AMD az UALink-et Ethernetre alagútba csomagolja, míg az Nvidia az NVLinket és az NVSwitch-et futtatja. Ez azonban nem marad sokáig így: az Amazon már jelezte, hogy a következő generációs Trainium4 gyorsítóiban mind az UALinket, mind az NVLink Fusion megoldásokat használni fogja.

Miért jobb a kapcsolóalapú architektúra?

A korábbi Trainium2 rendszerek még 2D és 3D torusz topológiát alkalmaztak – ezek hálós szerkezetben kapcsolják össze a gyorsítókat. Bár Nafea Bshara (az AWS Annapurna Labs társalapítója) szerint bizonyos munkaterhelésekhez ezek kiválók, a mai nagyméretű modellek igényeihez már jobb megoldás a kapcsolóalapú architektúra. Az előtöltési (prefill) fázisban ugyan nem játszik óriási szerepet a kapcsoló, de a tokenenkénti dekódolásnál kifizetődő, mert az egyidejűséget és a memóriaelérést maximalizálja, miközben a késleltetést is alacsonyan tartja.

Van hátulütője is: a bonyolultság nő, mert a hagyományos mesh nem igényel kapcsolót, míg a kapcsolóalapú megoldások igen – cserébe mégis kevesebb az „ugrás”, így csökken a késleltetés. 144 gyorsító fölé azonban még nem sikerült jelentősen skálázni.


Google: a kakukktojás

A mezőnyből csak a Google lóg ki: hetedik generációs Ironwood rendszerei továbbra is 2D és 3D toruszokat használnak, így egyetlen klaszterben 9216 TPU-t kapcsolhatnak össze. Mindezt optikai átvitellel oldják meg, aminek magasabb energiafogyasztását azonban ellensúlyozza a kapcsolók hiánya.

A „Chocolate Factory” kifejezetten optikai áramkörkapcsolókat alkalmaz, ami egy telefonközponthoz hasonló: a gépeket felhasználásonként dinamikusan újra lehet csatlakoztatni, és ha egy TPU meghibásodik, egy gombnyomással le lehet választani, majd újat a helyére kötni.

Összefoglalásként megjegyezhető, hogy az MI-szuperszerverek világa rekordgyorsasággal szabványosodik. Az óriásvállalatok ugyanazokat a működési elveket és fizikai kialakításokat veszik át, hogy a legnagyobb teljesítményt hozzák ki mindabból, amit az MI-korszak infrastruktúrája nyújtani képes – miközben az innováció határai a rackek belső világába költöznek.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 20:55

Az AMD új csúcsprocesszora lázba hozza a játékosokat

Január 29-én érkezik az AMD várva várt Ryzen 7 9850X3D processzora, amelyért 174 ezer forintot (499 USD) kell majd fizetni...

MA 20:37

Az INC zsarolóvírus fiaskója: 12 amerikai cég adatai visszakerültek

🔑 Egy súlyos biztonsági hiba miatt sikerült visszanyerni azokat a titkosított adatokat, amelyeket az INC zsarolóvírus-csoport lopott el egy tucat amerikai szervezettől...

MA 19:57

Bízhatunk az MI-ben? Így építhető fel a bizalom

A mesterséges intelligencia forradalma nemcsak új technológiákat hoz el, hanem új kihívásokat is felvet a bizalom terén...

MA 19:38

Az elöregedő állatkerti állomány veszélybe sodorja a fajmegőrzést

🐞 Érdekes felvetés, hogy az európai és észak-amerikai állatkertek emlősállományai egyre inkább elöregednek, ami komoly veszélyt jelent a hosszú távú fajmegőrzési törekvések szempontjából...

MA 19:20

A jóslat beteljesült: megszületett az első 2D topologikus kristályszigetelő

🧠 A finn Jyväskyläi Egyetem és az Aalto Egyetem kutatóinak sikerült megalkotniuk az első kétdimenziós topologikus kristályszigetelőt, egy olyan kvantumanyagot, amelyet több mint tíz éve jósoltak meg, de eddig nem tudtak létrehozni anyagtudományi akadályok miatt...

MA 19:01

Az örök fiatalság kulcsa: genetikai szupererő az éles időskori elméért

💬 Ez a jelenség jól illusztrálható azzal, hogy néhány nyolcvan év feletti ember meglepően fiatalos szellemi képességekkel bír, miközben kortársaiknál gyakoribb a memóriazavar és a demencia...

MA 18:54

Az Nvidia állítólag kalózkönyvtárból tanította az MI-jét

Egy frissített csoportos kereset szerint az Nvidia adatstratégiai csapatának egyik tagja közvetlenül megkereste az Anna’s Archive nevű oldal üzemeltetőit, hogy gyors hozzáférést szerezzen az általuk tárolt, több millió kalózkönyvhöz...

MA 18:38

A döcögő Windows 11: Jegyzettömb-trükkök helyett végre javítás?

💻 Érdemes megvizsgálni, hogy a Microsoft ismét új funkciókkal bővíti a klasszikus Jegyzettömböt a Windows 11-ben – köztük MI-alapú fejlesztésekkel és új formázási lehetőségekkel...

MA 18:19

Az Under Armournál 72 millió ügyfél adatai szivárogtak ki

🔐 Az Under Armour, a ruházati és fitneszadatokkal foglalkozó vállalat vizsgálja azt a súlyos adatlopási incidenst, amelyben 72 millió ügyfél adatait töltötték fel egy hackerfórumra...

MA 18:02

Az új Snapchat-szabályok lebuktatják a titkos tinilétet?

A Snapchat újításokat vezetett be, hogy a szülők még jobban nyomon követhessék, mennyi időt tölt a gyermekük a platformon, és milyen barátokat szerez...

MA 17:56

Egy nap, 29 új sérülékenység: az autóipar rémálma

Az idei Pwn2Own Automotive második napján Tokióban a biztonsági szakértők 29 korábban ismeretlen, úgynevezett nulladik napi sérülékenységet használtak ki autóipari rendszerekben, összesen 154 millió forint (439 250 USD) nyereményt zsebelve be...

MA 17:38

A Tesla diadala önvezető robotokkal sem jön gyorsan

Elon Musk ismét lassabb tempót jósol a Tesla legizgalmasabb fejlesztéseinél: a Cybercab robotaxi és az Optimus humanoid robot bevezetése jóval vontatottabb lehet, mint amit korábban ígért...

MA 17:19

Az államok is rárepülnének a tokenizálás aranybányájára

💸 Binance-alapító Changpeng Zhao jelenleg tucatnyi kormánnyal tárgyal arról, hogyan lehetne állami vagyont – például infrastruktúrát, ingatlant vagy nyersanyagokat – blokklánc-alapú tokenizációval eladni, és ezzel új bevételi forráshoz jutni...

MA 17:01

A nyomtatód árulkodik: az FBI titkos akciója

2026 januárjában letartóztatták Aurelio Luis Perez-Lugones IT-szakértőt, aki egy névtelen kormányzati beszállítónál dolgozott...

MA 16:55

Az új Marshall Heddon rendet tesz a hangrendszer-káoszban

🔊 Marshall új korszakot ígér a Bluetooth-hangfalaknak: megjelent a Heddon nevű, 105 ezer forintos (~$300) többhelyiséges zenehub...

MA 16:38

Az új kvantumanyag-forradalom: az anyag önmaga mérnöke lett

A kvantumanyagok világában új utak nyíltak: kutatók rájöttek, hogyan lehet anyagokat átmenetileg átalakítani anélkül, hogy azokat extrém lézeres besugárzásnak tennék ki...

MA 16:19

A levegőben úszó mikroműanyag-felhő: a légkör fullasztó terhe

Kutatók először becsülték meg, hány mikroműanyag szennyezi a Föld légkörét – az eredmény megdöbbentő...

MA 16:02

A világ legősibb barlangrajza 68 ezer éves titkokat őriz

🔥 Indonézia szigetvilágában, Sulawesi szigetén elképesztően régi, legalább 67 800 éves barlangrajzokat fedeztek fel kutatók, amelyek kéznyomatokat ábrázolnak...

MA 15:56

Az elfeledett molekula, amely áttörést hozhat a gombafertőzések ellen

💊 Lényeges, hogy a súlyos gombafertőzések évről évre több millió áldozatot követelnek világszerte, miközben az elérhető kezelési lehetőségek alig változnak...