Az Alibaba Cloud jelentősen visszafogta az Nvidia MI-GPU-k használatát

Az Alibaba Cloud új, Aegaeon nevű GPU-pool rendszere forradalmasította a vállalat MI-infrastruktúráját: a rendszernek köszönhetően mindössze 213 darab Nvidia H20 gyorsítóval képesek lettek ugyanannyi munkát elvégezni, amelyhez korábban 1192 GPU-ra volt szükség. Az áttörés részleteit a 2025-ös ACM Operációs Rendszerek Szemináriuma (ACM Symposium on Operating Systems, SOSP) konferencián mutatták be Szöulban.

Megosztott erőforrások, maximális hatékonyság

Az Aegaeon előnye, hogy nem egyetlen modellt köt le egyetlen GPU-ra, hanem virtualizálja a GPU-hozzáférést egészen a token szintjéig. Így több MI-modell futtatható egyszerre egyetlen chipen, mindig az éppen szükséges erőforrás-lefoglalással. A rendszer hatékonysága kilencszeresére nőtt a hagyományos szerver nélküli megoldásokhoz képest.

Több hónapos, éles tesztelés

A fejlesztést több hónapon keresztül próbálták ki, több tucat különféle nagy nyelvi modell (LLM), köztük akár 72 milliárd paraméterrel rendelkező változatok futtatására. A részletekről a Pekingi Egyetem és az Alibaba mérnökei publikáltak, kiemelve, hogy ős Nvidiás H20-asokat alkalmaztak – azért, mert a jelenlegi amerikai exportkorlátozások miatt ezek a típusok még elérhetők Kínában.

2025, adrienne, hardware.slashdot.org alapján

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 10:29

Jön az új gigász: 70 TB-os HDD a láthatáron

A Seagate bejelentette, hogy hamarosan forgalomba hozza az első, 70 TB kapacitású, 3,5 colos HDD-t, elsőként a világon...

MA 10:23

A James Webb végre leleplezte az univerzum óriáscsillagait

💫 A James Webb űrteleszkóp lenyűgöző felfedezéssel szolgál: eddig ismeretlen, óriási tömegű csillagokat talált a GS 3073 nevű, ősi galaxisban, amely mintegy egymilliárd évvel az ősrobbanás után alakult ki...

MA 10:15

Az orkák új szövetségesekkel vadásznak lazacra?

Az elmúlt időszakban több érdekes megfigyelés is arra utal, hogy a kardszárnyú delfinek (orkák) és a fehéroldalú delfinek szokatlan szövetséget alkothatnak a lazacvadászatban Brit Columbia partjainál...

MA 09:51

A hővel csábító növények titkai: élet a virágzás előtt

Általában elválaszthatatlan fogalmaknak tűnnek a virág és a beporzás, pedig évmilliókkal a virágok megjelenése előtt a növények már sikeresen vonzották az állatokat – csak nem színes szirmokkal, hanem forrósággal...

MA 09:43

Megérkezett az első otthoni depressziókezelő készülék

💡 Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az első olyan eszközt, amely otthon is használható depresszió kezelésére...

MA 09:30

A római sírok új rejtélye: ujjlenyomatok az idő mélyéről

🗿 Közel 1800 évvel ezelőtt a mai Britannia területén élő rómaiak különös temetkezési szertartást alkalmaztak: folyékony gipszpasztát kentek az elhunyt testére, még mielőtt eltemették volna...

MA 09:23

Az OpenAI szabad kezet kapott a Disney-hősökkel

👑 A Disney három évre exkluzív licencet adott több mint 200 karakterére az OpenAI-nak, így mostantól a Sora videós MI és a ChatGPT Images hivatalosan is rajzolt és animált formában generálhat Disney-, Pixar-, Marvel- és Star Wars-karaktereket...

MA 09:16

Az új ChatGPT 5.2: végre itt az okosabb MI

Sokan már napi szinten használják a ChatGPT-t tanulásra és munkára, így fontos kérdés, hogy egy új verzió mennyit javít a megbízhatóságon és a mindennapi hasznosságon...

MA 09:08

A CentreStack súlyos kriptográfiai hibája nyit kaput az adatlopásnak

A hackerek új, eddig dokumentálatlan sérülékenységet használnak ki a Gladinet CentreStack és Triofox fájlmegosztó rendszereiben, amellyel távoli kódfuttatást érhetnek el...

MA 09:02

A 3D-s huzalozás küszöbén a 10 000 qubites MI-chipek

Fontos kérdés, hogyan lehet a kvantumszámítógépek számítási teljesítményét jelentősen növelni, miközben a fizikai méretük nem nő arányosan...

MA 08:57

Az összeomlás ára a kriptovilágban: 15 év börtön Do Kwon-nak

Do Kwon, a dél-koreai kriptovállalkozó 15 év börtönt kapott az Egyesült Államokban, miután két digitális valutája, a TerraUSD és a Luna 2022-ben összesen 14 ezer milliárd forint (kb...

MA 08:52

Az ausztrál tinik lázadnak: Túl kemény a közösségi média-tilalom?

👏 A közelgő ausztrál közösségi média-tilalom komoly hullámokat vetett, hiszen a kormány egyre komolyabb lépéseket tesz a fiatalok megóvása érdekében...

MA 08:43

A VS Code-ot rejtett trójaiakkal fertőző bővítmények terjednek

🐛 Egy ügyes kibertámadási kampány már február óta fertőzi a fejlesztőket, miután 19 rosszindulatú bővítmény jelent meg a VS Code Marketplace-en...

MA 08:37

A Runway áttörése: percekig tartó koherencia az MI-ben

🚀 A Runway bemutatta GWM-1 névre keresztelt, első világmodelljét, amely jelentős lépés a vállalat részéről, eddig ugyanis leginkább videógenerálásban jeleskedett...

MA 08:29

Az adatvédelmi rémálom: több mint 10 ezer Docker Hub-kép titkot szivárogtat

Több mint 10 000 Docker Hubon elérhető konténerképben találtak olyan érzékeny adatokat, amelyeknek sosem kellett volna nyilvánosságra kerülniük...

MA 08:23

A lenyűgöző anyag, amelyet szinte lehetetlen előállítani

💫 Ez a jelenség jól illusztrálható azzal, hogy Londonban, a Royal Brompton Kórházban korábban a tüdőszkennelés akár 45 percig is eltartott, ahol a pácienseknek mozdulatlanul, a fejük felett összekulcsolt kézzel kellett feküdniük...

MA 08:14

Az egész Föld összes háza végre 3D-ben látható

Tudósok elkészítették az első globális 3D-térképet az emberi lakóépületekről, amelynek neve World Settlement Footprint 3D...

MA 08:08

A Fortnite visszatért a Google Playre – az Apple még nem enged

Az Epic Games legendás battle royale-ját, a Fortnite-ot újra letölthetik az amerikai Android-felhasználók, miután bírósági döntés kötelezte a Google-t az alkalmazás visszaengedésére...