Az Alibaba Cloud új, Aegaeon nevű GPU-pool rendszere forradalmasította a vállalat MI-infrastruktúráját: a rendszernek köszönhetően mindössze 213 darab Nvidia H20 gyorsítóval képesek lettek ugyanannyi munkát elvégezni, amelyhez korábban 1192 GPU-ra volt szükség. Az áttörés részleteit a 2025-ös ACM Operációs Rendszerek Szemináriuma (ACM Symposium on Operating Systems, SOSP) konferencián mutatták be Szöulban.
Megosztott erőforrások, maximális hatékonyság
Az Aegaeon előnye, hogy nem egyetlen modellt köt le egyetlen GPU-ra, hanem virtualizálja a GPU-hozzáférést egészen a token szintjéig. Így több MI-modell futtatható egyszerre egyetlen chipen, mindig az éppen szükséges erőforrás-lefoglalással. A rendszer hatékonysága kilencszeresére nőtt a hagyományos szerver nélküli megoldásokhoz képest.
Több hónapos, éles tesztelés
A fejlesztést több hónapon keresztül próbálták ki, több tucat különféle nagy nyelvi modell (LLM), köztük akár 72 milliárd paraméterrel rendelkező változatok futtatására. A részletekről a Pekingi Egyetem és az Alibaba mérnökei publikáltak, kiemelve, hogy ős Nvidiás H20-asokat alkalmaztak – azért, mert a jelenlegi amerikai exportkorlátozások miatt ezek a típusok még elérhetők Kínában.
2025, adrienne, hardware.slashdot.org alapján
Legfrissebb posztok
kedd 09:44
💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...
MA 11:49
🥨 A Google bemutatta eddigi legfejlettebb mesterségesintelligencia-kutató ügynökét, a Gemini Deep Research újragondolt változatát, amely immár a Gemini 3 Pro modellre épül...
MA 11:33
A Broadcom néhány EMEA (Európa, Közel-Kelet, Afrika) országban megszüntette a VMware vSphere Foundation csomag értékesítését...
MA 11:17
🐼 A stresszes patkányok sokkal hajlamosabbak újra és újra kannabiszt fogyasztani, mint kevésbé ideges társaik...
MA 11:02
🧙 A Remedy Entertainment végre leleplezte a régóta várt Control: Resonánst (Control: Resonant), amely a 2019-ben megjelent, nagy sikert aratott paranormális akciójáték folytatása lesz...
MA 10:57
Mára egyértelművé vált, hogy Einstein mégiscsak jól gondolta: az idő tényleg nem egyforma mindenhol az univerzumban...
MA 10:52
⚠ 2025. december 3-án minden megváltozott a React Server Components (RSC) világában: kiderült, hogy a React2Shell (CVE-2025-55182) nevű súlyos sebezhetőség teljesen kiszolgáltatta a szervereket a távoli kódvégrehajtási támadásoknak...
MA 10:43
🎮 A Capcom 2027-ben visszahozza Mega Mant, méghozzá a sorozat 40. évfordulójára készülő vadonatúj játékkal, a Mega Man: Kettős felülvezérlés (Dual Override) címmel...
MA 10:39
Egy lényeges szempont, hogy nem minden technológiai újítás talál célba elsőre...
MA 10:29
A Seagate bejelentette, hogy hamarosan forgalomba hozza az első, 70 TB kapacitású, 3,5 colos HDD-t, elsőként a világon...
MA 10:23
💫 A James Webb űrteleszkóp lenyűgöző felfedezéssel szolgál: eddig ismeretlen, óriási tömegű csillagokat talált a GS 3073 nevű, ősi galaxisban, amely mintegy egymilliárd évvel az ősrobbanás után alakult ki...
MA 10:15
Az elmúlt időszakban több érdekes megfigyelés is arra utal, hogy a kardszárnyú delfinek (orkák) és a fehéroldalú delfinek szokatlan szövetséget alkothatnak a lazacvadászatban Brit Columbia partjainál...
MA 09:51
Általában elválaszthatatlan fogalmaknak tűnnek a virág és a beporzás, pedig évmilliókkal a virágok megjelenése előtt a növények már sikeresen vonzották az állatokat – csak nem színes szirmokkal, hanem forrósággal...
MA 09:43
💡 Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az első olyan eszközt, amely otthon is használható depresszió kezelésére...
MA 09:30
🗿 Közel 1800 évvel ezelőtt a mai Britannia területén élő rómaiak különös temetkezési szertartást alkalmaztak: folyékony gipszpasztát kentek az elhunyt testére, még mielőtt eltemették volna...
MA 09:23
👑 A Disney három évre exkluzív licencet adott több mint 200 karakterére az OpenAI-nak, így mostantól a Sora videós MI és a ChatGPT Images hivatalosan is rajzolt és animált formában generálhat Disney-, Pixar-, Marvel- és Star Wars-karaktereket...
MA 09:16
Sokan már napi szinten használják a ChatGPT-t tanulásra és munkára, így fontos kérdés, hogy egy új verzió mennyit javít a megbízhatóságon és a mindennapi hasznosságon...
MA 09:08
A hackerek új, eddig dokumentálatlan sérülékenységet használnak ki a Gladinet CentreStack és Triofox fájlmegosztó rendszereiben, amellyel távoli kódfuttatást érhetnek el...
MA 09:02
Fontos kérdés, hogyan lehet a kvantumszámítógépek számítási teljesítményét jelentősen növelni, miközben a fizikai méretük nem nő arányosan...