Brutális GPU-megtakarítás: Az Alibaba új MI-technológiája mindenkit meglep!
A kínai Alibaba óriási erőforrás-megtakarítást ért el a mesterséges intelligencia terén: új technológiájával 82 százalékkal csökkentette a GPU-igényt az inferenciafeladatokban. Ez azt jelenti, hogy ugyanannyi vagy még több modellt képesek egyszerre kiszolgálni kevesebb hardverrel – ám ez nem az a „DeepSeek-momentum”, amely felforgatná az egész MI-piacot.
A GPU-pazarlás ellenszere
Az Alibaba Cloud több mint egymillió modell közül választ ki néhányat, amelyeket a felhasználók ténylegesen futtatnak. Korábban kénytelenek voltak a GPU-park 17,7 százalékát lekötni, hogy ezzel csupán az ügyféligények 1,35 százalékát szolgálják ki. Mivel a szokásos GPU-k memóriája miatt egy kártyán csak két-három modell futhatott, rengeteg elavult vagy gyengén használt hardver vesztegelt tétlenül, miközben a beszerzésük egyre nehezebb lett az amerikai embargók miatt.
Aegaeon: új ütemezés, kevesebb hardver
Erre válaszul fejlesztették ki az Aegaeon nevű GPU-poolozó és memóriamenedzsment technológiát, amellyel több modellt képesek összevonni egyetlen GPU-n, az adatok egy részét pedig a gazdagép memóriájába vagy más tárolókba terelik. Egy friss, három hónapos tesztben 1192 helyett csak 213 GPU-ra volt szükségük ugyanannak a feladatnak az ellátásához – vagyis 82 százalékos megtakarítást értek el, és egyes GPU-kon már tucatnyi modell is futhat egyszerre.
Az eljárás bizonyított, komoly szakmai konferencián is elismerték, és valóban javítja a hatékonyságot – ugyanakkor nem lehet tudni, hogy a nagy, nemzetközi felhőszolgáltatók már nem alkalmaznak-e hasonló vagy akár fejlettebb megoldásokat. Az viszont biztos, hogy az egyre szaporodó iparági vagy speciális MI-modellek miatt létfontosságú lesz minden GPU-ból a maximumot kihozni, hogy a kevésbé népszerű modellek futtatása se kerüljön aranyárba. Az Alibaba megoldása ebben segíthet, de a piac nem fog megremegni tőle.
2025, adrienne, go.theregister.com alapján
filózó
Te hogyan osztanád be a számítógépes erőforrásokat ilyen helyzetben?
Szerinted jó döntés előnyben részesíteni a hatékonyabb modelleket a ritkán használtakkal szemben?
Te mit tennél, ha még jobban kellene csökkenteni a hardverhasználatot?
A Coinbase világa eddig sem volt unalmas, de most egy új szintre lépett: integrálták a DFlow protokollt, így már a Solana blokkláncon is lehet közvetlenül spot- és predikciós piacokon kereskedni...
👀 Néhány nap alatt szinte felborult a világrend, ahogy fiatalok – legkülönfélébb jelmezekben – megrohamozták a Szcientológia központjait, New Yorktól Los Angelesig, szinte minden jelentősebb városban...
Nemcsak az e-mail-fiók veszélyes terep többé: már a naptármeghívók és az olyan együttműködési platformok, mint a Microsoft Teams, komolyan ki vannak téve az adathalászok támadásainak...
Ilyen esetre példa, amikor több száz éves keresztény núbiai freskók alapján rekonstruálták az egykori uralkodók és egyházi vezetők pompás viseleteit, amelyeket élő modelleken mutattak be – megható pillanatokat okozva a közönségnek...
Első pillantásra úgy tűnt, mintha rutinfeladatot oldanának meg az amerikai katonák: 140 kg-os műanyag szánokat húztak keresztül a századépület folyosóján...
A kibertámadások réme helyett ma egyre inkább saját rendszereink gyorsuló tempója okozza a legnagyobb veszélyt: a szoftverhibák kiszolgáltatottabbá teszik a cégeket, mint valaha...
Ilyen eset például, amikor nővérátadáskor használt kézi jegyzetelést automatizált MI-rendszerre cserélnek egy kórházban, így már napi több tízezer betegátadás során spórolnak meg valódi gondoskodásra fordítható perceket...
💸 A nagy nyelvi modellek bevezetése igazi lázat indított el a vállalatoknál, ám sokan még mindig leginkább adattárolási, adatrezidencia és peremvédelem kérdéseire koncentrálnak...
🏛 Az Athéné-tál egy páratlan szépségű, ezüstből készült tál, amelyet arannyal díszítettek a bölcsesség és a hadviselés istennője, valamint szent madara, a bagoly megjelenítésével...
A 2026-os férfi országúti kerékpáros idény bővelkedik lenyűgöző versenyekben és győzelmekben, a soron következő Giro d’Italia, amely idén Bulgáriában rajtol, pedig máris lázban tartja a csapatokat...
A kriptopiac a május első hetében igazi izgalmakat tartogat. Három fontos próbatétel közeleg: az amerikai foglalkoztatási adatok publikálása, a legnagyobb tőzsdék és bányászvállalatok eredményjelentései, valamint döntő szavazások több decentralizált szervezetben...
Ez a jelenség jól illusztrálható azzal, milyen tempóban fejlődnek az otthoni hálózati adattárolók: míg néhány éve a terabájtos RAID-tömbök, a PCIe-bővítés vagy a villámgyors Thunderbolt csak vállalati környezetben volt elérhető, ma már egy átlagos otthoni NAS is ilyen extrákkal kecsegtet...
A cukorbetegség és elhízás kezelésére szolgáló gyógyszerek, mint az Ozempic és a Wegovy, nem várt pozitív hatásokat hordozhatnak a mentális egészségre is...
Túlgondolt hajápolási rutin helyett néhány szokás kis megváltoztatása látványosan egészségesebbé és fényesebbé varázsolja a hajad — ráadásul nincs szükség drága hajszárítóra vagy formázóra sem...
🔴 Egy átfogó nemzetközi vizsgálat kimutatta, hogy az Alzheimer-kór kezelésére fejlesztett szerek, amelyek az agyban felhalmozódó amiloid-béta fehérjét célozzák, nagy valószínűséggel nem hoznak valódi javulást a betegek életében...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. PostalCal (iPhone/iPad)A Postal Employee Day Off Calendar egy könnyen kezelhető, kifejezetten az Amerikai Postaszolgálat munkatársai és családjaik számára készült naptáralkalmazás...
Az Amnezia VPN legújabb, 4.8.15-ös verziója minden nagyobb operációs rendszeren elérhető, és egyszerre hoz jelentős hibajavításokat, kiemelten fontos biztonsági frissítést, valamint számos felhasználóbarát újítást...