Brutális GPU-megtakarítás: Az Alibaba új MI-technológiája mindenkit meglep!

Brutális GPU-megtakarítás: Az Alibaba új MI-technológiája mindenkit meglep!
A kínai Alibaba óriási erőforrás-megtakarítást ért el a mesterséges intelligencia terén: új technológiájával 82 százalékkal csökkentette a GPU-igényt az inferenciafeladatokban. Ez azt jelenti, hogy ugyanannyi vagy még több modellt képesek egyszerre kiszolgálni kevesebb hardverrel – ám ez nem az a „DeepSeek-momentum”, amely felforgatná az egész MI-piacot.

A GPU-pazarlás ellenszere

Az Alibaba Cloud több mint egymillió modell közül választ ki néhányat, amelyeket a felhasználók ténylegesen futtatnak. Korábban kénytelenek voltak a GPU-park 17,7 százalékát lekötni, hogy ezzel csupán az ügyféligények 1,35 százalékát szolgálják ki. Mivel a szokásos GPU-k memóriája miatt egy kártyán csak két-három modell futhatott, rengeteg elavult vagy gyengén használt hardver vesztegelt tétlenül, miközben a beszerzésük egyre nehezebb lett az amerikai embargók miatt.

Aegaeon: új ütemezés, kevesebb hardver

Erre válaszul fejlesztették ki az Aegaeon nevű GPU-poolozó és memóriamenedzsment technológiát, amellyel több modellt képesek összevonni egyetlen GPU-n, az adatok egy részét pedig a gazdagép memóriájába vagy más tárolókba terelik. Egy friss, három hónapos tesztben 1192 helyett csak 213 GPU-ra volt szükségük ugyanannak a feladatnak az ellátásához – vagyis 82 százalékos megtakarítást értek el, és egyes GPU-kon már tucatnyi modell is futhat egyszerre.

Hatékonyabb felhő, de nem forradalom

Az eljárás bizonyított, komoly szakmai konferencián is elismerték, és valóban javítja a hatékonyságot – ugyanakkor nem lehet tudni, hogy a nagy, nemzetközi felhőszolgáltatók már nem alkalmaznak-e hasonló vagy akár fejlettebb megoldásokat. Az viszont biztos, hogy az egyre szaporodó iparági vagy speciális MI-modellek miatt létfontosságú lesz minden GPU-ból a maximumot kihozni, hogy a kevésbé népszerű modellek futtatása se kerüljön aranyárba. Az Alibaba megoldása ebben segíthet, de a piac nem fog megremegni tőle.

2025, adrienne, go.theregister.com alapján

  • Te hogyan osztanád be a számítógépes erőforrásokat ilyen helyzetben?
  • Szerinted jó döntés előnyben részesíteni a hatékonyabb modelleket a ritkán használtakkal szemben?
  • Te mit tennél, ha még jobban kellene csökkenteni a hardverhasználatot?



Legfrissebb posztok

vasárnap 22:59

Be lehet tépni, ha valaki varangyot nyalogat?

A varangyok nyalogatása köré sok városi legenda szövődött, de valójában komoly veszélyekkel jár, és aligha vezet pszichedelikus élményhez...

MA 07:21

Az Apple és a Google uralma meginoghat a brit piacon

Az Apple-nek és a Google-nek át kell alakítania a mobilos működését az Egyesült Királyságban, miután a brit versenyhatóság, a Competition and Markets Authority (CMA) szigorúbb szabályozást javasol...



MA 07:14

Újabb leépítés az MI-óriásnál: a Meta 600 dolgozót küld el

A Meta újabb nagyszabású átszervezés keretében 600 alkalmazottat bocsát el MI-részlegéből...

MA 07:07

Ázsiai átverőközpontok miatt 2500 Starlinket kapcsoltak le

A SpaceX nemrég több mint 2500 Starlink műholdas internetkészüléket kapcsolt le Mianmarban, miután kiderült, hogy az eszközöket nagyszabású kibercsalásokhoz és emberkereskedelemhez használták fel...



MA 07:03

Újabb trópusi vihar veszélyezteti a karibi szigeteket

A Melissa trópusi vihar jelenleg a Karib-térség egyik leghosszabb ideje áradásoknak kitett területei fölött halad, és heves esőzésekkel, életveszélyes áradásokkal fenyeget több szigetet is...

csütörtök 22:59

Leépítési hullám sújtja az MI-labort a Metánál

📈 A Meta – a Facebook, az Instagram, a Threads, a Messenger és a WhatsApp anyavállalata – 600 dolgozótól válik meg új MI-laborjában...

csütörtök 22:29

Az új Snapchat MI-lencse mostantól ingyenes

📷 Amerikában mostantól minden Snapchat-felhasználó számára ingyenesen elérhető az Imagine lencse (Imagine Lens), a cég első, szabad szöveges utasítást értelmező, MI-alapú képgeneráló lencséje...



csütörtök 22:00

Az első Androidos XR-headset: itt a Samsung Galaxy XR

A Samsung bemutatta a Galaxy XR-t, az első olyan XR-headsetet, amely Androidon fut...



csütörtök 22:00

Hogyan menekültek meg ezrek a pompeii láva elől?

🌋 Közel 2000 évvel ezelőtt a Vezúv kitörése teljesen elpusztította Pompeii és Herculaneum városát; a lakókat és az épületeket izzó kő, hamu és gáz keveréke temette maga alá...



csütörtök 21:30

Az új Google kvantumchip átírja a káosz fizikáját?

A Google legújabb, Willow nevű kvantumchipje eddig soha nem látott részletességgel vizsgálta a kvantumkáoszt, amivel nemcsak a molekuláris kémia, hanem a fekete lyukak fizikájának új megértését is ígéri...



csütörtök 21:01

Az állami leállás veszélybe sodorhatja a rászoruló családokat

Milliók mindennapi élelmezése került veszélybe az Egyesült Államokban, mivel a kormányzati leállás következtében akadozik a legnagyobb élelmiszersegély-program, a SNAP (korábbi nevén Élelmiszerjegyek – Food Stamps) finanszírozása...

csütörtök 20:59

A mesterséges intelligencia forradalmasíthatja a tanulást

A felsőoktatásban egyre több professzor kísérletezik MI-alapú tanárbotokkal, hogy segítse a diákokat a nehezebb tantárgyak elsajátításában, különösen ott, ahol az egyéni odafigyelés gyakran lehetetlen...

csütörtök 20:30

Az igazi kvantumszámítógépek már a küszöbön állnak?

A Google szerint áttörést értek el, ami felgyorsíthatja a kvantumszámítógépek gyakorlati bevetését...

csütörtök 20:01

Az MI-cégek újabb rablása: A Reddit perli a Perplexityt

A Reddit ismét a bíróságon védi felhasználói adatait: most a Perplexity nevű MI-céget vádolja azzal, hogy jogtalanul gyűjtötte és használta a fórum posztjait saját MI-modellje fejlesztéséhez...

csütörtök 19:59

Az aszteroidák rejtőzködő óriása a Nap árnyékából

🌓 Egy újonnan felfedezett, 700 méter széles aszteroida sebességével és pályájával keltett izgalmat a csillagászok körében...



csütörtök 19:30

Az OpenAI böngészőjébe érkeznek a várva várt funkciók

Az OpenAI a napokban mutatta be új MI-alapú böngészőjét, a ChatGPT Atlast (ChatGPT Atlas), amelynek nem titkolt célja, hogy letaszítsa a Google Chrome-ot a trónról...

csütörtök 19:01

Az Alibaba beszáll az okosszemüveg-versenybe, és kihívja a ChatGPT-t

Az Alibaba hivatalosan is bemutatta első MI-alapú okosszemüvegét, a Quark AI Glasses-t, amelynek induló ára 4699 jüan, azaz nagyjából 240 000 forint...

csütörtök 18:59

Elio – Összecsukható, zsebméretű vizespalack

Bemutatkozik az Elio Az Elio egy okos vizespalack, amely 750 ml folyadékot képes tárolni, és használaton kívül egy vékony, zsebméretű koronggá hajtható össze...

csütörtök 18:58

Az Espresso Pro: A távmunkások álma vagy pénzkidobás?

A munkavégzés helye ma már bárhol lehet – akár egy furgonban is...