Az öreg GPU-k olcsón futtatják a gigantikus MI-modelleket

Az öreg GPU-k olcsón futtatják a gigantikus MI-modelleket
A Perplexity nevű MI-keresőcég kutatócsapata új szoftveres finomításokat fejlesztett, amelyek lehetővé teszik a több százmilliárd, akár közel ezermilliárd paraméteres modellek hatékony futtatását régebbi és olcsóbb hardvereken is. Ez áttörés, hiszen a legnagyobb MI-modelleket eddig csak méregdrága, legmodernebb GPU-kon lehetett futtatni, főként a bonyolult memóriakezelés és a hálózati késleltetés miatt.

Az óriásmodellek problémái

A kevert szakértős (mixture of experts, MoE) modellek – mint a DeepSeek V3 vagy a Moonshot AI Kimi K2 – paraméterszáma 671 milliárdtól akár ezermilliárdig terjed. Ezek akkora helyet foglalnak, hogy még nyolc darab H100- vagy H200-GPU-val szerelt rendszerekbe sem fér el egyszerre minden hozzájuk tartozó adat, különösen, ha a szükséges rövid távú memóriát is figyelembe vesszük. Ezért vagy nagyobb, még drágább szerverekre van szükség, vagy a modell szétosztására több kisebb gépre.

A kézenfekvő megoldás az Nvidia GB200/GB300 NVL72 rendszerek használata lenne – ezek 72 darab, 192 vagy 288 GB-os GPU-t tartalmaznak, simán elfér rajtuk bármilyen nagy modell is –, de ezek sem elérhetők mindenhol, nagyon drágák, és állandóan hiánycikkek. Ezzel szemben a régebbi, például H100-as rendszerek viszonylag olcsók és elterjedtek, de csak akkor lehet velük hatékonyan dolgozni, ha a modelleket több csomópont között osztják szét. Ez viszont hálózati késleltetéssel és jelentős teljesítményvesztéssel jár.

MoE-modelleknél ráadásul az adatforgalom sem egyszerű: minden egyes szótöredéket vagy karaktert mindig más-más „szakértő” generál, és ezek akár a hálózat különböző pontjain lévő GPU-król futnak. Ez a megközelítés jelentősen csökkenti a memóriaigényt, de sokkal intenzívebb adatforgalmat eredményez.

Különösen fontos, hogy míg egy szerveren belül a gyors NVLink vagy az AMD Infinity Fabric simán viszi ezt a terhelést, addig több gép között akár hétszer-tizennégyszer lassabbak a hálózati összeköttetések, ami szűk keresztmetszethez vezet.

Az Amazon megkötései és a Perplexity szoftveres trükkjei

Akik nem Nvidia-gyártmányú hálózati kártyákat használnak – mint például rengeteg Amazon Web Services (AWS) felhasználó –, másfajta hálózati technológiákkal találják szembe magukat. Az Amazon saját Elastic Fabric Adapterét (EFA) alkalmazza: ez hasonlóan akár 400 Gbit/s összsávszélességet tud, de két fontos területen elmarad az Nvidia ConnectX-től. Egyrészt az EFA-n keresztüli üzenetküldés nem olyan gyors és hatékony, másrészt nem támogatja a GPUDirect Asyncot, ezért a GPU-k közötti adatmozgásnál minden a CPU-n keresztül megy, ami újabb késedelmet jelent.

Ezzel szemben a Perplexity új, speciális kommunikációs szoftvermodulokat (kerneleket) fejlesztett, amelyek lehetővé teszik, hogy EFA-val működő rendszerekben is kiegyensúlyozottan, minimális késéssel fussanak a MoE-modellek. Ezek a fejlesztések bizonyos mérőszámokban már most jobb eredményt hoztak, mint a DeepSeek V3-hoz készült DeepEP keretrendszer, amely eddig a ConnectX-7 szabványra volt optimalizálva.

Látható teljesítménynövekedés és a jövő

A Perplexity élesben is tesztelte fejlesztését: a DeepSeek V3 (700 milliárd paraméter) és a Kimi K2 (1 billió paraméter) modellekkel több AWS-példányon, EFA-hálózattal. A DeepSeek V3 még ráfért egyetlen H200-as szerverre, így jó viszonyítási alapot adott, de a Kimi K2-t már csak elosztva lehetett kezelni.

Az egygépes és a 2–4 példányos konfiguráció összevetésénél világos volt: ahogy egyre több gépen, egyre több GPU-val futtak a modellek, a Perplexity szoftveres finomhangolása egyre jobban érvényesült; főleg közepes batchméreteknél hozott jelentős gyorsulást. Különösen fontos, hogy a masszív sávszélességbeli hátrány ellenére – az NVLinkhez vagy az Infinity Fabrichoz képest az EFA akár 14-szer lassabb lehet – a Kimi K2-vel is érezhetően sikerült gyorsításokat elérni.

A Perplexity csapata folyamatosan dolgozik további optimalizáción; például az Amazon libfabric könyvtárainak változásait követi, hogy még hatékonyabban kihasználja az EFA-n keresztüli adatáramlást.


Ütős hardver helyett okos optimalizálás

A fentiek tükrében most azok is kihasználhatják a legújabb MI-modellek előnyeit, akik nem tudják vagy nem akarják megfizetni a csúcskategóriás GPU-kat, de nagy, olcsóbb és akár használt hardvereken dolgoznának nagy MI-komponensekkel, például kedvezményes AWS-szervereken. Ez lehetővé teszi, hogy az új MI-forradalomhoz ne csak a legnagyobb techmultik férjenek hozzá – most már tényleg mindenki próbálkozhat öreg, de jól összebarkácsolt vasakkal is.

2025, adminboss, go.theregister.com alapján

  • Te örülnél, ha olcsóbb gépeken is lehetne futtatni a legnagyobb MI-modelleket?
  • Szerinted igazságosabb lesz az MI-hoz való hozzáférés ettől?
  • Ha a fejlesztő helyében lennél, te is inkább optimalizálnád a szoftvert, vagy kevésbé törődnél a régi hardverekkel?


Legfrissebb posztok

MA 06:42

Az igazi Múmia visszatér: Fraser és Weisz újra együtt

🎬 Megint feltámad A múmia (The Mummy) filmsorozat, mégpedig a rajongók kedvenc párosával: Brendan Fraser és Rachel Weisz ismét visszatérnek a következő részben...

szombat 11:39

Mindent a Queen’s English-ről! Először is, ilyen nem létezik

A “Queen’s English” kifejezés sokak számára az angol nyelv leghelyesebb, legtisztább változatát jelenti...

MA 19:21

Az MI most a fotóidból választ neked partnert a Tinderen

A Tinder egy új, MI-alapú funkciót tesztel, amely a telefonod fényképei alapján próbál még jobb partnereket találni számodra...

MA 19:01

Újabb SonicWall-botrány: állami hackerek törtek be

🔒 Szeptemberben a hálózatbiztonsággal foglalkozó SonicWallt komoly támadás érte, amely során államilag támogatott hackerek szereztek jogosulatlan hozzáférést bizonyos ügyfelek tűzfal-konfigurációs mentési fájljaihoz...

MA 18:51

Az új Windows 11-es Store tényleg leveszi a terhet a felhasználókról

😎 A Windows 11 felhasználói mostantól egyszerre több alkalmazást is telepíthetnek a Microsoft Store webes felületéről, ugyanis megérkezett a régóta várt tömeges telepítési funkció...

MA 18:41

Az elszabadult bolygó, amely úgy zabál, mint egy csillag

💫 Az űr egyik legfurcsább bolygóját fedezték fel: a Cha 1107-7626 nevű vándorbolygó hatalmas mennyiségű gázt és port nyel el, ráadásul olyan tempóban, hogy a tudósok szerint akár másodpercenként 6 milliárd tonna anyagot is elnyelhet...

MA 18:31

Az orosz hekkerek újabb csapása: a gabonaipart sem kímélik

Orosz állami támogatással működő hekkercsoport, a Sandworm (más néven APT44) idén újabb támadássorozatot indított Ukrajna ellen, ahol elsősorban adattörlő programokat vetettek be – köztük a gabonaágazatban is, amely az ország egyik legfontosabb bevételi forrása...

MA 18:10

Az új Shazam frissítése végre szemet gyönyörködtető

A Shazam iOS-re most megkapta a Liquid Glass (folyékony üveg) dizájnt, amellyel az app nemcsak esztétikusabb lett, hanem még felhasználóbarátabb is...

MA 17:52

Az első ezermilliárdos vezér, a Teslánál tényleg Musk dönt mindenben

Elon Musk újabb csillagászati fizetési csomagot kaphat, amellyel nemcsak újra a világ leggazdagabb embere lehet, de akár ő lehet a történelem első trillió dolláros (362 000 milliárd forint) magánvagyonosa is...

MA 17:31

A Sony új mércét állított az MI elfogultságának mérésére

🔬 A mesterségesintelligencia-modellek gyakran elfogultak, legyen szó képelemzésről vagy arról, hogyan értelmezik az emberek kinézetét, foglalkozását...

MA 17:21

Az univerzum fiatal lázadója: forró gázkitörések egy távoli galaxisban

Az SXDF-NB1006-2 nevű galaxis a világegyetem egyik legtávolabbi, alig 12,9 milliárd fényévnyire található csillagrendszere, amelynek sorsába most bepillantást engedett a James Webb-űrtávcső...

MA 17:11

Az önvezető Black Hawk tabletről irányítható katonai helikopter lett

A DARPA hatmillió dolláros (kb. 2,1 milliárd forintos) támogatásával a Lockheed Martin leányvállalata, a Sikorsky áttörést ért el az autonóm helikopterek fejlesztésében...

MA 17:01

Az áttörés új korszakot hozhat az élelmiszer-termelésben

🥦 A növények nitrogénigénye évről évre óriási mennyiségű műtrágyát követel, ami energiapazarlással és jelentős szén-dioxid-kibocsátással jár...

MA 16:51

Az áttörő fogzománcgél megváltoztathatja a fogászati kezeléseket

😃 A fogzománc regenerálása eddig lehetetlennek tűnt, most azonban brit kutatóknak sikerült egy új, fehérjealapú géllel elérniük, hogy a károsodott zománc visszanőjön...

MA 16:41

Az iPhone új korszaka: hajlítható modellek és Air 2 érkeznek

📱 A következő években komoly változások jönnek az iPhone-oknál: 2026 második felében végre bemutatkozhat a várt hajlítható iPhone, az Apple pedig tovább bővíti az ultravékony iPhone Air családot is...

MA 16:30

Az új Windows 11 bolti trükk végre időt spórol

A Microsoft Store webes felületén megjelent egy új funkció, amellyel egyszerre több alkalmazás telepíthető Windows 11 alatt – nem kell egyesével végigkattintani minden letöltést...

MA 16:21

Kibervédelem, tudod mit csinálsz vagy csak találgatás az egész?

🔐 Egy modern IT-vezető akár egy pilóta is lehetne: kifogástalanul vezetett naplókkal, minden műszer villog, a csapat felkészült, az irányítás a helyén van...

MA 16:11

Az IBM-üzlet, amely felemelte a Microsoftot

🥇 1980-ban az IBM sürgősen operációs rendszert keresett első személyi számítógépéhez. A nagynevű vállalat végül a Microsoft ajánlata mellett döntött, ami nemcsak az informatikát változtatta meg, hanem megalapozta a Microsoft jövőbeli uralmát is...

MA 16:02

Az Ikea olcsó okosotthonai legyőzik a versenytársakat

Az Ikea ismét forradalmasítja az okosotthonok világát: vadonatúj, színes és rendkívül kedvező árú, Matter over Thread okoseszközeivel minden eddiginél egyszerűbbé és olcsóbbá teszi a belépést a connected home korszakába...