2025. 11. 06., 18:02

Az öreg GPU-k olcsón futtatják a gigantikus MI-modelleket

Az öreg GPU-k olcsón futtatják a gigantikus MI-modelleket
A Perplexity nevű MI-keresőcég kutatócsapata új szoftveres finomításokat fejlesztett, amelyek lehetővé teszik a több százmilliárd, akár közel ezermilliárd paraméteres modellek hatékony futtatását régebbi és olcsóbb hardvereken is. Ez áttörés, hiszen a legnagyobb MI-modelleket eddig csak méregdrága, legmodernebb GPU-kon lehetett futtatni, főként a bonyolult memóriakezelés és a hálózati késleltetés miatt.

Az óriásmodellek problémái

A kevert szakértős (mixture of experts, MoE) modellek – mint a DeepSeek V3 vagy a Moonshot AI Kimi K2 – paraméterszáma 671 milliárdtól akár ezermilliárdig terjed. Ezek akkora helyet foglalnak, hogy még nyolc darab H100- vagy H200-GPU-val szerelt rendszerekbe sem fér el egyszerre minden hozzájuk tartozó adat, különösen, ha a szükséges rövid távú memóriát is figyelembe vesszük. Ezért vagy nagyobb, még drágább szerverekre van szükség, vagy a modell szétosztására több kisebb gépre.

A kézenfekvő megoldás az Nvidia GB200/GB300 NVL72 rendszerek használata lenne – ezek 72 darab, 192 vagy 288 GB-os GPU-t tartalmaznak, simán elfér rajtuk bármilyen nagy modell is –, de ezek sem elérhetők mindenhol, nagyon drágák, és állandóan hiánycikkek. Ezzel szemben a régebbi, például H100-as rendszerek viszonylag olcsók és elterjedtek, de csak akkor lehet velük hatékonyan dolgozni, ha a modelleket több csomópont között osztják szét. Ez viszont hálózati késleltetéssel és jelentős teljesítményvesztéssel jár.

MoE-modelleknél ráadásul az adatforgalom sem egyszerű: minden egyes szótöredéket vagy karaktert mindig más-más „szakértő” generál, és ezek akár a hálózat különböző pontjain lévő GPU-król futnak. Ez a megközelítés jelentősen csökkenti a memóriaigényt, de sokkal intenzívebb adatforgalmat eredményez.

Különösen fontos, hogy míg egy szerveren belül a gyors NVLink vagy az AMD Infinity Fabric simán viszi ezt a terhelést, addig több gép között akár hétszer-tizennégyszer lassabbak a hálózati összeköttetések, ami szűk keresztmetszethez vezet.

Az Amazon megkötései és a Perplexity szoftveres trükkjei

Akik nem Nvidia-gyártmányú hálózati kártyákat használnak – mint például rengeteg Amazon Web Services (AWS) felhasználó –, másfajta hálózati technológiákkal találják szembe magukat. Az Amazon saját Elastic Fabric Adapterét (EFA) alkalmazza: ez hasonlóan akár 400 Gbit/s összsávszélességet tud, de két fontos területen elmarad az Nvidia ConnectX-től. Egyrészt az EFA-n keresztüli üzenetküldés nem olyan gyors és hatékony, másrészt nem támogatja a GPUDirect Asyncot, ezért a GPU-k közötti adatmozgásnál minden a CPU-n keresztül megy, ami újabb késedelmet jelent.

Ezzel szemben a Perplexity új, speciális kommunikációs szoftvermodulokat (kerneleket) fejlesztett, amelyek lehetővé teszik, hogy EFA-val működő rendszerekben is kiegyensúlyozottan, minimális késéssel fussanak a MoE-modellek. Ezek a fejlesztések bizonyos mérőszámokban már most jobb eredményt hoztak, mint a DeepSeek V3-hoz készült DeepEP keretrendszer, amely eddig a ConnectX-7 szabványra volt optimalizálva.

Látható teljesítménynövekedés és a jövő

A Perplexity élesben is tesztelte fejlesztését: a DeepSeek V3 (700 milliárd paraméter) és a Kimi K2 (1 billió paraméter) modellekkel több AWS-példányon, EFA-hálózattal. A DeepSeek V3 még ráfért egyetlen H200-as szerverre, így jó viszonyítási alapot adott, de a Kimi K2-t már csak elosztva lehetett kezelni.

Az egygépes és a 2–4 példányos konfiguráció összevetésénél világos volt: ahogy egyre több gépen, egyre több GPU-val futtak a modellek, a Perplexity szoftveres finomhangolása egyre jobban érvényesült; főleg közepes batchméreteknél hozott jelentős gyorsulást. Különösen fontos, hogy a masszív sávszélességbeli hátrány ellenére – az NVLinkhez vagy az Infinity Fabrichoz képest az EFA akár 14-szer lassabb lehet – a Kimi K2-vel is érezhetően sikerült gyorsításokat elérni.

A Perplexity csapata folyamatosan dolgozik további optimalizáción; például az Amazon libfabric könyvtárainak változásait követi, hogy még hatékonyabban kihasználja az EFA-n keresztüli adatáramlást.


Ütős hardver helyett okos optimalizálás

A fentiek tükrében most azok is kihasználhatják a legújabb MI-modellek előnyeit, akik nem tudják vagy nem akarják megfizetni a csúcskategóriás GPU-kat, de nagy, olcsóbb és akár használt hardvereken dolgoznának nagy MI-komponensekkel, például kedvezményes AWS-szervereken. Ez lehetővé teszi, hogy az új MI-forradalomhoz ne csak a legnagyobb techmultik férjenek hozzá – most már tényleg mindenki próbálkozhat öreg, de jól összebarkácsolt vasakkal is.

2025, adminboss, go.theregister.com alapján

  • Te örülnél, ha olcsóbb gépeken is lehetne futtatni a legnagyobb MI-modelleket?
  • Szerinted igazságosabb lesz az MI-hoz való hozzáférés ettől?
  • Ha a fejlesztő helyében lennél, te is inkább optimalizálnád a szoftvert, vagy kevésbé törődnél a régi hardverekkel?


Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Lively Letters – Phonics (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) ContactVault Pro (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) FormatX: Video Audio Converter...

APP
péntek 09:11

APPok, Amik Ingyenesek MA, 6/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     FormatX: Video Audio Converter (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) War Mongrels (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia...

APP
csütörtök 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...