
Kettészakadt a felhőpiac
A GPU-bérlés ára nemcsak önmagában érdekes, hanem abban is, hogy mit jelez a piacról. A felhőalapú MI-infrastruktúra egyre inkább két részre oszlik. Az alap, tömegtermékek piacán defláció érvényesül: például az Nvidia H100-as GPU-jának óradíja kevesebb mint felére, 7,57 dollárról (kb. 2 800 Ft) 3,93 dollárra (kb. 1 450 Ft) esett 2025 szeptembere óta. Ugyanakkor a modern csúcskártyáknál – ahol tényleg nagy a kereslet – az árak emelkedni kezdtek, és idén először a vezető felhőszolgáltatók, például az AWS, nem csökkentették, hanem megemelték a GPU-bérlés (előjegyzett kapacitás) árait. Az újabb generációk (pl. H200) szűkössége miatt már az előző szériás (A100) chipek ára is felfelé mozdult.
Miért csak 5% a kihasználtság? – A beszerzési csapda
Gyakorlati példán keresztül: egy cég szeretne 48 GPU-t, jelentkezik a felhőszolgáltatónál, majd hetekig, hónapokig vár. Végül a szolgáltató szól: „van 36 GPU, csak most lehet lekötni, egy vagy három évre”. Ha nemet mondanak, egyből elbukhatják a lehetőséget. Ugyanis a hiánytól való félelem (FOMO) mindenkit arra ösztönöz, hogy inkább többet foglaljon le, mint kevesebbet. Ha végre hozzájutnak a kártyákhoz, azokat már senki nem meri visszaadni, hiszen utána egy újabb sorban állás következne, így az erőforrásokat inkább pihentetik, de fizetnek érte. Sőt, inkább kifizetik a háromszoros óradíjat, csak nehogy a GPU-t elveszítsék. Ez a félelem tartja fenn az 5%-os kihasználtságot: a hiány miatt drága a hardver, de pont emiatt nem akarják leadni a felesleget sem.
A történet másik oldala viszont: a Kubernetes-gyakorlatban a mérnökök jellemzően 5–10-szer annyi kapacitást igényelnek, mint amennyit valójában felhasználnak, mert a túlkiosztásnak nincs jól látható következménye, míg az alulméretezés technikai riasztásokat eredményez.
Az architekturális pazarlás ördögi köre
Még ha jól is sikerül a beszerzés, a meglévő GPU-kon futó feladatok rendszerint akkor is pazarolnak. Az MI-munkafolyamatok általában CPU-igényes (adatbetöltés, előfeldolgozás) és GPU-igényes szakaszokra (tanítás, inferencia) tagolódnak. Sokszor mindez egy konténerbe van zárva, így a GPU-t az egész futásidő alatt lefoglalják, még akkor is, amikor nincs számítási feladat. Az MI-infrastruktúrát elemző cégek egymástól függetlenül ugyanarra jutnak: a kétféle pazarlás (beszerzés, architektúra) összeadódnak. Ezért van, hogy felhasználói oldalon még a legdrágább villamosenergia-számla mellett is csak 5%-os a valódi kihasználtság.
Hogyan lehetne elérni a 40%-os kihasználtságot?
Ha a kockázatkerülés miatt senki nem adja vissza az erőforrásait, és a szerződések már megvannak, egyetlen mód marad: okosabban kell kihasználni a meglévő GPU-teljesítményt. Az egyik legegyszerűbb technika például a GPU-megosztás időzónák között – egy multinacionális banknak elég egy GPU-farmot üzemeltetni, ha a különböző országok eltérő időben használják. Egyes automatizált ütemező szoftverek ezt már emberi beavatkozás nélkül oldják meg. Az ausztrál Canva például az új rendszerrel 50%-os felhőköltség-csökkenést és 40% feletti GPU-kihasználtságot ért el, miközben több mint 100 MI-modellt futtatnak párhuzamosan.
Ugyanakkor fontos: a jelentés eredményei nem tartalmazzák azokat az MI-laborokat, amelyek dedikált tanításokat futtatnak – ott ennél jóval magasabb lehet a kihasználtság.
A bérlési utak már nem univerzálisak
2026-ban a GPU-beszerzési stratégiák közötti különbségek még élesebbek:
– Hyperscaler on-demand: 1 100–2 500 Ft/óra, kiszámíthatatlan elérhetőséggel.
– Kapacitáscsomag: 1 600–1 840 Ft/óra; időben ütemezhető, de hosszabb elköteleződéssel.
– Spotpiacok: akár 90%-os kedvezmény, de magas megszakítási kockázat.
– Specializált GPU-felhők: 730–1 460 Ft/óra, rugalmas foglalás.
– Saját vagy bérelt szerver: csak magas (60% feletti) tartós kihasználtságnál éri meg.
– Decentralizált piacterek: 365 Ft/óra alatt is lehet, de erősen változó minőséggel.
A veszteséges stratégia az, ha egy cégnél véglegesen rögzített, többéves szerződés mögé bújnak; helyette célszerű a piac több szegmensét vegyesen kihasználni.
Öt konkrét lépés a takarékosságért
– Folyamatosan igazítsd a szükséges erőforrásokat – ne ragadj le a telepítéskori beállításnál.
– Használd ki a regionális spotárazást, főleg egyszerű inferenciáknál.
– Szeleteld fel a GPU-kat (MIG, időosztásos megosztás) a lehető legjobb kihasználásért.
– Válaszd szét az adatelőkészítést és a számításigényes munkákat.
– Igazítsd a szerződéses kapacitásokat a tényleges igényekhez.
A lényeg
Mielőtt valaki újabb H200-as GPU-t szerez be – ami főleg extra nagy modellekhez kell, hiszen 141 GB memóriája majdnem duplája a H100-énak –, érdemes auditálni, hogy valóban szükséges-e ekkora erőforrás. Általános MI-feladatokra a H100 elég, és óriási megtakarítást hoz, egy A100 pedig még inkább. A pazarló, generációalapú beszerzés helyett mostanra valóban a célspecifikus kiosztás az indokolt az elérhető infrastruktúrán. Ugyanis ha 5%-os kihasználtsággal futtatják az aktuális legdrágább chipeket, annál drágább elpocsékolást nehéz elképzelni. Minden szervezetnél fel kell tenni az alapkérdést: tényleg a megfelelő GPU dolgozik-e a megfelelő feladaton, vagy csak a FOMO döntött helyette? Csak a két fő gondon (túlelőjegyzésen és hibás futtatási architektúrán) együtt lehet érdemben változtatni. Ellenkező esetben a vállalatok csak tovább etetik a legdrágább MI-infrastruktúrát, minimális hatékonysággal.
