MA 17:21

A Blackwell-lel tízszer olcsóbb az MI-üzemeltetés

A mesterséges intelligencia-alapú alkalmazásoknál az egyik legjelentősebb fejlemény a költségek drasztikus, akár tízszeres csökkentése az Nvidia Blackwell platformján. Ugyanakkor a hardver csak az egyenlet egyik fele: valódi áttörést az optimalizált szoftverek és a nyílt forráskódú modellek kombinációja hozta el. Négy vezető MI-szolgáltató tapasztalatai mutatják, hogy a Blackwell-infrastruktúra, az okosan integrált szoftverstack és a legújabb nyílt modellek bevezetése révén az egészségügytől a játékiparon át a chatalapú ügynökökig és az ügyfélszolgálatig mindenhol jelentős költségcsökkenés vált lehetségessé, ahogy a kezdeti pilotoktól a milliós felhasználói bázisig terjed az adattömeg.

Látványos megtakarítás az MI-alapú szolgáltatásokban

Sully.ai 90%-kal, azaz tízszeresen csökkentette az MI-inferencia költségeit a Blackwell-alapú Baseten szolgáltatónál, miközben a rendszer válaszideje is 65%-kal javult. Ennek következtében az orvosok több mint 30 millió percnyi munkaidőt spóroltak meg, mivel a digitális orvosi adatrögzítés teljesen automatizálhatóvá vált.
Az MI-játékplatformon, az AI Dungeonön (MI Börtön) a Latitude négyszeres költségcsökkenést ért el, miután a nagy, úgynevezett MoE (mixture-of-experts) modelleket üzemeltette a DeepInfra Blackwell-infrastruktúráján. Egymillió token kiszolgálása így 74 forintba került a Hopper platform 149 forintjával szemben, míg az NVFP4 formátum bevezetése után ez megfeleződött, mindössze 37 forintra. Érdemes kiemelni, hogy a puszta hardverváltás csak kétszeres csökkenést jelentett, de a további fejlesztésekkel sikerült elérni a négyszeres eredményt.
A Sentient Foundation ügynök-chat platformján a Fireworks AI Blackwell-optimalizált stackjével 25–50%-kal sikerült javítani a költséghatékonyságon. Egy hét alatt 5,6 millió kérést dolgoztak fel vírusszerű növekedés mellett, miközben az átlagos késleltetés végig alacsony maradt.
Az ügyfélszolgálatban is új korszak kezdődött: a Decagon Blackwell-alapú Together AI-rendszerrel hatszoros költségcsökkenést ért el a hangalapú MI-támogatásban, a válaszidő pedig 400 milliszekundum alatt maradt – kritikus szint, hiszen hangalapú ügyfélszolgálatnál minden tizedmásodperc számít.

Tízszeres megtakarítás: hátterében a technika

A tapasztalt költségcsökkenés három tényezőből áll össze: új precizitásformátumok, a modellek architektúrája és az optimalizált szoftverstack.
A Latitude példája jól mutatja: először a Hopperről Blackwellre váltás hozott kétszeres eredményt, majd az NVFP4 alacsony precizitású formátumra való átállás további duplázást hozott. Az NVFP4 ugyanis úgy csökkenti a memória- és számítási igényt, hogy a pontosság megmarad – különösen jól működik akkor, ha MoE-modelleket használnak, és minden egyes kérésnél csak egy részmodellt aktiválnak.
A modellek architektúrája sem elhanyagolható: a MoE-rendszerek profitálnak a Blackwell NVLink-struktúrájából, ahol a „szakértő” modellek szinte azonnal kommunikálni tudnak egymással. Ezzel szemben a klasszikus „sűrű” modelleknél, amelyek minden paramétert aktiválnak minden kérésnél, ez az előny kevésbé érvényesül.

Az integrált szoftverstack szintén komoly különbséget okoz. Az Nvidia Blackwell hardvere, az NVL72-architektúra, valamint a Dynamo és TensorRT-LLM szoftverek együttes optimalizálása további eredményeket hoz. Például a Basetennél, a Sully.ai esetében így tudták elérni a tízszeres költségcsökkenést – akik viszont más rendszerrel, például vLLM-mel dolgoznak, szerényebb megtakarítást tapasztalnak.
Fontos megjegyezni, hogy a Blackwell különösen jól teljesít „reasoning”, azaz összetett következtetést igénylő modelleknél, amelyeknél sok token keletkezik egy válaszhoz. Ennek oka, hogy a Blackwell szerverei hatékonyan képesek a hosszú kontextusok kezelésére, amikor a kérdés előkészítése (context prefill) és a tokengenerálás szétválasztva történik.

Mire figyelj, mielőtt Blackwellre váltasz?

Nem csak az Nvidia Blackwell kínál költségcsökkentő lehetőséget: az AMD MI300, a Google TPU-család vagy például a Groq és a Cerebras speciális gyorsítói szintén alternatívák lehetnek. A felhőszolgáltatók (AWS, Google Cloud, Azure) tovább optimalizálnak, így a kérdés mindig az, hogy a konkrét munkaterheléshez melyik összeállítás a legmegfelelőbb.
Érdemes kiemelni, hogy a bemutatott 6–10-szeres teljesítményjavulás mind nagy volumenű, késleltetés-érzékeny alkalmazásoknál jelentkezett, ahol havonta akár több millió kérés fut át a rendszeren. Akiknél a válaszidő kevésbé kritikus, előbb ismerkedjenek a szoftveres optimalizálással vagy modelleváltással, hardvercsere nélkül is jelentős megtakarítás jöhet.
Minden teszteredménynek érdemes utánajárni: a szolgáltatók által közölt teljesítménymutatók laboratóriumi ideálokat tükröznek – de a valódi hozzáadott értéket a saját, éles használat során tudod lemérni.
A bevezetés sorrendje is meghatározó lehet: a Latitude előbb váltott hardvert, majd az új precizitásformátumot vezette be, így kétszeres, majd négyszeres csökkentést ért el. Teljes architektúraváltás helyett érdemes lehet előbb a meglévő infrastruktúrán szoftvert optimalizálni, vagy nyílt modelleket futtatni – ez is elhozhatja az eredmény felét, drága új hardver nélkül.

Mérlegen a szolgáltatók és a teljes költség

Nem minden Blackwell-alapú felhőszolgáltatás ugyanolyan. Van, amelyik az Nvidia integrált szoftverstackjét használja (Dynamo, TensorRT-LLM), mások inkább alternatívákat (pl. vLLM). A technikai részletek valós teljesítménykülönbséget okoznak, ezért mindig ellenőrizni kell, hogy az adott szolgáltató melyik stacket kínálja.
A gazdasági döntést azonban nemcsak a tokenenkénti költség határozza meg. Ugyan a specializált, Blackwellre optimalizált szolgáltatók (Baseten, DeepInfra, Fireworks, Together AI) extra rugalmasságot hoznak, de külön menedzsmentet igényelnek. A nagy felhőszolgáltatóknál (AWS, Azure, Google Cloud) talán drágább ugyan a tokenenkénti ár, ám a működtetés egyszerűbb, jelentősen alacsonyabb adminisztrációval párosul.
Végső soron minden MI-fejlesztőnek magának kell kiszámolnia, melyik stratégia hozza el a legjobb ár-érték arányt az adott feladatnál.

2025, adminboss, venturebeat.com alapján

Share on Social Media

filózó

Te mit gondolsz arról, hogy mindent optimalizálni kell, vagy néha a kevesebb is elég?
Te átváltanál új hardverre, vagy inkább a meglévő rendszert próbálnád fejleszteni?

Legfrissebb posztok

Az algoritmusok tényleg mérgezik a közéletet? Itt a megoldás

MI Hírek

MA 19:01

Az algoritmusok tényleg mérgezik a közéletet? Itt a megoldás

🤔 A közösségi oldalak algoritmusai egyre inkább szélsőséges tartalmakat tolnak előtérbe, ami komoly politikai megosztottságot eredményez...

A túlélő ősi fekete lyukak: sötét anyagot rejtenek?

Tudomány

MA 18:20

A túlélő ősi fekete lyukak: sötét anyagot rejtenek?

💫 Az univerzum hajnalán, közvetlenül az ősrobbanás után, az akkor még forró és kaotikus térben születtek meg az első, úgynevezett primordiális (ősi) fekete lyukak...

A valaha észlelt leghangosabb gravitációs hullám próbára teszi Einstein elméletét

Tudomány

MA 18:04

A valaha észlelt leghangosabb gravitációs hullám próbára teszi Einstein elméletét

2025 januárjában a tudósok minden eddiginél tisztább gravitációs hullámjelet észleltek, amely két távoli fekete lyuk összeolvadásából származott...

A közösségi médiafüggőség: mítosz vagy valós veszély?

Tudomány

MA 17:56

A közösségi médiafüggőség: mítosz vagy valós veszély?

A Meta két nagy port kavaró perbe keveredett: Új-Mexikóban az állam főügyésze a gyerekek kizsákmányolását és károkozását rója fel a platform addiktív funkciói miatt, míg Los Angelesben egy nő mentális egészségromlásáért okolja a céget...

A szinglik új nemzedéke, akiket mégis büntet a rendszer

Színes

MA 17:37

A szinglik új nemzedéke, akiket mégis büntet a rendszer

Soha nem volt még ilyen magas az egyedülállók száma Amerikában, ráadásul sokan szándékosan választják ezt az életformát...

Az Archaeopteryx szájának titkai: bizarr fogak és elképesztően mozgékony nyelv

Tudomány

MA 17:02

Az Archaeopteryx szájának titkai: bizarr fogak és elképesztően mozgékony nyelv

🐮 Tipikus eset, amikor egy legendás őslény újabb meglepetéssel szolgál: az Archaeopteryx, a dinoszauruszok és madarak közötti átmenetet jelző ikonikus lény számos meglepő, eddig ismeretlen sajátossággal gazdagítja ismereteinket...

A Microsoft újabb bakija kifektette a Chrome-ot – most orvosolták

Színes

MA 16:55

A Microsoft újabb bakija kifektette a Chrome-ot – most orvosolták

A Microsoft végre kijavította azt a bosszantó hibát, amely miatt a Family Safety szülői felügyeleti szolgáltatás megakadályozta a Windows-felhasználókat abban, hogy elindítsák a Google Chrome-ot és más böngészőket...

Az univerzum tojása: lenyűgöző Hubble-fotó új titkokat tár fel

Tudomány

MA 16:37

Az univerzum tojása: lenyűgöző Hubble-fotó új titkokat tár fel

Lenyűgöző pillanatot örökített meg a Hubble űrtávcső: a Tojás-köd (Egg Nebula) közepén egy haldokló csillag rejtőzik, amely kettős fénysugarat bocsát ki sűrű porburka poláris nyílásain át...

Az IBM visszavág az MI-nek: még több pályakezdőt vesz fel

MI Hírek

MA 16:19

Az IBM visszavág az MI-nek: még több pályakezdőt vesz fel

Miközben egyre több techóriás hangoztatja, hogy az MI elvenné a pályakezdők munkáját, az IBM épp az ellenkező irányba mozdul: 2026-ban háromszorosára növelné a pályakezdők felvételét az Egyesült Államokban...

Kriptó

MA 16:01

Az aranykornak vége: a Bitcoin csak 85 ezer dollár fölött robbanhat

A Bitcoin árfolyama hetek óta 60 és 70 ezer dollár között mozog, jócskán elmaradva az októberi csúcsától...

Tudomány

MA 15:39

Az otthoni levegő rejtett veszélyei, amikről alig beszélünk

Otthonaink védelmet nyújtanak, de a benti levegő minőségére kevésbé figyelünk, pedig szinte soha nem látjuk, nem halljuk, és ritkán érezzük...

MI Hírek

MA 15:20

Az MI felveri az áramárat – a középosztály issza meg a levét

🔋 Az elmúlt években az MI-verseny miatt sorra létesülnek új adatközpontok az Egyesült Államokban...

Az ősi sír, amely titkos középkori alagutakhoz vezet Németországban

Tudomány

MA 15:02

Az ősi sír, amely titkos középkori alagutakhoz vezet Németországban

🗿 A németországi Dornberg közelében zajló ásatások során régészek váratlan felfedezést tettek egy kőkori temetkezési helyen...

Az MI szuperhőssé teszi az ügyfélszolgálatosokat

MI Hírek

MA 14:56

Az MI szuperhőssé teszi az ügyfélszolgálatosokat

A gyorsan fejlődő MI-technológiák nemhogy elvennék az ügyfélszolgálati munkatársak állásait, hanem segítenek nekik abban, hogy hatékonyabban oldják meg az ügyfelek problémáit...

Tudomány

MA 14:37

A csavart mágneses anyag forradalmasíthatja az ultrasűrű adattárolást

💾 Egy alig észrevehető atomszintű csavar a mágneses rétegekben forradalmi áttörést hozott: új típusú, rendkívül apró mágneses örvények – úgynevezett szkyrmionok – jöttek létre, amelyek teljesen megváltoztathatják az adattárolás jövőjét...

Az OpenAI áttörése: szinte azonnali kódgenerálás Cerebras lapkákkal

MI Hírek

MA 14:20

Az OpenAI áttörése: szinte azonnali kódgenerálás Cerebras lapkákkal

⚡ Egy lényeges szempont, hogy az OpenAI szakít a kizárólagos Nvidia-függéssel, és új partnert választott a kódgenerálás felgyorsítására: a Cerebras Systems óriáslapkáit...

Az északi kanadai erdők ötszörösére fokozhatják a CO2-megkötést

Tudomány

MA 14:02

Az északi kanadai erdők ötszörösére fokozhatják a CO2-megkötést

Kanada az évszázad végére évente akár ötször több szén-dioxidot távolíthatna el a légkörből, mint amennyit most kibocsát – mindezt azáltal, hogy fákat ültet a boreális erdő északi peremén...

Színes

MA 13:55

Az emulátorháború folytatódik: a Nintendo ismét lecsap

Komolyabb akadályok elé néznek a Nintendo Switch-emulátorokat kereső felhasználók, ugyanis a Nintendo ismét DMCA-értesítéseket küldött a GitHubon jelenleg fellelhető összes Switch-emulátor és azok változatai (forkjai) ellen...

Tudomány

MA 13:38

Az Ariane 6 lehet az Amazon műholdas álmának utolsó esélye

Érdemes megvizsgálni, hogy Európa legerősebb rakétája, az Ariane 6 sikerrel indította el az Amazon régóta várt műholdhálózatát, amikor a vállalatnak erre a legnagyobb szüksége volt...

MI Hírek

MA 13:22

Az MI-korszak titkos fegyvere: az ügynökmenedzser

Erre utal többek között az, hogy a vállalatok egyre nagyobb arányban telepítenek önállóan is működni képes MI-ügynököket, de ezek sikeres működtetéséhez egészen új típusú vezetőkre van szükség...

A Bitwarden új Cupid Vaultja forradalmasítja a biztonságos jelszómegosztást

Színes

MA 13:01

A Bitwarden új Cupid Vaultja forradalmasítja a biztonságos jelszómegosztást

🔒 A Bitwarden mostantól egy új funkcióval, a Cupid Vault-tal segíti a biztonságos jelszómegosztást, főként azoknak, akik egy-két személlyel szeretnének közösen használni fiókokat...

A Google Fotók megújul: itt a vadiúj lebegő menüsáv

Színes

MA 12:55

A Google Fotók megújul: itt a vadiúj lebegő menüsáv

📷 A Google Photos végre megszabadult a régi, képernyő alján húzódó navigációs sávjától, és helyette egy lebegő, kapszula alakú eszköztár jelent meg...

Az abortusz 44-szer biztonságosabb, mint a szülés az USA-ban

Tudomány

MA 12:38

Az abortusz 44-szer biztonságosabb, mint a szülés az USA-ban

Fontos kérdés, hogy mit is jelent valójában a terhesség vállalása vagy az abortusz választása az Egyesült Államokban élők egészségére nézve...

Tudomány

MA 12:02

Az évszázad halászati tilalma: újjászületik a Jangce élővilága

A kínai Jangce-folyó élővilága évtizedeken át szenvedett a túlhalászattól és élőhelyei pusztulásától, amit súlyosbított a szennyezés, a gátépítések és a rohamtempójú ipari terjeszkedés is...

Az új Nothing Phone 4a színei totális káoszt kavarnak

Színes

MA 11:55

Az új Nothing Phone 4a színei totális káoszt kavarnak

💥 A Nothing hamarosan bemutatja a Nothing Phone 4a sorozatát, de az új szivárgások csak még több kérdést vetnek fel, mint amennyi választ adnak...

Az ál-MI chatbotos bővítmények titokban e-maileket és API-kulcsokat lopnak

MI Hírek

MA 11:20

Az ál-MI chatbotos bővítmények titokban e-maileket és API-kulcsokat lopnak

Több mint harminc, MI-asszisztensként álcázott, de valójában kártékony Chrome-bővítményt legalább 260 000 felhasználó telepített, akik így akaratlanul is kitették magukat adatlopásnak...

MI Hírek

MA 11:01

Az MI Markdownra állt: villámtempóban habzsolja a weboldalakat

A Cloudflare ismét felforgatja a web működését: ezúttal arra kínál megoldást, hogyan fogyaszthatják az MI-alapú robotok gyorsabban és olcsóbban a weboldalak tartalmát...

Színes

MA 10:57

Az amerikai techóriások markában vergődik Európa

🌐 Európa digitális szolgáltatásainak túlnyomó többsége amerikai techcégek kezében van, ami egyre nagyobb aggodalmat okoz a kontinensen, főként az EU és az USA között feszülő geopolitikai ellentétek miatt...

Színes

MA 10:50

A legendás Metal Gear Solid 4 visszatér: megérkezett az első remaster

Júniusban a Sony PlayStation 5-ös bemutatóján nagy meglepetés érte a Metal Gear-rajongókat: közel húsz év után végre remastert kap a Metal Gear Solid 4: Guns of the Patriots...