2026. 02. 13., 17:21

A Blackwell-lel tízszer olcsóbb az MI-üzemeltetés

A Blackwell-lel tízszer olcsóbb az MI-üzemeltetés
A mesterséges intelligencia-alapú alkalmazásoknál az egyik legjelentősebb fejlemény a költségek drasztikus, akár tízszeres csökkentése az Nvidia Blackwell platformján. Ugyanakkor a hardver csak az egyenlet egyik fele: valódi áttörést az optimalizált szoftverek és a nyílt forráskódú modellek kombinációja hozta el. Négy vezető MI-szolgáltató tapasztalatai mutatják, hogy a Blackwell-infrastruktúra, az okosan integrált szoftverstack és a legújabb nyílt modellek bevezetése révén az egészségügytől a játékiparon át a chatalapú ügynökökig és az ügyfélszolgálatig mindenhol jelentős költségcsökkenés vált lehetségessé, ahogy a kezdeti pilotoktól a milliós felhasználói bázisig terjed az adattömeg.

Látványos megtakarítás az MI-alapú szolgáltatásokban

Sully.ai 90%-kal, azaz tízszeresen csökkentette az MI-inferencia költségeit a Blackwell-alapú Baseten szolgáltatónál, miközben a rendszer válaszideje is 65%-kal javult. Ennek következtében az orvosok több mint 30 millió percnyi munkaidőt spóroltak meg, mivel a digitális orvosi adatrögzítés teljesen automatizálhatóvá vált.
Az MI-játékplatformon, az AI Dungeonön (MI Börtön) a Latitude négyszeres költségcsökkenést ért el, miután a nagy, úgynevezett MoE (mixture-of-experts) modelleket üzemeltette a DeepInfra Blackwell-infrastruktúráján. Egymillió token kiszolgálása így 74 forintba került a Hopper platform 149 forintjával szemben, míg az NVFP4 formátum bevezetése után ez megfeleződött, mindössze 37 forintra. Érdemes kiemelni, hogy a puszta hardverváltás csak kétszeres csökkenést jelentett, de a további fejlesztésekkel sikerült elérni a négyszeres eredményt.
A Sentient Foundation ügynök-chat platformján a Fireworks AI Blackwell-optimalizált stackjével 25–50%-kal sikerült javítani a költséghatékonyságon. Egy hét alatt 5,6 millió kérést dolgoztak fel vírusszerű növekedés mellett, miközben az átlagos késleltetés végig alacsony maradt.
Az ügyfélszolgálatban is új korszak kezdődött: a Decagon Blackwell-alapú Together AI-rendszerrel hatszoros költségcsökkenést ért el a hangalapú MI-támogatásban, a válaszidő pedig 400 milliszekundum alatt maradt – kritikus szint, hiszen hangalapú ügyfélszolgálatnál minden tizedmásodperc számít.

Tízszeres megtakarítás: hátterében a technika

A tapasztalt költségcsökkenés három tényezőből áll össze: új precizitásformátumok, a modellek architektúrája és az optimalizált szoftverstack.
A Latitude példája jól mutatja: először a Hopperről Blackwellre váltás hozott kétszeres eredményt, majd az NVFP4 alacsony precizitású formátumra való átállás további duplázást hozott. Az NVFP4 ugyanis úgy csökkenti a memória- és számítási igényt, hogy a pontosság megmarad – különösen jól működik akkor, ha MoE-modelleket használnak, és minden egyes kérésnél csak egy részmodellt aktiválnak.
A modellek architektúrája sem elhanyagolható: a MoE-rendszerek profitálnak a Blackwell NVLink-struktúrájából, ahol a „szakértő” modellek szinte azonnal kommunikálni tudnak egymással. Ezzel szemben a klasszikus „sűrű” modelleknél, amelyek minden paramétert aktiválnak minden kérésnél, ez az előny kevésbé érvényesül.

Az integrált szoftverstack szintén komoly különbséget okoz. Az Nvidia Blackwell hardvere, az NVL72-architektúra, valamint a Dynamo és TensorRT-LLM szoftverek együttes optimalizálása további eredményeket hoz. Például a Basetennél, a Sully.ai esetében így tudták elérni a tízszeres költségcsökkenést – akik viszont más rendszerrel, például vLLM-mel dolgoznak, szerényebb megtakarítást tapasztalnak.
Fontos megjegyezni, hogy a Blackwell különösen jól teljesít „reasoning”, azaz összetett következtetést igénylő modelleknél, amelyeknél sok token keletkezik egy válaszhoz. Ennek oka, hogy a Blackwell szerverei hatékonyan képesek a hosszú kontextusok kezelésére, amikor a kérdés előkészítése (context prefill) és a tokengenerálás szétválasztva történik.

Mire figyelj, mielőtt Blackwellre váltasz?

Nem csak az Nvidia Blackwell kínál költségcsökkentő lehetőséget: az AMD MI300, a Google TPU-család vagy például a Groq és a Cerebras speciális gyorsítói szintén alternatívák lehetnek. A felhőszolgáltatók (AWS, Google Cloud, Azure) tovább optimalizálnak, így a kérdés mindig az, hogy a konkrét munkaterheléshez melyik összeállítás a legmegfelelőbb.
Érdemes kiemelni, hogy a bemutatott 6–10-szeres teljesítményjavulás mind nagy volumenű, késleltetés-érzékeny alkalmazásoknál jelentkezett, ahol havonta akár több millió kérés fut át a rendszeren. Akiknél a válaszidő kevésbé kritikus, előbb ismerkedjenek a szoftveres optimalizálással vagy modelleváltással, hardvercsere nélkül is jelentős megtakarítás jöhet.
Minden teszteredménynek érdemes utánajárni: a szolgáltatók által közölt teljesítménymutatók laboratóriumi ideálokat tükröznek – de a valódi hozzáadott értéket a saját, éles használat során tudod lemérni.
A bevezetés sorrendje is meghatározó lehet: a Latitude előbb váltott hardvert, majd az új precizitásformátumot vezette be, így kétszeres, majd négyszeres csökkentést ért el. Teljes architektúraváltás helyett érdemes lehet előbb a meglévő infrastruktúrán szoftvert optimalizálni, vagy nyílt modelleket futtatni – ez is elhozhatja az eredmény felét, drága új hardver nélkül.


Mérlegen a szolgáltatók és a teljes költség

Nem minden Blackwell-alapú felhőszolgáltatás ugyanolyan. Van, amelyik az Nvidia integrált szoftverstackjét használja (Dynamo, TensorRT-LLM), mások inkább alternatívákat (pl. vLLM). A technikai részletek valós teljesítménykülönbséget okoznak, ezért mindig ellenőrizni kell, hogy az adott szolgáltató melyik stacket kínálja.
A gazdasági döntést azonban nemcsak a tokenenkénti költség határozza meg. Ugyan a specializált, Blackwellre optimalizált szolgáltatók (Baseten, DeepInfra, Fireworks, Together AI) extra rugalmasságot hoznak, de külön menedzsmentet igényelnek. A nagy felhőszolgáltatóknál (AWS, Azure, Google Cloud) talán drágább ugyan a tokenenkénti ár, ám a működtetés egyszerűbb, jelentősen alacsonyabb adminisztrációval párosul.
Végső soron minden MI-fejlesztőnek magának kell kiszámolnia, melyik stratégia hozza el a legjobb ár-érték arányt az adott feladatnál.

2025, adminboss, venturebeat.com alapján

  • Te mit gondolsz arról, hogy mindent optimalizálni kell, vagy néha a kevesebb is elég?
  • Te átváltanál új hardverre, vagy inkább a meglévő rendszert próbálnád fejleszteni?


Legfrissebb posztok

MA 07:36

A United alkalmazás már mutatja a reptéri várakozást – ha nem késik

✈ Végre megérkezett az a menüpont, amire mindenki vágyott: a United mostantól mutatja a beszállás előtti biztonsági ellenőrzések várakozási idejét az appban – vagyis, ha épp eszméletlenül hosszú sorok kígyóznak, pontosan tudhatod, mennyit fogsz unatkozni multitasking közben a poggyászoddal...

MA 07:29

A TrueConf hibája miatt ezrével csaptak le videókonferenciákra

📺 A hackerek egy súlyos, eddig ismeretlen biztonsági rést kihasználva támadták meg a TrueConf videókonferencia-szervereket...

MA 07:22

Az Nvidia végre véget vet a shader-fordítási kínoknak – de csak félig

💻 Amikor a PC-d éppen unatkozik, az Nvidia szerint igazán kihasználhatná az időt arra, hogy előre lefordítsa a játékokhoz szükséges shadereket...

MA 07:17

A Claude Code szelleme visszatért: kísért az MI-kód

Egyetlen óvatlan pillanat elég volt, hogy a vállalati biztonsági vezetők rémálma valóra váljon...

MA 07:09

Az ember visszatér a Holdra: elrajtolt az Artemis II küldetés

🚀 A floridai Kennedy Űrközpontból szerdán új korszak indult, amikor három amerikai és egy kanadai űrhajós útnak indult a Hold felé...

MA 07:01

A MOL és a Hitachi építheti Japán első lebegő adatközpontját

Japánban egyre komolyabban veszik a lebegő adatközpontok fejlesztését. A Mitsui OSK Lines (MOL) és a Hitachi most együttműködést kötött, hogy 2027-re egy használt hajóból alakítsanak ki egy úszó szerverfarmot, amely hűtéséhez tengervizet vagy folyóvizet használna...

MA 06:58

Az Apple kíméletlen döntései: miért buknak el egyes újdonságaik?

Tim Cook több mint tízéves vezérigazgatói pályafutása alatt az Apple-t a világ egyik legsikeresebb vállalatává emelte...

MA 06:50

Az új CrystalRAT: adatlopás és káosz egy csomagban

Egyre figyelemreméltóbb fenyegetést jelent a nemrég megjelent CrystalRAT, amelyet már Telegramon és YouTube-on is hirdetnek...

MA 06:44

Az optika kétszáz éves trükkje új korszakot nyit a kvantumtitkosításban

Fontos kérdés, hogy képesek vagyunk-e lépést tartani a digitális világ adatbiztonsági igényeivel...

MA 06:37

Az emberiség visszatér a Holdra fél évszázad után

2026. április 1-jén új korszak kezdődött az űrkutatásban: majdnem 54 év után ismét emberek indultak útnak a Hold felé...

MA 06:29

A NoVoice kártevő tombol, 2,3 millió androidos készüléket fertőzött meg

🚨 Az utóbbi időben több mint 2,3 millió androidos eszközt sikerült megfertőznie egy új, NoVoice névre keresztelt kártevőnek...

MA 06:22

Az újabb Solana-botrány: 70 milliárd forintnyi kriptó nyomtalanul eltűnt a Driftről

💸 A Solana-alapú Drift decentralizált pénzügyi platformon több mint 70 milliárd forint értékű kriptót vontak ki gyanús tranzakciók során...

MA 06:15

Az amerikaiak végre tű nélkül fogyhatnak: megérkezett a GLP–1 tabletta

Új korszak indult szerdán az USA-ban: az FDA rábólintott a Foundayo nevű GLP-1 tablettára, ami mostantól kapható lesz...

MA 06:09

Az MI romba döntheti versenyképességed – védd a kritikus tudást!

Érdekes felvetés, hogy a mesterséges intelligencia bevezetése milyen hatással lehet egy cég versenyképességére...

MA 06:05

Történelmi események a mai napon (Április 2.)

Április 2. tele van fordulópontokkal: Florida első európai észlelése, a Falkland-háború kirobbanása, Haile Selassie trónra lépése és nagy port kavart terrortámadások, illetve merényletek formálták a világot...

MA 06:01

Az MI jön, mennek a radiológusok? A kórházigazgatók készülnek

Mitchell H. Katz, a New York-i egészségügyi óriás, a NYC Health + Hospitals vezérigazgatója szerint, ha mesterséges intelligencia végezné az elsődleges radiológiai értékeléseket, jelentős összegeket lehetne megtakarítani...

szerda 21:56

Az óriásbankok is ringbe szállnak az előrejelzési piacokon?

A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...

szerda 21:46

Az új csodapirula, a Foundayo, felforgatja a fogyókúrapiacot

Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...

szerda 21:26

Az űrtoalett áttörése: kényelmi forradalom a Hold felé

🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...

szerda 20:46

Az extrém időjárás már enyhe melegedésnél is könyörtelenül csap le

🌫 Felmerül a kérdés, hogy mennyire vagyunk biztonságban, ha a globális felmelegedést sikerül mérsékelt szinten tartani...

szerda 20:23

Az udvar koronázatlan királya: a Ninja Fireside360 mindent felfűt

A tavaszi esték hűvös leheletére legtöbben gyorsan visszavonulnak a négy fal közé, amikor kint elfogy a meleg...

szerda 20:12

Az iráni hekkerek imádnak hencegni, de ritkán ütnek nagyot

Képzeld el, hogy mindenki arról beszél, mennyire menők az iráni hekkerek, miközben a valóság egészen más képet mutat...

szerda 20:02

Az okosotthonod végre nem falja fel a sávszélt

Az okos otthoni biztonsági rendszered mostantól sokkal hatékonyabb lehet: a legújabb Matter 1...

szerda 19:58

A svéd iskolák visszatérnek a tankönyvekhez: újra hódít a papír

📚 Svédországban egyre inkább háttérbe szorulnak a digitális eszközök a tantermekben: a hagyományos könyvek és a kézírás ismét előtérbe kerülnek...

szerda 19:45

A Hershey visszahozza a Reese’s eredeti ízét – végre!

🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...

szerda 19:35

Az átlátható DNS, ami nem kémkedik: 1.1.1.1

Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...

szerda 19:23

Az új Gmail MI‑postaláda tényleg csak a gazdagoké?

Felmerül a kérdés, hogy vajon tényleg mindenkinek szüksége lenne-e a Gmail vadonatúj, MI-alapú postaládájára...

szerda 19:12

Az MI nem elveszi a munkánkat, átformálja – az Nvidia-vezér tanácsai

A fehérgalléros dolgozók közül sokan aggódnak, hogy az MI miatt veszélybe kerülhetnek a munkahelyeik...

szerda 18:57

Az ügyfélszolgálati MI: jó ötlet vagy csapnivaló élmény?

Az automatizált ügyfélszolgálat egyre több vállalatnál válik normává, ám a felhasználók sokszor frusztráló élményekről számolnak be...