2026. 02. 13., 17:21

A Blackwell-lel tízszer olcsóbb az MI-üzemeltetés

A Blackwell-lel tízszer olcsóbb az MI-üzemeltetés
A mesterséges intelligencia-alapú alkalmazásoknál az egyik legjelentősebb fejlemény a költségek drasztikus, akár tízszeres csökkentése az Nvidia Blackwell platformján. Ugyanakkor a hardver csak az egyenlet egyik fele: valódi áttörést az optimalizált szoftverek és a nyílt forráskódú modellek kombinációja hozta el. Négy vezető MI-szolgáltató tapasztalatai mutatják, hogy a Blackwell-infrastruktúra, az okosan integrált szoftverstack és a legújabb nyílt modellek bevezetése révén az egészségügytől a játékiparon át a chatalapú ügynökökig és az ügyfélszolgálatig mindenhol jelentős költségcsökkenés vált lehetségessé, ahogy a kezdeti pilotoktól a milliós felhasználói bázisig terjed az adattömeg.

Látványos megtakarítás az MI-alapú szolgáltatásokban

Sully.ai 90%-kal, azaz tízszeresen csökkentette az MI-inferencia költségeit a Blackwell-alapú Baseten szolgáltatónál, miközben a rendszer válaszideje is 65%-kal javult. Ennek következtében az orvosok több mint 30 millió percnyi munkaidőt spóroltak meg, mivel a digitális orvosi adatrögzítés teljesen automatizálhatóvá vált.
Az MI-játékplatformon, az AI Dungeonön (MI Börtön) a Latitude négyszeres költségcsökkenést ért el, miután a nagy, úgynevezett MoE (mixture-of-experts) modelleket üzemeltette a DeepInfra Blackwell-infrastruktúráján. Egymillió token kiszolgálása így 74 forintba került a Hopper platform 149 forintjával szemben, míg az NVFP4 formátum bevezetése után ez megfeleződött, mindössze 37 forintra. Érdemes kiemelni, hogy a puszta hardverváltás csak kétszeres csökkenést jelentett, de a további fejlesztésekkel sikerült elérni a négyszeres eredményt.
A Sentient Foundation ügynök-chat platformján a Fireworks AI Blackwell-optimalizált stackjével 25–50%-kal sikerült javítani a költséghatékonyságon. Egy hét alatt 5,6 millió kérést dolgoztak fel vírusszerű növekedés mellett, miközben az átlagos késleltetés végig alacsony maradt.
Az ügyfélszolgálatban is új korszak kezdődött: a Decagon Blackwell-alapú Together AI-rendszerrel hatszoros költségcsökkenést ért el a hangalapú MI-támogatásban, a válaszidő pedig 400 milliszekundum alatt maradt – kritikus szint, hiszen hangalapú ügyfélszolgálatnál minden tizedmásodperc számít.

Tízszeres megtakarítás: hátterében a technika

A tapasztalt költségcsökkenés három tényezőből áll össze: új precizitásformátumok, a modellek architektúrája és az optimalizált szoftverstack.
A Latitude példája jól mutatja: először a Hopperről Blackwellre váltás hozott kétszeres eredményt, majd az NVFP4 alacsony precizitású formátumra való átállás további duplázást hozott. Az NVFP4 ugyanis úgy csökkenti a memória- és számítási igényt, hogy a pontosság megmarad – különösen jól működik akkor, ha MoE-modelleket használnak, és minden egyes kérésnél csak egy részmodellt aktiválnak.
A modellek architektúrája sem elhanyagolható: a MoE-rendszerek profitálnak a Blackwell NVLink-struktúrájából, ahol a „szakértő” modellek szinte azonnal kommunikálni tudnak egymással. Ezzel szemben a klasszikus „sűrű” modelleknél, amelyek minden paramétert aktiválnak minden kérésnél, ez az előny kevésbé érvényesül.

Az integrált szoftverstack szintén komoly különbséget okoz. Az Nvidia Blackwell hardvere, az NVL72-architektúra, valamint a Dynamo és TensorRT-LLM szoftverek együttes optimalizálása további eredményeket hoz. Például a Basetennél, a Sully.ai esetében így tudták elérni a tízszeres költségcsökkenést – akik viszont más rendszerrel, például vLLM-mel dolgoznak, szerényebb megtakarítást tapasztalnak.
Fontos megjegyezni, hogy a Blackwell különösen jól teljesít „reasoning”, azaz összetett következtetést igénylő modelleknél, amelyeknél sok token keletkezik egy válaszhoz. Ennek oka, hogy a Blackwell szerverei hatékonyan képesek a hosszú kontextusok kezelésére, amikor a kérdés előkészítése (context prefill) és a tokengenerálás szétválasztva történik.

Mire figyelj, mielőtt Blackwellre váltasz?

Nem csak az Nvidia Blackwell kínál költségcsökkentő lehetőséget: az AMD MI300, a Google TPU-család vagy például a Groq és a Cerebras speciális gyorsítói szintén alternatívák lehetnek. A felhőszolgáltatók (AWS, Google Cloud, Azure) tovább optimalizálnak, így a kérdés mindig az, hogy a konkrét munkaterheléshez melyik összeállítás a legmegfelelőbb.
Érdemes kiemelni, hogy a bemutatott 6–10-szeres teljesítményjavulás mind nagy volumenű, késleltetés-érzékeny alkalmazásoknál jelentkezett, ahol havonta akár több millió kérés fut át a rendszeren. Akiknél a válaszidő kevésbé kritikus, előbb ismerkedjenek a szoftveres optimalizálással vagy modelleváltással, hardvercsere nélkül is jelentős megtakarítás jöhet.
Minden teszteredménynek érdemes utánajárni: a szolgáltatók által közölt teljesítménymutatók laboratóriumi ideálokat tükröznek – de a valódi hozzáadott értéket a saját, éles használat során tudod lemérni.
A bevezetés sorrendje is meghatározó lehet: a Latitude előbb váltott hardvert, majd az új precizitásformátumot vezette be, így kétszeres, majd négyszeres csökkentést ért el. Teljes architektúraváltás helyett érdemes lehet előbb a meglévő infrastruktúrán szoftvert optimalizálni, vagy nyílt modelleket futtatni – ez is elhozhatja az eredmény felét, drága új hardver nélkül.


Mérlegen a szolgáltatók és a teljes költség

Nem minden Blackwell-alapú felhőszolgáltatás ugyanolyan. Van, amelyik az Nvidia integrált szoftverstackjét használja (Dynamo, TensorRT-LLM), mások inkább alternatívákat (pl. vLLM). A technikai részletek valós teljesítménykülönbséget okoznak, ezért mindig ellenőrizni kell, hogy az adott szolgáltató melyik stacket kínálja.
A gazdasági döntést azonban nemcsak a tokenenkénti költség határozza meg. Ugyan a specializált, Blackwellre optimalizált szolgáltatók (Baseten, DeepInfra, Fireworks, Together AI) extra rugalmasságot hoznak, de külön menedzsmentet igényelnek. A nagy felhőszolgáltatóknál (AWS, Azure, Google Cloud) talán drágább ugyan a tokenenkénti ár, ám a működtetés egyszerűbb, jelentősen alacsonyabb adminisztrációval párosul.
Végső soron minden MI-fejlesztőnek magának kell kiszámolnia, melyik stratégia hozza el a legjobb ár-érték arányt az adott feladatnál.

2025, adminboss, venturebeat.com alapján

  • Te mit gondolsz arról, hogy mindent optimalizálni kell, vagy néha a kevesebb is elég?
  • Te átváltanál új hardverre, vagy inkább a meglévő rendszert próbálnád fejleszteni?


Legfrissebb posztok

MA 15:01

A Meta limitet szab az okosszemüvegek Conversation Focusának

👑 A Meta okosszemüvegei új korlátozást kaptak: már csak havi három órán át használható ingyen a Conversation Focus nevű funkció...

MA 14:31

Az amerikai kormány újra zöld utat ad Anthropic Mythos és Fable MI‑modelljeinek

Az Egyesült Államok Kereskedelmi Minisztériuma feloldotta az exporttilalmat az Anthropic két fejlett MI-modellje, a Mythos 5 és a Fable 5 esetében...

MA 10:25

Az amerikai kormány zöld utat ad a legerősebb Claude-oknak

Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...

MA 10:01

A Meta-leépítések után is cáfolja az MI miatti állásfélelmeket Zuckerberg

A technológiai iparban egyre nagyobb félelem övezi azt, hogy az MI széles körű elterjedése mennyi munkahely megszűnéséhez vezethet...

MA 09:25

A rejtélyesen eltűnő chatek: felháborodtak a Claude Code-felhasználók

Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...

MA 09:14

A Pokémon GO júliusa: új raidfőnökök, kiemelt órák, GO Fest-őrület

Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 7/1

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...

MA 09:01

Az MI rejtett szívkockázati jelre bukkant a százéves EKG-ban

❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...

MA 08:37

A NASA négy új robotküldetéssel tör utat a holdbázisnak

🚀 Megemlíthető, hogy az amerikai űrügynökség egyre nagyobb lendülettel dolgozik azon, hogy hosszú távú emberi jelenlétet teremtsen a Holdon...

MA 08:25

Az MI-lökéshullám felpörgeti a Dell bevételeit, de messze nem aranybánya

Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...

MA 08:13

A 6 milliós Pokémon-kártyalopásért több mint tíz év börtönt kapott

💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...

MA 08:01

A Szamóca-hold ma este: az év legalacsonyabb, apró teliholdja

🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...

MA 07:48

Az Android 17 új zárképernyő-trükkje bárkit elbuktat betöréskor

Az Android 17 jelentős szigorításokat vezet be a zárolóképernyőn, amellyel gyakorlatilag ellehetetleníti a PIN vagy jelszó feltörését...

MA 07:36

A kínai Lineshine szuperszámítógép világrekorder: közel 2 kvadrillió művelet/mp

A kínai LineShine szuperszámítógép most először szerezte meg a világelsőséget a számítási sebesség terén...

MA 07:25

Az amerikai agrárminisztérium 180 millió legyet enged szabadon – íme, miért

A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...

MA 07:13

A Microsoft felpörgeti kvantumbiztos ütemtervét, nőnek a kockázatok

⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...

MA 06:49

Az MI‑böngészők új réme: a BioShocking-adatlopás

Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...

MA 06:37

A Samsung szó szerint átformálja a hajlítható telefonjait?

Ahogy beköszönt a nyár, egyre hangosabbak a pletykák a Samsung legújabb összehajtható telefonjairól...

MA 06:06

Történelmi események a mai napon (Július 1.)

Ma háborúk fordulópontjai, birodalmak átrendeződései és új korszakokat nyitó tudományos, társadalmi mérföldkövek találkoznak...

MA 06:01

Az okosabb botvédelem mostantól megóvja a Teams-megbeszéléseket

🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...

kedd 18:32

A Cleveland-i Fed elnöke szerint MI fűti az inflációt – jöhet újabb kamatemelés

A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...

kedd 18:01

A Samsung Messages júliusban leáll: ezt az 5 dolgot tedd meg azonnal!

⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...

kedd 17:02

Az új CRISPR az epigenomot célozza, átírja a gének kapcsolóit

🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..

kedd 16:31

A Tata Electronicsnál múlt héten kiszivárogtak érzékeny iPhone-beszállítói adatok

Az elmúlt héten hatalmas adatlopás történt az indiai Tata Electronicsnál, ahol közel 630 GB-nyi bizalmas információ került illetéktelen kezekbe...

kedd 16:01

A YouTube-on már nézhető a Peacock – épp a vb-re!

A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...

kedd 15:01

A Blackfield 2 millió dollárt követel a Nidec-től

💸 A világ egyik legnagyobb motor- és elektronikai alkatrészgyártójaként ismert, több mint 100 ezer embert foglalkoztató japán Nidec Corporation most hatalmas nyomás alatt áll: a Blackfield zsarolóvírus-banda 2 millió dollárt, vagyis körülbelül 726 millió forintot követel tőle...

kedd 14:32

A Sentryn át eltérítették a Claude Code-ot; Datadog, PagerDuty, Jira is veszélyben

A Claude Code MI-ügynök elleni támadás meglepő módon mindent kikerült, amit ma védelemnek nevezünk...

kedd 12:01

A kínai szuperszámítógép a világ leggyorsabbja, lehagyta Amerikát

A kínai LineShine nevű szuperszámítógép lett a világ leggyorsabbja, első ízben 2017 óta, hogy ismét kínai gép vezeti a mezőnyt...

kedd 11:31

A tenger alatti alagutaké a jövő Shetlanden: összekötnék a szigeteket

🚦 Érdemes megvizsgálni, hogy a Shetland-szigetek vezetése radikális változtatásra készül a közlekedésben: egy 1,5 milliárd angol font (650 milliárd forint) értékű terv szerint az elöregedő kompokat víz alatti alagutak válthatják fel a következő nyolc éven belül...