2026. 03. 24., 10:44

Az Nvidia 3 milliárd paraméteres MI-je lenyomja a nagyokat matekban, kódban

Az Nvidia 3 milliárd paraméteres MI-je lenyomja a nagyokat matekban, kódban
Az MI-modellek fejlesztésében sokáig azt hittük, hogy minél nagyobb és költségesebb egy modell, annál jobb eredményt ad. Most azonban az Nvidia Nemotron-Cascade 2 minden várakozást megcáfol. Mindössze 3 milliárd aktív paraméterével sorra nyeri a legrangosabb matematikai és programozói versenyeket, miközben a 30 milliárd összparaméterrel rendelkező MoE-architektúra igény szerint, okosan aktiválja az egyes szakértőit. Ennél is fontosabb, hogy az Nvidia most megosztotta a teljes, finomhangolás utáni tanítási eljárását, így bárki követheti a vállalati alkalmazásra szabott képzési receptet anélkül, hogy mindent a nulláról kellene felépítenie.

Megfizethető finomhangolás, mérnöki trükkök

Egy korszerű nagy nyelvi modell betanítása óriási költséggel jár: akár tíz-húszmilliárd forintot is felemészthet. A Nemotron-Cascade 2 viszont nem új modellként készült el. Az Nvidia már meglévő, kis méretű Nemotron-3-Nano modelljéből indultak ki, de a Cascade RL nevű, saját fejlesztésű utólagos tanítási lánccal minden benchmarkon felülmúlják az alapmodellt, sőt, sokszor még a kétszer-négyszer nagyobb testvéreket is megelőzik. Vagyis a siker kulcsa a jól megtervezett finomhangolási receptben rejlik, nem feltétlenül a nyers paraméterszámban. Ez minden vállalat számára vonzó lehetőség: nem kell a legnagyobb MI-t fejleszteni, ha van egy jobban vezérelt tanítási folyamat.

Cascade RL: megszelídített fejlesztés külön világokra

A jelenlegi nagy nyelvi modelleket többfeladatú tanulással szokás fejleszteni, de ilyenkor egy terület erősítése hajlamos lerontani a többi teljesítményét – ezt nevezik katasztrofális felejtésnek. A Cascade RL ezt azzal kerüli el, hogy szigorúan sorban, egyenként végzi el a megerősítéses tanulás (RL) lépéseit az egyes domainekre: először instrukciókövetés, aztán komplex tudományos, majd kódfeladatok, végül finomhangolás emberi preferenciákra és összetettebb programozási kihívásokra. Ekkor következik be a fordulat – a modell például a programozási tanulástól nem felejti el a matematikát, sőt, gyakran javul is benne. Minden domainen lehet igazítani a tanítás részletein, és a számítási kapacitás is hatékonyabban használható. Fontos, hogy a sorrend rugalmas: a fejlesztők a modell viselkedését figyelik, és ennek megfelelően döntenek a következő lépésről.

MOPD: a saját tudás tanít meg igazán

Hiába a körültekintő sorrend, az egyes RL-szakaszok között lehet kisebb teljesítményeltolódás, amikor a modell elveszít néhány, korábban elsajátított képességet. Ezt a problémát hidalja át a Multi-Domain On-Policy Distillation (MOPD), amellyel az egyes fázisok legjobb pillanatait „tanárként” használják fel – vagyis a saját legjobb korábbi mentéseik tanítják meg a végső diákmodellt. Így nem kell kívülről importálni drága tanár-MI-t, és elkerülhető a modellinkompatibilitás. Ráadásul a MOPD token-szinten dolgozik, nem egész mondatok szintjén, vagyis sokkal gyorsabban és kevesebb példával fejleszt, mint a hagyományos RL. E hatékonyság többek között azt eredményezte, hogy matematikai feladatokban 30 lépés alatt, míg emberi preferenciás kihívásokban 52 lépésben értek el mérföldkő szintű pontszámot, szemben az RLHF 160 lépésével.


Előnyök és árnyalatok: hol tarol, hol marad le

A Nemotron-Cascade 2 matematikában és programozásban a konkurens, többször nagyobb modellek orra alá tör borsot: a LiveCodeBench v6 kódolási platformon az eddigi rekorder Qwen3.5-35B-A3B-t és Qwen3.5-397B-A17B-t, valamint a Kimi-K2.5-1T-t is legyőzi (87,2 vs. 74,6/83,6/85,0). A matematikai HMMT 2025-ös versenyen is fej fej mellett teljesít a legnagyobb MI-kkel. Az ArenaHard megmérettetésen 83,5 pontot ér el, jelentősen előzve a kategóriáján belüli konkurenciát. Ha eszközintegrált következtetést is engedélyeznek, az AIME 2025-ön 98,6 pontig jut. Vagyis a modell a legnehezebb, logikai következtetést igénylő feladatokra optimalizált, nem pedig a lexikális, tudásalapú vagy összetettebb ügynökalapú párbeszédre. Ezeken a feladatokon, például az MMLU-Pro vagy a GPQA-Diamond teszteken, egy kicsit lemarad a legjobbak mögött.

Ezt vihetik magukkal a vállalati MI-csapatok

Az egész recept legnagyobb előnye, hogy vállalati környezetben komoly rugalmasságot ad: egy-egy új képesség hozzáadható anélkül, hogy nulláról kellene mindent újrakezdeni. A saját ellenőrzőpontokból származó tanárok révén nincs szükség költséges, külső referencia modellekre, minden az adott szervezet adataiból, saját tanítási futamaiból készíthető el. A Cascade RL szigorúan on-policy elven működik, külső regularizáció nélkül, és programozáshoz csupán 3500 „nehéz” feladaton is képes volt jelentősen felfejleszteni a modellt.

Intelligencia-sűrűség kevesebb paraméterrel

A fejlesztési trend most nem a paraméterszám további növelését, hanem az úgynevezett intelligencia-sűrűség maximalizálását célozza: mennyit tud egy adott aktív paraméter. Az Nvidia Cascade sorozata, a DeepSeek- és Qwen-modellek is ebbe az irányba tartanak. Nem mindegy, hogy egy 3 milliárd paraméteres modell költség- és válaszidőben mennyivel kedvezőbb, mint egy 70+-milliárd paraméteres óriás, miközben a célzott feladatokra már teljesen versenyképesek. Persze kérdés, hogy ez a módszer általánosabban is működik-e – például kevésbé ellenőrizhető vállalati problémákon –; ez még további kutatást kíván. De ahol a vállalati alkalmazások konkrét, jól mérhető logikai következtetést, üzleti modellezést, számítógépes vagy megfelelőségi elemzést várnak el, a most publikált recept az egyik legrészletesebb és legköltséghatékonyabb út a csúcs-MI-képességekhez.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 19:56

A feltörekvő piacokon banki appként használják a kriptotőzsdéket

Felmerül a kérdés, miért váltak a kriptovaluták ilyen népszerűvé a feltörekvő országokban...

MA 19:45

A fülesfókák szíve csak partraszállás után pörög fel

A hosszú, mély merülések extrém terhelést jelentenek a tengeri emlősöknek. Ilyenkor a szív és az agy kivételével a többi szerv áttér oxigén nélküli anyagcserére, aminek következtében tejsav halmozódik fel...

MA 19:34

A bistrifluron 95%-ban irtja a termeszeket, emberre veszélytelen

A szárazfatermeszek mesterien rejtőzködnek, fából készült épületek belsejében csendben táplálkoznak és gyarapodnak, míg a tulajdonosok csak a károk észlelése után szembesülnek a jelenlétükkel...

MA 19:25

A OnePlus 15R két hét alatt új szintre tette az üzemidőt

🔋 Két hét használat után a OnePlus 15R egészen új szintre emelte az okostelefonos üzemidő fogalmát...

MA 19:13

A fizikusok olyan kvantumrészecskéket fedeztek fel, amelyek felrúgják a valóság szabályait

Különösen említést érdemel, hogy a fizikusok hosszú ideig két típusba sorolták az elemi részecskéket: boszonokra és fermionokra...

MA 19:01

A jégkori kínaiak megdöbbentően fejlett kőeszközöket készítettek 146 ezer éve

🔨 Érdemes megvizsgálni, hogy a modern ember ősrokonai mennyire képesek voltak alkalmazkodni a szélsőséges körülményekhez: a közép-kínai Lingjing lelőhely feltárásán kivételesen fejlett kőeszközökre bukkantak, amelyek körülbelül 146 ezer évvel ezelőtt készültek...

MA 18:57

A szándékalapú káoszteszt akkor kell, amikor az MI magabiztosan téved

A mai vállalatok egyre bátrabban telepítenek autonóm MI-rendszereket, ám ezek magától értetődő magabiztossággal képesek váratlanul, akár katasztrofálisan hibázni...

MA 18:34

Lehet, hogy már elkéstünk: bajban a Bitcoin a kvantumkor előtt

A kvantumszámítógépek megjelenése alapvetően fenyegeti a világgazdaság digitális alapjait, ráadásul már most csak néhány év maradt a védekezésre...

MA 18:23

Az Abiotic Factor brutál frissítése: okosabb kedvencek, őrült kémia, végre felmosó

🚀 Érdemes megjegyezni, hogy az Abiotikus tényező fejlesztői ismét egy hatalmas frissítést adtak ki, amely tovább bővíti a játék eleve hatalmas világát...

MA 14:46

Az EU a VPN-ekre készül rászállni – közeleg a tiltóhullám?

😱 Az online világ minden eddiginél bonyolultabbá vált, különösen, ha a fiatalok védelméről van szó...

MA 14:35

Az emberiség már a Marsig vezető gyorssáv küszöbén áll?

🚀 Érdekes, hogy a tudományos világ ezen a héten egyszerre foglalkozik különös víruskitöréssel, űrutazási forradalommal és kvantumakkumulátorral...

MA 14:24

A téridő királynője, Max Caulfield, átveszi Gordon Freeman helyét

👑 Mi történik, ha a Half-Life világában nem csendes tudós, hanem egy időutazós tinédzser lesz a főhős?..

MA 13:24

A hét 7 legnagyobb tech-sztorija: Apple-kártérítés, vadonatúj Fitbit

Május második hetének technológiai újdonságai minden eddiginél színesebbek: fizetős kárpótlás az iPhone-tulajdonosoknak, egy új „zseniális” Google Fitbit, legendás játék visszatérése Switch 2 konzolra, valamint a Vine feltámadása is elfért a hét legfontosabb techhírei között...

MA 13:12

Az okosodás ára: miért zsugorodik az agyunk?

Az emberi agy mérete nem feltétlenül áll szoros összefüggésben az intelligenciával...

MA 13:02

A nagy MI-per: Musk kontra Altman 55 ezermilliárdért

Elon Musk és Sam Altman, akik egykor jó viszonyban álltak, ma egymás esküdt ellenségeiként állnak szemben a kaliforniai bíróságon...

MA 12:56

Az első futóórádhoz: ezek a legjobb olcsó órák és karpántok

Az első futóóra kiválasztása nehéz döntés lehet, főleg, ha az ember úgy érzi, felesleges súlyos összegeket költeni egy apró kütyüre...

MA 12:45

Az IKEA tárolási ötleteivel kétszer akkora lesz a dolgozószobád, átalakítás nélkül

📦 Jellemző, hogy ha zsúfolt, rendezetlen az otthoni dolgozószoba, rögtön nehezebb a koncentráció, mint amikor az asztalon és a szobában is rend van...

MA 12:35

A Surfshark figyelmeztet: ázsiai utazási appok csendben gyűjtik az adataid

👑 Aki Ázsiába utazik, hamar szembesül azzal, hogy a helyi közlekedéshez, ételrendeléshez és tájékozódáshoz kötelező letölteni az ottani appokat, hiszen az európai vagy magyar alkalmazások gyakran használhatatlanok...

MA 12:23

Az 899 dolláros, AI-kész RTX 5060-as PC: megéri?

Ilyen eset például, amikor egy új játékra vagy irodai munkára keresel számítógépet, de a RAM-árak az egekben járnak, így nehéz jó ár-érték arányú, előre összeszerelt gépet találni...

MA 11:01

Az Elder Scrolls után a hős modder Pip-Boyra vitte a Falloutot

Modderek körében népszerű ötlet, hogy klasszikus játékokat integrálnak a modern környezetbe, de kevesen viszik ezt olyan extrém szintre, mint RPGKing117, aki sorra varázsolja be a legendás szerepjátékokat a Fallout 4 univerzumába...

MA 10:52

Az új TCL QM8L: lenyűgöző mini-LED tévé remek áron, apró furcsákkal

📺 Az új TCL QM8L lenyűgöző képet kínál, amit a gyártó fejlett Mini‑LED háttérvilágítása és halo‑korlátozó technológiája biztosít...

MA 10:36

Nézd a Sporzát ingyen bárhonnan: foci, tenisz, kerékpár

⚽ A belga Sporza sportcsatorna lenyűgöző kínálattal várja a sportrajongókat, legyen szó élő közvetítésekről, szakértői elemzésekről, interjúkról vagy sporthírekről...

MA 10:22

Beleolvad a mezőnybe – és ez benne a lényeg: FlexiSpot C7 Morpher teszt

💻 A FlexiSpot C7 Morpher első pillantásra egy teljesen átlagos konferenciatermi szék benyomását kelti...

MA 09:36

A hírhedt kettősgyilkos Betty Broderick 78 évesen meghalt

Véget ért egy amerikai bűnügyi saga: a 78 éves Betty Broderick elhunyt, akit egykor kettős gyilkosság miatt ítéltek el Kaliforniában...

MA 09:29

A bíró engedélyezi: az Aave Észak-Koreához köthető, 25 milliárd forintnyi ETH-t mozgat

💸 Egy amerikai szövetségi bíró engedélyezte, hogy az Aave elindítsa helyreállítási tervét: 71 millió dollárnyi (kb...

MA 09:22

A Skywind megamod lélegzetelállítóan új életet lehel a Morrowindbe

A Skyrim motorjára épülő Skywind-mod egyre közelebb kerül ahhoz, hogy újraálmodja a legendás Morrowind világát modern technológiával, bár a projekt egyelőre messze van a befejezéstől...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/9

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Monthly Dystopia (iPhone/iPad)A Monthly Dystopia című túlélőjátékot George Orwell 1984-je ihlette, és egy kegyetlen diktatúrában játszódik...

MA 09:09

A nagy leleplezés jön: megnyílnak az amerikai UFO-akták

Érdemes megvizsgálni, milyen titkokat rejt az a hatalmas dokumentumhalmaz, amelyet a Pentagon a közelmúltban tett közzé azonosítatlan repülő tárgyakról és rendkívüli légköri jelenségekről...

MA 09:01

Az OpenAI hangja GPT-5 szintre lép – jönnek a valódi asszisztensek

Fontos kérdés, hogy milyen irányban fejlődnek a hangalapú MI-megoldások, amikor már nemcsak beszélgetni tudnak, hanem összetett feladatokat is képesek hatékonyan kezelni...