2026. 03. 24., 10:44

Az Nvidia 3 milliárd paraméteres MI-je lenyomja a nagyokat matekban, kódban

Az Nvidia 3 milliárd paraméteres MI-je lenyomja a nagyokat matekban, kódban
Az MI-modellek fejlesztésében sokáig azt hittük, hogy minél nagyobb és költségesebb egy modell, annál jobb eredményt ad. Most azonban az Nvidia Nemotron-Cascade 2 minden várakozást megcáfol. Mindössze 3 milliárd aktív paraméterével sorra nyeri a legrangosabb matematikai és programozói versenyeket, miközben a 30 milliárd összparaméterrel rendelkező MoE-architektúra igény szerint, okosan aktiválja az egyes szakértőit. Ennél is fontosabb, hogy az Nvidia most megosztotta a teljes, finomhangolás utáni tanítási eljárását, így bárki követheti a vállalati alkalmazásra szabott képzési receptet anélkül, hogy mindent a nulláról kellene felépítenie.

Megfizethető finomhangolás, mérnöki trükkök

Egy korszerű nagy nyelvi modell betanítása óriási költséggel jár: akár tíz-húszmilliárd forintot is felemészthet. A Nemotron-Cascade 2 viszont nem új modellként készült el. Az Nvidia már meglévő, kis méretű Nemotron-3-Nano modelljéből indultak ki, de a Cascade RL nevű, saját fejlesztésű utólagos tanítási lánccal minden benchmarkon felülmúlják az alapmodellt, sőt, sokszor még a kétszer-négyszer nagyobb testvéreket is megelőzik. Vagyis a siker kulcsa a jól megtervezett finomhangolási receptben rejlik, nem feltétlenül a nyers paraméterszámban. Ez minden vállalat számára vonzó lehetőség: nem kell a legnagyobb MI-t fejleszteni, ha van egy jobban vezérelt tanítási folyamat.

Cascade RL: megszelídített fejlesztés külön világokra

A jelenlegi nagy nyelvi modelleket többfeladatú tanulással szokás fejleszteni, de ilyenkor egy terület erősítése hajlamos lerontani a többi teljesítményét – ezt nevezik katasztrofális felejtésnek. A Cascade RL ezt azzal kerüli el, hogy szigorúan sorban, egyenként végzi el a megerősítéses tanulás (RL) lépéseit az egyes domainekre: először instrukciókövetés, aztán komplex tudományos, majd kódfeladatok, végül finomhangolás emberi preferenciákra és összetettebb programozási kihívásokra. Ekkor következik be a fordulat – a modell például a programozási tanulástól nem felejti el a matematikát, sőt, gyakran javul is benne. Minden domainen lehet igazítani a tanítás részletein, és a számítási kapacitás is hatékonyabban használható. Fontos, hogy a sorrend rugalmas: a fejlesztők a modell viselkedését figyelik, és ennek megfelelően döntenek a következő lépésről.

MOPD: a saját tudás tanít meg igazán

Hiába a körültekintő sorrend, az egyes RL-szakaszok között lehet kisebb teljesítményeltolódás, amikor a modell elveszít néhány, korábban elsajátított képességet. Ezt a problémát hidalja át a Multi-Domain On-Policy Distillation (MOPD), amellyel az egyes fázisok legjobb pillanatait „tanárként” használják fel – vagyis a saját legjobb korábbi mentéseik tanítják meg a végső diákmodellt. Így nem kell kívülről importálni drága tanár-MI-t, és elkerülhető a modellinkompatibilitás. Ráadásul a MOPD token-szinten dolgozik, nem egész mondatok szintjén, vagyis sokkal gyorsabban és kevesebb példával fejleszt, mint a hagyományos RL. E hatékonyság többek között azt eredményezte, hogy matematikai feladatokban 30 lépés alatt, míg emberi preferenciás kihívásokban 52 lépésben értek el mérföldkő szintű pontszámot, szemben az RLHF 160 lépésével.


Előnyök és árnyalatok: hol tarol, hol marad le

A Nemotron-Cascade 2 matematikában és programozásban a konkurens, többször nagyobb modellek orra alá tör borsot: a LiveCodeBench v6 kódolási platformon az eddigi rekorder Qwen3.5-35B-A3B-t és Qwen3.5-397B-A17B-t, valamint a Kimi-K2.5-1T-t is legyőzi (87,2 vs. 74,6/83,6/85,0). A matematikai HMMT 2025-ös versenyen is fej fej mellett teljesít a legnagyobb MI-kkel. Az ArenaHard megmérettetésen 83,5 pontot ér el, jelentősen előzve a kategóriáján belüli konkurenciát. Ha eszközintegrált következtetést is engedélyeznek, az AIME 2025-ön 98,6 pontig jut. Vagyis a modell a legnehezebb, logikai következtetést igénylő feladatokra optimalizált, nem pedig a lexikális, tudásalapú vagy összetettebb ügynökalapú párbeszédre. Ezeken a feladatokon, például az MMLU-Pro vagy a GPQA-Diamond teszteken, egy kicsit lemarad a legjobbak mögött.

Ezt vihetik magukkal a vállalati MI-csapatok

Az egész recept legnagyobb előnye, hogy vállalati környezetben komoly rugalmasságot ad: egy-egy új képesség hozzáadható anélkül, hogy nulláról kellene mindent újrakezdeni. A saját ellenőrzőpontokból származó tanárok révén nincs szükség költséges, külső referencia modellekre, minden az adott szervezet adataiból, saját tanítási futamaiból készíthető el. A Cascade RL szigorúan on-policy elven működik, külső regularizáció nélkül, és programozáshoz csupán 3500 „nehéz” feladaton is képes volt jelentősen felfejleszteni a modellt.

Intelligencia-sűrűség kevesebb paraméterrel

A fejlesztési trend most nem a paraméterszám további növelését, hanem az úgynevezett intelligencia-sűrűség maximalizálását célozza: mennyit tud egy adott aktív paraméter. Az Nvidia Cascade sorozata, a DeepSeek- és Qwen-modellek is ebbe az irányba tartanak. Nem mindegy, hogy egy 3 milliárd paraméteres modell költség- és válaszidőben mennyivel kedvezőbb, mint egy 70+-milliárd paraméteres óriás, miközben a célzott feladatokra már teljesen versenyképesek. Persze kérdés, hogy ez a módszer általánosabban is működik-e – például kevésbé ellenőrizhető vállalati problémákon –; ez még további kutatást kíván. De ahol a vállalati alkalmazások konkrét, jól mérhető logikai következtetést, üzleti modellezést, számítógépes vagy megfelelőségi elemzést várnak el, a most publikált recept az egyik legrészletesebb és legköltséghatékonyabb út a csúcs-MI-képességekhez.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...