MA 10:44

Az Nvidia 3 milliárd paraméteres MI-je lenyomja a nagyokat matekban, kódban

Az Nvidia 3 milliárd paraméteres MI-je lenyomja a nagyokat matekban, kódban
Az MI-modellek fejlesztésében sokáig azt hittük, hogy minél nagyobb és költségesebb egy modell, annál jobb eredményt ad. Most azonban az Nvidia Nemotron-Cascade 2 minden várakozást megcáfol. Mindössze 3 milliárd aktív paraméterével sorra nyeri a legrangosabb matematikai és programozói versenyeket, miközben a 30 milliárd összparaméterrel rendelkező MoE-architektúra igény szerint, okosan aktiválja az egyes szakértőit. Ennél is fontosabb, hogy az Nvidia most megosztotta a teljes, finomhangolás utáni tanítási eljárását, így bárki követheti a vállalati alkalmazásra szabott képzési receptet anélkül, hogy mindent a nulláról kellene felépítenie.

Megfizethető finomhangolás, mérnöki trükkök

Egy korszerű nagy nyelvi modell betanítása óriási költséggel jár: akár tíz-húszmilliárd forintot is felemészthet. A Nemotron-Cascade 2 viszont nem új modellként készült el. Az Nvidia már meglévő, kis méretű Nemotron-3-Nano modelljéből indultak ki, de a Cascade RL nevű, saját fejlesztésű utólagos tanítási lánccal minden benchmarkon felülmúlják az alapmodellt, sőt, sokszor még a kétszer-négyszer nagyobb testvéreket is megelőzik. Vagyis a siker kulcsa a jól megtervezett finomhangolási receptben rejlik, nem feltétlenül a nyers paraméterszámban. Ez minden vállalat számára vonzó lehetőség: nem kell a legnagyobb MI-t fejleszteni, ha van egy jobban vezérelt tanítási folyamat.

Cascade RL: megszelídített fejlesztés külön világokra

A jelenlegi nagy nyelvi modelleket többfeladatú tanulással szokás fejleszteni, de ilyenkor egy terület erősítése hajlamos lerontani a többi teljesítményét – ezt nevezik katasztrofális felejtésnek. A Cascade RL ezt azzal kerüli el, hogy szigorúan sorban, egyenként végzi el a megerősítéses tanulás (RL) lépéseit az egyes domainekre: először instrukciókövetés, aztán komplex tudományos, majd kódfeladatok, végül finomhangolás emberi preferenciákra és összetettebb programozási kihívásokra. Ekkor következik be a fordulat – a modell például a programozási tanulástól nem felejti el a matematikát, sőt, gyakran javul is benne. Minden domainen lehet igazítani a tanítás részletein, és a számítási kapacitás is hatékonyabban használható. Fontos, hogy a sorrend rugalmas: a fejlesztők a modell viselkedését figyelik, és ennek megfelelően döntenek a következő lépésről.

MOPD: a saját tudás tanít meg igazán

Hiába a körültekintő sorrend, az egyes RL-szakaszok között lehet kisebb teljesítményeltolódás, amikor a modell elveszít néhány, korábban elsajátított képességet. Ezt a problémát hidalja át a Multi-Domain On-Policy Distillation (MOPD), amellyel az egyes fázisok legjobb pillanatait „tanárként” használják fel – vagyis a saját legjobb korábbi mentéseik tanítják meg a végső diákmodellt. Így nem kell kívülről importálni drága tanár-MI-t, és elkerülhető a modellinkompatibilitás. Ráadásul a MOPD token-szinten dolgozik, nem egész mondatok szintjén, vagyis sokkal gyorsabban és kevesebb példával fejleszt, mint a hagyományos RL. E hatékonyság többek között azt eredményezte, hogy matematikai feladatokban 30 lépés alatt, míg emberi preferenciás kihívásokban 52 lépésben értek el mérföldkő szintű pontszámot, szemben az RLHF 160 lépésével.


Előnyök és árnyalatok: hol tarol, hol marad le

A Nemotron-Cascade 2 matematikában és programozásban a konkurens, többször nagyobb modellek orra alá tör borsot: a LiveCodeBench v6 kódolási platformon az eddigi rekorder Qwen3.5-35B-A3B-t és Qwen3.5-397B-A17B-t, valamint a Kimi-K2.5-1T-t is legyőzi (87,2 vs. 74,6/83,6/85,0). A matematikai HMMT 2025-ös versenyen is fej fej mellett teljesít a legnagyobb MI-kkel. Az ArenaHard megmérettetésen 83,5 pontot ér el, jelentősen előzve a kategóriáján belüli konkurenciát. Ha eszközintegrált következtetést is engedélyeznek, az AIME 2025-ön 98,6 pontig jut. Vagyis a modell a legnehezebb, logikai következtetést igénylő feladatokra optimalizált, nem pedig a lexikális, tudásalapú vagy összetettebb ügynökalapú párbeszédre. Ezeken a feladatokon, például az MMLU-Pro vagy a GPQA-Diamond teszteken, egy kicsit lemarad a legjobbak mögött.

Ezt vihetik magukkal a vállalati MI-csapatok

Az egész recept legnagyobb előnye, hogy vállalati környezetben komoly rugalmasságot ad: egy-egy új képesség hozzáadható anélkül, hogy nulláról kellene mindent újrakezdeni. A saját ellenőrzőpontokból származó tanárok révén nincs szükség költséges, külső referencia modellekre, minden az adott szervezet adataiból, saját tanítási futamaiból készíthető el. A Cascade RL szigorúan on-policy elven működik, külső regularizáció nélkül, és programozáshoz csupán 3500 „nehéz” feladaton is képes volt jelentősen felfejleszteni a modellt.

Intelligencia-sűrűség kevesebb paraméterrel

A fejlesztési trend most nem a paraméterszám további növelését, hanem az úgynevezett intelligencia-sűrűség maximalizálását célozza: mennyit tud egy adott aktív paraméter. Az Nvidia Cascade sorozata, a DeepSeek- és Qwen-modellek is ebbe az irányba tartanak. Nem mindegy, hogy egy 3 milliárd paraméteres modell költség- és válaszidőben mennyivel kedvezőbb, mint egy 70+-milliárd paraméteres óriás, miközben a célzott feladatokra már teljesen versenyképesek. Persze kérdés, hogy ez a módszer általánosabban is működik-e – például kevésbé ellenőrizhető vállalati problémákon –; ez még további kutatást kíván. De ahol a vállalati alkalmazások konkrét, jól mérhető logikai következtetést, üzleti modellezést, számítógépes vagy megfelelőségi elemzést várnak el, a most publikált recept az egyik legrészletesebb és legköltséghatékonyabb út a csúcs-MI-képességekhez.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 12:01

Az Apple visszahozza a WWDC-t: jönnek a nagy bejelentések

💻 Megemlíthető, hogy az Apple idén június 8–12. között rendezi meg éves Worldwide Developers Conference (WWDC) rendezvényét, amely immár online formában hozza össze a világ fejlesztőit egy hétre...

MA 11:45

Az iPhone-ok új réme: már bárki feltörheti a telefonodat

🔒 Egy frissen kiszivárgott szoftvercsomag most minden régebbi iPhone-t veszélybe sodor. A DarkSword nevű, iPhone-okat célzó exploit egyetlen letöltéssel beszerezhető a GitHubon, használatához pedig semmiféle különleges tudás nem kell – néhány kattintással a támadók teljes hozzáférést szerezhetnek a személyes adataidhoz...

MA 11:35

Az anyag legújabb csavarja: megszületett a fél-Möbiuszos molekula

Most először sikerült a vegyészeknek olyan, eddig ismeretlen szerkezetű molekulát létrehozni, amely fél-Möbiusz-topológiával rendelkezik...

MA 11:23

Az inzulintabletta átírhatja a cukorbetegség kezelésének szabályait

Az inzulintabletta ötlete több mint száz éve foglalkoztatja a tudósokat, de eddig mindig kudarcba fulladt: a bélrendszer lebontotta az inzulint, mielőtt eljutott volna a vérbe, így millióknak maradt a napi injekció...

MA 11:12

Az első érintős játékkonzol? A OnePlus nagy dobása

🕹 A mobilos játékosok világa hamarosan izgalmas újdonsággal bővülhet, mivel egy nagy gyártó, minden jel szerint a OnePlus, saját Android-alapú kézikonzol fejlesztésén dolgozik...

MA 10:57

Az autóbérlés forradalma: itt a Turo ChatGPT-alkalmazás

Mostantól kényelmesen kereshetsz és foglalhatsz bérautót a Turo ChatGPT-alkalmazásával, amely hétfőn indult el...

MA 10:51

Az AWS-nek meggyűlt a baja a Közel-Kelettel

Senki sem várta volna, hogy az iráni konfliktus ennyire felkavarja a felhőszolgáltatásokat a Közel-Keleten...

MA 10:37

A TeamPCP hackercsoport támadásra készül az iráni rendszerek ellen

🗡 A TeamPCP nevű hackercsoport újabb támadási hullámba kezdett: Kubernetes-klasztereket vesz célba egy olyan kártékony szkripttel, amely minden gépet letöröl, amint iráni konfigurációt észlel...

MA 10:22

Az MI-vezérelt slime már beszélget veled a Dragon Quest X-ben

A Dragon Quest X rajongói hamarosan egy különleges újdonsággal találkozhatnak: a játékban felbukkanó klasszikus slime-karakter mostantól Chatty Slimey néven MI-alapú chatbottá válik...

MA 10:17

A Juno űrszonda még mindig lenyűgöző felfedezéseket tesz a Jupiterről

A Jupiter hatalmas viharaiban keletkező villámok ereje legalább százszorosa a földi villámcsapásokénak – derült ki a NASA Juno űrszondájának adataiból...

MA 10:01

Az emberiség visszatér az űrbe: indul az Artemis II

🚀 Több mint ötven évvel az utolsó Apollo-misszió után most tényleg történelmet ír a NASA: az Artemis II készen áll arra, hogy újra embereket küldjön a Holdhoz...

MA 09:57

Az OpenAI új eszköze rendet vág a ChatGPT-fájlok között

📂 Megérkezett a ChatGPT legújabb fejlesztése, a Könyvtár funkció, amellyel mostantól saját fájlokat és képeket lehet feltölteni és tárolni az OpenAI felhőalapú tárhelyén...

MA 09:43

Az ország megbénult: hackertámadás miatt autók ezrei álltak le

🚗 Jól mutatja, mi történik, ha a járművek indítását a technika gátolja: országszerte autók álltak le, amikor egy iowai cég rendszereit hackertámadás érte...

MA 09:36

Az óceán felmorajlott: pusztító földrengés rázta meg Tongát

🌊 Egy rendkívül erős, a Richter-skála szerinti 7,6-os földrengés rázta meg a dél-csendes-óceáni Tongához közeli térséget, ami miatt az alacsonyan fekvő szigetekről azonnali evakuálást rendeltek el...

MA 09:30

Miért él tovább az ősi idegenek mítosza?

👽 Az emberi kíváncsiság soha nem nyugszik, ezt bizonyítja, hogy egyesek ma is elhiszik: az ókori civilizációk legnagyobb vívmányai földönkívüli segítséggel születtek...

MA 09:22

Az okostelefonok tárhelyforradalma közeleg: tényleg búcsút intünk a 128 GB-nak?

Az okostelefonok világában új korszak kezdődik, hiszen már 2026-ban várhatóan jelentősen nő az átlagos tárhelyméret a készülékeken...

MA 09:15

Az USA kitiltja a külföldi routereket – most mindenki bajban?

Az Egyesült Államok lépett: a jövőben nem kerülhetnek forgalomba olyan otthoni hálózati routerek, amelyeket külföldön gyártanak...

MA 09:01

Az újabb bitcoin-botrány: egymásnak estek a bányászok

💰 A napokban ritka technikai esemény kavart hullámokat a Bitcoin világában: rövid időre két konkurens blokklánc jött létre, majd az egyik – végül – felülírta a másikat...

MA 08:57

A meglepő fogyás titka 50 feletti nőknél: hormonok és gyógyszerek

Lényeges szempont, hogy a változókor utáni nők átlagosan 35%-kal több súlyt adtak le, amikor a menopauzális hormonpótló terápiát a tirzepatiddal kombinálták...

MA 08:50

Az óriás Balancer leáll: a drasztikus átalakulás küszöbén

Egykor a decentralizált pénzügyek egyik vezető protokollja, a Balancer masszív leépítést és drasztikus szervezeti változást jelentett be, miután tavaly közel 40 milliárd forintnyi (110 millió USD) digitális eszköz tűnt el egy biztonsági rés miatt...

MA 08:37

Megérkezett a DeerFlow 2.0 – a vállalati MI-szuperügynök?

🚀 A ByteDance, a TikTok mögötti kínai technológiai óriás, február végén mutatta be a DeerFlow 2...

MA 08:30

Az Expert Review kálváriája: bukik a Grammarly, érkezik az utód

Nemrég sok szó esett arról, miért bukott el a Grammarly hírhedt Expert Review szolgáltatása...

MA 08:22

A klíma végképp felborult – ilyet még nem tapasztaltunk

🌡 Érdekes felvetés, hogy Földünk klímája mostanra elérte azt a pontot, amelyre a modern feljegyzések kezdete óta nem volt példa...

MA 08:15

A texasi gigaberuházás: Elon Musk forradalmi chipgyára

Elon Musk egy 9400 milliárd forint (25 milliárd USD) értékű óriásberuházásra készül: a texasi Austinban építi fel a Terafab névre keresztelt chipgyárat...

MA 08:01

Az olaj újra 100 dollár fölött – forr a Közel-Kelet

Az olaj ára kedden ismét jelentősen emelkedett, miután az előző napok jelentős zuhanását a közel-keleti konfliktus fejleményei felülírták...

MA 07:57

Az Apple reklámokat hoz a Térképekbe – minket is elárasztanak?

Ha már unod, hogy mindenhol reklám van, készülj fel: az Apple következő célpontja a Térképek (Apple Maps)!..

MA 07:37

Az emberi bélvírusok lehetnek a stabil vércukor titkos kulcsai?

A bélben élő vírusok, más néven a bélvirom, nemcsak jelen vannak, hanem aktívan befolyásolhatják a szervezet szénhidrát-anyagcseréjét...

MA 07:29

Az újabb Mazda-botrány: kiszivárogtak a dolgozók és partnerek adatai

🚗 A Mazda Motor Corporation tavaly decemberben súlyos biztonsági incidenst észlelt, amely során munkavállalói és üzleti partnerei adatai kerültek veszélybe...

MA 07:22

Az LG áttöri a határokat: 1–120 Hz között állítható képfrissítés

Az LG Display új korszakot nyit a laptopok világában, hiszen elindította az Oxide 1Hz nevű LCD-kijelzők sorozatgyártását, amely képes automatikusan igazodni a tartalomhoz, és 1 Hz-től akár 120 Hz-ig változtatni a képfrissítési frekvenciát...