Az Nvidia pótolja az amerikai MI‑modellek hiányát

Az Nvidia pótolja az amerikai MI‑modellek hiányát
Ilyen eset például, amikor a vállalatok azért nem vezetnek be MI-t, mert nincs elérhető, kiváló minőségű, nyílt súlyú modell, amely mellett nem merül fel az adatszivárgás veszélye. Senki nem szeretné egyetlen API-hívás miatt kockáztatni az ügyféladatokat vagy érzékeny szellemi tulajdont – ez kizárja a zárt modelleket, mint a ChatGPT-t. Amerikában az elérhető nyílt súlyú modellek nem érik utol az OpenAI vagy az Anthropic szintjét, ami nemcsak az MI elterjedését akadályozza, hanem gátat vet az Nvidia ügynökjellegű MI-víziójának is.

Három új nyílt súlyú modell: minden igényre

Az Nvidia most három új, saját tervezésű, nyílt súlyú LLM-mel (nagy nyelvi modellel) bővítette kínálatát: a Nemotron 3 három méretben, Nano (30 milliárd paraméter), Super (100 milliárd) és Ultra (500 milliárd) változatban készül. Ezek nem csupán a vállalati felhasználást célozzák, hanem teljesen nyíltak is: az Nvidia nemcsak a súlyokat, hanem a tanító adatokat és a megerősítéses tanuláshoz használt környezeteket is elérhetővé teszi. Ez lehetővé teszi, hogy bárki személyre szabhassa a modellt egyedi alkalmazásokhoz.

Fejlett architektúra nagy dokumentumokra és gyors futásra

Az új modellek újszerű, hibrid MoE (mixture-of-experts, szakértőalapú) architektúrát használnak, amelyet hosszú szövegek – például több ezer oldalas dokumentumok – gyors feldolgozására terveztek. A Mamba-2 és a Transformer-rétegek kombinációjának köszönhetően akár egymillió tokenes szövegeket is kezelni tudnak: ez kb. 3 000 dupla sorközű oldalnak felel meg. A Mamba-2 főként a hosszabb szekvenciáknál hatékonyabb, így gyorsabb feldolgozást, stabilabb kimenetet tesz lehetővé, míg a Transformer precíz gondolkodást és témakövetést biztosít, hogy a modell ne veszítse el a fonalat.

Kevesebb memória, nagyobb szabadság, gyorsabb működés

A MoE architektúra lényege, hogy a paramétereknek csak egy töredéke dolgozik minden generált tokennél, ezért az új Nemotron modellek jóval kevesebb memóriát igényelnek, így ugyanazon a hardveren gyorsabbak, mint a sűrű modellek. Például a 30 milliárdos Nanónál csak 3 milliárd aktív egyszerre. A nagyobb modelleknél, mint a Super és az Ultra, megjelenik az NVFP4 adatformátum és a fejlettebb, úgynevezett látens MoE: itt a szakértők közös rejtett reprezentáción dolgoznak, majd innen vetítik vissza az eredményt, ami négyszer annyi szakértő bevetését teszi lehetővé ugyanannyi költséggel.


Spekulatív dekódolás és testreszabhatóság

Speciális újdonság, hogy a modellek képesek egyszerre több token előrejelzésére (multi-token prediction, azaz egyfajta spekulatív dekódolás), ami akár háromszoros gyorsulást hozhat, például kódszerkesztők vagy más intelligens asszisztensek esetében. A Nemotron 3 Nano már ezen a héten letölthető – vállalati hardveren, mint az L40S vagy az RTX Pro 6000 Server Edition, vagy akár mindössze 24 GB-os GPU-kon is, 4 bites kvantált változatban.

Végül a modellek teljesítménye vetekszik a gpt-oss-20B vagy a Qwen3 VL 32B modellekkel, testreszabhatóságuk viszont jóval nagyobb: az Nvidia úgynevezett NeMo Gym-környezettel és RL-adatkészletekkel könnyíti meg a speciális alkalmazásokhoz való finomhangolást. A Super és az Ultra változatok 2025 első felében rajtolnak.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 10:02

Az új vérteszt leleplezte: a kiégett ló sosem nyer

🐎 Az OxiDx vérteszt legfrissebb eredményei szerint az oxidatív stressztől mentes versenylovak sokkal jobb eséllyel végeznek az élmezőnyben...

MA 10:00

A Trump-féle szakértelem ide vagy oda: végre elkészült a Roman-űrtávcső

👀 Néhány hete a NASA szakemberei végleg összeillesztették a Nancy Grace Roman Űrteleszkópot Marylandben, befejezve ezzel a szerelési munkálatokat...

MA 09:43

Az év végi Xbox-frissítés kényelmesebb headset-élményt hoz

Az év utolsó Xbox-frissítése kellemes meglepetést tartogat azoknak, akik Xbox Wireless Headsetet használnak Windows 11 alatt...

MA 09:36

Az X-et kísérti a Twitter múltja: új szabályok, régi nevek

Az X, a korábban Twitter néven ismert közösségi platform, váratlanul frissítette felhasználási feltételeit, visszahozva a Twitter márkaneveit és logóit a szabályzatba...

MA 09:30

Az új Robinhood: NFL-fogadással hódítja meg a fiatalokat

🏆 Érdemes megvizsgálni, hogy a Robinhood legújabb újításaival valóban átalakítja-e az online fogadások és előrejelzési piacok világát, mivel már nemcsak részvényekkel és kriptovalutákkal lehet kereskedni a platformjukon, hanem sporteseményekre és politikai fejleményekre is lehet fogadni – mégpedig elképesztő ütemben növekvő forgalom mellett...

MA 09:22

A várva várt olcsó vb-jegyek megérkeztek

🎉 A FIFA az óriási felháborodás nyomán visszakozott, és jelentősen csökkentette néhány labdarúgó-világbajnoki jegy árát...

MA 09:16

Az orvosok vészjelzése: a vastagbélrák egyre fiatalabbakat érint

💉 Vastagbélrákban egyre több fiatalt diagnosztizálnak világszerte, és az orvosok egyre nagyobb aggodalommal figyelik a trendet...

MA 09:09

Az új ChatGPT Images-szel valóra válnak az álmok pár kattintással

Az OpenAI legújabb fejlesztése, a GPT Image 1.5 forradalmasítja a képgenerálást a ChatGPT-ben...

MA 09:02

Az Oscar-rövidlisták sokkjai: új kategóriák, nagy visszatérők

🏆 A 2026-os Oscar-gála ismét izgalmas verseny elé néz, hiszen az Amerikai Filmakadémia már közzétette a tizenkét legfontosabb kategória rövidlistáját...

MA 08:58

Az újabb Tesla robotaxi-baleset: felügyelővel is retteghetnek az utasok

A Tesla austini Robotaxi-flottája újabb balesetet szenvedett, miközben a cég arra készül, hogy eltávolítsa a járművekből a biztonsági felügyelőket...

MA 08:51

Az éjszakai szívinfarktus tényleg enyhébb – új terápia születhet?

Erre utal többek között az, hogy a szívinfarktusok éjszaka jóval kevésbé károsítják a szívet, mint a nappal bekövetkezők...

MA 08:44

A veszélyes Firefox-bővítmények új fegyvere: rosszindulatú logók

Egy újonnan felfedezett támadássorozat, a GhostPoster, több mint 50 ezer letöltést elérő Firefox-bővítmények logóképeiben rejt el rosszindulatú JavaScript-kódot...

MA 08:37

Az új Meta-bot kiszűri a zajt a zenéből – örüljünk?

Felmerül a kérdés, hogy tényleg szükség van-e egy olyan eszközre, mint a Meta friss fejlesztése, a SAM Audio, amely képes hangklippekből különválasztani a hangszereket és a beszédhangokat...

MA 08:29

Az ősi edények titkos kódja: matematika írás nélkül

🗝 Több mint 8000 évvel ezelőtt a mai Észak-Mezopotámiában élt Halaf-kultúra fazekasai olyan művészi kerámiákat alkottak, amelyek nemcsak szépségükkel, hanem rejtett matematikai üzeneteikkel is lenyűgöznek...

MA 08:23

Az UGREEN hálózati switch: valódi áttörés fillérekért?

🔋 Érdekes felvetés, hogy a gyors hálózatépítéshez már filléres eszközöket is kaphatunk – ráadásul most egy olyan, 2...

MA 08:16

A jegesmedvék titkos fegyvere: ugráló gének a túlélésért

🦜 A klímaváltozás brutalitása a jegesmedvék életét is felforgatja. Míg a sarkvidéki jég kiterjedése februárban történelmi mélypontra csökkent, és az Északi-sarkvidék négyszer gyorsabban melegszik, mint a világ többi része, a jegesmedvék lassan elveszítik vadászterületeiket...

MA 08:02

Az MI segít a Divinity fejlesztésében, embert nem vált ki

Érdemes megvizsgálni, mire használják jelenleg az MI-t a játékstúdiók – különösen, ha minden idők egyik legsikeresebb RPG-jének készítője, a Larian Studios nyilatkozik erről...

MA 07:57

Az élő sejtek mozgásából is nyerhetünk áramot

⚡ Az élő sejtek nemcsak passzív építőkövek – nem kizárt, hogy képesek saját áramot fejleszteni...

MA 07:53

Az Aqua10 Ultra tényleg forradalmasítja a takarítást?

🛁 A Dreame Aqua10 Ultra robotporszívó a prémium kategóriát célozza meg, és sokak számára új mércét jelenthet a padlótisztításban...