Az Nvidia pótolja az amerikai MI‑modellek hiányát

Az Nvidia pótolja az amerikai MI‑modellek hiányát
Ilyen eset például, amikor a vállalatok azért nem vezetnek be MI-t, mert nincs elérhető, kiváló minőségű, nyílt súlyú modell, amely mellett nem merül fel az adatszivárgás veszélye. Senki nem szeretné egyetlen API-hívás miatt kockáztatni az ügyféladatokat vagy érzékeny szellemi tulajdont – ez kizárja a zárt modelleket, mint a ChatGPT-t. Amerikában az elérhető nyílt súlyú modellek nem érik utol az OpenAI vagy az Anthropic szintjét, ami nemcsak az MI elterjedését akadályozza, hanem gátat vet az Nvidia ügynökjellegű MI-víziójának is.

Három új nyílt súlyú modell: minden igényre

Az Nvidia most három új, saját tervezésű, nyílt súlyú LLM-mel (nagy nyelvi modellel) bővítette kínálatát: a Nemotron 3 három méretben, Nano (30 milliárd paraméter), Super (100 milliárd) és Ultra (500 milliárd) változatban készül. Ezek nem csupán a vállalati felhasználást célozzák, hanem teljesen nyíltak is: az Nvidia nemcsak a súlyokat, hanem a tanító adatokat és a megerősítéses tanuláshoz használt környezeteket is elérhetővé teszi. Ez lehetővé teszi, hogy bárki személyre szabhassa a modellt egyedi alkalmazásokhoz.

Fejlett architektúra nagy dokumentumokra és gyors futásra

Az új modellek újszerű, hibrid MoE (mixture-of-experts, szakértőalapú) architektúrát használnak, amelyet hosszú szövegek – például több ezer oldalas dokumentumok – gyors feldolgozására terveztek. A Mamba-2 és a Transformer-rétegek kombinációjának köszönhetően akár egymillió tokenes szövegeket is kezelni tudnak: ez kb. 3 000 dupla sorközű oldalnak felel meg. A Mamba-2 főként a hosszabb szekvenciáknál hatékonyabb, így gyorsabb feldolgozást, stabilabb kimenetet tesz lehetővé, míg a Transformer precíz gondolkodást és témakövetést biztosít, hogy a modell ne veszítse el a fonalat.

Kevesebb memória, nagyobb szabadság, gyorsabb működés

A MoE architektúra lényege, hogy a paramétereknek csak egy töredéke dolgozik minden generált tokennél, ezért az új Nemotron modellek jóval kevesebb memóriát igényelnek, így ugyanazon a hardveren gyorsabbak, mint a sűrű modellek. Például a 30 milliárdos Nanónál csak 3 milliárd aktív egyszerre. A nagyobb modelleknél, mint a Super és az Ultra, megjelenik az NVFP4 adatformátum és a fejlettebb, úgynevezett látens MoE: itt a szakértők közös rejtett reprezentáción dolgoznak, majd innen vetítik vissza az eredményt, ami négyszer annyi szakértő bevetését teszi lehetővé ugyanannyi költséggel.


Spekulatív dekódolás és testreszabhatóság

Speciális újdonság, hogy a modellek képesek egyszerre több token előrejelzésére (multi-token prediction, azaz egyfajta spekulatív dekódolás), ami akár háromszoros gyorsulást hozhat, például kódszerkesztők vagy más intelligens asszisztensek esetében. A Nemotron 3 Nano már ezen a héten letölthető – vállalati hardveren, mint az L40S vagy az RTX Pro 6000 Server Edition, vagy akár mindössze 24 GB-os GPU-kon is, 4 bites kvantált változatban.

Végül a modellek teljesítménye vetekszik a gpt-oss-20B vagy a Qwen3 VL 32B modellekkel, testreszabhatóságuk viszont jóval nagyobb: az Nvidia úgynevezett NeMo Gym-környezettel és RL-adatkészletekkel könnyíti meg a speciális alkalmazásokhoz való finomhangolást. A Super és az Ultra változatok 2025 első felében rajtolnak.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 08:23

Az UGREEN hálózati switch: valódi áttörés fillérekért?

🔋 Érdekes felvetés, hogy a gyors hálózatépítéshez már filléres eszközöket is kaphatunk – ráadásul most egy olyan, 2...

MA 08:16

A jegesmedvék titkos fegyvere: ugráló gének a túlélésért

🦜 A klímaváltozás brutalitása a jegesmedvék életét is felforgatja. Míg a sarkvidéki jég kiterjedése februárban történelmi mélypontra csökkent, és az Északi-sarkvidék négyszer gyorsabban melegszik, mint a világ többi része, a jegesmedvék lassan elveszítik vadászterületeiket...

MA 08:02

Az MI segít a Divinity fejlesztésében, embert nem vált ki

Érdemes megvizsgálni, mire használják jelenleg az MI-t a játékstúdiók – különösen, ha minden idők egyik legsikeresebb RPG-jének készítője, a Larian Studios nyilatkozik erről...

MA 07:57

Az élő sejtek mozgásából is nyerhetünk áramot

⚡ Az élő sejtek nemcsak passzív építőkövek – nem kizárt, hogy képesek saját áramot fejleszteni...

MA 07:53

Az Aqua10 Ultra tényleg forradalmasítja a takarítást?

🛁 A Dreame Aqua10 Ultra robotporszívó a prémium kategóriát célozza meg, és sokak számára új mércét jelenthet a padlótisztításban...

MA 07:44

A WhatsAppon keresztül kémkedhet utánad a mobilod

A biztonsági szakértők most hozták nyilvánosságra a Silent Whisper nevű követési technikát, amely a legnépszerűbb üzenetküldő alkalmazások, például a WhatsApp és a Signal sebezhetőségeit használja ki...

MA 07:36

Az Autopilot-botrány megrengeti a Teslát: veszélyben a kaliforniai eladások

A Tesla komoly bajba került Kaliforniában, miután egy állami bíró kimondta, hogy félrevezető volt, ahogyan az Autopilotot és a Full Self-Driving funkciót reklámozta...

MA 07:30

A Samsung Micro RGB óriástévék végre kisebb méretben is érkeznek

A Samsung évekkel ezelőtt bemutatta a gigantikus, 292 cm-es (115″) Micro RGB TV-jét, most azonban ez a technológia sokkal több nappaliba beköltözhet...

MA 07:22

A nappalid titkos kémje: így figyelhet a tévéd

📺 Texas perelte be az öt legnagyobb tévégyártót, mert azok állítólag titokban képernyőképeket készítenek arról, mit néznek a felhasználók, és ezt engedély nélkül használják fel...

MA 07:16

Az északi-sarkvidék eltűnik a szemünk előtt: húsz év drámája

🌌 Az elmúlt húsz évben az Északi-sarkvidék rendkívüli gyorsasággal változott meg, ahogy a hőmérséklet sosem látott ütemben nőtt, és a jég olvadása felgyorsult...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 12/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     LUCH: Photo Effects & Filters (iPhone/iPad)A LUCH Films egy modern fotóalkalmazás, amellyel a képeidet filmes, analóg stílusban szerkesztheted...

MA 07:10

A texasi kormány háborút hirdet az okostévék titkos megfigyelése ellen

📺 Texas főügyésze, Ken Paxton, nagy port kavart azzal, hogy eljárást indított öt vezető okostévé-gyártó ellen, köztük a Samsung, az LG, a Sony, a Hisense és a TCL cégekkel szemben...

MA 07:02

Az ősi méhek titkos rejteke: fészkek a csontok mélyén

🐝 Több ezer éve a mai Dominikai Köztársaság területén egy barlang rejtegette egyedülálló titkát: a kihalt rágcsálók és lajhárok csontjai nemcsak a ragadozók maradványai voltak, hanem méhek otthonául is szolgáltak...

MA 06:50

Az új Android-kártevő a Play Áruházban bújik meg

Egy új androidos kártevő, a Cellik bérbe vehető eszközként jelent meg a hackerek körében, rengeteg funkcióval: képes bármely, a Google Playről elérhető alkalmazást megfertőzni úgy, hogy a felhasználó észre sem veszi a különbséget...

MA 06:43

A népszerű bővítmények titokban lehallgatják az MI-beszélgetéseidet

🕵 Több mint 8 millió felhasználó töltött le olyan böngészőbővítményeket, amelyek ahelyett, hogy védenék az adatokat, épp ellenkezőleg: minden egyes MI-vel folytatott chatet rögzítenek, és az adatokat visszaküldik a fejlesztőknek...

MA 06:37

A Mars óriási pillangókrátere ősi víz nyomait rejti

Érdekes felvetés, hogy a Mars felszínén egy hatalmas, pillangó alakú kráter található, melyet a legújabb képeken az Európai Űrügynökség (ESA) mutatott meg a világnak...

MA 06:29

Az MI lepipálta a mérnököket: 843 alkatrészes Linux-gép elsőre indul

A Los Angeles-i Quilter nevű startup kevesebb mint egy hét alatt újrarajzolta a számítástechnika határait: MI-re bízta egy vadonatúj, kétpaneles, Linuxot futtató alaplap megtervezését...

MA 06:23

A Waymo 15 milliárdot szerez: beindult az önvezetés aranyláz?

Az Alphabet tulajdonában lévő Waymo komoly lépésre készül: a robotaxi-szolgáltató közel 5 500 milliárd forintnyi (15 milliárd USD) friss tőkével akarja felgyorsítani a növekedést...

MA 06:16

Az Alexa Plus végre böngészőben is használható

Megérkezett az Amazon legújabb dobása: az Alexa Plus végre elérhető webes felületen is, bár egyelőre csak néhány kiválasztott felhasználó számára...