2026. 03. 07., 10:50

Az indiai MI-forradalom új fejezete: ingyenes a Sarvam 30B és 105B

Az indiai fejlesztésű Sarvam 30B és Sarvam 105B nagy nyelvi modellek nyílt forráskódúvá váltak, ami alaposan felborította az eddigi elképzeléseket arról, mire képesek a helyi fejlesztésű MI-rendszerek. Ezek a modellek teljes egészében Indiában készültek, az IndiaAI program támogatásával, és a tanításukhoz kizárólag házon belül összeállított, magas minőségű, óriási adathalmazokat használtak. A fejlesztők minden részletet kézben tartottak az adattól a modellarchitektúrán, végrehajtási algoritmusokon és üzemeltetési rendszereken át az optimalizált, valós felhasználásra kész implementációig.

Modellek és képességek

A Sarvam 30B és 105B a kategóriájukon belül is kimagasló teljesítményt nyújtanak. Előbbi főként valós idejű beszélgetős alkalmazásokra optimalizált, például a Samvaad platformon fut, míg utóbbi a komplex okfejtést és ügynökszerű (agentic) feladatokat igénylő környezetekhez, mint például az Indus MI-asszisztens. Mindkét modell az indiai nyelveket tekintve látványosan felülmúlja még a jóval nagyobb méretű vetélytársakat is.

A Sarvam modellek fejlesztése igazi, teljes skálájú MI-fejlesztést jelent. Az adathalmaz gyűjtésében, tokenizálásában, modellarchitektúrában, üzemeltetésben, hardveroptimalizációkban mindent saját maguk fejlesztettek, így a skálázhatóság és a továbbfejlesztés alapja is adott.

Architektúra: hatékony intelligencia

Mindkét modell a Mixture-of-Experts (MoE) transzformer alapjaira épül, ahol a szakértői útvonalak révén a paraméterszám növelhető, miközben az egy tokenhez tartozó számítási igény nem nő arányosan, így az üzemeltetés költsége ésszerű marad. Ez teszi lehetővé, hogy a Sarvam 30B-t akár laptopon, a 105B-t pedig nagyvállalati szervereken is futtatni lehessen. Az architektúra része még a hosszú szövegkörnyezet támogatása, Rotary Positional Embeddings, RMSNorm és gyorstárazott figyelem (KV-cache-optimalizáció).

A Sarvam 30B Grouped Query Attention-t alkalmaz, hogy kevesebb memóriát igényeljen, a 105B pedig még mélyebb, Multi-head Latent Attention mechanizmust, amely főleg a hosszabb szövegek feldolgozásánál jelent előnyt.

Saját fejlesztésű tanítás és adat

A modellek teljes tanítási folyamata házon belül zajlott. Az előtanításhoz 16 billió tokennyi adatot (30B) és 12 billió tokent (105B) használtak, amelyben kód, internetes szövegek, szakmai tartalom, matematika és többnyelvű anyag is szerepelt. Kiemelten odafigyeltek a gondolkodási képességek, a tényszerű válaszok és a szoftveres tudás erősítésére. A tíz leggyakrabban használt indiai nyelvre kiemelt hangsúlyt helyeztek.

A felügyelet melletti finomhangolás során a promptokat mesterségesen is generálták, hogy leküzdjék a publikus adatokra jellemző gyenge minőséget. A biztonság érdekében külön, indiai sajátosságokra kidolgozott figyelmeztető és támadási szcenáriókat is bevontak, és alaposan tesztelték a modellt szélsőséges helyzetekben is.

A megerősítéses tanítás során a modellt összetett, a matematika, programozás, web- és eszközhasználat területére tartozó kérdésekkel faggatják, ahol a helyes válaszokat többféle módon ellenőrzik és értékelik, hogy az MI valóban fejlődjön minden fontos aspektusban.


Benchmarkok: a teszteredmények

A Sarvam 105B a tudás, matematika, programozás és utasításkövetés terén a legjobb nyílt és zárt modellekkel is felveszi a versenyt. Különösen az indiai nyelveken jelent versenyelőnyt: 98,6 pontot ért el a Math500 teszten, 71,7-et a LiveCodeBench-en, 90,6-ot az MMLU-n, és 84,8-at az IF-Evalon. Az AIME 25 összetett gondolkodást igénylő feladatain is kiemelkedő, 88,3-as arányt teljesített eszközhasználat nélkül, 96,7-et eszközhasználattal. Ügynökszerű képességekben, például hosszú távú tervezésben, információ-visszakeresésben és koherens, többlépéses gondolkodásban kiemelkedően teljesít.

A Sarvam 30B mindeközben a hatékonyság bajnoka: 2,4 milliárd aktív paraméterrel gond nélkül hozza vagy felülmúlja a nagyobb modelleket matematikában (97,0 Math500), programozásban (92,1 HumanEval, 92,7 MBPP), tudásban (85,1 MMLU). Képes mélyebb logikai és matematikai láncolatok követésére is. Ezekkel az eredményekkel megcáfolja azt a gyakorlatot, hogy hatékony modellel ne lehetne első osztályú képességeket elérni.

Indiai nyelvi teljesítmény

A fejlesztők saját benchmarkot is készítettek a 22 hivatalos indiai nyelven – ráadásul mind natív írással, mind latin betűs átirattal, hogy a chat- és online kommunikációban is jól használható MI szülessen. Az értékelés négy dimenzióban történt: folyékonyság, helyes nyelvhasználat, hasznosság, terjengősség. Az értékelések során a Sarvam 105B átlagosan 90%-os sikerarányt ért el, STEM-tárgyakban és kódolásban is 84% fölött. A kisebb, 30B-s modell sem marad el: 89%-os általános siker, STEM-területen 87%.

Tokenizációs és futtatási optimalizációk

Az indiai nyelvekre kihegyezett Sarvam-tokenizáló 12 írásrendszert támogat, és jelentősen csökkenti a feldolgozáshoz szükséges tokenek számát – főleg olyan ritka nyelveknél, mint például az odia vagy a szantáli. Ez mérhető előnyt jelent mind a kiszolgálási költségben, mind a válaszidőben.

A futtatási optimalizációknak hála a Sarvam 30B akár fejlesztői laptopokon is jól fut: Apple Siliconon mérhetően 20–40%-kal gyorsabb a natív MI-inferencia, szerveres környezetben (H100) 3–6-szoros gyorsulás figyelhető meg a Qwen3-hoz képest. Középkategóriás GPU-kkal (L40S) is könnyen futtatható, hosszabb szövegeknél 1,5–3-szoros gyorsulással.

A Sarvam MI alkalmazásai

A demók széles körben mutatják be a Sarvam erejét: önállóan képes teljes weboldalakat, landing page-eket generálni, álláslistákat összeállítani, vagy akár összetett STEM-feladatokat, például JEE Main 2026 vizsgakérdéseket megoldani. A modellek könnyen integrálhatók fejlesztői platformokba, weboldalakba, ügyfélszolgálatba, vagy akár egyedi oktatási alkalmazásokba.

Ezenfelül a modellek nyílt forráskódúak lettek: az API, a súlyok és az implementációk minden fejlesztő számára elérhetők a közösségi platformokon és a Hugging Face-en, így az indiai MI új korszakát indíthatják el, ahol a hatékonyság, a gondolkodás és a valós felhasználhatóság egyszerre adott, kompromisszumok nélkül.

2025, adminboss, www.sarvam.ai alapján

Legfrissebb posztok

kedd 20:45

A Wall Street figyelmeztet: az emberi piac nem bírja a gépsebességű kereskedést

Wall Street és a kriptovilág vezetői egyre komolyabb kihívást látnak abban, hogy a modern pénzügyi piacok az emberi tempó helyett már éjjel-nappal gépek által vezérelt, automatizált rendszerekre támaszkodnak...

kedd 20:35

A Kaptár rendezője szerint Leon Kennedy hetvenévesen is visszatérhet

👷 Leon Kennedy visszatérése az A kaptár: Rekviem (Resident Evil: Requiem) ben minden rajongó számára örömteli pillanat volt...

kedd 20:23

Az illat, amely egy csapásra a középkorba ránt

🚬 Van, aki szívesen költene 70 ezer forintot egy olyan parfümre, amely egy sárban dagonyázó középkori főhős világát idézi meg?..

kedd 20:12

Az Edge szándékosan olvashatóan tárol jelszavakat – aranybánya közös gépeken

Érdemes megvizsgálni, hogy a Microsoft Edge böngészőjében tárolt jelszavak meglepően egyszerűen, olvasható formában jelenhetnek meg a számítógép memóriájában...

kedd 20:01

A Bank of America szerint többet kellene kérni a GTA 6-ért

A Grand Theft Auto-rajongók mostanában két nagy kérdésen pörögnek: vajon csúszik-e a GTA 6 megjelenése, és mennyibe fog kerülni a játék?..

kedd 19:56

A Solana felpörög, itt a Jito saját tárcás JTX-e

⚡ A Jito Labs egy vadonatúj, önőrizetű, tárcaalapú kereskedési platformot indított a Solana-hálózaton, amely villámgyors kereskedést és profi eszközöket kínál...

kedd 19:46

Az iráni háború drágít: egy eldugott kaliforniai megyében 7 dollár a benzin

Kaliforniában olyan üzemanyagárak tarolják le a benzinkutakat, amire az országban máshol sincs példa: egy távoli, vidéki megyében már 7 dollár (kb...

kedd 19:35

Az MI elbocsát, a Kongresszus tétlen – ki fog segíteni?

Amerikában egyre nő a bizonytalanság a munkahelyek jövőjét illetően, hiszen a mesterséges intelligencia térhódítása már nemcsak elméleti kérdés...

kedd 19:23

Az Arsenal–Atlético BL-elődöntő visszavágó: hol nézhető, beharangozó

A londoni Emirates Stadionban ma este minden adott egy igazi futballünnephez: az Arsenal rendkívül közel került a Premier League trófeájához, így a szurkolók körében igazi karneváli hangulat uralkodik...

kedd 19:12

Az Amazon e-mail szolgáltatásával elszabadult a tömeges adathalászat

Érdekes felvetés, hogy az Amazon egyik fontos szolgáltatása, a Simple Email Service a totális átverések célpontjává vált...

kedd 18:56

A Microsoft szerint a Windows 11 frissítések most furcsák, de rendben vannak

Az utóbbi hónapokban a Windows 11 felhasználók többsége meglepődve tapasztalhatta, hogy a szokásos havi frissítések nem egy, hanem akár két-három újraindítást is igényelnek...

kedd 18:45

A Coinbase a Centrifuge-re támaszkodik, részesedést is szerez

A Coinbase stratégiai partnerséget kötött a Centrifuge céggel, amely ezentúl a kriptoplatform alapértelmezett tokenizációs infrastruktúrája lesz...

kedd 18:34

A kriptó igazi értéke a szabályozáson kívül van – állítja Arthur Hayes

A Bitcoin valódi ereje abban rejlik, hogy teljesen kívül áll a pénzügyi szabályozásokon...

kedd 18:24

A búcsú és az új tulajdonosok: Letterman nekimegy a CBS-nek

👋 Míg az új tulajdonosok szemében a pénz a fő szempont, Letterman személyes és keserédes emlékeket idéz, és bírálja a csatorna döntéseit...

kedd 17:13

Az új Spotify-trükkök: zseniális ötletek és totális mellényúlások

Az elmúlt hetekben számos fejlesztéssel rukkolt elő a Spotify, de a platform láthatóan még mindig nem lassít, hiszen hamarosan két új funkcióval bővülhet a kínálat...

kedd 17:01

A Bitcoin fittyet hány a bizonytalanságokra: újra felfelé tör

💰 Fontos kérdés, hogy mennyire viseli meg a Bitcoin árfolyamát a világgazdasági bizonytalanság és az amerikai jegybanki kamatpolitika váratlan fordulata...

kedd 16:56

Az új Resident Evilben tényleg újjászületnek a vérfagyasztó zombik?

Az új Resident Evil: Requiem egyik legnagyobb vonzereje Leon Kennedy, ám a zombik is szinte ugyanilyen erővel vonzzák a rajongókat...

kedd 16:45

Az egyszemű óriás Matt Damonnal: a legek Odüsszeiája

Hadd ordítsam már bele a levegőbe, hogy Matt Damon ezúttal tényleg mindent belead!..

kedd 16:23

Az Airwrap túl drága? Íme a legjobb feleáras alternatívák

💰 A hajformázás világát teljesen felforgatta az Airwrap megjelenése: a forró hengerek helyett irányított légárammal formázta a hajat, így kímélve azt...

kedd 16:12

Az Andreessen Horowitz 800 milliárddal száll be a kriptóba

💸 Az Andreessen Horowitz (a16z) 2,2 milliárd dolláros, vagyis közel 800 milliárd forintos új kriptoalapot indított, hogy a következő tíz évben minden szakaszban segítse a blokklánc-startupokat...

kedd 16:02

A mesterséges intelligencia tényleg elveszi a fiatalok munkáját?

Az MIT kutatója, Andrew McAfee szerint súlyos hiba lenne a kezdő munkaköröket teljesen automatizálni MI-vel...

kedd 15:56

Az MI felforgatja a kriptovilágot: leépítésbe kezd a Coinbase

Érdekes fejlemény, hogy a kriptovaluta-ipar egyik legnagyobb szereplője jelentős létszámleépítéssel reagál a piaci kihívásokra és a mesterséges intelligencia térnyerésére...

kedd 15:45

Az OpenAI majdnem Freeman lett – Muskot a Half‑Life ihlette

Az OpenAI egyik korai, kevéssé ismert fejezete most újabb részletekkel bővült: Elon Musk komolyan fontolgatta, hogy a vállalat neve Freeman legyen, utalva a Felezési idő (Half-Life) videojáték tudós főhősére...

kedd 15:12

Az Nvidia Kína nélkül: stratégiai mesterhúzás vagy óriási öngól?

Az Nvidia teljesen elveszítette jelenlétét a kínai MI-chip­piacon, miután az amerikai exportkorlátozások életbe léptek...

kedd 15:01

Az angol óriásbank újabb milliárdos dobása a kriptófronton

💰 Érdekes felvetés, hogy a hagyományos pénzügyi óriások egyre magabiztosabban lépnek be a kriptopiacra...

kedd 14:56

Az év krimiszenzációja: összeérhetnek a Paradise-sorozatok?

Többek között évtizedek óta nem látott crossover-őrületre készülnek a BBC sikerszériái, és a Beyond Paradise negyedik évadának szereplői már teljes erőbedobással támogatják az ötletet...

kedd 14:45

A Bullish az Equiniti felvásárlásával új pénzügyi infrastruktúrát épít

💰 Jól illusztrálja a trendet, hogy a nagyobb kriptoplatformok már nem csupán a digitális pénzek cseréjére koncentrálnak, hanem egyre inkább a hagyományos tőzsdei háttérinfrastruktúra teljes körű átalakítására is...

kedd 14:24

Az eltűnt kanadai Emoji-tó nyomában: sosem látott katasztrófa

💧 Kanada egyik leglátványosabb tava, a Quebec tartományban található Lac Rouge, különös módon, néhány nap leforgása alatt teljesen eltűnt...

kedd 13:56

Az Apple Wallet tényleg hamarosan kiváltja a plasztikkártyákat?

💳 A közelgő iOS-frissítések számos hasznos újítást hoznak az iPhone-felhasználók mindennapjaiba. Az iOS 26...