2026. 03. 07., 10:50

Az indiai MI-forradalom új fejezete: ingyenes a Sarvam 30B és 105B

Az indiai fejlesztésű Sarvam 30B és Sarvam 105B nagy nyelvi modellek nyílt forráskódúvá váltak, ami alaposan felborította az eddigi elképzeléseket arról, mire képesek a helyi fejlesztésű MI-rendszerek. Ezek a modellek teljes egészében Indiában készültek, az IndiaAI program támogatásával, és a tanításukhoz kizárólag házon belül összeállított, magas minőségű, óriási adathalmazokat használtak. A fejlesztők minden részletet kézben tartottak az adattól a modellarchitektúrán, végrehajtási algoritmusokon és üzemeltetési rendszereken át az optimalizált, valós felhasználásra kész implementációig.

Modellek és képességek

A Sarvam 30B és 105B a kategóriájukon belül is kimagasló teljesítményt nyújtanak. Előbbi főként valós idejű beszélgetős alkalmazásokra optimalizált, például a Samvaad platformon fut, míg utóbbi a komplex okfejtést és ügynökszerű (agentic) feladatokat igénylő környezetekhez, mint például az Indus MI-asszisztens. Mindkét modell az indiai nyelveket tekintve látványosan felülmúlja még a jóval nagyobb méretű vetélytársakat is.

A Sarvam modellek fejlesztése igazi, teljes skálájú MI-fejlesztést jelent. Az adathalmaz gyűjtésében, tokenizálásában, modellarchitektúrában, üzemeltetésben, hardveroptimalizációkban mindent saját maguk fejlesztettek, így a skálázhatóság és a továbbfejlesztés alapja is adott.

Architektúra: hatékony intelligencia

Mindkét modell a Mixture-of-Experts (MoE) transzformer alapjaira épül, ahol a szakértői útvonalak révén a paraméterszám növelhető, miközben az egy tokenhez tartozó számítási igény nem nő arányosan, így az üzemeltetés költsége ésszerű marad. Ez teszi lehetővé, hogy a Sarvam 30B-t akár laptopon, a 105B-t pedig nagyvállalati szervereken is futtatni lehessen. Az architektúra része még a hosszú szövegkörnyezet támogatása, Rotary Positional Embeddings, RMSNorm és gyorstárazott figyelem (KV-cache-optimalizáció).

A Sarvam 30B Grouped Query Attention-t alkalmaz, hogy kevesebb memóriát igényeljen, a 105B pedig még mélyebb, Multi-head Latent Attention mechanizmust, amely főleg a hosszabb szövegek feldolgozásánál jelent előnyt.

Saját fejlesztésű tanítás és adat

A modellek teljes tanítási folyamata házon belül zajlott. Az előtanításhoz 16 billió tokennyi adatot (30B) és 12 billió tokent (105B) használtak, amelyben kód, internetes szövegek, szakmai tartalom, matematika és többnyelvű anyag is szerepelt. Kiemelten odafigyeltek a gondolkodási képességek, a tényszerű válaszok és a szoftveres tudás erősítésére. A tíz leggyakrabban használt indiai nyelvre kiemelt hangsúlyt helyeztek.

A felügyelet melletti finomhangolás során a promptokat mesterségesen is generálták, hogy leküzdjék a publikus adatokra jellemző gyenge minőséget. A biztonság érdekében külön, indiai sajátosságokra kidolgozott figyelmeztető és támadási szcenáriókat is bevontak, és alaposan tesztelték a modellt szélsőséges helyzetekben is.

A megerősítéses tanítás során a modellt összetett, a matematika, programozás, web- és eszközhasználat területére tartozó kérdésekkel faggatják, ahol a helyes válaszokat többféle módon ellenőrzik és értékelik, hogy az MI valóban fejlődjön minden fontos aspektusban.


Benchmarkok: a teszteredmények

A Sarvam 105B a tudás, matematika, programozás és utasításkövetés terén a legjobb nyílt és zárt modellekkel is felveszi a versenyt. Különösen az indiai nyelveken jelent versenyelőnyt: 98,6 pontot ért el a Math500 teszten, 71,7-et a LiveCodeBench-en, 90,6-ot az MMLU-n, és 84,8-at az IF-Evalon. Az AIME 25 összetett gondolkodást igénylő feladatain is kiemelkedő, 88,3-as arányt teljesített eszközhasználat nélkül, 96,7-et eszközhasználattal. Ügynökszerű képességekben, például hosszú távú tervezésben, információ-visszakeresésben és koherens, többlépéses gondolkodásban kiemelkedően teljesít.

A Sarvam 30B mindeközben a hatékonyság bajnoka: 2,4 milliárd aktív paraméterrel gond nélkül hozza vagy felülmúlja a nagyobb modelleket matematikában (97,0 Math500), programozásban (92,1 HumanEval, 92,7 MBPP), tudásban (85,1 MMLU). Képes mélyebb logikai és matematikai láncolatok követésére is. Ezekkel az eredményekkel megcáfolja azt a gyakorlatot, hogy hatékony modellel ne lehetne első osztályú képességeket elérni.

Indiai nyelvi teljesítmény

A fejlesztők saját benchmarkot is készítettek a 22 hivatalos indiai nyelven – ráadásul mind natív írással, mind latin betűs átirattal, hogy a chat- és online kommunikációban is jól használható MI szülessen. Az értékelés négy dimenzióban történt: folyékonyság, helyes nyelvhasználat, hasznosság, terjengősség. Az értékelések során a Sarvam 105B átlagosan 90%-os sikerarányt ért el, STEM-tárgyakban és kódolásban is 84% fölött. A kisebb, 30B-s modell sem marad el: 89%-os általános siker, STEM-területen 87%.

Tokenizációs és futtatási optimalizációk

Az indiai nyelvekre kihegyezett Sarvam-tokenizáló 12 írásrendszert támogat, és jelentősen csökkenti a feldolgozáshoz szükséges tokenek számát – főleg olyan ritka nyelveknél, mint például az odia vagy a szantáli. Ez mérhető előnyt jelent mind a kiszolgálási költségben, mind a válaszidőben.

A futtatási optimalizációknak hála a Sarvam 30B akár fejlesztői laptopokon is jól fut: Apple Siliconon mérhetően 20–40%-kal gyorsabb a natív MI-inferencia, szerveres környezetben (H100) 3–6-szoros gyorsulás figyelhető meg a Qwen3-hoz képest. Középkategóriás GPU-kkal (L40S) is könnyen futtatható, hosszabb szövegeknél 1,5–3-szoros gyorsulással.

A Sarvam MI alkalmazásai

A demók széles körben mutatják be a Sarvam erejét: önállóan képes teljes weboldalakat, landing page-eket generálni, álláslistákat összeállítani, vagy akár összetett STEM-feladatokat, például JEE Main 2026 vizsgakérdéseket megoldani. A modellek könnyen integrálhatók fejlesztői platformokba, weboldalakba, ügyfélszolgálatba, vagy akár egyedi oktatási alkalmazásokba.

Ezenfelül a modellek nyílt forráskódúak lettek: az API, a súlyok és az implementációk minden fejlesztő számára elérhetők a közösségi platformokon és a Hugging Face-en, így az indiai MI új korszakát indíthatják el, ahol a hatékonyság, a gondolkodás és a valós felhasználhatóság egyszerre adott, kompromisszumok nélkül.

2025, adminboss, www.sarvam.ai alapján

Legfrissebb posztok

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...