MA 10:50

Az indiai MI-forradalom új fejezete: ingyenes a Sarvam 30B és 105B

Az indiai fejlesztésű Sarvam 30B és Sarvam 105B nagy nyelvi modellek nyílt forráskódúvá váltak, ami alaposan felborította az eddigi elképzeléseket arról, mire képesek a helyi fejlesztésű MI-rendszerek. Ezek a modellek teljes egészében Indiában készültek, az IndiaAI program támogatásával, és a tanításukhoz kizárólag házon belül összeállított, magas minőségű, óriási adathalmazokat használtak. A fejlesztők minden részletet kézben tartottak az adattól a modellarchitektúrán, végrehajtási algoritmusokon és üzemeltetési rendszereken át az optimalizált, valós felhasználásra kész implementációig.

Modellek és képességek

A Sarvam 30B és 105B a kategóriájukon belül is kimagasló teljesítményt nyújtanak. Előbbi főként valós idejű beszélgetős alkalmazásokra optimalizált, például a Samvaad platformon fut, míg utóbbi a komplex okfejtést és ügynökszerű (agentic) feladatokat igénylő környezetekhez, mint például az Indus MI-asszisztens. Mindkét modell az indiai nyelveket tekintve látványosan felülmúlja még a jóval nagyobb méretű vetélytársakat is.

A Sarvam modellek fejlesztése igazi, teljes skálájú MI-fejlesztést jelent. Az adathalmaz gyűjtésében, tokenizálásában, modellarchitektúrában, üzemeltetésben, hardveroptimalizációkban mindent saját maguk fejlesztettek, így a skálázhatóság és a továbbfejlesztés alapja is adott.

Architektúra: hatékony intelligencia

Mindkét modell a Mixture-of-Experts (MoE) transzformer alapjaira épül, ahol a szakértői útvonalak révén a paraméterszám növelhető, miközben az egy tokenhez tartozó számítási igény nem nő arányosan, így az üzemeltetés költsége ésszerű marad. Ez teszi lehetővé, hogy a Sarvam 30B-t akár laptopon, a 105B-t pedig nagyvállalati szervereken is futtatni lehessen. Az architektúra része még a hosszú szövegkörnyezet támogatása, Rotary Positional Embeddings, RMSNorm és gyorstárazott figyelem (KV-cache-optimalizáció).

A Sarvam 30B Grouped Query Attention-t alkalmaz, hogy kevesebb memóriát igényeljen, a 105B pedig még mélyebb, Multi-head Latent Attention mechanizmust, amely főleg a hosszabb szövegek feldolgozásánál jelent előnyt.

Saját fejlesztésű tanítás és adat

A modellek teljes tanítási folyamata házon belül zajlott. Az előtanításhoz 16 billió tokennyi adatot (30B) és 12 billió tokent (105B) használtak, amelyben kód, internetes szövegek, szakmai tartalom, matematika és többnyelvű anyag is szerepelt. Kiemelten odafigyeltek a gondolkodási képességek, a tényszerű válaszok és a szoftveres tudás erősítésére. A tíz leggyakrabban használt indiai nyelvre kiemelt hangsúlyt helyeztek.

A felügyelet melletti finomhangolás során a promptokat mesterségesen is generálták, hogy leküzdjék a publikus adatokra jellemző gyenge minőséget. A biztonság érdekében külön, indiai sajátosságokra kidolgozott figyelmeztető és támadási szcenáriókat is bevontak, és alaposan tesztelték a modellt szélsőséges helyzetekben is.

A megerősítéses tanítás során a modellt összetett, a matematika, programozás, web- és eszközhasználat területére tartozó kérdésekkel faggatják, ahol a helyes válaszokat többféle módon ellenőrzik és értékelik, hogy az MI valóban fejlődjön minden fontos aspektusban.


Benchmarkok: a teszteredmények

A Sarvam 105B a tudás, matematika, programozás és utasításkövetés terén a legjobb nyílt és zárt modellekkel is felveszi a versenyt. Különösen az indiai nyelveken jelent versenyelőnyt: 98,6 pontot ért el a Math500 teszten, 71,7-et a LiveCodeBench-en, 90,6-ot az MMLU-n, és 84,8-at az IF-Evalon. Az AIME 25 összetett gondolkodást igénylő feladatain is kiemelkedő, 88,3-as arányt teljesített eszközhasználat nélkül, 96,7-et eszközhasználattal. Ügynökszerű képességekben, például hosszú távú tervezésben, információ-visszakeresésben és koherens, többlépéses gondolkodásban kiemelkedően teljesít.

A Sarvam 30B mindeközben a hatékonyság bajnoka: 2,4 milliárd aktív paraméterrel gond nélkül hozza vagy felülmúlja a nagyobb modelleket matematikában (97,0 Math500), programozásban (92,1 HumanEval, 92,7 MBPP), tudásban (85,1 MMLU). Képes mélyebb logikai és matematikai láncolatok követésére is. Ezekkel az eredményekkel megcáfolja azt a gyakorlatot, hogy hatékony modellel ne lehetne első osztályú képességeket elérni.

Indiai nyelvi teljesítmény

A fejlesztők saját benchmarkot is készítettek a 22 hivatalos indiai nyelven – ráadásul mind natív írással, mind latin betűs átirattal, hogy a chat- és online kommunikációban is jól használható MI szülessen. Az értékelés négy dimenzióban történt: folyékonyság, helyes nyelvhasználat, hasznosság, terjengősség. Az értékelések során a Sarvam 105B átlagosan 90%-os sikerarányt ért el, STEM-tárgyakban és kódolásban is 84% fölött. A kisebb, 30B-s modell sem marad el: 89%-os általános siker, STEM-területen 87%.

Tokenizációs és futtatási optimalizációk

Az indiai nyelvekre kihegyezett Sarvam-tokenizáló 12 írásrendszert támogat, és jelentősen csökkenti a feldolgozáshoz szükséges tokenek számát – főleg olyan ritka nyelveknél, mint például az odia vagy a szantáli. Ez mérhető előnyt jelent mind a kiszolgálási költségben, mind a válaszidőben.

A futtatási optimalizációknak hála a Sarvam 30B akár fejlesztői laptopokon is jól fut: Apple Siliconon mérhetően 20–40%-kal gyorsabb a natív MI-inferencia, szerveres környezetben (H100) 3–6-szoros gyorsulás figyelhető meg a Qwen3-hoz képest. Középkategóriás GPU-kkal (L40S) is könnyen futtatható, hosszabb szövegeknél 1,5–3-szoros gyorsulással.

A Sarvam MI alkalmazásai

A demók széles körben mutatják be a Sarvam erejét: önállóan képes teljes weboldalakat, landing page-eket generálni, álláslistákat összeállítani, vagy akár összetett STEM-feladatokat, például JEE Main 2026 vizsgakérdéseket megoldani. A modellek könnyen integrálhatók fejlesztői platformokba, weboldalakba, ügyfélszolgálatba, vagy akár egyedi oktatási alkalmazásokba.

Ezenfelül a modellek nyílt forráskódúak lettek: az API, a súlyok és az implementációk minden fejlesztő számára elérhetők a közösségi platformokon és a Hugging Face-en, így az indiai MI új korszakát indíthatják el, ahol a hatékonyság, a gondolkodás és a valós felhasználhatóság egyszerre adott, kompromisszumok nélkül.

2025, adminboss, www.sarvam.ai alapján

Legfrissebb posztok

MA 13:40

A higany folyékony, mert meghajlítja a fizika törvényeit

Egy lényeges szempont, hogy a higany, bár fém, szobahőmérsékleten mégis folyékony...

MA 13:20

Az emberiség turbófokra kapcsolt: sosem fűtöttük így a Földet

Szóval, képzeld el, tényleg turbófokozatra kapcsoltunk a bolygó klímájának fűtésében. Egyszerűen pörög a globális melegedés: a kutatók most kimutatták, hogy nagyjából 0,35 Celsius-fokkal melegszik a Föld évtizedenként – ráadásul az elmúlt 10 évben!..

MA 12:01

A Rivian raktárában halálos baleset, vizsgálat indult

Egy 61 éves férfi, Kevin Lancaster vesztette életét a Rivian illinois-i raktárában, miután beszorult egy kamion és a rakodórámpa közé...

MA 11:57

Az aszteroida mégsem csapódik a Holdba – fellélegezhetünk!

Itt a legfrissebb űrhír, amitől ki lehet ugrani a bőrödből: a 2024 YR4 nevű aszteroida tavaly olyan pánikot keltett, mint amikor a szomszéd kihívja rád a rendőröket, mert túl hangosan bulizol...

MA 11:20

Újabb kémprogram vadászik az izraeli mobilokra

🕵 Felmerül a kérdés, hogy mennyire lehet megbízni a vészhelyzeti értesítésekben, amikor egyre kifinomultabb kémprogramok fenyegetik az okostelefonokat...

MA 11:01

Az első aszteroidaeltérítés: a NASA átírta a történelmet

🚀 2022 szeptemberében a NASA egy különleges kísérletbe fogott: egy 570 kilogrammos, 22 530 km/órával haladó űrszondát frontálisan nekivezette a Dimorphos nevű kisbolygónak...

MA 10:55

Az MI-ügynökök élesbe mennek – nem csak jobb modellekkel

🤖 Ahogy a modern MI-modellek egyre okosabbak és sokoldalúbbak lesznek, nem elég csak a mesterséges intelligencia fejlődésére építeni – a köré épített eszközöket, úgynevezett harnesseket is fejleszteni kell...

MA 10:38

Az adatvédelem jövője: forradalmi újítások a Cloudflare One-tól

🔒 Az üzleti világ digitális átalakulása egyre gyorsabb tempót diktál. A munka már nem egyetlen hálózaton vagy irodán belül zajlik, hanem bármilyen végpontról – legyen az laptop, mobil vagy böngésző – és mindenféle szoftveren, például SaaS-alkalmazásokban...

MA 10:28

Az Apple száműzte a kínai ByteDance appjait az USA-ból

Az utóbbi hónapokban több amerikai iPhone-tulajdonos vette észre, hogy a korábban gond nélkül letölthető kínai alkalmazásokat most már nem tudják elérni akkor sem, ha kínai App Store-fiókkal próbálkoznak...

MA 10:22

Az iPhone-ok rémálma: a Coruna exploitkészlet titkos útja

2025-ben egy, az Apple iPhone-okat támadó, kiemelkedően veszélyes exploitkészlet felbukkanása keltett riadalmat a biztonsági szakértők között...

MA 10:01

Az Atlanti-óceán sötét titkai: vegyi fegyverek a halászhálóban

Felmerül a kérdés, hogy milyen rejtett fenyegetések leselkednek azokra, akik az Atlanti-óceánból próbálnak megélhetést biztosítani maguknak...

MA 09:55

Az egészségügyi óriás adatbotránya: 3,4 millió páciens érintett

💉 A TriZetto Provider Solutions, az egészségügyi informatikai szektor egyik nagy szereplője, jelentős adatszivárgás áldozata lett, amelynek során több mint 3,4 millió páciens személyes adata került veszélybe...

MA 09:47

Az új Pokémon: Pokopia – életvidám közösségi kaland vár rád

A Pokopia elhozza azt az idilli, meleg hangulatot, amelyet eddig csak kevesen tudtak ilyen jól ötvözni a klasszikus Pokémon-univerzummal...

MA 09:37

Az eltűnt erszényesek visszatértek: két fajt élve találtak Új-Guineában

🐱 Ilyen eset például, amikor egy fajról azt hisszük, hogy évezredekkel ezelőtt kihalt, de aztán mégis felbukkan egy élettel teli erdő mélyén...

MA 09:28

Az amerikaiak felélik a nyugdíj-megtakarításaikat: itt az új vészkassza

💰 Egyre többen kényszerülnek életük elsődleges pénzügyi tartalékához, a 401(k)-hez (amerikai nyugdíjmegtakarítási számla) nyúlni, amikor sürget a baj...

MA 09:19

A Bitcoin megint beszakadt: elolvadt az emelkedés haszna

💸 A kriptopiac pénteki reménykeltő megugrása után szombatra újra beköszöntött a hullámvasút: a bitcoin árfolyama 3,4%-kal esett vissza, így ismét 68 000 dollár, azaz körülbelül 25,3 millió forint alá süllyedt...

MA 09:10

Az új Microsoft 365-mentés végre fájlokat is visszaállít

Az eddig időigényes Microsoft 365 Backup hamarosan olyan frissítést kap, amely lehetővé teszi az adminisztrátorok számára, hogy ne csak teljes SharePoint- vagy OneDrive-helyeket, hanem egyes fájlokat és mappákat is visszaállítsanak...

MA 09:04

Az új GoPro Lit Hero: apró, de óriási a felhajtás

📺 Első pillantásra úgy tűnt, hogy a GoPro Lit Hero lehet az eddigi legizgalmasabb akciókamera a márka kínálatában: kicsi, könnyű, szinte bárhová magaddal viheted, legyen szó nyaralásról vagy olyan helyről, ahol egy nagyobb fényképezőgéppel feltűnősködnél...

MA 08:57

Az extrém koponyaformák: díszítés, törzsi összetartás vagy ősi hagyomány?

💀 Érdekes felvetés, hogy szinte minden földrészen, kivéve az Antarktiszt, találtak már idegennek tűnő, módosított koponyákat...

MA 08:46

Az első MI-kódoló érkezik a Galaxy telefonokra?

A Samsung egyre bátrabban építi be az MI-t a telefonjaiba, sőt, a legújabb Galaxy S24-sorozatnál és a Galaxy MI-nél már nem is használja az „okostelefon” kifejezést – helyette MI-telefonnak nevezi az eszközeit...

MA 08:37

Az időjárás megőrült: hó, véreső és rekkenő hőség

☂ Lényeges, hogy az idei tavasz a szokásosnál is vadabb időjárási fordulatokat hozott az Egyesült Királyságban...

MA 08:02

Az egekben a repülőjegyárak – tényleg a kerozin a főbűnös?

✈ Különösen igaz ez akkor, ha épp most tervezel utazást: jelentős áremelkedés várható a repülőjegyek piacán...

MA 07:55

Az InstallFix új trükkje: hamis Claude Code-útmutatókkal terjeszt adatlopókat

💡 Az utóbbi időben egyre több fejlesztő használja a jól ismert curl-to-bash parancsokat, hogy parancssori eszközöket telepítsen különböző weboldalakról – anélkül, hogy alaposan ellenőrizné a letöltött kódot...

MA 07:48

Az első jógaórád: Erre lesz igazán szükséged, a többit felejtsd!

😊 A jóga egyre népszerűbb a nyugati világban, mert nem igényel komoly felszerelést, mégis sokan elbizonytalanodnak, mivel és hogyan vágjanak bele...

MA 07:37

A Life EV lett a Rad Power Bikes új gazdája

A Rad Power Bikes annyi befektetőt vonzott be, hogy összesen 120 milliárd forintot gyűjtött, mégis tavaly decemberben csődbe jutott...

MA 07:29

A MI nyolcból hetet munkanélkülivé tesz? Khosla szerint rendben van

🤔 A nagynevű befektető, Vinod Khosla elképzelése szerint a mesterséges intelligencia 2030-ra a munkahelyek 80 százalékát átveheti az emberektől...

MA 07:19

Az X új hirdetései: ajánlás vagy szemfényvesztő burkolt reklám?

👁 Az X most egy kísérleti hirdetési formátumot próbál ki: bizonyos bejegyzések alatt közvetlenül egy termékajánló jelenik meg...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/7

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Four Last Things (iPhone/iPad)A Four Last Things egy point-and-click kalandjáték, amelyben reneszánsz kori festményekből készült látványvilágban játszhatsz...

MA 07:10

Az új rekord után taroltak a bitcoin-spekulánsok

💰 A bitcoin árfolyama rövid időre elérte a 74 000 dolláros rekordmagasságot, majd pillanatok alatt visszazuhant 69 000 dollár alá...