2025. 11. 21., 12:20

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben
A nyílt nagy nyelvi modelleknél (LLM-eknél) gyakran csak a kész eredményt látjuk, de az egész fejlesztési folyamat elzárva marad. Ennek következtében a fejlesztők és kutatók számára nehézkessé válik, hogy a modell tudását, működését vagy viselkedését mélyebben megértsék, vagy saját igényeikre szabják. Az Olmo 3 most épp ezen változtat: nemcsak korszerű, nyílt modelleket ad a közösség kezébe, hanem közzéteszi a teljes fejlesztési folyamatot, az összes ellenőrzőpontot, adatot és modellsúlyt. Így végre bárki hozzáférhet az MI fejlődéséhez vezető teljes úthoz, és bármely ponton bekapcsolódhat.

Az Olmo 3 modellcsalád: Teljes nyitottság, visszakövethetőség

Az Olmo 3 középpontjában a 32 milliárd paraméteres Olmo 3-Think áll, amely először teszi lehetővé, hogy a modell gondolkodási láncolataiba, részeredményeibe is betekintést nyerjünk – mindez visszavezethető egészen a tanítóadatokig és a képzési döntésekig. Az Olmo 3 családja kompakt, sűrű modelleket tartalmaz (7 milliárd és 32 milliárd paraméterrel), amelyek futtathatók akár laptopon, akár kutatói klasztereken.

Az Olmo 3-Base a valaha kiadott legerősebb, teljesen nyílt alapmodell, amely minden fejlesztési komponensével együtt elérhető. Az új, bővített és diverzifikált értékelési rendszerben az Olmo 3-Base matematikában, olvasásban és programozásban is kiemelkedő, hosszú szövegeken is stabilan teljesít (akár 65 ezer tokenig). Ez ideális alap továbbtanításhoz, célspecifikus finomhangoláshoz, vagy megerősítéses tanuláshoz, és könnyen bővíthető extra képességekkel, például eszközhasználattal vagy összetett utasítások követésével.

Az Olmo 3-Think kifejezetten érvelési, gondolkodási feladatokra készült, komoly számítási kapacitást igénylő kutatásokhoz. Két méretben érhető el: a nagyobb, 32 milliárd paraméteres verzió szorosan versenyzik a Qwen és hasonló csúcskategóriás nyílt modellekkel, pedig hatszor kevesebb képzési adatmennyiségből tanult. A kisebb, 7 milliárdos változat ugyancsak azonos koncepcióval készül, és összetett feladatoknál lépésről lépésre követhetővé teszi a gondolkodást még szerényebb hardveren is.

Az Olmo 3-Instruct (7B) a csevegő, gyors, válaszadás-centrikus vonal: többkörös chat, utasításkövetés, eszközhasználat mind beépített funkció. Az értékelések szerint felveszi a versenyt, sőt, gyakran megelőzi hasonló nyílt modelleket, például a Qwen 2.5, Gemma 3 és Llama 3.1 modelleket.

Végül, az Olmo 3-RL Zero (7B) teljesen nyílt megerősítéses tanulási útként jelent meg, kifejezetten bonyolult gondolkodási viselkedések felépítésére, átlátható, visszaellenőrizhető jutalmazással.

A modellfolyam: teljes rugalmasság és újrafelhasználhatóság

Az Olmo 3 nem egyetlen, fagyasztott modellt kínál, hanem teljesen dokumentált fejlesztési útvonalakat: az Instruct ágat mindennapi csevegésre és eszközhasználatra, az RL Zero ágat a megerősítéses tanulási kísérletekhez, és a Think/indoklási ágat, amely a legkomplexebb gondolkodást támogatja. Mindezek lehetővé teszik, hogy akár saját, testreszabott utat járj be: kiindulhatsz a Base modellből, használhatsz saját finomhangolási, preferenciaoptimalizálási (DPO) sablont, vagy beépíthetsz újfajta RL-célokat. Az egész folyamat újrafelhasználható építőelemmé, sablonná válik – vagyis nemcsak a mi munkánkat látod, hanem bármikor a saját MI-d fejlesztésének is alapja lehet.

Kimagasló teljesítmény különböző területeken

Az Olmo 3 modelleket kiterjedt tesztkészleten vizsgálták, amelyek magukban foglalják az iparági standard feladatokat: matematikai problémákat, programozási és kódolási feladatokat, olvasásértést, információ-visszakeresést, általános tudásalapú kérdéseket. Az Olmo 3-Base 32B minden összehasonlított nyílt alapmodellt megelőz vagy leköröz, programozási, matematikai és hosszú szövegfeldolgozási teszteken is kiemelkedően teljesít.

Mindez a gondosan válogatott tanítóadathalmazoknak, az egyes modellekre optimalizált képzési stratégiának és új algoritmikus fejlesztéseknek köszönhető. Az RL-környezetek kidolgozása is kulcsfontosságú volt, főleg az érvelő modelleknél. A modellteljesítményben nincs kompromisszum: az Olmo 3 sorra hozza a legjobb számokat a főbb benchmarkokon, sokszor minimális különbséggel az iparág nagyágyúihoz képest (pl. Qwen 2.5, Gemma 3).


Fejlett gondolkodási és csevegési képességek

Az Olmo 3-Think a Base bázismodellt indoklási modellel fejleszti tovább: átfogó matematikai, kódolási és összetett problémákon tanítják több lépéses megoldásra, majd SFT-, DPO- és RLVR-ágon keresztül finomítják. Ezáltal rendkívül magas minőségű gondolkodási láncokat alakít ki – ezek minden korábbinál jobban követik a valós logikai gondolkodást, és a teljes folyamat nyíltan követhető. A 32B verzió a legtöbb mérés szerint vezeti saját mezőnyét, vagy néhány ponton belül marad a legjobb, nyílt súlyú modellekhez képest (például Qwen 3 32B vagy Gemma 3 27B).

Az Olmo 3-Instruct főleg csevegésre, eszközhasználatra és szintetikus adatok generálására optimalizált, rövidebb válaszokat ad, így gyorsabb és hatékonyabb inferencia érhető el. Az összehasonlítások azt mutatják, hogy 7 milliárdos méretben is lekörözi vagy kiegyenlíti főbb riválisait még összetettebb, többkörös beszélgetésekben is.

A valódi nyitottság előnye

Az Olmo 3 összes komponense – adat, kód, modellsúlyok, ellenőrzőpontok – nyíltan, szabadon felhasználható engedélyekkel érhető el. Ezzel új szabványt teremt a mesterséges intelligencia fejlesztésében: a teljes modellfolyam nyilvánossá tétele segíti az átláthatóságot, a bizalmat, a közösségi kollaborációt és az innovációt is.

Ebből adódóan az Olmo 3 nem csupán új modelleket adott a nyílt forrású MI-közösségnek, hanem áttörést hozott a fejlesztési folyamat megosztásában is – és mostantól tényleg mindenki számára elérhetővé vált a fejlődés teljes útja.

2025, adminboss, allenai.org alapján

Legfrissebb posztok

kedd 18:04

Az idei legjobb csillagvetítők: csillagos ég a gyerekszobában

⭐ A csillagvetítők ma már nemcsak díszes éjszakai fények: a komolyabb modellek igazi tudományos taneszközökké váltak, amelyekkel csillagképeket, bolygókat és a világegyetem izgalmait lehet közelebb hozni a gyerekekhez...

kedd 17:59

Az MI-botrány nyomában: Discord, kiszivárgott adatok és a Thiel-szál

🔎 A Discord, az egyik legnépszerűbb kommunikációs platform, komoly adatvédelmi botránnyal szembesült, miután kiderült, hogy a Persona Identities nevű azonosítószoftverének kódja nyilvánosan elérhető volt az interneten, sőt amerikai kormányzati szervereken is hozzáférhetővé vált...

kedd 17:39

Az írás születésének titkai: rejtett nyomok az őskori művészetben

Meglepő nyomokra bukkantak a németországi barlangokban előkerült, mintegy 40 ezer éves műtárgyakon: az őskori mesterek nem pusztán kedvtelésből véstek vonalakat, pöttyöket és kereszteket az elefántcsontfigurákra; ezek a díszítések egy jól szervezett, jelentéssel bíró rendszer részei lehettek...

kedd 17:20

Az északkeleti hóvihar: mesebeli hóemberek, pokoli lapátolás

❄ Az Egyesült Államok északkeleti részén közel 38 cm hó esett, megbénítva New York City-t, New Jersey-t, Connecticutot, Rhode Islandet és Massachusettset...

kedd 17:02

Az amerikai részvények már éjjel-nappal kereskedhetők a Krakenen

📈 A Kraken kriptotőzsde új szintre emeli a kereskedést: mostantól már tokenizált amerikai részvényekkel is lehet folyamatosan, a nap 24 órájában, akár húszszoros tőkeáttéttel kereskedni...

kedd 17:00

Az MI átrajzolja a hatalmi térképet – Ki marad talpon?

🗺 Az elmúlt évben minden korábbinál nagyobb volt a vezetői pozíciók cseréje a nagyvállalatoknál, de ennek oka nem valamilyen piaci visszaesés vagy rossz negyedév volt...

kedd 16:39

Az észak-koreai Lazarus-csoport már kórházakra is rászállt

Amerikai egészségügyi szervezetek kerültek célkeresztbe: a Lazarus néven ismert, államilag támogatott észak-koreai hackercsoport a Medusa nevű zsarolóvírust vetette be ellenük...

kedd 16:21

Az MI-háború új fejezete: visszavágtak a kínai techóriások az Anthropicnak?

🚀 Egyre élesedik a nemzetközi mesterségesintelligencia-verseny, most három ismert kínai cég került a reflektorfénybe: a DeepSeek, a Moonshot AI és a MiniMax...

kedd 14:01

Az Autopilot-botrány: a Tesla hadat üzen a kaliforniai hatóságoknak

A Tesla beperelte a kaliforniai Közlekedési Hatóságot (DMV), miután az megtiltotta az Autopilot és a Full Self-Driving elnevezések használatát az autók értékesítésekor...

kedd 13:59

A mikroműanyagok rejtélye: ártanak nekünk, vagy túlzás a félelem?

🤔 Érdemes megvizsgálni, mennyire megalapozottak a mikroműanyagok egészségkárosító hatásairól szóló figyelmeztetések. Az elmúlt években félelmet keltő hírek terjedtek el: mikroműanyagok már mindenütt jelen vannak, az élelmiszerektől a vízen át a tisztítószerekig, és lassan felhalmozódnak a szervezetünkben – legalábbis ezt állították...

kedd 13:40

Az MI leleplezi a nyílt forráskódú világ 500+ sebezhetőségét

A szoftvervilágban most olyan történések zajlanak, amelyek alapjaiban rengetik meg azt, amit eddig a biztonságról gondoltunk...

kedd 13:20

A Pentagon titkos hálózatain bukkant fel Elon Musk MI-je

🕵 Az amerikai védelmi minisztérium hamarosan hadrendbe állítja Elon Musk tulajdonában lévő Grok nevű MI-t, amelyet titkos katonai rendszerekben is bevethetnek...

kedd 12:01

Az OpenClaw MI-ügynöke kis híján lenullázta a teljes postaládát

📥 A Meta egyik MI-biztonsági kutatója, Summer Yue szerint kis híján komoly adatvesztésbe torkollott egy kísérlete az OpenClaw ügynökkel...

kedd 11:39

Az új GL.iNet Flint 3: Wi‑Fi 7, sci-fibe csomagolva

🚀 A GL.iNet Flint 3 BE9300 router igazi erőmű a Wi‑Fi 7-es szabvány terén, és első látásra akár egy sci-fi regényből is érkezhetett volna...

kedd 11:21

Az MI felforgat mindent: hová tűnt a befektetők hűsége?

Az MI-őrület mostanra teljesen felforgatta a kockázatitőke-piac jól bevált szabályait. A közelmúltban az OpenAI hatalmas tőkebevonásának árnyékában az Anthropic is soha nem látott, 10 800 milliárd forint értékű befektetést szerzett...

kedd 11:02

Az új Dyson PencilWash tarol: ultravékony és szuperkönnyű

A Dyson most mutatta be legújabb padlótisztító találmányát, amely szinte forradalmasítja a takarítást az otthonokban...

kedd 10:56

A jövő páncélszekrénye: üvegmemória, amely túléli az évszázadokat

Az emberiség egyre több adatot termel és gyűjt, minden eddiginél gyorsabb ütemben – a mesterséges intelligencia elterjedésével pedig a tárolandó információ mennyisége robbanásszerűen nő...

kedd 10:46

Itt a várva várt élő helymegosztás a Google Messages-ben

Az elmúlt években a Google Messages egy egyszerű üzenetküldő alkalmazásból fejlett, modern platformmá nőtte ki magát Androidon...

kedd 10:37

Az MI‑pánik újra padlóra küldi a kriptoárfolyamokat

Az utóbbi hét napban a főbb kriptodevizák látványos, 8–11%-os veszteségeket szenvedtek el...

kedd 10:19

A baktériumok belülről falják fel a daganatokat

💉 Különleges génmódosítással készült baktériumok hamarosan képesek lehetnek arra, hogy felfalják a rákos daganatokat belülről kifelé...

kedd 10:02

Az MI-ügynökök vadnyugatának vége: a Google tiltólistára teszi az OpenClaw-t

🕵 A hétvégén kitört a botrány a Google körül, miután számos fejlesztő hozzáférését korlátozták a népszerű Antigravity-platformhoz...

kedd 09:56

Az ember visszatér a Holdra, az egér az új szupervakcinára tüsszent

2026. február 23. Az elmúlt hét bővelkedett a meglepetésekben: váratlan fordulat a Moderna új mRNS-influenza-vakcinája engedélyezése körül, biztató kísérleti eredmények egy univerzális, belélegezhető oltásról, veszélyesnek bizonyuló légszennyezés és egy sivatagi dinólelelet, ami átírja a spinosauridák történetét...

kedd 09:46

Az MI energiaéhsége: Sam Altman mindent bevetne, hogy ne legyen igazuk

Sam Altman, az OpenAI vezérigazgatója újabb hullámokat keltett azzal, hogy minden MI-t támadó hangot visszautasított az India AI Impact csúcstalálkozón, mondván, igazán elfogadhatatlan az a „csúnya” vád, hogy sok vizet és energiát zabál az MI – hiszen tessék, az emberek is 20 évig csak esznek, nőnek és tanulnak, mire okossá válnak...

kedd 09:37

Az indiai Xflow felforgatja a nemzetközi vállalati pénzáramlást

🌍 Az Xflow egy indiai fintech startup, amely jelentős támogatást kapott a Stripe-tól és a PayPal Ventures-től, miután 6 milliárd forintnyi (16,6 millió USD) tőkét vont be...

kedd 09:28

Az Atlanti-óceán ősi erői feltártak egy hatalmas föld alatti kanyont

Mintegy 1000 kilométerre Portugália partjaitól, mélyen az Atlanti-óceán alatt, egy hatalmas föld alatti kanyonrendszer húzódik, amely minden szárazföldi képződményt felülmúl – köztük a Nagy-kanyont (Grand Canyon) is...

kedd 09:20

Az agy rejtélyes átalakulása menopauzában: amit még nem értünk

🧠 A menopauza komoly változást hoz a nők életében, és gyakran nem csupán testi tüneteket okoz...

kedd 09:10

A nagy hóháború: kinek a dolga a lapátolás?

❄ Kezdetben egy hóvihar igazi próbája annak, mennyire működik a társadalmi szerződés...

kedd 09:01

A Fairphone végre felzárkózik: jön az Android 16

Na jó, szóval végre érkezik az Android 16 a Fairphone Gen 6-ra – és ha már a nagy riválisoknál ez megoldódott, igazán ideje volt, nem?..

kedd 08:46

A spanyol hatóságok lecsaptak: hacktivisták a kormány elleni DDoS mögött

Négy feltételezett hacktivistát vett őrizetbe a spanyol Polgárőrség, akik a gyanú szerint több kormányzati minisztérium, politikai párt és közintézmény ellen indítottak kibertámadásokat...