Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben
A nyílt nagy nyelvi modelleknél (LLM-eknél) gyakran csak a kész eredményt látjuk, de az egész fejlesztési folyamat elzárva marad. Ennek következtében a fejlesztők és kutatók számára nehézkessé válik, hogy a modell tudását, működését vagy viselkedését mélyebben megértsék, vagy saját igényeikre szabják. Az Olmo 3 most épp ezen változtat: nemcsak korszerű, nyílt modelleket ad a közösség kezébe, hanem közzéteszi a teljes fejlesztési folyamatot, az összes ellenőrzőpontot, adatot és modellsúlyt. Így végre bárki hozzáférhet az MI fejlődéséhez vezető teljes úthoz, és bármely ponton bekapcsolódhat.

Az Olmo 3 modellcsalád: Teljes nyitottság, visszakövethetőség

Az Olmo 3 középpontjában a 32 milliárd paraméteres Olmo 3-Think áll, amely először teszi lehetővé, hogy a modell gondolkodási láncolataiba, részeredményeibe is betekintést nyerjünk – mindez visszavezethető egészen a tanítóadatokig és a képzési döntésekig. Az Olmo 3 családja kompakt, sűrű modelleket tartalmaz (7 milliárd és 32 milliárd paraméterrel), amelyek futtathatók akár laptopon, akár kutatói klasztereken.

Az Olmo 3-Base a valaha kiadott legerősebb, teljesen nyílt alapmodell, amely minden fejlesztési komponensével együtt elérhető. Az új, bővített és diverzifikált értékelési rendszerben az Olmo 3-Base matematikában, olvasásban és programozásban is kiemelkedő, hosszú szövegeken is stabilan teljesít (akár 65 ezer tokenig). Ez ideális alap továbbtanításhoz, célspecifikus finomhangoláshoz, vagy megerősítéses tanuláshoz, és könnyen bővíthető extra képességekkel, például eszközhasználattal vagy összetett utasítások követésével.

Az Olmo 3-Think kifejezetten érvelési, gondolkodási feladatokra készült, komoly számítási kapacitást igénylő kutatásokhoz. Két méretben érhető el: a nagyobb, 32 milliárd paraméteres verzió szorosan versenyzik a Qwen és hasonló csúcskategóriás nyílt modellekkel, pedig hatszor kevesebb képzési adatmennyiségből tanult. A kisebb, 7 milliárdos változat ugyancsak azonos koncepcióval készül, és összetett feladatoknál lépésről lépésre követhetővé teszi a gondolkodást még szerényebb hardveren is.

Az Olmo 3-Instruct (7B) a csevegő, gyors, válaszadás-centrikus vonal: többkörös chat, utasításkövetés, eszközhasználat mind beépített funkció. Az értékelések szerint felveszi a versenyt, sőt, gyakran megelőzi hasonló nyílt modelleket, például a Qwen 2.5, Gemma 3 és Llama 3.1 modelleket.

Végül, az Olmo 3-RL Zero (7B) teljesen nyílt megerősítéses tanulási útként jelent meg, kifejezetten bonyolult gondolkodási viselkedések felépítésére, átlátható, visszaellenőrizhető jutalmazással.

A modellfolyam: teljes rugalmasság és újrafelhasználhatóság

Az Olmo 3 nem egyetlen, fagyasztott modellt kínál, hanem teljesen dokumentált fejlesztési útvonalakat: az Instruct ágat mindennapi csevegésre és eszközhasználatra, az RL Zero ágat a megerősítéses tanulási kísérletekhez, és a Think/indoklási ágat, amely a legkomplexebb gondolkodást támogatja. Mindezek lehetővé teszik, hogy akár saját, testreszabott utat járj be: kiindulhatsz a Base modellből, használhatsz saját finomhangolási, preferenciaoptimalizálási (DPO) sablont, vagy beépíthetsz újfajta RL-célokat. Az egész folyamat újrafelhasználható építőelemmé, sablonná válik – vagyis nemcsak a mi munkánkat látod, hanem bármikor a saját MI-d fejlesztésének is alapja lehet.

Kimagasló teljesítmény különböző területeken

Az Olmo 3 modelleket kiterjedt tesztkészleten vizsgálták, amelyek magukban foglalják az iparági standard feladatokat: matematikai problémákat, programozási és kódolási feladatokat, olvasásértést, információ-visszakeresést, általános tudásalapú kérdéseket. Az Olmo 3-Base 32B minden összehasonlított nyílt alapmodellt megelőz vagy leköröz, programozási, matematikai és hosszú szövegfeldolgozási teszteken is kiemelkedően teljesít.

Mindez a gondosan válogatott tanítóadathalmazoknak, az egyes modellekre optimalizált képzési stratégiának és új algoritmikus fejlesztéseknek köszönhető. Az RL-környezetek kidolgozása is kulcsfontosságú volt, főleg az érvelő modelleknél. A modellteljesítményben nincs kompromisszum: az Olmo 3 sorra hozza a legjobb számokat a főbb benchmarkokon, sokszor minimális különbséggel az iparág nagyágyúihoz képest (pl. Qwen 2.5, Gemma 3).


Fejlett gondolkodási és csevegési képességek

Az Olmo 3-Think a Base bázismodellt indoklási modellel fejleszti tovább: átfogó matematikai, kódolási és összetett problémákon tanítják több lépéses megoldásra, majd SFT-, DPO- és RLVR-ágon keresztül finomítják. Ezáltal rendkívül magas minőségű gondolkodási láncokat alakít ki – ezek minden korábbinál jobban követik a valós logikai gondolkodást, és a teljes folyamat nyíltan követhető. A 32B verzió a legtöbb mérés szerint vezeti saját mezőnyét, vagy néhány ponton belül marad a legjobb, nyílt súlyú modellekhez képest (például Qwen 3 32B vagy Gemma 3 27B).

Az Olmo 3-Instruct főleg csevegésre, eszközhasználatra és szintetikus adatok generálására optimalizált, rövidebb válaszokat ad, így gyorsabb és hatékonyabb inferencia érhető el. Az összehasonlítások azt mutatják, hogy 7 milliárdos méretben is lekörözi vagy kiegyenlíti főbb riválisait még összetettebb, többkörös beszélgetésekben is.

A valódi nyitottság előnye

Az Olmo 3 összes komponense – adat, kód, modellsúlyok, ellenőrzőpontok – nyíltan, szabadon felhasználható engedélyekkel érhető el. Ezzel új szabványt teremt a mesterséges intelligencia fejlesztésében: a teljes modellfolyam nyilvánossá tétele segíti az átláthatóságot, a bizalmat, a közösségi kollaborációt és az innovációt is.

Ebből adódóan az Olmo 3 nem csupán új modelleket adott a nyílt forrású MI-közösségnek, hanem áttörést hozott a fejlesztési folyamat megosztásában is – és mostantól tényleg mindenki számára elérhetővé vált a fejlődés teljes útja.

2025, adminboss, allenai.org alapján

Legfrissebb posztok

MA 12:34

Az űrállomásról rajtolhat az első űrbéli orvosi mentés

Az amerikai űrügynökség minden eddiginél komolyabb orvosi vészhelyzet elé nézhet: az egyik űrhajós a Nemzetközi Űrállomáson (ISS) váratlanul egészségügyi problémákat tapasztalt, ezért egy előre tervezett űrsétát elhalasztottak, és felmerült, hogy a legénység egy részét előbb kell hazahozni, mint ahogy eredetileg tervezték...

MA 12:02

Vége az álomnak: a Ballie sosem költözik be otthonainkba?

😪 Hat év fejlesztés és ígérgetés után a Samsung Ballie nevű otthoni robotja végleg eltűnt a vásárlók elől, és már csak belső céges projektté silányult...

MA 11:49

Az ifjú galaxisfürt, amely megrengeti a kozmológiai elméleteket

Különösen figyelemre méltó, hogy egy nemzetközi kutatócsoport olyan galaxisfürtöt azonosított, amely a feltételezettnél jóval korábban és jóval magasabb hőmérsékleten jelent meg az univerzumban, mint amit a mai elméletek megengednének...

MA 10:58

A meglepő ok, amiért jéghidegnek érezzük a vizet mentolos fogkrém után

👀 Külön említést érdemel, hogy sokan ismerik a pillanatot, amikor fogmosás után iszunk egy korty vizet, és az hirtelen jéghidegnek tűnik, sőt, a levegővétel is hűsítő élményt nyújt...

MA 10:50

A rendszeres mozgás felérhet a terápiával depresszió ellen

Világszerte több mint 280 millió embert érint a depresszió, amely komoly terhet ró az egészségügyre és az érintettekre...

MA 10:43

A Chase veszi át az Apple hitelkártyáját – jön a váltás

Az Apple Card felhasználók egyelőre nem fognak változást érzékelni, miután az Apple hivatalosan bejelentette, hogy a JPMorgan Chase váltja a Goldman Sachsot a hitelkártya-kibocsátójaként...

MA 10:36

A Ford MI-asszisztense új korszakot nyit az autózásban

Ford bejelentette, hogy hamarosan MI-asszisztenssel és továbbfejlesztett BlueCruise technológiával frissíti szolgáltatásait...

MA 10:29

A természet utolsó menedékei riasztó ütemben tűnnek el

🌳 A világ szárazföldi biodiverzitás szempontjából legfontosabb területeit, az úgynevezett „hotspotokat” egy új kutatás szerint súlyosan terheli az emberi földhasználat...

MA 10:22

A Disney+ belép a függőleges videók korszakába

Idén érkezik a Disney+ újítása: a függőleges videófolyam, amely a TikTok sikerét lovagolja meg...

MA 10:08

Az ultragyors UV-fény átírhatja a kommunikáció és a képalkotás szabályait

Továbbá megemlíthető, hogy a fotonikus technológiák, amelyek az ultraibolya (UV-C) tartományban (100–280 nm) működnek, már most kulcsszerepet játszanak számos területen, a szuperfelbontású mikroszkópiától az optikai kommunikációig...

MA 10:02

A Grok-bot botránya: kiskorúakat ábrázoló szexuális képek a sötét weben

Az internet biztonságáért küzdő szervezetek komoly figyelmeztetést adtak ki: az Elon Musk tulajdonában lévő Grok MI-chatbotot bűnözők használták fel gyermekekről készült szexuális képek létrehozásához...

MA 09:43

A Dell 52 colos, 6K-s óriása letarolja a piacot

A Dell bemutatta az UltraSharp 52 Thunderbolt Hub monitort, amely igazi óriás: 132 cm-es (52 hüvelykes) képátlójával és elképesztő 6K felbontásával jelenleg egyedülálló a világon...

MA 09:36

Az MI a Fordokba költözik – és ez már valóság

🚗 A Ford is beszáll az MI-alapú élményversenybe: 2026-tól a gyártó autóiban személyre szabott digitális asszisztens segíti majd a sofőrt és az utasokat...

MA 09:29

A trónról taszítva: zuhan a ChatGPT népszerűsége

ChatGPT piaci részesedése jelentősen visszaesett, miközben a Google Gemini egyre nagyobb teret hódít a weben...

MA 09:22

Az Apple-gépeken leálltak a Logitech appok – kitört a káosz

A Logitech Options+ és G HUB alkalmazások hirtelen működésképtelenné váltak Macen, miután egy lejárt tanúsítvány blokkolta az indításukat...

MA 09:08

A JPMorgan veszi át az Apple Cardot – végre búcsú a Goldmantól

Az Apple hivatalosan bejelentette, hogy az Apple Card új kibocsátója a JPMorgan Chase lesz...

MA 09:01

Az OpenAI nem használja fel egészségügyi adataidat MI-képzéshez

💉 Az OpenAI elindítja a ChatGPT Health nevű új funkciót, amely kizárólag egészségügyi beszélgetésekre készült, és biztonságos, privát teret kínál a felhasználóknak...

MA 08:57

A kínai MI új ragadozója berobban a hongkongi tőzsdére

📈 Kína vezető MI-fejlesztője, a Zhipu részvényei sikeresen debütáltak a hongkongi tőzsdén, miután 558 millió dolláros (207 milliárd forint) IPO-jával elsőként a kínai „MI-tigrisek” közül vált nyilvános részvénytársasággá...

MA 08:43

Az OpenAI már az egészségügyi adataidra is szemet vetett

Az OpenAI új lehetőséget mutatott be: hamarosan feltöltheted egészségügyi adataidat a ChatGPT-be, azaz megoszthatod vele orvosi leleteidet, vizsgálati eredményeidet vagy a fitneszalkalmazásokból származó információkat...