Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben
A nyílt nagy nyelvi modelleknél (LLM-eknél) gyakran csak a kész eredményt látjuk, de az egész fejlesztési folyamat elzárva marad. Ennek következtében a fejlesztők és kutatók számára nehézkessé válik, hogy a modell tudását, működését vagy viselkedését mélyebben megértsék, vagy saját igényeikre szabják. Az Olmo 3 most épp ezen változtat: nemcsak korszerű, nyílt modelleket ad a közösség kezébe, hanem közzéteszi a teljes fejlesztési folyamatot, az összes ellenőrzőpontot, adatot és modellsúlyt. Így végre bárki hozzáférhet az MI fejlődéséhez vezető teljes úthoz, és bármely ponton bekapcsolódhat.

Az Olmo 3 modellcsalád: Teljes nyitottság, visszakövethetőség

Az Olmo 3 középpontjában a 32 milliárd paraméteres Olmo 3-Think áll, amely először teszi lehetővé, hogy a modell gondolkodási láncolataiba, részeredményeibe is betekintést nyerjünk – mindez visszavezethető egészen a tanítóadatokig és a képzési döntésekig. Az Olmo 3 családja kompakt, sűrű modelleket tartalmaz (7 milliárd és 32 milliárd paraméterrel), amelyek futtathatók akár laptopon, akár kutatói klasztereken.

Az Olmo 3-Base a valaha kiadott legerősebb, teljesen nyílt alapmodell, amely minden fejlesztési komponensével együtt elérhető. Az új, bővített és diverzifikált értékelési rendszerben az Olmo 3-Base matematikában, olvasásban és programozásban is kiemelkedő, hosszú szövegeken is stabilan teljesít (akár 65 ezer tokenig). Ez ideális alap továbbtanításhoz, célspecifikus finomhangoláshoz, vagy megerősítéses tanuláshoz, és könnyen bővíthető extra képességekkel, például eszközhasználattal vagy összetett utasítások követésével.

Az Olmo 3-Think kifejezetten érvelési, gondolkodási feladatokra készült, komoly számítási kapacitást igénylő kutatásokhoz. Két méretben érhető el: a nagyobb, 32 milliárd paraméteres verzió szorosan versenyzik a Qwen és hasonló csúcskategóriás nyílt modellekkel, pedig hatszor kevesebb képzési adatmennyiségből tanult. A kisebb, 7 milliárdos változat ugyancsak azonos koncepcióval készül, és összetett feladatoknál lépésről lépésre követhetővé teszi a gondolkodást még szerényebb hardveren is.

Az Olmo 3-Instruct (7B) a csevegő, gyors, válaszadás-centrikus vonal: többkörös chat, utasításkövetés, eszközhasználat mind beépített funkció. Az értékelések szerint felveszi a versenyt, sőt, gyakran megelőzi hasonló nyílt modelleket, például a Qwen 2.5, Gemma 3 és Llama 3.1 modelleket.

Végül, az Olmo 3-RL Zero (7B) teljesen nyílt megerősítéses tanulási útként jelent meg, kifejezetten bonyolult gondolkodási viselkedések felépítésére, átlátható, visszaellenőrizhető jutalmazással.

A modellfolyam: teljes rugalmasság és újrafelhasználhatóság

Az Olmo 3 nem egyetlen, fagyasztott modellt kínál, hanem teljesen dokumentált fejlesztési útvonalakat: az Instruct ágat mindennapi csevegésre és eszközhasználatra, az RL Zero ágat a megerősítéses tanulási kísérletekhez, és a Think/indoklási ágat, amely a legkomplexebb gondolkodást támogatja. Mindezek lehetővé teszik, hogy akár saját, testreszabott utat járj be: kiindulhatsz a Base modellből, használhatsz saját finomhangolási, preferenciaoptimalizálási (DPO) sablont, vagy beépíthetsz újfajta RL-célokat. Az egész folyamat újrafelhasználható építőelemmé, sablonná válik – vagyis nemcsak a mi munkánkat látod, hanem bármikor a saját MI-d fejlesztésének is alapja lehet.

Kimagasló teljesítmény különböző területeken

Az Olmo 3 modelleket kiterjedt tesztkészleten vizsgálták, amelyek magukban foglalják az iparági standard feladatokat: matematikai problémákat, programozási és kódolási feladatokat, olvasásértést, információ-visszakeresést, általános tudásalapú kérdéseket. Az Olmo 3-Base 32B minden összehasonlított nyílt alapmodellt megelőz vagy leköröz, programozási, matematikai és hosszú szövegfeldolgozási teszteken is kiemelkedően teljesít.

Mindez a gondosan válogatott tanítóadathalmazoknak, az egyes modellekre optimalizált képzési stratégiának és új algoritmikus fejlesztéseknek köszönhető. Az RL-környezetek kidolgozása is kulcsfontosságú volt, főleg az érvelő modelleknél. A modellteljesítményben nincs kompromisszum: az Olmo 3 sorra hozza a legjobb számokat a főbb benchmarkokon, sokszor minimális különbséggel az iparág nagyágyúihoz képest (pl. Qwen 2.5, Gemma 3).


Fejlett gondolkodási és csevegési képességek

Az Olmo 3-Think a Base bázismodellt indoklási modellel fejleszti tovább: átfogó matematikai, kódolási és összetett problémákon tanítják több lépéses megoldásra, majd SFT-, DPO- és RLVR-ágon keresztül finomítják. Ezáltal rendkívül magas minőségű gondolkodási láncokat alakít ki – ezek minden korábbinál jobban követik a valós logikai gondolkodást, és a teljes folyamat nyíltan követhető. A 32B verzió a legtöbb mérés szerint vezeti saját mezőnyét, vagy néhány ponton belül marad a legjobb, nyílt súlyú modellekhez képest (például Qwen 3 32B vagy Gemma 3 27B).

Az Olmo 3-Instruct főleg csevegésre, eszközhasználatra és szintetikus adatok generálására optimalizált, rövidebb válaszokat ad, így gyorsabb és hatékonyabb inferencia érhető el. Az összehasonlítások azt mutatják, hogy 7 milliárdos méretben is lekörözi vagy kiegyenlíti főbb riválisait még összetettebb, többkörös beszélgetésekben is.

A valódi nyitottság előnye

Az Olmo 3 összes komponense – adat, kód, modellsúlyok, ellenőrzőpontok – nyíltan, szabadon felhasználható engedélyekkel érhető el. Ezzel új szabványt teremt a mesterséges intelligencia fejlesztésében: a teljes modellfolyam nyilvánossá tétele segíti az átláthatóságot, a bizalmat, a közösségi kollaborációt és az innovációt is.

Ebből adódóan az Olmo 3 nem csupán új modelleket adott a nyílt forrású MI-közösségnek, hanem áttörést hozott a fejlesztési folyamat megosztásában is – és mostantól tényleg mindenki számára elérhetővé vált a fejlődés teljes útja.

2025, adminboss, allenai.org alapján

Legfrissebb posztok

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/7

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Overlap: World Clock (iPhone/iPad)Az Overlap egy intelligens világóra alkalmazás, amely jelentősen megkönnyíti a különböző időzónákban élők számára az egyeztetést...

MA 06:05

Történelmi események a mai napon (Január 7.)

Röviden: ezen a napon Galileo Galilei először pillantotta meg a négy legnagyobb Jupiter-holdat, elindult a szenátusi tárgyalás Bill Clinton impeachment-ügyében, és a Charlie Hebdo elleni terrortámadás megrázta Párizst...

kedd 09:37

Az AMD újra odacsap: a Ryzen AI 400-as sorozattal ráijeszt az Intelre

Érdekes felvetés, hogy ami először apróságnak tűnt – az AMD új Ryzen 7 9850X3D-jének bejelentése –, az valójában csak a jéghegy csúcsa a 2026-os CES-en...

kedd 09:29

Az Nvidia végre a Linuxot és a Fire TV-t is komolyan veszi

🚀 Az Nvidia befejezte az RTX 5080-as frissítést a GeForce Now felhőalapú játékplatformján, és most új funkciókat kapnak az előfizetők...

kedd 09:14

Az izzó galaxishalmaz új fejezetet nyit a világegyetem történetében

💫 Egy minden eddiginél forróbb galaxishalmazt fedeztek fel a korai világegyetemben, ami teljesen váratlanul érte a csillagászokat...

kedd 09:01

Az adatbrókerek rémálma: Kalifornia kemény szabályokkal csap le

Kaliforniában januártól életbe lépett az ország legszigorúbb adatvédelmi jogszabálya, amely jelentősen leegyszerűsíti az állampolgárok számára a személyes adataik törlését és további gyűjtésük megtiltását...

kedd 08:57

Az új SmartVoice eszközök net nélkül is lehallgatnak

🔈 Az Emerson bemutatta SmartVoice nevű eszközeit, amelyekkel egyszerű hangutasításokkal irányíthatod a mindennapi háztartási gépeket, méghozzá alkalmazás, Wi‑Fi vagy bármilyen okosotthon-hub nélkül...

kedd 08:51

Az Nvidia zsebre vágható MI-gépe új ligába lépett

🤖 Érdekes felvetés, hogy egy asztali MI-minigép hirtelen a figyelem középpontjába került: az Nvidia DGX Spark a legújabb szoftverfrissítésnek köszönhetően már több mint kétszeres teljesítménynövekedést ígér októberi bemutatkozása óta...

kedd 08:43

A jövő Hyundai-gyáraiban az emberformájú robotok veszik át a munkát

🤖 A Hyundai Motor Group 2028-tól emberformájú robotokat telepít gyáraiba, ezzel lépést tartva a legnagyobb cégekkel a robotizációs versenyben...

kedd 08:36

Az Nvidia új varázslatai vas nélkül turbózzák a játékélményt

Az Nvidia a CES 2026 rendezvényen ugyan nem mutatott be új gamer hardvert, mégis fejlesztések egész sorával készült a játékosoknak – szoftveres fronton...

kedd 08:30

A nagy élelmiszermítosz: tényleg napi 200 döntést hozol?

Évek óta tartja magát az a vélekedés, hogy az emberek naponta több mint 200 döntést hoznak az ételválasztásaikkal kapcsolatban, többségük ráadásul tudat alatt...

kedd 08:23

A Ryzen AI Embedded P100 az ipari MI nagy dobása

🔧 A CES 2026 alkalmával az AMD nemcsak a szokásos asztali és mobil processzorait mutatta be, hanem végre a beágyazott piacra is komoly figyelmet fordított...

kedd 08:17

Az NVIDIA Rubin MI-platformja berobban: új szabályok jönnek

Az NVIDIA idén a 2026-os CES-en bemutatta minden eddiginél fejlettebb MI-platformját, amely Rubin névre hallgat...

kedd 08:01

A Starlink leállása lebénította a netet, forrong Pápua Új-Guinea

Az emberek egyre elégedetlenebbek Pápua Új-Guineában, miután a kormány felszólította a Starlinket, hogy szüntesse be az internetszolgáltatását...

kedd 07:57

A bitcoin 95 ezer felé száguld, az XRP berobban

A kriptovilág az év egyik legizgalmasabb napját élte át hétfőn, amikor a bitcoin árfolyama 3%-os emelkedéssel elérte a 94 400 dollárt (kb...

kedd 07:51

Az élet ára a sejtekben: a láthatatlan energiaszámla

⚡ Az élő rendszerek működéséhez a látható energiaráfordításokon túl rejtett energiaköltségek is társulnak...

kedd 07:44

Az 50 legmegdöbbentőbb tudományos tény a világról

Érdemes megvizsgálni, hogy mennyi furcsaság és meghökkentő érdekesség rejlik körülöttünk – az emberi testtől a bolygónk szélsőséges adottságaiig és a világegyetem elképesztő titkaiig...

kedd 07:36

Az új HP EliteBookokkal végre fellélegezhet az IT-részleg

A HP idén alaposan megújította az EliteBook X G2 üzleti laptopokat, amelyek most először AMD, Intel és Qualcomm processzorokkal is elérhetők ugyanazon a platformon belül...

kedd 07:29

Az Afeela elektromos autói berobbannak: PlayStation-játékokkal és egyedi hangzással

A Sony és a Honda közös vállalkozása, az Afeela, most először tartott önálló bemutatót, ahol felfedték, hogyan képzelik el a jövő villanyautóit – belül PlayStation-játékokkal, kívül vadonatúj dizájnnal...