Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben
A nyílt nagy nyelvi modelleknél (LLM-eknél) gyakran csak a kész eredményt látjuk, de az egész fejlesztési folyamat elzárva marad. Ennek következtében a fejlesztők és kutatók számára nehézkessé válik, hogy a modell tudását, működését vagy viselkedését mélyebben megértsék, vagy saját igényeikre szabják. Az Olmo 3 most épp ezen változtat: nemcsak korszerű, nyílt modelleket ad a közösség kezébe, hanem közzéteszi a teljes fejlesztési folyamatot, az összes ellenőrzőpontot, adatot és modellsúlyt. Így végre bárki hozzáférhet az MI fejlődéséhez vezető teljes úthoz, és bármely ponton bekapcsolódhat.

Az Olmo 3 modellcsalád: Teljes nyitottság, visszakövethetőség

Az Olmo 3 középpontjában a 32 milliárd paraméteres Olmo 3-Think áll, amely először teszi lehetővé, hogy a modell gondolkodási láncolataiba, részeredményeibe is betekintést nyerjünk – mindez visszavezethető egészen a tanítóadatokig és a képzési döntésekig. Az Olmo 3 családja kompakt, sűrű modelleket tartalmaz (7 milliárd és 32 milliárd paraméterrel), amelyek futtathatók akár laptopon, akár kutatói klasztereken.

Az Olmo 3-Base a valaha kiadott legerősebb, teljesen nyílt alapmodell, amely minden fejlesztési komponensével együtt elérhető. Az új, bővített és diverzifikált értékelési rendszerben az Olmo 3-Base matematikában, olvasásban és programozásban is kiemelkedő, hosszú szövegeken is stabilan teljesít (akár 65 ezer tokenig). Ez ideális alap továbbtanításhoz, célspecifikus finomhangoláshoz, vagy megerősítéses tanuláshoz, és könnyen bővíthető extra képességekkel, például eszközhasználattal vagy összetett utasítások követésével.

Az Olmo 3-Think kifejezetten érvelési, gondolkodási feladatokra készült, komoly számítási kapacitást igénylő kutatásokhoz. Két méretben érhető el: a nagyobb, 32 milliárd paraméteres verzió szorosan versenyzik a Qwen és hasonló csúcskategóriás nyílt modellekkel, pedig hatszor kevesebb képzési adatmennyiségből tanult. A kisebb, 7 milliárdos változat ugyancsak azonos koncepcióval készül, és összetett feladatoknál lépésről lépésre követhetővé teszi a gondolkodást még szerényebb hardveren is.

Az Olmo 3-Instruct (7B) a csevegő, gyors, válaszadás-centrikus vonal: többkörös chat, utasításkövetés, eszközhasználat mind beépített funkció. Az értékelések szerint felveszi a versenyt, sőt, gyakran megelőzi hasonló nyílt modelleket, például a Qwen 2.5, Gemma 3 és Llama 3.1 modelleket.

Végül, az Olmo 3-RL Zero (7B) teljesen nyílt megerősítéses tanulási útként jelent meg, kifejezetten bonyolult gondolkodási viselkedések felépítésére, átlátható, visszaellenőrizhető jutalmazással.

A modellfolyam: teljes rugalmasság és újrafelhasználhatóság

Az Olmo 3 nem egyetlen, fagyasztott modellt kínál, hanem teljesen dokumentált fejlesztési útvonalakat: az Instruct ágat mindennapi csevegésre és eszközhasználatra, az RL Zero ágat a megerősítéses tanulási kísérletekhez, és a Think/indoklási ágat, amely a legkomplexebb gondolkodást támogatja. Mindezek lehetővé teszik, hogy akár saját, testreszabott utat járj be: kiindulhatsz a Base modellből, használhatsz saját finomhangolási, preferenciaoptimalizálási (DPO) sablont, vagy beépíthetsz újfajta RL-célokat. Az egész folyamat újrafelhasználható építőelemmé, sablonná válik – vagyis nemcsak a mi munkánkat látod, hanem bármikor a saját MI-d fejlesztésének is alapja lehet.

Kimagasló teljesítmény különböző területeken

Az Olmo 3 modelleket kiterjedt tesztkészleten vizsgálták, amelyek magukban foglalják az iparági standard feladatokat: matematikai problémákat, programozási és kódolási feladatokat, olvasásértést, információ-visszakeresést, általános tudásalapú kérdéseket. Az Olmo 3-Base 32B minden összehasonlított nyílt alapmodellt megelőz vagy leköröz, programozási, matematikai és hosszú szövegfeldolgozási teszteken is kiemelkedően teljesít.

Mindez a gondosan válogatott tanítóadathalmazoknak, az egyes modellekre optimalizált képzési stratégiának és új algoritmikus fejlesztéseknek köszönhető. Az RL-környezetek kidolgozása is kulcsfontosságú volt, főleg az érvelő modelleknél. A modellteljesítményben nincs kompromisszum: az Olmo 3 sorra hozza a legjobb számokat a főbb benchmarkokon, sokszor minimális különbséggel az iparág nagyágyúihoz képest (pl. Qwen 2.5, Gemma 3).


Fejlett gondolkodási és csevegési képességek

Az Olmo 3-Think a Base bázismodellt indoklási modellel fejleszti tovább: átfogó matematikai, kódolási és összetett problémákon tanítják több lépéses megoldásra, majd SFT-, DPO- és RLVR-ágon keresztül finomítják. Ezáltal rendkívül magas minőségű gondolkodási láncokat alakít ki – ezek minden korábbinál jobban követik a valós logikai gondolkodást, és a teljes folyamat nyíltan követhető. A 32B verzió a legtöbb mérés szerint vezeti saját mezőnyét, vagy néhány ponton belül marad a legjobb, nyílt súlyú modellekhez képest (például Qwen 3 32B vagy Gemma 3 27B).

Az Olmo 3-Instruct főleg csevegésre, eszközhasználatra és szintetikus adatok generálására optimalizált, rövidebb válaszokat ad, így gyorsabb és hatékonyabb inferencia érhető el. Az összehasonlítások azt mutatják, hogy 7 milliárdos méretben is lekörözi vagy kiegyenlíti főbb riválisait még összetettebb, többkörös beszélgetésekben is.

A valódi nyitottság előnye

Az Olmo 3 összes komponense – adat, kód, modellsúlyok, ellenőrzőpontok – nyíltan, szabadon felhasználható engedélyekkel érhető el. Ezzel új szabványt teremt a mesterséges intelligencia fejlesztésében: a teljes modellfolyam nyilvánossá tétele segíti az átláthatóságot, a bizalmat, a közösségi kollaborációt és az innovációt is.

Ebből adódóan az Olmo 3 nem csupán új modelleket adott a nyílt forrású MI-közösségnek, hanem áttörést hozott a fejlesztési folyamat megosztásában is – és mostantól tényleg mindenki számára elérhetővé vált a fejlődés teljes útja.

2025, adminboss, allenai.org alapján

Legfrissebb posztok

Top
hétfő 16:50

Egyetemet végzett milliárdosok – ki mit végzett?

A közvéleményben gyakran keringenek olyan történetek, amelyek a felsőoktatásból kimaradó vállalkozókról szólnak...

MA 13:17

Az űr igazi keményei: meglepő élőlények a végtelenben

A Földön kívüli élet lehetősége egyre kevésbé tűnik elképzelhetetlennek, hiszen napról napra bővül azoknak a földi fajoknak a listája, amelyek képesek túlélni a világűr zord körülményeit...

MA 12:33

A CERN-ben nyolcszoros tempóra kapcsolt az antihidrogén-gyártás

Fantasztikus áttörést ért el egy nemzetközi kutatócsoport a CERN-ben, köztük a Swansea-i Egyetem fizikusai: sikerült nyolcszor gyorsabban előállítani antihidrogén-atomokat, mint korábban...

MA 12:01

A mesterséges intelligencia, amely Elon Muskot istenként imádja

Az utóbbi napokban Grok, az X maximális igazságkeresésre programozott MI-chatbotja, egyre furcsábban rajong Elon Muskért...

MA 11:33

A Salesforce újabb botránya: ügyféladatokat loptak a Gainsighton át

⚠ A Salesforce belső vizsgálatot indított, miután ismeretlenek ügyféladatok ellopására használták fel a Gainsight nevű külső alkalmazást...

MA 11:18

Az oroszlánok titkos hangja: eddig ismeretlen hangot fedeztek fel

A tudósok mesterséges intelligencia segítségével több mint 3 000 afrikai oroszlánok hangfelvételeit vizsgálták meg, és meglepő felfedezésre jutottak: az állatok nemcsak a híres, torokból jövő, erőteljes ordítást használják, hanem létezik egy úgynevezett köztes ordítás is...

MA 11:02

A maja zsenialitás nyomában: így jósolták meg a napfogyatkozásokat

🔭 A maja civilizációban az égi jelenségek, köztük a nap- és holdfogyatkozások megfigyelése központi szerepet játszott...

MA 10:58

Az áttörés, amely új korszakot nyit a növénykeresztezésben

🌱 Miközben a tavaszi mezőket egyszerre szállja meg több tucat növényfaj virágpora, felmerül a kérdés: egy növény hogyan tudja pontosan eldönteni, melyik faj pollenjétől lesz termékeny, és melyiket utasítsa el?..

MA 10:50

A római falakon lógó levágott fejek hátborzongató célt szolgáltak

💀 Egy 2000 éves spanyol erőd romjai között a régészek egyetlen emberi koponyát találtak, amely drámai körülmények között került felszínre...

MA 10:37

A mesterséges intelligencia megtanít tanulni: megérkezett a Tanulómód

A ChatGPT legújabb fejlesztése, a Tanulómód (Study Mode), forradalmasíthatja a tanulást – és nemcsak diákoknak...

MA 10:29

Az újabb támadáshullám csap le a Palo Alto VPN-ekre

⚠ Az elmúlt napokban szokatlanul intenzív támadási hullám indult a Palo Alto Networks GlobalProtect VPN-belépési portáljai ellen, a szkennelések száma egyetlen nap alatt negyvenszeresére nőtt...

MA 10:15

Az év adatlopása sújtotta az olasz vasútóriást

🚂 Olaszország nemzeti vasúttársaságának, az FS Italiane Groupnak érzékeny adatai szivárogtak ki, miután egy hacker feltörte informatikai szolgáltatójuk, az Almaviva rendszerét...

MA 10:09

Az európai talaj mélyén lappangó láthatatlan méreg

A dániai Korsør egykor békés tengerparti település volt, ahol a tehenek nyugodtan legeltek, lakói pedig mit sem sejtettek arról, hogy életüket hamarosan örökre megváltoztatja egy láthatatlan veszély...

MA 10:02

A japán export berobbant – Európa és Ázsia hajtja a növekedést

A japán export októberben a vártnál jóval nagyobb mértékben nőtt, különösen az ázsiai és európai megrendelések erősödésének köszönhetően...

MA 09:36

A Meta új virtuális bulijai: elegünk van a videóhívásokból?

A Meta új lehetőséget adott a virtuális találkozókra: mostantól a Hyperscape Capture tereiben akár nyolc barát is összegyűlhet egy online bulihoz...

MA 09:16

A moha túléli az űrt is – mi következik ezután?

Kilenc hónapot töltöttek mohaminták az űr kíméletlen körülményei között, azután visszahozták őket a Földre – és a spórák több mint 80 százaléka tovább szaporodott...

MA 09:02

Az eltűnt bolygó rejtélye: hogyan született a Hold

🌓 A Hold keletkezésének legnépszerűbb magyarázata szerint egy ősi, Theia nevű bolygó nagyjából 4,5 milliárd évvel ezelőtt ütközött a Földdel...

MA 08:59

A mesterséges intelligencia nyomra bukkan: ilyen ősi a fotoszintézis

🌱 Ez a jelenség jól szemlélteti, hogy a Föld legrégibb életének története éppen csak sejthető, hiszen a több milliárd éves kőzetek teljesen átalakultak az évmilliárdok alatt...

MA 08:50

Az Amazon Alexa+ végre Kanadában is elérhető

🇨🇦 Mostantól Kanadában is elérhető az Amazon új generációs digitális asszisztense, az Alexa+...