2025. 11. 21., 12:20

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben
A nyílt nagy nyelvi modelleknél (LLM-eknél) gyakran csak a kész eredményt látjuk, de az egész fejlesztési folyamat elzárva marad. Ennek következtében a fejlesztők és kutatók számára nehézkessé válik, hogy a modell tudását, működését vagy viselkedését mélyebben megértsék, vagy saját igényeikre szabják. Az Olmo 3 most épp ezen változtat: nemcsak korszerű, nyílt modelleket ad a közösség kezébe, hanem közzéteszi a teljes fejlesztési folyamatot, az összes ellenőrzőpontot, adatot és modellsúlyt. Így végre bárki hozzáférhet az MI fejlődéséhez vezető teljes úthoz, és bármely ponton bekapcsolódhat.

Az Olmo 3 modellcsalád: Teljes nyitottság, visszakövethetőség

Az Olmo 3 középpontjában a 32 milliárd paraméteres Olmo 3-Think áll, amely először teszi lehetővé, hogy a modell gondolkodási láncolataiba, részeredményeibe is betekintést nyerjünk – mindez visszavezethető egészen a tanítóadatokig és a képzési döntésekig. Az Olmo 3 családja kompakt, sűrű modelleket tartalmaz (7 milliárd és 32 milliárd paraméterrel), amelyek futtathatók akár laptopon, akár kutatói klasztereken.

Az Olmo 3-Base a valaha kiadott legerősebb, teljesen nyílt alapmodell, amely minden fejlesztési komponensével együtt elérhető. Az új, bővített és diverzifikált értékelési rendszerben az Olmo 3-Base matematikában, olvasásban és programozásban is kiemelkedő, hosszú szövegeken is stabilan teljesít (akár 65 ezer tokenig). Ez ideális alap továbbtanításhoz, célspecifikus finomhangoláshoz, vagy megerősítéses tanuláshoz, és könnyen bővíthető extra képességekkel, például eszközhasználattal vagy összetett utasítások követésével.

Az Olmo 3-Think kifejezetten érvelési, gondolkodási feladatokra készült, komoly számítási kapacitást igénylő kutatásokhoz. Két méretben érhető el: a nagyobb, 32 milliárd paraméteres verzió szorosan versenyzik a Qwen és hasonló csúcskategóriás nyílt modellekkel, pedig hatszor kevesebb képzési adatmennyiségből tanult. A kisebb, 7 milliárdos változat ugyancsak azonos koncepcióval készül, és összetett feladatoknál lépésről lépésre követhetővé teszi a gondolkodást még szerényebb hardveren is.

Az Olmo 3-Instruct (7B) a csevegő, gyors, válaszadás-centrikus vonal: többkörös chat, utasításkövetés, eszközhasználat mind beépített funkció. Az értékelések szerint felveszi a versenyt, sőt, gyakran megelőzi hasonló nyílt modelleket, például a Qwen 2.5, Gemma 3 és Llama 3.1 modelleket.

Végül, az Olmo 3-RL Zero (7B) teljesen nyílt megerősítéses tanulási útként jelent meg, kifejezetten bonyolult gondolkodási viselkedések felépítésére, átlátható, visszaellenőrizhető jutalmazással.

A modellfolyam: teljes rugalmasság és újrafelhasználhatóság

Az Olmo 3 nem egyetlen, fagyasztott modellt kínál, hanem teljesen dokumentált fejlesztési útvonalakat: az Instruct ágat mindennapi csevegésre és eszközhasználatra, az RL Zero ágat a megerősítéses tanulási kísérletekhez, és a Think/indoklási ágat, amely a legkomplexebb gondolkodást támogatja. Mindezek lehetővé teszik, hogy akár saját, testreszabott utat járj be: kiindulhatsz a Base modellből, használhatsz saját finomhangolási, preferenciaoptimalizálási (DPO) sablont, vagy beépíthetsz újfajta RL-célokat. Az egész folyamat újrafelhasználható építőelemmé, sablonná válik – vagyis nemcsak a mi munkánkat látod, hanem bármikor a saját MI-d fejlesztésének is alapja lehet.

Kimagasló teljesítmény különböző területeken

Az Olmo 3 modelleket kiterjedt tesztkészleten vizsgálták, amelyek magukban foglalják az iparági standard feladatokat: matematikai problémákat, programozási és kódolási feladatokat, olvasásértést, információ-visszakeresést, általános tudásalapú kérdéseket. Az Olmo 3-Base 32B minden összehasonlított nyílt alapmodellt megelőz vagy leköröz, programozási, matematikai és hosszú szövegfeldolgozási teszteken is kiemelkedően teljesít.

Mindez a gondosan válogatott tanítóadathalmazoknak, az egyes modellekre optimalizált képzési stratégiának és új algoritmikus fejlesztéseknek köszönhető. Az RL-környezetek kidolgozása is kulcsfontosságú volt, főleg az érvelő modelleknél. A modellteljesítményben nincs kompromisszum: az Olmo 3 sorra hozza a legjobb számokat a főbb benchmarkokon, sokszor minimális különbséggel az iparág nagyágyúihoz képest (pl. Qwen 2.5, Gemma 3).


Fejlett gondolkodási és csevegési képességek

Az Olmo 3-Think a Base bázismodellt indoklási modellel fejleszti tovább: átfogó matematikai, kódolási és összetett problémákon tanítják több lépéses megoldásra, majd SFT-, DPO- és RLVR-ágon keresztül finomítják. Ezáltal rendkívül magas minőségű gondolkodási láncokat alakít ki – ezek minden korábbinál jobban követik a valós logikai gondolkodást, és a teljes folyamat nyíltan követhető. A 32B verzió a legtöbb mérés szerint vezeti saját mezőnyét, vagy néhány ponton belül marad a legjobb, nyílt súlyú modellekhez képest (például Qwen 3 32B vagy Gemma 3 27B).

Az Olmo 3-Instruct főleg csevegésre, eszközhasználatra és szintetikus adatok generálására optimalizált, rövidebb válaszokat ad, így gyorsabb és hatékonyabb inferencia érhető el. Az összehasonlítások azt mutatják, hogy 7 milliárdos méretben is lekörözi vagy kiegyenlíti főbb riválisait még összetettebb, többkörös beszélgetésekben is.

A valódi nyitottság előnye

Az Olmo 3 összes komponense – adat, kód, modellsúlyok, ellenőrzőpontok – nyíltan, szabadon felhasználható engedélyekkel érhető el. Ezzel új szabványt teremt a mesterséges intelligencia fejlesztésében: a teljes modellfolyam nyilvánossá tétele segíti az átláthatóságot, a bizalmat, a közösségi kollaborációt és az innovációt is.

Ebből adódóan az Olmo 3 nem csupán új modelleket adott a nyílt forrású MI-közösségnek, hanem áttörést hozott a fejlesztési folyamat megosztásában is – és mostantól tényleg mindenki számára elérhetővé vált a fejlődés teljes útja.

2025, adminboss, allenai.org alapján

Legfrissebb posztok

MA 14:02

A 2500 éves egyiptomi gyöngyfátyol, amely Ozirisszá változtatja a halottat

Több ezer apró, színes gyöngyből készült halotti lepel került elő Luxorban, amely mintegy 2500 évvel ezelőtt szolgált a halottak túlvilágra való átvezetésének szimbólumaként...

MA 13:56

Az ergonómia bajnoka: Sihoo Doro C300 Pro V2 teszt

Felmerül a kérdés, hogy mennyit számít egy jó irodai szék a mindennapi munkában...

MA 13:45

Az óriási szuperszámítógépes szimulációk feltárták a kozmosz mágneses titkát

💫 Fontos kérdés, hogy miért találhatók rendezett, óriási mágneses terek az univerzum minden szegletében – a bolygóktól a csillagokon át egészen a galaxisokig...

MA 13:23

A Hyperliquid makrogazdasági fogadásokkal támadja a Polymarketet

A Hyperliquid elhozta a való élet eseményeire épülő jóslatokat a decentralizált tőzsdék világába...

MA 13:12

Mikor érkezik végre a Riválisok 2. évad 5. része Hulu-ra és Disney+-ra?

😱 A Riválisok (Rivals) pimasz második évadából a jelenlegi adagban már csak két epizód van hátra, és az előző részben minden eddiginél többet láthattunk – szó szerint is...

MA 12:44

A szaúdi NEOM 2030 utánra halasztja a The Line építését

🚧 Különösen igaz ez, ha grandiózus, sci-fibe illő tervekről van szó: Szaúd-Arábia leállította A Vonal (The Line) projekt további munkálatait legalább 2030-ig...

MA 11:55

A stabilcoinok értéke már 95 ország devizatartalékát is veri

A stabilcoinok piaci értéke mára elérte a 322 milliárd dollárt (kb...

MA 11:35

Egy ritka genetikai betegség átírja, mit gondolunk az agy félelemközpontjáról

💪 Különösen akkor, ha egy ritka genetikai eltérés világít rá, hogy amit az agytudomány évtizedek óta biztosnak hitt, az lehet, hogy alapjaiban nem igaz...

MA 11:12

Az Apple új Star Cityje teljesen más, mint Az egész emberiségért

Érdekes felvetés, hogy egy alkotógárda akár két teljesen eltérő sci-fi sorozatot is le tud tenni az asztalra, miközben a témájuk első pillantásra nagyon hasonlónak tűnik...

MA 11:01

Az XRP 1,35 alá esik: 1,30-nál dőlhet el minden

Erre példa, amikor egy kriptovaluta hetekig alig mozdul, majd hirtelen elindul a lejtőn: az XRP árfolyama már harmadszor pattant le a fontos 1,36 dolláros ellenállásról, így a bikák lendülete megtört, és a jegyzés most az 1,35 dolláros szint alá süllyedt...

MA 10:55

Az MI-adósságok csendben átrajzolják a vállalati kockázati térképet

Egy lényeges szempont, hogy az elmúlt húsz évben a technikai adósság leginkább elavult rendszereket, zűrzavaros programkódot és elhanyagolt dokumentációt jelentett...

MA 10:46

A Mars parittyaként hajítja a NASA Psyche-t a rejtélyes fémvilág felé

Ebből következően érdemes megérteni, hogy a NASA Psyche űrszondája meghatározó mérföldkőhöz ért: sikeresen kihasználta a Mars gravitációját, hogy lendületet kapjon és megfelelő irányba álljon a kisbolygóövben keringő titokzatos, fémben gazdag Psyche aszteroida felé...

MA 10:37

Váratlanul meghalt Nathan Allman, az Ondo Finance alapítója

Egy egész iparág meglepő hírre ébredt: Nathan Allman, az Ondo Finance alapítója és vezérigazgatója váratlanul elhunyt...

MA 10:28

A Jupiteren túl rejtélyes gyűrűben bolygógyárra bukkantak a tudósok

4,6 milliárd éve a Napot masszív gáz- és porlemez vette körül, amelyből először apró porszemek születtek, majd ezekből bonyolult ütközések és összetapadások révén kialakultak a bolygókezdemények...

MA 10:19

A Derelict Star, az űrplatformer, amely Jonathan Blow-nál is kiverte a biztosítékot

🚀 Az indie platformerek piacán időnként felbukkan egy-egy olyan játék, amely képes megosztani még a műfaj legnagyobb rajongóit is...

MA 10:01

A bab és a szója akár 30%-kal mérsékelheti a magas vérnyomás kockázatát

Egy lényeges szempont, hogy az étkezési szokásaink drasztikusan befolyásolják a magas vérnyomás kialakulásának kockázatát...

MA 09:55

A Naprendszer legnagyobb holdja melegszik: Ganümédész rejtélyes múltjára fény derül

A Jupiter legnagyobb holdja, Ganümédész nem csupán a Naprendszer legnagyobb holdja, hanem egyedülálló mágneses térrel is rendelkezik...

MA 09:46

A Bitcoin megtorpan 76 500 dollárnál: vihar előtti csend?

⚡ Fontos kérdés, hogy mire vár most a Bitcoin, hiszen napok óta egy szűk sávban, 76 500 dollár (körülbelül 27 millió forint) környékén stagnál...

MA 09:37

Az ősi hal, amely elárulhatja, hogyan léptek először partra az állatok

🐟 Több mint 380 millió évvel ezelőtt különös hibrid haltípusok népesítették be a Föld ősi vizeit...

MA 09:28

A százmillió éves rovar rákollókkal vadászott – ilyet még nem láttunk

Álom­szerűen tiszta borostyánban találtak egy döbbenetes ősi rovart Mianmarban, amelynek mellső lábait rákollókra emlékeztető hatalmas ollók koronázzák meg...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 5/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ImgRef (iPhone/iPad)Ez az alkalmazás egy sokoldalú, minden igényt kielégítő kreatív eszköz: lehetővé teszi mood boardok készítését, referenciafotók rendezését, intelligens médiakezelést, precíz színválasztást és szabad kollázsolást...

MA 09:11

A bevehetetlenek: hat középkori vár, amelyet sosem vettek be

A középkori várak korában, amikor Európában állandó háborúk és hatalmi harcok dúltak, a masszív, kőből épült erődök sokszor a túlélés zálogát jelentették...

MA 09:01

Az Alzheimer-kór rejtett kiváltója: megvan a mód, hogyan állítsuk le

💡 Amerikai kutatók áttörést értek el az Alzheimer-kór kiváltó okainak felderítésében, és egyúttal ígéretes új kezelési lehetőséget is találtak...

MA 08:55

Az epigenetikai nyomok korán jelzik, miért öregszenek gyorsabban a hawaii őslakosok

🌱 Fontos kérdés, hogy miért jelennek meg bizonyos betegségek, például a diabétesz, sokkal fiatalabb korban a hawaii őslakosok között, mint az állam többi lakójánál...

MA 08:47

Felejtsd el a jelszólopást: így jutnak be 2026-ban a hekkerek

🔒 Az utóbbi években radikálisan megváltozott, ahogyan a hekkerek betörnek a nagyvállalatok rendszereibe, különösen az Egyesült Államokban...

MA 08:36

Az amerikai csapások után HYPE megelőzte a Dogecoint, esnek a privacy tokenek

💰 A kriptopiacok jelentős mozgásokat mutattak, miután amerikai rakétacsapások értek iráni célpontokat, ami azonnali hatással volt az olajárakra és a főbb devizákra is...

MA 08:18

A NEAR-rali gyorsul: keresztlánc-aktivitás dob rá újabb 15%-ot

Az elmúlt 24 órában 15%-ot emelkedett a NEAR token, így ára elérte az 1050 forintot (2,8 USD), ami egy hónapos felfutás csúcsa: ebben az időszakban a NEAR értéke megduplázódott...

MA 08:01

A Vénusz bizarr mintái zavarba ejtik a tudósokat

💫 A Vénusz felszínén hatalmas, titokzatos köralakzatok rajzolódnak ki, amelyek jelenleg is nagy fejtörést okoznak a kutatóknak...

MA 07:55

Az NYT Connections keddi tippjei és megoldásai (május 26., #1080)

💡 Egy lényeges szempont, hogy a Connections játék izgalma nemcsak a logikai kihívásban rejlik, hanem abban is, hogy könnyű félrevezetni magunkat...