2025. 11. 21., 12:20

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben

Az Olmo 3 forradalma: nyílt modellcsalád az MI-fejlesztésben
A nyílt nagy nyelvi modelleknél (LLM-eknél) gyakran csak a kész eredményt látjuk, de az egész fejlesztési folyamat elzárva marad. Ennek következtében a fejlesztők és kutatók számára nehézkessé válik, hogy a modell tudását, működését vagy viselkedését mélyebben megértsék, vagy saját igényeikre szabják. Az Olmo 3 most épp ezen változtat: nemcsak korszerű, nyílt modelleket ad a közösség kezébe, hanem közzéteszi a teljes fejlesztési folyamatot, az összes ellenőrzőpontot, adatot és modellsúlyt. Így végre bárki hozzáférhet az MI fejlődéséhez vezető teljes úthoz, és bármely ponton bekapcsolódhat.

Az Olmo 3 modellcsalád: Teljes nyitottság, visszakövethetőség

Az Olmo 3 középpontjában a 32 milliárd paraméteres Olmo 3-Think áll, amely először teszi lehetővé, hogy a modell gondolkodási láncolataiba, részeredményeibe is betekintést nyerjünk – mindez visszavezethető egészen a tanítóadatokig és a képzési döntésekig. Az Olmo 3 családja kompakt, sűrű modelleket tartalmaz (7 milliárd és 32 milliárd paraméterrel), amelyek futtathatók akár laptopon, akár kutatói klasztereken.

Az Olmo 3-Base a valaha kiadott legerősebb, teljesen nyílt alapmodell, amely minden fejlesztési komponensével együtt elérhető. Az új, bővített és diverzifikált értékelési rendszerben az Olmo 3-Base matematikában, olvasásban és programozásban is kiemelkedő, hosszú szövegeken is stabilan teljesít (akár 65 ezer tokenig). Ez ideális alap továbbtanításhoz, célspecifikus finomhangoláshoz, vagy megerősítéses tanuláshoz, és könnyen bővíthető extra képességekkel, például eszközhasználattal vagy összetett utasítások követésével.

Az Olmo 3-Think kifejezetten érvelési, gondolkodási feladatokra készült, komoly számítási kapacitást igénylő kutatásokhoz. Két méretben érhető el: a nagyobb, 32 milliárd paraméteres verzió szorosan versenyzik a Qwen és hasonló csúcskategóriás nyílt modellekkel, pedig hatszor kevesebb képzési adatmennyiségből tanult. A kisebb, 7 milliárdos változat ugyancsak azonos koncepcióval készül, és összetett feladatoknál lépésről lépésre követhetővé teszi a gondolkodást még szerényebb hardveren is.

Az Olmo 3-Instruct (7B) a csevegő, gyors, válaszadás-centrikus vonal: többkörös chat, utasításkövetés, eszközhasználat mind beépített funkció. Az értékelések szerint felveszi a versenyt, sőt, gyakran megelőzi hasonló nyílt modelleket, például a Qwen 2.5, Gemma 3 és Llama 3.1 modelleket.

Végül, az Olmo 3-RL Zero (7B) teljesen nyílt megerősítéses tanulási útként jelent meg, kifejezetten bonyolult gondolkodási viselkedések felépítésére, átlátható, visszaellenőrizhető jutalmazással.

A modellfolyam: teljes rugalmasság és újrafelhasználhatóság

Az Olmo 3 nem egyetlen, fagyasztott modellt kínál, hanem teljesen dokumentált fejlesztési útvonalakat: az Instruct ágat mindennapi csevegésre és eszközhasználatra, az RL Zero ágat a megerősítéses tanulási kísérletekhez, és a Think/indoklási ágat, amely a legkomplexebb gondolkodást támogatja. Mindezek lehetővé teszik, hogy akár saját, testreszabott utat járj be: kiindulhatsz a Base modellből, használhatsz saját finomhangolási, preferenciaoptimalizálási (DPO) sablont, vagy beépíthetsz újfajta RL-célokat. Az egész folyamat újrafelhasználható építőelemmé, sablonná válik – vagyis nemcsak a mi munkánkat látod, hanem bármikor a saját MI-d fejlesztésének is alapja lehet.

Kimagasló teljesítmény különböző területeken

Az Olmo 3 modelleket kiterjedt tesztkészleten vizsgálták, amelyek magukban foglalják az iparági standard feladatokat: matematikai problémákat, programozási és kódolási feladatokat, olvasásértést, információ-visszakeresést, általános tudásalapú kérdéseket. Az Olmo 3-Base 32B minden összehasonlított nyílt alapmodellt megelőz vagy leköröz, programozási, matematikai és hosszú szövegfeldolgozási teszteken is kiemelkedően teljesít.

Mindez a gondosan válogatott tanítóadathalmazoknak, az egyes modellekre optimalizált képzési stratégiának és új algoritmikus fejlesztéseknek köszönhető. Az RL-környezetek kidolgozása is kulcsfontosságú volt, főleg az érvelő modelleknél. A modellteljesítményben nincs kompromisszum: az Olmo 3 sorra hozza a legjobb számokat a főbb benchmarkokon, sokszor minimális különbséggel az iparág nagyágyúihoz képest (pl. Qwen 2.5, Gemma 3).


Fejlett gondolkodási és csevegési képességek

Az Olmo 3-Think a Base bázismodellt indoklási modellel fejleszti tovább: átfogó matematikai, kódolási és összetett problémákon tanítják több lépéses megoldásra, majd SFT-, DPO- és RLVR-ágon keresztül finomítják. Ezáltal rendkívül magas minőségű gondolkodási láncokat alakít ki – ezek minden korábbinál jobban követik a valós logikai gondolkodást, és a teljes folyamat nyíltan követhető. A 32B verzió a legtöbb mérés szerint vezeti saját mezőnyét, vagy néhány ponton belül marad a legjobb, nyílt súlyú modellekhez képest (például Qwen 3 32B vagy Gemma 3 27B).

Az Olmo 3-Instruct főleg csevegésre, eszközhasználatra és szintetikus adatok generálására optimalizált, rövidebb válaszokat ad, így gyorsabb és hatékonyabb inferencia érhető el. Az összehasonlítások azt mutatják, hogy 7 milliárdos méretben is lekörözi vagy kiegyenlíti főbb riválisait még összetettebb, többkörös beszélgetésekben is.

A valódi nyitottság előnye

Az Olmo 3 összes komponense – adat, kód, modellsúlyok, ellenőrzőpontok – nyíltan, szabadon felhasználható engedélyekkel érhető el. Ezzel új szabványt teremt a mesterséges intelligencia fejlesztésében: a teljes modellfolyam nyilvánossá tétele segíti az átláthatóságot, a bizalmat, a közösségi kollaborációt és az innovációt is.

Ebből adódóan az Olmo 3 nem csupán új modelleket adott a nyílt forrású MI-közösségnek, hanem áttörést hozott a fejlesztési folyamat megosztásában is – és mostantól tényleg mindenki számára elérhetővé vált a fejlődés teljes útja.

2025, adminboss, allenai.org alapján

Legfrissebb posztok

MA 06:29

Az egyszerű tápanyag, amely új erőt adhat a rákkezelésnek

Egyre többet tudunk arról, hogy a mindennapi zöldségekben megtalálható zeaxantin nemcsak a látás egészségét óvja, hanem a daganatok elleni harcban is kulcsszerepet játszhat...

MA 06:23

Az új Pokémon Champions: sétagalopp vagy kőkemény rajt?

A Pokémon Champions elhozza a kompetitív Pokémon-harcok világát mindenki számára, de az első lépések nem egyszerűek...

MA 06:15

Az OpenAI hadat üzen: itt a 100 ezres ChatGPT Pro

🔫 Megjött a ChatGPT Pro, amelyért már havi 100 ezer forintot kell kiperkálni; ezzel próbálják leverni a hasonló árú Claude-ot...

MA 06:05

Történelmi események a mai napon (Április 11.)

Mit hozott ez a nap a történelemben? A mongol hódítástól és brit koronázástól kezdve az Apollo 13 (Apollo–13) drámai startján, Idi Amin bukásán és az algíri merényleteken át egészen a szumátrai nagy földrengésekig sorakoznak a mérföldkövek...

péntek 21:44

A kereskedők rémálma: betört az MI az autószalonokba

Jó, jó, persze, csak épp közben megérkezett a mesterséges intelligencia is az autóvásárlás világába...

péntek 21:34

Az iráni hackerek Amerika ipari rendszereire vadásznak

Az Egyesült Államokban közel 4000 ipari vezérlőrendszer vált sebezhetővé iráni kibertámadásokkal szemben, miután kiderült, hogy számos Rockwell Automation PLC közvetlenül az internetre csatlakozik...

péntek 21:24

Az Artemis II legénysége visszatér – látványos vízreszállás a Csendes-óceánban

Érdekes megjegyezni, hogy négy űrhajós tíznapos, a Holdat megkerülő útja után minden a NASA tervei szerint halad...

péntek 21:12

Az Alzheimer-kór elleni küzdelem válságban van – új kezelés kell!

💡 Kezdetben az Alzheimer-kór kezelése főként az agyi fehérjék, különösen az amyloid-béta eltávolítását célozta...

péntek 21:01

Az FBI elolvasta a Signal-üzeneteidet – komolyan?

💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...

péntek 20:56

A Windows 11 végre megszabadul az idegesítő Copilot-gomboktól!

Na, végre! A Microsoft lassan, de biztosan leszámol azzal, hogy minden sarkon ránk erőlteti a Copilot-gombokat a Windows 11-ben...

péntek 20:45

Az Asus leszámolna a videokártyák olvadásával

⚡ Az utóbbi években sok PC-rajongót tartott izgalomban vagy éppen aggodalomban a csúcskategóriás grafikus kártyák, például az RTX 4090 vagy a hamarosan megjelenő RTX 5090, valamint a hozzájuk tartozó tápkábelek leolvadása...

péntek 20:34

A Starlink-forradalom küszöbén: olcsóbb, gyorsabb űrinternet?

🚀 A legfrissebb hírek szerint a műholdas internet tényleg felpöröghet, az új FCC-szabályoknak köszönhetően...

péntek 20:23

A Gmail titkosítása végre teljes mobilon

🔒 Fontos kérdés, hogy mennyire védettek az e-mailek okostelefonokon. Most először vált elérhetővé a Gmail végponttól végpontig terjedő titkosítása (E2EE) minden Android- és iOS-eszközön, így a vállalati felhasználók külön alkalmazás nélkül olvashatnak és írhatnak titkosított leveleket...

péntek 20:01

Az atomok fényjele leleplezheti a gravitációs hullámokat

💫 A gravitációs hullámok eddig kizárólag hatalmas, kilométeres méretű műszerekkel voltak kimutathatók; ezek apró téridő-rezgéseket érzékelnek, amelyek például fekete lyukak összeolvadásakor keletkeznek...

péntek 19:56

A Play Áruházból eltűnt egy kedvelt horrorjáték – de miért?

Kezdetben az Android-felhasználók gond nélkül letölthették a Doki Doki Irodalmi Klub!..

péntek 19:45

A filléres napelemek titka: hibákból születő csúcshatékonyság

A vezető, ám helyigényes szilícium-napelemek piacán egy új versenytárs kezd feltörni: a különleges szerkezetű, hibákkal teli perovszkit-napelemek...

péntek 19:34

Az európai repterek három héten belül kerozin nélkül maradhatnak

✈ Az európai repülőterek súlyos üzemanyaghiánnyal nézhetnek szembe három héten belül, ami jelentősen megzavarná a nyári utazási szezont és komoly károkat okozna a gazdaságnak...

péntek 19:25

A szupravezetés hihetetlen visszatérése extrém mágneses térben

💥 Egy különleges fém, az urán-ditellurid (UTe2) egészen új oldalát mutatta meg a fizikusoknak, amikor nemrégiben váratlanul visszatért benne a szupravezetés szinte rekorderősségű mágneses terekben – pedig normál esetben ilyen körülmények között már rég megszűnne...

péntek 19:02

Az emberi küzdelemnek vége a kibervédelemben?

Erre utal többek között az, hogy a legkomolyabb biztonsági rések egyre gyorsabban kerülnek a támadók kezébe, mint ahogy a védekezés képes lenne lépést tartani velük...

péntek 18:56

Az MI-láz rekordbevételt hozott a TSMC-nek

A tajvani TSMC idei első negyedéves árbevétele elképesztő, 35%-os növekedést mutatott a januártól márciusig tartó időszakban, köszönhetően az MI-chipek iránti világméretű kereslet folyamatos emelkedésének...

péntek 18:45

A legsebezhetőbbek az androidos kriptovaluta-alkalmazások

Mintegy 50 millió Androidos készülék volt veszélyben egy súlyos biztonsági hiba miatt, amelyet a Microsoft szakértői az EngageLab SDK-ban azonosítottak...

péntek 18:34

Az Artemis II űrhajósai végre vízre szállnak – így nézheted a Netflixen

Az Orion űrhajó hősei, Victor Glover, Reid Wiseman, Christina Koch és Jeremy Hansen már hazafelé tartanak, és hamarosan a Csendes-óceánon hajtanak végre vízreszállást...

péntek 18:23

A CPUID feltörése veszélybe sodorta a népszerű PC‑mérőket

⚠ Milliók által használt diagnosztikai programokat tettek használhatatlanná hackerek, akik a népszerű CPU-Z és HWMonitor hivatalos letöltési linkjeit módosították...

péntek 17:35

Az otthoni sétapad tényleg csodaszer? Két modellt teszteltem

Az utóbbi években a sétapadok, más néven íróasztal alá helyezhető futópadok igazi wellness-sztárrá váltak...

péntek 17:23

Az FBI iPhone-értesítésekből rakta össze a törölt Signal-üzeneteket

Ez a jelenség jól illusztrálható azzal, hogy a texasi ICE Prairieland Detention Facility-nél történt rongálás és petárdázás ügyében a hatóságok váratlan módszerrel jutottak hozzá kulcsfontosságú bizonyítékokhoz...

péntek 17:02

Amikor a szülő tehetetlen: a Discord-támadások kegyetlen valósága

🙁 Brady Frey számára egy teljesen átlagos napnak indult, amikor egyszer csak kiderült, hogy tinédzser lánya Discord-fiókját feltörték...

péntek 16:33

Az első baktériumdob: hallgasd, melyik kórokozó fertőzött meg!

🎵 Képzeld el, hogy nem mikroszkóppal lesed a bacikat, hanem meghallgatod őket!..

péntek 16:23

Dél-Koreában alanyi jogon jár az alapszintű mobilnet

Dél-Korea úttörő lépést tett: mostantól minden mobil-előfizető számára elérhető az alapszintű internet-hozzáférés...

péntek 16:12

Az Amazon aranyat érő MI-chipjein máris betelt a kapacitás

Egy lényeges szempont, hogy az Amazon vezetője, Andy Jassy friss éves levelében számos meglepő újdonsággal szolgált a felhőóriás háza tájáról...