Az OpenAI O3 és O3-mini Modelljei Átgondolnak Minden Választ

Az OpenAI O3 és O3-mini Modelljei Átgondolnak Minden Választ
Pénteken, az "OpenAI-val töltött 12 nap" nevet viselő programsorozat utolsó napján Sam Altman, az OpenAI vezérigazgatója bejelentette legújabb mesterséges intelligencia "érvelési" modelljeit, az o3-at és az o3-mini-t. Ezek az év elején indított o1 modellek továbbfejlesztett változatai. A vállalat egyelőre nem tervezi azonnali kiadásukat, de már most elérhetővé teszi a modelleket biztonsági tesztelésre és kutatási célokra.
Az új modellek az OpenAI által "private chain of thought"-nak (privát gondolatmenet-lánc) nevezett technológiát használják, amelyben a modell megáll, átgondolja belső folyamatait és előre tervez, mielőtt válaszolna. Ezt "simulated reasoning"-nek (szimulált érvelés, SR) nevezzük, ami az MI egy olyan formája, amely túlmutat az alapszintű nagy nyelvi modelleken (LLM).

Új név és rekordteljesítmény

Az információk alapján az OpenAI az “o3” nevet választotta a modellcsaládnak az “o2” helyett, hogy elkerülje a potenciális védjegyjogi konfliktusokat a brit távközlési szolgáltatóval, az O2-vel. A pénteki élő közvetítés során Altman elismerte cégének névadási hibáit, és így fogalmazott: “Az OpenAI valóban nagyon rossz a névadásban, ezért o3-nak nevezzük.”

Az OpenAI szerint az o3 modell rekordot döntött az ARC-AGI mércén, egy vizuális érvelési teszten, amely 2019-es létrehozása óta veretlen volt. Alacsony számítási kapacitású forgatókönyvekben az o3 75,7%-ot ért el, míg magas számítási kapacitás mellett 87,5%-ot – ezzel elérve az emberi teljesítményhez közeli 85%-os küszöböt.

Kiemelkedő eredmények különböző teszteken

Az OpenAI arról is beszámolt, hogy az o3 96,7%-ot ért el a 2024-es American Invitational Mathematics Examinationon (Amerikai Meghívásos Matematikai Vizsgán), mindössze egy kérdést hibázva el. A modell emellett 87,7%-ot ért el a GPQA Diamond teszten, amely posztgraduális szintű biológia, fizika és kémia kérdéseket tartalmaz. Az EpochAI által készített Frontier Math mércén az o3 a feladatok 25,2%-át oldotta meg, míg más modellek nem haladták meg a 2%-ot.

Az élő közvetítés során az ARC Prize Foundation elnöke így nyilatkozott: “Amikor látom ezeket az eredményeket, át kell értékelnem a világképemet arról, hogy mire képes az MI.”

Az o3-mini változatot, amelyet szintén pénteken jelentettek be, adaptív gondolkodási idő funkcióval látták el, amely alacsony, közepes és magas feldolgozási sebességet kínál. A vállalat szerint a magasabb számítási beállítások jobb eredményeket hoznak. Az OpenAI beszámolt arról, hogy az o3-mini felülmúlja elődjét, az o1-et a Codeforces teszten.

A „simulated reasoning” térnyerése

Az OpenAI bejelentése akkor érkezett, amikor más vállalatok is kifejlesztik saját SR modelljeiket. Ilyen például a Google, amely csütörtökön bejelentette a Gemini 2.0 Flash Thinking Experimental-t (Villám Gondolkodás Kísérleti Verzió). Novemberben a DeepSeek elindította a DeepSeek-R1-et, míg az Alibaba Qwen csapata kiadta a QwQ-t, amit az első “nyílt” alternatívának neveztek az o1-hez képest.

Ezek az új MI modellek a hagyományos LLM-eken alapulnak, de egy csavarral: finomhangolták őket, hogy egyfajta iteratív gondolatmenet-láncot hozzanak létre, ami szinte brutális erővel, futásidőben skálázható módon szimulálja az érvelést. Nem a mesterséges intelligencia modell képzése során próbálnak fejlesztéseket elérni – amelyek az utóbbi időben csökkenő hozamokat mutattak –, hanem a futásidőben alkalmazott technikákkal érnek el jobb teljesítményt.

Az OpenAI először biztonsági kutatók számára teszi elérhetővé az új SR modelleket tesztelési célból. Altman elmondta, hogy a vállalat az o3-mini-t január végén tervezi elindítani, és nem sokkal később követi majd az o3 is.

Legfrissebb posztok

MA 20:49

A FaZe Clan tényleg a szétesés küszöbén áll?

A FaZe Clan jövője komoly kérdéseket vet fel, miután hat népszerű influencer – Adapt, Jason, Ronaldo, Lacy, Rage és Silky – bejelentette távozását a csapatból...

MA 20:33

A 10 kihagyhatatlan üzleti könyv, amit idén el kell olvasnod

A sikeres vezetők nemcsak a felszínt kapargatják, hanem szívesen merülnek el mélyebb gondolatokban is: ezek a könyvek nemcsak elméletekről, hanem a mindennapi üzleti élet valós kihívásairól szólnak...

MA 20:17

A kedvező árú Tecmojo 12U hálózati rack falra is szerelhető

A szerverek számára nélkülözhetetlen az állványos elhelyezés, hiszen míg egy asztali PC vagy NAS önmagában is megállja a helyét, igazi adatközponti érzést csak egy jó rack adhat...

MA 20:01

Az agyi miniorganoidok forradalmasítják a pszichiátriát

Egyre több kutatás mutatja, hogy a laborban növesztett miniatűr agyak most először engednek igazán részletes bepillantást abba, hogyan torzul az idegrendszer aktivitása skizofrénia és bipoláris zavar esetén...

MA 19:33

Az olvadó gleccserek végórái: drámai veszteség évtizedeken belül

Az elkövetkező évtizedekben évente akár 4 000 gleccser is eltűnhet világszerte, és a század végére már alig maradhat belőlük...

MA 19:19

Az idei filmek üzenete: egyék meg a gazdagokat!

2025-ben a mozik folytatták régi hagyományukat: a leggazdagabbak újra az év nagy ellenségeivé váltak...

MA 19:02

A 2026-os év három legizgalmasabb kriptója: ezekre figyelj

💸 A kriptopénzpiac erőteljes hullámzásait láttuk 2025-ben, hiszen a vezető kriptovaluták értéke 10–50 százalékkal esett vissza...

MA 18:49

Az új Retroid Pocket 6 már a PS2-t is viszi

A Retroid Pocket 6 végre valóság lett, és hamarosan megérkezik az első előrendelők kezébe...

MA 18:34

Az év sokkoló egészségügyi sztorijai: kanyaró, MI-vezérelt vírusok, botrányok

Érdemes megvizsgálni, milyen jelentős fordulatokat hozott 2025 az egészségügy terén: áttörő orvosi kezelések, alapvető biológiai rejtélyek és egészségpolitikai viharok formálták a világot, miközben az MI és a tudomány új korszakot nyitott...

MA 18:18

A Realme GT8 Pro cserélhető kamerával borzolja a kedélyeket

Megemlíthető továbbá, hogy az okostelefonpiacon évtizedek óta ritkán találni igazán meglepő újdonságot, ám a Realme GT8 Pro váratlanul új színt vitt a megszokott kínálatba...

MA 18:01

Az univerzum sorsa veszélyben: gyengül a sötét energia?

Az utóbbi időben egyre nagyobb vitát váltott ki, hogy a sötét energia, az Univerzum gyorsuló tágulásáért felelős titokzatos erő talán mégsem viselkedik úgy, ahogy korábban gondoltuk...

MA 17:50

Az ötven felettiek költekezése turbózza a gazdaságot

A befektetési világ egyre inkább az 50 év felettiekre, az úgynevezett Silver Spenders-re figyel, akik erősödő anyagi helyzetükkel és növekvő befolyásukkal komoly gazdasági lendületet adnak a brit piacnak...

MA 17:35

Az indiai startuplufi kipukkan? A befektetők már válogatnak

📈 India startup-ökoszisztémája 2025-ben közel 4 000 milliárd forintnyi (11 milliárd dollárnyi) tőkét vonzott, de a befektetők jóval kevesebb csekket írtak alá, mint korábban, és mind válogatósabbá váltak...

MA 17:17

Az érzelmileg intelligens párok valódi titkai

Érdemes megvizsgálni, hogy mit csinálnak másként azok a párok, akik magas érzelmi intelligenciával kezelik a konfliktusokat...

MA 17:03

Az Apple Watch: a hatékonyság titkos aduásza

⏱ Felmerül a kérdés: tényleg csak az egészséged figyelésére jó az Apple Watch, vagy a munkahelyi termelékenységben is segíthet?..

MA 16:50

Az MI mindent elárasztott 2025-ben – de hol a forradalom?

Érdemes megérteni, hogy 2025-re az MI már a mindennapok része lett, de az igazi világrengető áttörés elmaradt...

MA 16:33

Az iraki agyagpajzs a porviharok ellen

🌀 Irak déli sivatagaiban egyre gyakrabban támadnak heves por- és homokviharok, amelyeket az éghajlatváltozás okozta aszály, a magasabb hőmérséklet és az erdőirtás felerősítenek...

MA 16:18

A PlayStation idei éve: meglepetések helyett tökéletes folytatás?

🎮 A PlayStation semmit sem bíz a véletlenre a mostani konzolgenerációban. A 2020 óta piacon lévő PlayStation 5 folyamatosan bővült exkluzív játékokkal – a Returnaltől a God of War Ragnarökig, vagy éppen a The Last of Us folytatásaiig...

MA 16:02

A világegyetem csodája: 400 gyűrű fedi fel a csillagszületés titkát

A téli égbolton, ha délkelet felé nézel, és a ragyogó csillagokat keresed, érdemes kicsit feljebb tekinteni a visszafogottabb fényű Perseus csillagkép felé...