Az OpenAI berobbant: megérkezett a GPT-5.2

Jellemző példa erre, hogy az OpenAI legfrissebb MI-modellje, a GPT-5.2 csütörtökön három változatban – Instant, Thinking és Pro – debütált a ChatGPT platformján. Az időzítés nem véletlen: Sam Altman, a cég vezérigazgatója a hónap elején elrendelte a “code red” riadókészültséget, amikor a Google új Gemini 3 modellje jelentős piacot hódított el, és letarolta az MI-rangsorokat. A helyzet egy csapásra megváltozott: minden OpenAI-erőforrást a ChatGPT továbbfejlesztésére állítottak rá.

Három modell, három cél

A GPT-5.2 minden korábbinál nagyobb gazdasági értékteremtést céloz, hatékonyabban készít táblázatokat, prezentációkat, jobb kódot ír, képeket értelmez, hosszabb szövegeket dolgoz fel, képes eszközöket kezelni és összetett, többlépcsős feladatokat is megoldani. Az Instant modell gyors, általános, például fordítási vagy szövegalkotási munkákhoz készült. A Thinking változat bonyolultabb, gondolkodást igénylő feladatokra, például programozásra vagy matematikára alkalmas. A Pro verzió pedig a legmagasabb pontossági elvárásokat is teljesíti speciális szakterületeken.

Feszült verseny, brutál költségek

Nem hagyható figyelmen kívül, hogy a pillanatnyi lépéskényszert főként a Google Gemini 3 okozta, amely több MI-teszten első helyen végzett, és már több mint 650 millió havi aktív felhasználót vonz. Az OpenAI hetente 800 millió aktív ChatGPT-felhasználót tart számon, de a több évre előre vállalt, 1,4 billió HUF értékű MI-infrastruktúra-fejlesztési költség tekintélyes tétel, főleg amikor már nem egyértelmű a technológiai előnyük.

Az új modellek fejlesztése felgyorsult: a GPT-5.2 augusztus óta már a harmadik jelentős modellfrissítés. Korábban a GPT-5 új válaszrendszert vezetett be, novemberben pedig megjelentek a ChatGPT előre beállított személyiségei is, hogy ne legyen annyira ridegen gépies a párbeszéd.

Számháború és eredmények

A most bemutatott GPT-5.2 fejlesztése régóta zajlik, mégis érezhető a piaci nyomás. Az OpenAI hivatalosan nem közölt összehasonlító táblázatot a Google vagy éppen a Claude Opus 4.5 modellhez képest, de néhány teljesítményadat így is előkerült: a GPT-5.2 Thinking például 55,6 százalékot ért el a SWE-bench szoftvermérnöki teszten (szemben a Gemini 3 Pro 43,3 és a Claude Opus 4.5 52 százalékával), illetve 92,4 százalékos eredményt produkált a GPQA tudományos felmérésen (Gemini: 91,9 százalék).

A GDPval benchmark szerint a Thinking modell a szakmai feladatok 70,9 százalékában felér az emberi profikhoz (Gemini: 53,3 százalék), ráadásul tizenegyedannyi idő alatt és századannyi költséggel végzi el ugyanazt. Egy másik lényeges előrelépés, hogy a GPT-5.2 Thinking átlagosan 38 százalékkal ritkábban hallucinál, vagyis kevesebb tévinformációt ad, mint elődje.

Tudás, óvatosság és várakozás

Az MI-tesztek persze mindig némi fenntartással kezelendők, hiszen könnyen a cég javára lehet kerekíteni az eredményeket. Külső, független értékelések hónapokat is igénybe vehetnek, de aki ChatGPT-vel dolgozik, immár jobb teljesítményre és fejlettebb programkódokra számíthat – még ha a csinnadratta mögött most is inkrementális, apró előrelépések húzódnak meg.

2025, adminboss, arstechnica.com alapján

Share on Social Media