
Hatékonyság új szinten – kevesebb token, nagyobb tudás
A GPT-5.4 egyik legnagyobb fejlesztése a hatékonyság: bizonyos feladatoknál 47%-kal kevesebb tokent igényel, mint elődei. Ennél is izgalmasabb azonban a natív géphasználati mód megjelenése: az API-n és a Codexen keresztül az MI úgy képes kezelni a számítógépet, mint egy ember – alkalmazások között is navigál, egérrel és billentyűzettel dolgozik, sőt a képernyőképek alapján is döntéseket hoz. Ezzel vált nyilvánvalóvá: a GPT-5.4 ténylegesen önálló munkafolyamatokat tud vezérelni, nem csak egyszeri kérdésekre válaszol.
Rekordok dőlnek: böngészés, automatizálás, képfeldolgozás
A GPT-5.4 bizonyítottan jelentősen fejlettebb az előző generációnál, amit nívós szakmai mérések is igazolnak. Böngészési képessége a BrowseComp tesztjén 17 százalékpontot javult, a GPT-5.4 Pro pedig 89,3%-os sikeraránnyal új iparági mércét állít. Asztali környezetben, képernyőképekkel és felhasználói parancsokkal 75%-os pontosságot ért el (szemben az emberi 72,4%-kal). Képes nagyfelbontású képekkel és összetett dokumentumokkal is dolgozni: az MMMU-Pro mérésén minden eddiginél kevesebb gondolkodási tokent igényelt, míg az OmniDocBench hibaaránya jelentősen csökkent. Lényeges hangsúlyozni, hogy az MI immár komplex vállalati feladatokon is megállja a helyét, hosszabb, egymásra épülő workflow-kat kezel.
Eszközkeresés és okosabb rendszerek
Ahogy nő a használható MI-eszközök ökoszisztémája, úgy vált kulcsfontosságúvá az eszközkeresés fejlesztése. Ahelyett, hogy az összes funkciódefiníciót egyszerre kapná meg az MI, most már csak egy könnyített listát lát, amelyből szükség esetén keres, és betölti a részletes leírásokat. Egy 250 feladatos tesztben ez a megközelítés 47%-os tokenmegtakarítást hozott, miközben a pontosság változatlan maradt.
Újítások fejlesztőknek és kódolóknak
A GPT-5.4 a kódírók életét is megreformálja: a Codex-integrációval és az új /fast móddal akár 1,5-szer gyorsabban dolgozik, mint elődei, és fejlettebb workflow-szabályozókkal rendelkezik. Külön kipróbálható a Playwright (Interactive) funkció, amellyel vizuálisan lehet hibakeresést és tesztelést végezni webes és Electron-alkalmazások fejlesztése során.
Pénzügyi MI-támogatás Excelben és Google Sheetsben
Az igazán nagy dobás a vállalati és pénzügyi vonalon érkezett: a ChatGPT közvetlenül beépíthetővé vált a Microsoft Excel és Google Sheets táblázatokba (béta verzióban), így az MI képes pénzügyi modelleket építeni, elemezni, frissíteni. Külön integráció érkezik a piacvezető pénzügyi rendszerekhez (FactSet, MSCI, Third Bridge, Moody’s), valamint előreparaméterezett pénzügyi „képességekhez” – például eredmény-előrejelzés, DCF-elemzés vagy befektetési jegyzet készítése – is.
A GPT-5.4 Thinking az OpenAI saját befektetési banki tesztjén 43,7%-ról 88%-ra ugró teljesítményével minden korábbi modellt felülmúlt.
Professzionális szinten teljesít
A GPT-5.4-et már nem csupán trükkös feladványokon mérik: egy, 44 szakmai területet lefedő teszten az iparági szakemberek átlagát 83%-ban érte el vagy haladta meg (a GPT-5.2 71%-ot tudott). Táblázatmodellezési feladatokon 87,5%-os eredményt produkált, prezentációkészítésnél pedig a tesztelők 68%-a jobban értékelte, mint az előző verziót. Lényeges hangsúlyozni, hogy az MI jelentősen csökkentette a tényszerű tévedések számát: a válaszok 33%-kal kevesebb hibát tartalmaztak, mint korábban.
Mennyibe kerül az MI-forradalom?
Az API-ban a GPT-5.4 Thinking változat használata 900 forintba, míg a kimeneti tokenek 5 400 forintba kerülnek, egymillió tokenre vetítve; a Pro változat ára ennek a tizenkétszerese (10 800 Ft / 64 800 Ft / 1 M token), ami jelenleg a prémium kategóriába sorolja a modellt. 272 000 token felett a díjak duplázódnak, ezzel is ösztönözve a kompaktabb feladatleírásokat. Az MI jelenleg olcsóbb, mint néhány versenytárs, főleg a vállalati, hosszú távú workflow-kban.
Átalakuló irodai munka és workflow-k
A GPT-5.4-gyel az OpenAI egyértelműen a személyes munkafolyamatok – számítógép-kezelés, eszközhasználat, hosszú kontextus, valós céges outputok – felé mozdul. A hangsúly a hatékonyságon, a megbízhatóságon és a kevesebb téves próbálkozáson van, így a jövő irodai MI-rendszerei egyre inkább helyettesítenek majd komplett tevékenységeket, nem csak válaszolgatnak a kérdésekre.
