
Új szint az „ügynöki” teljesítményben
A GPT-5.5 középpontjában az autonóm, több lépésből álló feladatok önálló kezelése áll. Míg elődei gyakran granuláris, lépésről lépésre adott utasításokat követeltek, hogy elkerüljék az úgynevezett „hallucinációkat”, az új modell képes magától végrehajtani komplex, akár szétszórt adatok kezelését igénylő feladatokat is. Kódot ír, hibát keres nagy rendszerekben, okosan keres információt online, sőt képes önállóan navigálni dokumentumok és táblázatok között.
Jelentős technológiai mérföldkő, hogy míg a nagyobb modellek általában lassabbak, a GPT-5.5 az előző verzióhoz hasonló válaszidő mellett hozza a lényegesen magasabb intelligenciaszintet. Ez egyedileg fejlesztett algoritmusokkal (amelyeket részben maga a modell írt) és NVIDIA GB200, GB300 rendszerekre optimalizálva valósult meg, az eredmény pedig 20%-kal gyorsabb tokengenerálás.
Két változat, specializált képességek
A GPT-5.5 két verzióban érhető el: az alapmodell mellett a Pro változatot azoknak szánják, akik kiemelkedő pontosságot vagy speciális következtetési feladatokat igényelnek – például jogi kutatás, adatelemzés vagy fejlett üzleti analitika. Ez a változat gyorsabb, mélyebb és összetettebb válaszokat ad, támogatva a legbonyolultabb, többlépéses munkafolyamatokat.
A Pro változat az „Expert-SWE” belső fejlesztői teszten különösen jól teljesített, ami hosszú távú programozási kihívásokat mér: a GPT-5.5 kevesebb token felhasználásával produkált jobb eredményt a GPT-5.4-hez képest.
Versenyfutás a legjobb MI-címért
Az amerikai csúcsmodelek piacán az OpenAI, az Anthropic és a Google között zajlik a verseny. Bár a Claude Opus 4.7 egy hete átvette a vezetést a benchmarkok többségén, mára a GPT-5.5 visszavette a koronát a legtöbb összehasonlításban (például a Terminal-Bench 2.0-n, ahol 82,7%-os pontosságot ért el az Opus 4.7 69,4%-a és a Mythos 82%-a ellenében).
Ugyanígy, komplex, eszköz nélküli tudományos érvelésben még mindig akadnak nála jobbak: a Humanity’s Last Exam teszten a Mythos Preview jelentősen megelőzte (GPT-5.5 Pro: 43,1%, Mythos Preview: 56,8%).
A Claude Opus 4.7 a magas szintű szoftvermérnöki benchmarkokon van előnyben, míg a Gemini 3.1 Pro az akadémiai érvelés és pénzügyi elemzés terén remekel. Az OpenAI modellje viszont dominál az ügynöki feladatokban, a tudásalapú gazdasági munkában és a hálózati biztonságban. A tényleges piaci verseny azonban a GPT-5.5 és a Claude Opus 4.7 között zajlik, mivel a Mythos Preview nem elérhető széles körben – kifejezetten kormányzati és stratégiai partnerek férhetnek hozzá, kiberbiztonsági kockázatok miatt.
Áremelés és új díjszabás
Az új intelligencia komoly áremelést hoz magával: a GPT-5.5 bemeneti oldalon 1 millió tokenre 1 800 Ft-ot, míg a Pro változat már 10 800 Ft-ot kér. Az OpenAI szerint ezt a hatékonyság ellensúlyozza: a GPT-5.5 kevesebb tokenből old meg azonos feladatokat, mint elődje.
Ugyanígy, a gyorsaságért többet kell fizetni – a Codex Fast módja 2,5-szer drágább, viszont 1,5-szer gyorsabban generál tokent.
A régi „mini” és „nano” (olcsóbb) szintek jelenleg nem érhetők el az új modellből, viszont a GPT-5.5 fokozatosan megjelenik minden előfizetői szinten. API-n keresztüli elérés hamarosan várható; ennek kockázatai és előnyei miatt szigorúbb kiberbiztonsági protokollokat vezettek be.
Kiberpermisszív licencek és biztonság
A GPT-5.5 elérte azt a szintet, ahol már képes fejlett sebezhetőségek felismerésére és javítására is. Az OpenAI ezért „Trusted Access for Cyber” rendszert állított fel, amelyben csak igazolt védekező szakemberek, például kritikus infrastruktúrák irányítói kérhetnek engedélyt a kevésbé korlátozott verziók használatára (pl. GPT-5.4-Cyber). Az MI kétélű eszköz: gyorsítja a védekezést, de a visszaélést is lehetővé teszi, ezért az OpenAI külön kezeli az ilyen kényes helyzeteket.
Felhasználói reakciók és jövőbeli kilátások
A fejlesztők és haladó felhasználók már most mérföldkőnek érzik a GPT-5.5 képességeit: fejlesztői körökben kiemelik a „koncepcionális tisztaságot”, amellyel a modell összetett forráskódokat képes átlátni, debugolni, sőt önállóan javítani. Egy NVIDIA-mérnök odáig ment, hogy a hozzáférés elvesztését „végtag-amputációhoz” hasonlította.
A tudományos közösségben hasonló a visszhang: 28 000 genetikai markert elemzett ki percek alatt olyan alapos jelentéssel, amelyen korábban hónapokig dolgozott volna a csapat. Az alkalmazott kutatásban hónapokon belül paradigmaváltást várnak a gyógyszerkutatásban.
A GPT-5.5 tehát már nem egyszerű chatrobot, hanem a modern munkahely és operációs rendszer nélkülözhetetlen kelléke lehet – és a fejlesztők szerint még bőven van benne tartalék. Az OpenAI vezető tudósa szerint még van tér jóval okosabb modellek kiképzésére, így a fejlődés tovább gyorsulhat az MI-háborúban.
