
Kiemelt műszaki újdonságok
A GPT-OSS modelleket főként angol nyelvű szövegeken képezték, különös figyelmet fordítva a STEM területekre, a programozásra és az általános tudásra. Érdemes megjegyezni, hogy nem rendelkeznek a GPT-4o-hoz hasonló vizuális képességekkel. Az OpenAI a tanítást követően megerősítéses tanulást alkalmazott, hasonlóan az o4-mini esetében, így a modellek komplexebb gondolkodási láncokra is képesek a felhasználók által beállítható „Magas szintű következtetés” (Reasoning: high) módban.
A modellek bátran használják az úgynevezett szakértői keverék (MoE) architektúrát. A nagyobb, 117 milliárdos verzióban 128 ilyen „szakértő” működik, amelyek közül négy lép életbe minden válasz generálásánál. A kisebb változatban 32 szakértő, összesen 3,6 milliárd paraméterrel aktív egyszerre. Ezek a szakértők lényegében almodellek, amelyeket egy belső irányítási rendszer aktivál szükség esetén. Bár a paraméterszám óriási, mégis lényegesen gyorsabb token generálást tesznek lehetővé, mint a hasonló méretű, de „sűrű” modellek.
Könnyű futtatás, korlátok nélkül
A modellek működtetése hardver szempontból sem igényel túlzott erőforrást. A legnagyobb, 117 milliárdos modell egyetlen 80 GB H100 GPU memórián is futtatható, míg a kisebb, 21 milliárdos változat már akár 16 GB VRAM-mal is működik. Tesztek szerint például az RTX 6000 Ada kártyával egyes beállítások mellett 125 token/másodperc feletti generálási sebesség érhető el. Mindkét modell 128 ezer tokenes szövegkörnyezettel dolgozik – ami ma már nem kiemelkedő, hiszen a Qwen3 modellek 256 ezer, a Llama 4 pedig akár 10 millió tokenes szövegablakot is kínálnak.
Biztonság és elérhetőség
A GPT-OSS fejlesztése során fontos szempont volt a biztonság – ennek fényében az OpenAI szűrte a veszélyes vagy káros tartalmakat, például a vegyi, biológiai, sugárzó vagy nukleáris technológiához kapcsolódó adatokat kizárták a tanító adathalmazból. Ezenkívül a modelleket úgy alakították ki, hogy a felhasználók ne tudjanak veszélyes promptokat beadni.
Ennek ellenére az OpenAI elismeri, hogy a nyílt modellekkel, ha valaki rosszindulatúan módosítja őket, visszaélhetnek. Ezt megelőzendő, félmillió dolláros jutalmat ajánlottak azoknak, akik új biztonsági hibákat találnak. A GPT-OSS már elérhető többféle modelldepóban, például a Hugging Face-en, és támogatja a legismertebb keretrendszereket – PyTorch, Triton, vLLM, Ollama, LM Studio, Hugging Face Transformers.
Újabb modellek is jöhetnek
Altman, az OpenAI vezérigazgatója utalt rá, hogy még ezen a héten jelentős frissítés várható – talán a GPT-5-re is számíthatunk.