Az OpenAI végre tényleg “nyitott” MI-t adott ki

Az OpenAI hosszú idő után először hozott nyilvánosságra szabadon elérhető, nagy nyelvi MI-t az új GPT-OSS formájában. Két modellméret készült el: egy 117 milliárd paraméteres, amely teljesítményében megközelíti a cég saját o4-mini modelljét, valamint egy kisebb, 21 milliárd paraméteres, amely az o3-mini szintjét hozza. Ezek a modellek az Apache 2.0 licenc alatt érhetők el, tehát kereskedelmi és bármilyen más célra szabadon felhasználhatók.

Kiemelt műszaki újdonságok

A GPT-OSS modelleket főként angol nyelvű szövegeken képezték, különös figyelmet fordítva a STEM területekre, a programozásra és az általános tudásra. Érdemes megjegyezni, hogy nem rendelkeznek a GPT-4o-hoz hasonló vizuális képességekkel. Az OpenAI a tanítást követően megerősítéses tanulást alkalmazott, hasonlóan az o4-mini esetében, így a modellek komplexebb gondolkodási láncokra is képesek a felhasználók által beállítható „Magas szintű következtetés” (Reasoning: high) módban.

A modellek bátran használják az úgynevezett szakértői keverék (MoE) architektúrát. A nagyobb, 117 milliárdos verzióban 128 ilyen „szakértő” működik, amelyek közül négy lép életbe minden válasz generálásánál. A kisebb változatban 32 szakértő, összesen 3,6 milliárd paraméterrel aktív egyszerre. Ezek a szakértők lényegében almodellek, amelyeket egy belső irányítási rendszer aktivál szükség esetén. Bár a paraméterszám óriási, mégis lényegesen gyorsabb token generálást tesznek lehetővé, mint a hasonló méretű, de „sűrű” modellek.

Könnyű futtatás, korlátok nélkül

A modellek működtetése hardver szempontból sem igényel túlzott erőforrást. A legnagyobb, 117 milliárdos modell egyetlen 80 GB H100 GPU memórián is futtatható, míg a kisebb, 21 milliárdos változat már akár 16 GB VRAM-mal is működik. Tesztek szerint például az RTX 6000 Ada kártyával egyes beállítások mellett 125 token/másodperc feletti generálási sebesség érhető el. Mindkét modell 128 ezer tokenes szövegkörnyezettel dolgozik – ami ma már nem kiemelkedő, hiszen a Qwen3 modellek 256 ezer, a Llama 4 pedig akár 10 millió tokenes szövegablakot is kínálnak.

Biztonság és elérhetőség

A GPT-OSS fejlesztése során fontos szempont volt a biztonság – ennek fényében az OpenAI szűrte a veszélyes vagy káros tartalmakat, például a vegyi, biológiai, sugárzó vagy nukleáris technológiához kapcsolódó adatokat kizárták a tanító adathalmazból. Ezenkívül a modelleket úgy alakították ki, hogy a felhasználók ne tudjanak veszélyes promptokat beadni.

Ennek ellenére az OpenAI elismeri, hogy a nyílt modellekkel, ha valaki rosszindulatúan módosítja őket, visszaélhetnek. Ezt megelőzendő, félmillió dolláros jutalmat ajánlottak azoknak, akik új biztonsági hibákat találnak. A GPT-OSS már elérhető többféle modelldepóban, például a Hugging Face-en, és támogatja a legismertebb keretrendszereket – PyTorch, Triton, vLLM, Ollama, LM Studio, Hugging Face Transformers.