
Mi az az open-weight, és miben más, mint az open-source?
Fontos tisztázni: az OpenAI nem teljesen nyílt forráskódú (open-source) modelleket tesz közzé, hanem úgynevezett open-weight modelleket. Ez azt jelenti, hogy csak a betanítás során keletkezett súlyokat adják közre – ezek a számértékek határozzák meg, hogyan válaszol a modell a bemenetekre. Ezek alapján a modellek rögtön használhatók vagy tovább is finomhangolhatók, de a kód és a tanítási adatok zártak maradnak. Ez jelentős különbség: a teljesen nyílt forráskódú modellek tartalmazzák a tanítási kódot és az adatokat is, de ezekkel az átlagember mit sem tud kezdeni, hacsak nincs hozzá megfelelő, erős NVIDIA GPU-ja. Ennek ellenére több nyílt forráskódú nyelvi modell már elérhető más cégektől, például a Mistral NeMo vagy a Mistral Small 3.
Különbségek a két új modell között
A gpt-oss-120b és a gpt-oss-20b közötti legfőbb eltérés a paraméterek számában rejlik: előbbi 117 milliárd, utóbbi 21 milliárd paraméterrel rendelkezik. Ez a különbség meghatározza a szükséges hardvert is: a nagyobb modell gördülékeny futtatásához egy 80 GB-os GPU kell, míg a kisebb változat már egy modern, 16 GB RAM-mal szerelt PC-n is használható. Ez lehetővé teszi, hogy a gpt-oss-20b akár teljes egészében helyben, internet nélkül fusson, például kódelemzés céljából. Mindkét modellt rugalmas licenc alatt teszik elérhetővé, vagyis a felhasználók szabadon módosíthatják őket igényeik szerint.
Képességek és korlátok
Bár ezek nem kereskedelmi modellek, teljesítményük a cég zárt rendszereihez hasonló. Egyetlen jelentős korlát van: nem támogatják a multimodális bemenetet, vagyis nem dolgoznak fel képet, videót vagy hangot. Ezekhez továbbra is a felhőben futó OpenAI szolgáltatások szükségesek. Mindazonáltal ugyanazokat a fejlett MI-funkciókat kínálják – például eszközhasználatot, gondolatmenet-követést, vagy összetettebb problémák lépésenkénti megoldását Python nyelven.
Fejlesztésük során az OpenAI a korábbi, versenyszintű kódolási technikáit alkalmazta. A gpt-oss-120b például alig marad el teljesítményben az o3-tól, amely a cég jelenlegi csúcsmodellje, míg a kisebb testvér, a gpt-oss-20b, az o3-mini és az o4-mini közé pozicionálható.
Verseny és demokratizálódás
A verseny is egyre élesedik: Mark Zuckerberg és a Meta hangsúlyozza a nyitottságot, Zuckerberg pedig radikálisan kritizálja a zárt rendszereket. Mindezek ellenére az OpenAI bejelentésének időzítése érzékenyen érinti a Meta ambícióit, legalábbis a technológiával lelkesen kísérletezők szerint.
A nagy modellek “súlyainak” nyilvánossá tétele jelentősen demokratizálja az MI-hoz való hozzáférést: mostantól azok is használhatják a hónapokig, óriási adatközpontokban optimalizált rendszereket, akiknek nincs ehhez infrastruktúrájuk. Ez különösen hasznos azoknak, akik csak egy igazán jó alapmodellt keresnek, amelyre saját alkalmazást építhetnének.
Lehetséges jövő és következtetések
Mindezt figyelembe véve az OpenAI már több szervezettel dolgozik együtt, köztük egy nemzeti alkalmazott MI-központtal is, hogy saját modelleleket adaptáljanak. A cég kísérletként tekint a két modell kiadására: ha elegen használják őket, várhatóan még több open-weight modellt tesznek elérhetővé. Így végre a felhasználók jóval nagyobb szabadságot nyernek a mesterséges intelligencia rendszerek kiaknázásában és fejlesztésében.