2026. 04. 08., 17:04

A mesterséges intelligencia betört a munkahelyre: a GLM-5.1 tarol

Megvizsgálandó, miben hoz újat, ha egy MI-modell egy teljes munkanapig képes önállóan dolgozni. A kínai Z.ai (Zhupai AI) bemutatta a GLM-5.1-et, a saját fejlesztésű, nyílt forráskódú nagy nyelvi modelljét, amely nemcsak hogy elérhető kereskedelmi célokra és testreszabható, hanem az első, amely egyhuzamban, emberi beavatkozás nélkül, nyolc órán át képes önállóan dolgozni összetett feladatokon.

Az ügynökszerű MI: Nemcsak gyors, hanem kitartó

A legtöbb mai MI-modell inkább sprintelni képes: gyors válaszokat ad, de nagyobb, hosszú távú problémákban hamar elakad, stratégiája szétesik, vagy indokolatlanul ismételget. A GLM-5.1 viszont maratoni futó, amely a hosszabb, komplex feladatokra lett optimalizálva. Masszív, 754 milliárd paraméteres Mixture-of-Experts architektúrával dolgozik, és 202 752 tokenes szövegkörnyezete révén képes a célokat tartani, csökkenteni a hibák halmozódását, és önállóan újratervezni saját stratégiáját.

A fejlesztők szerint az eddigi MI-k átlagosan 20 lépést tudtak önjáróan végigvinni, ám most a GLM-5.1 már 1700 lépéses, eszközhasználattal járó munkafolyamatokat is hiba nélkül lezár, jóval tovább kitolva a produktív horizontot. A modell fejlesztésével a Z.ai nem titkolt célja, hogy maga mögé utasítsa a nyugati piacokon domináló szereplőket, mint a GPT-5.4-et vagy a Claude Opus 4.6-ot.

Kulcstechnológia: Lépcsőzetes optimalizálás, nem csak méret

Bár a GLM-5.1 óriási méretű, valódi újítása abban rejlik, hogy elkerüli a korábbi modellek stagnáló teljesítményét. Míg a legtöbb MI az első pár próbálkozás után lelassul, új ötletek nélkül marad, ez a modell képes újabb és újabb szerkezeti változtatásokra. Egy fejlett adatbázis-optimalizációs teszt (VectorDBBench) során a modell 655 iteráción és több mint 6000 eszközhasználaton át, lépésről lépésre ért el áttöréseket: előbb a sávszélességet felezte, majd kétlépcsős pontozási folyamatot vezetett be, végül többszintű routingot és kvantált döntési mechanizmusokat, így 3500 lekérdezés/másodperc eredményről 21 500-ra ugrott. Ezek a mutatók hatszoros hatékonyságnövekedést jelentenek a korábbi csúcsmodellekhez képest.

Hasonlóképpen, a gépi tanulási architektúrák optimalizálását vizsgáló KernelBench-en a GLM-5.1 nemcsak gyorsulni tudott – képes volt több mint ezer körön át folyamatosan tartani a fejlődést, végül 3,6-szoros gyorsulást elérve a PyTorch referenciához képest. Míg bizonyos feladatokban – mint a kernel-optimalizálás – a Claude Opus 4.6 maradt az élen, az önálló munkaidőben még őt is felülmúlja.

Felhasználási modell és árazás: Új szintű mérnöki eszköz

A GLM-5.1-et nem chatrobotként, hanem professzionális fejlesztői szerszámként pozicionálja a gyártó. A modell többféle előfizetéses csomagban érhető el: a Lite (kb. 9900 Ft/negyedév) egyszerűbb, a Pro (kb. 29 700 Ft/negyedév) összetett, a Max (kb. 79 200 Ft/negyedév) pedig integrált, fejlett felhasználáshoz ajánlott. Ezekhez ingyenes kiegészítő eszközök (például látáselemző, webolvasó, dokumentumolvasó) járnak.

API-s felhasználás esetén 1 millió input token 510 Ft, a kimenet 1600 Ft. Versenytársaival összevetve a GLM-5.1 költsége fele a GPT-5.4-ének, míg a Claude Opus 4.6 tízszer drágább. A kód-inferenciához ajánlott GLM-5 Turbo modell magasabb sebességű, elsősorban automatizált, felügyelt futtatásokhoz ajánlott.

A modell támogatja a helyi futtatást is, így a fejlesztők saját szerveren vagy felhőben is használhatják. Előnye, hogy már fejlett gondolkodási paraméterezéssel (az API-ban) a modell belső lépései és megoldási folyamatai is átláthatók.

Új benchmarkok: Kína átveszi a vezetést?

A GLM-5.1 kiválóan teljesít benchmarkokon: a valódi GitHub-problémák (SWE-Bench Pro) megoldásában 58,4 pontot szerzett, ezzel maga mögé utasította a GPT-5.4-et (57,7), a Claude Opus 4.6-ot (57,3), sőt a Google Gemini 3.1 Pro-t is (54,2). Ezen túlmenően következtetési és ügynökszerű teszteken (Terminal-Bench, CyberGym) is rendre 10–20 százalékkal felülmúlja az előző generációs modelleket. Az egyik leglátványosabb demonstráció során a modell nyolc óra alatt, felügyelet nélkül egy teljes, működő asztali operációs környezetet (fájlkezelő, terminál, játékok, szövegszerkesztő stb.) fejlesztett le, aprólékosan végigcsiszolva a stílust és a működést is.

Nyílt és zárt modellstratégia: Két világ találkozása

A GLM-5.1 MIT-licenc alatt, nyílt forráskódú modellként jelent meg (súlyai elérhetők a ModelScope-on és a Hugging Face-en), így a fejlesztők szabadon használhatják és továbbfejleszthetik. Ám a nagy teljesítményű, gyors Turbo-változatot zárt modellként tartják fenn, csak fizetős szolgáltatás részeként elérhető. Ez a hibrid stratégia egyre elterjedtebb a kínai MI-piacon (pl. Alibaba), és célja, hogy a közösségi ökoszisztéma szélesedjen, miközben a fejlett, üzletileg kulcsfontosságú technológiák stabil bevételi forrást biztosítsanak.

Fejlesztői visszajelzések: Egyheti munkát két nap alatt

A fejlesztői közösség pozitívan fogadta a kiadást, kiemelve a GLM-5.1 üzembiztosságát, önállóságát és azt, hogy nincs szükség prompt-optimalizálásra. Sokan arról számoltak be, hogy olyan feladatokat, amelyek korábban egy-egy hétig tartottak volna – kód előfeldolgozása, logika és hiperparaméterek hangolása – most két nap alatt sikerült lezárniuk. A fejlesztők számára ez azt is jelenti, hogy bátrabban dolgozhatnak, és nem kell tartaniuk az MI-k erőforrás- vagy memóriaszűkössége miatt bekövetkező holtpontoktól. A nyolcórás autonóm teljesítmény különösen nagy visszhangot keltett a közösségi médiában.

A hosszú távú MI-munka: Új korszak kezdete

Mindezek nyomán az MI-fejlesztés elsőbbségét már nem a másodpercenként feldolgozott tokenek száma, hanem a felügyelet nélküli, összefüggő munkaidő fogja meghatározni. Egy modell, amely nyolc órán át ember nélkül dolgozik, átírja a szoftverfejlesztés eddigi menetét. Bár komoly kihívások maradtak (például az önértékelés numerikus mérőszámok nélküli finomhangolása), a GLM-5.1 bemutatásával új mércét állítottak fel. A kérdés így már nem az, hogy mit kérdezhetsz az MI-től, hanem hogy milyen projektet adhatsz ki neki teljes munkaidőre. A fókusz így egyre inkább azokra a rendszerekre tolódik, amelyek valódi, több lépéses projekteket tudnak végigvinni minimális emberi kontroll mellett. Ez az ügynökszerű mérnöki megközelítés új fejezetet nyithat a globális MI-gazdaságban.

2026, adminboss, venturebeat.com alapján

filózó

Te mit éreznél, ha egy mesterséges intelligencia önállóan dolgozna helyetted több órán keresztül?
Te megengednéd, hogy egy ilyen MI teljesen kontroll nélkül oldjon meg egy fontos feladatot?

Legfrissebb posztok

Az agyfúrás helyett itt a viselhető agytech jövője

MI Hírek

szombat 18:31

Az agyfúrás helyett itt a viselhető agytech jövője

Érdemes megvizsgálni, hogy az emberi elme és a technológia közötti közvetlen kapcsolat mennyire válhat mindennapossá a következő években...

Az MI-ügynökök pereit intézi az első digitális bíróság

MI Hírek

szombat 18:01

Az MI-ügynökök pereit intézi az első digitális bíróság

💻 A mesterséges intelligenciával működő ügynökök egyre gyakrabban üzletelnek és kötnek megállapodásokat emberi beavatkozás nélkül, ám ezek a gépi tranzakciók is ugyanúgy vitákhoz vezethetnek, ahogyan akkor is, amikor emberek állnak egymással szemben...

Az üzleti MI-ügynökök magabiztosan tévednek – hiányzik a kontextus

MI Hírek

szombat 17:01

Az üzleti MI-ügynökök magabiztosan tévednek – hiányzik a kontextus

Ami kezdetben ártalmatlannak tűnt, mára súlyos problémává nőtte ki magát: az üzleti MI-ügynökök magabiztosan hibás válaszokat adnak, mindezt úgy, hogy senki nem veszi észre, amíg valaki vissza nem követi az adatot egy elavult metrikáig vagy egy olyan dokumentumig, amelyet a lekérő rendszer soha nem töltött be...

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. CrestWall – 4K Wallpapers (iPhone/iPad)A CrestWall egy kézzel válogatott, 4K felbontású háttérképeket kínáló alkalmazás, amely elsősorban azoknak készült, akik fontosnak tartják iPhone-juk kinézetét...

Tudomány

szombat 09:01

A legegyszerűbb folyadékok sem csak folynak – némelyik megreped

💧 Ki gondolná, hogy egy látszólag egyöntetű, sűrű, fekete folyadék képes lehet a szilárd anyagokhoz hasonlóan elpattanni vagy szétrepedni?..

Tavasszal több ezer ápoló és mentálhigiénés dolgozó vonult utcára San Franciscóban, hogy tiltakozzon a kórházi munkájukban egyre inkább jelen lévő technológiák ellen...

MI Hírek

szombat 06:25

Az MI-verseny irányt vált: olcsóbb, okosabb rendszerek előretörése

🚀 A mesterséges intelligencia fejlődése nemcsak a minél nagyobb modellek építéséről vagy a teljesítménymutatók hajszolásáról szól már...

HistoryToday

szombat 06:05

Történelmi események a mai napon (Július 11.)

Ármány és hatalomváltás Bizáncban, a flamandok nagy győzelme Franciaország felett, Vichy Franciaország megszületése, az első transzatlanti műholdas tévéadás és a Skylab látványos megsemmisülése – sűrű nap a világtörténelemben...

Az XREAL megfizethető AR-szemüvegei végre megérkeztek az USA-ba

MI Hírek

szombat 06:00

Az XREAL megfizethető AR-szemüvegei végre megérkeztek az USA-ba

📱 Az XREAL új, megfizethető AR-szemüvegei mostantól az Egyesült Államokban is kaphatók, mindössze 299 dollárért (kb...

Az Etna, Európa legaktívabb vulkánja, titkos eredetű lehet

Tudomány

péntek 18:31

Az Etna, Európa legaktívabb vulkánja, titkos eredetű lehet

🌋 Egy lényeges szempont, hogy a szicíliai Etna évtizedek óta izgatja a tudósok és a vulkánokat kutató geológusok kíváncsiságát...