2026. 04. 08., 17:04

A mesterséges intelligencia betört a munkahelyre: a GLM-5.1 tarol

A mesterséges intelligencia betört a munkahelyre: a GLM-5.1 tarol
Megvizsgálandó, miben hoz újat, ha egy MI-modell egy teljes munkanapig képes önállóan dolgozni. A kínai Z.ai (Zhupai AI) bemutatta a GLM-5.1-et, a saját fejlesztésű, nyílt forráskódú nagy nyelvi modelljét, amely nemcsak hogy elérhető kereskedelmi célokra és testreszabható, hanem az első, amely egyhuzamban, emberi beavatkozás nélkül, nyolc órán át képes önállóan dolgozni összetett feladatokon.

Az ügynökszerű MI: Nemcsak gyors, hanem kitartó

A legtöbb mai MI-modell inkább sprintelni képes: gyors válaszokat ad, de nagyobb, hosszú távú problémákban hamar elakad, stratégiája szétesik, vagy indokolatlanul ismételget. A GLM-5.1 viszont maratoni futó, amely a hosszabb, komplex feladatokra lett optimalizálva. Masszív, 754 milliárd paraméteres Mixture-of-Experts architektúrával dolgozik, és 202 752 tokenes szövegkörnyezete révén képes a célokat tartani, csökkenteni a hibák halmozódását, és önállóan újratervezni saját stratégiáját.

A fejlesztők szerint az eddigi MI-k átlagosan 20 lépést tudtak önjáróan végigvinni, ám most a GLM-5.1 már 1700 lépéses, eszközhasználattal járó munkafolyamatokat is hiba nélkül lezár, jóval tovább kitolva a produktív horizontot. A modell fejlesztésével a Z.ai nem titkolt célja, hogy maga mögé utasítsa a nyugati piacokon domináló szereplőket, mint a GPT-5.4-et vagy a Claude Opus 4.6-ot.

Kulcstechnológia: Lépcsőzetes optimalizálás, nem csak méret

Bár a GLM-5.1 óriási méretű, valódi újítása abban rejlik, hogy elkerüli a korábbi modellek stagnáló teljesítményét. Míg a legtöbb MI az első pár próbálkozás után lelassul, új ötletek nélkül marad, ez a modell képes újabb és újabb szerkezeti változtatásokra. Egy fejlett adatbázis-optimalizációs teszt (VectorDBBench) során a modell 655 iteráción és több mint 6000 eszközhasználaton át, lépésről lépésre ért el áttöréseket: előbb a sávszélességet felezte, majd kétlépcsős pontozási folyamatot vezetett be, végül többszintű routingot és kvantált döntési mechanizmusokat, így 3500 lekérdezés/másodperc eredményről 21 500-ra ugrott. Ezek a mutatók hatszoros hatékonyságnövekedést jelentenek a korábbi csúcsmodellekhez képest.

Hasonlóképpen, a gépi tanulási architektúrák optimalizálását vizsgáló KernelBench-en a GLM-5.1 nemcsak gyorsulni tudott – képes volt több mint ezer körön át folyamatosan tartani a fejlődést, végül 3,6-szoros gyorsulást elérve a PyTorch referenciához képest. Míg bizonyos feladatokban – mint a kernel-optimalizálás – a Claude Opus 4.6 maradt az élen, az önálló munkaidőben még őt is felülmúlja.

Felhasználási modell és árazás: Új szintű mérnöki eszköz

A GLM-5.1-et nem chatrobotként, hanem professzionális fejlesztői szerszámként pozicionálja a gyártó. A modell többféle előfizetéses csomagban érhető el: a Lite (kb. 9900 Ft/negyedév) egyszerűbb, a Pro (kb. 29 700 Ft/negyedév) összetett, a Max (kb. 79 200 Ft/negyedév) pedig integrált, fejlett felhasználáshoz ajánlott. Ezekhez ingyenes kiegészítő eszközök (például látáselemző, webolvasó, dokumentumolvasó) járnak.

API-s felhasználás esetén 1 millió input token 510 Ft, a kimenet 1600 Ft. Versenytársaival összevetve a GLM-5.1 költsége fele a GPT-5.4-ének, míg a Claude Opus 4.6 tízszer drágább. A kód-inferenciához ajánlott GLM-5 Turbo modell magasabb sebességű, elsősorban automatizált, felügyelt futtatásokhoz ajánlott.

A modell támogatja a helyi futtatást is, így a fejlesztők saját szerveren vagy felhőben is használhatják. Előnye, hogy már fejlett gondolkodási paraméterezéssel (az API-ban) a modell belső lépései és megoldási folyamatai is átláthatók.


Új benchmarkok: Kína átveszi a vezetést?

A GLM-5.1 kiválóan teljesít benchmarkokon: a valódi GitHub-problémák (SWE-Bench Pro) megoldásában 58,4 pontot szerzett, ezzel maga mögé utasította a GPT-5.4-et (57,7), a Claude Opus 4.6-ot (57,3), sőt a Google Gemini 3.1 Pro-t is (54,2). Ezen túlmenően következtetési és ügynökszerű teszteken (Terminal-Bench, CyberGym) is rendre 10–20 százalékkal felülmúlja az előző generációs modelleket. Az egyik leglátványosabb demonstráció során a modell nyolc óra alatt, felügyelet nélkül egy teljes, működő asztali operációs környezetet (fájlkezelő, terminál, játékok, szövegszerkesztő stb.) fejlesztett le, aprólékosan végigcsiszolva a stílust és a működést is.

Nyílt és zárt modellstratégia: Két világ találkozása

A GLM-5.1 MIT-licenc alatt, nyílt forráskódú modellként jelent meg (súlyai elérhetők a ModelScope-on és a Hugging Face-en), így a fejlesztők szabadon használhatják és továbbfejleszthetik. Ám a nagy teljesítményű, gyors Turbo-változatot zárt modellként tartják fenn, csak fizetős szolgáltatás részeként elérhető. Ez a hibrid stratégia egyre elterjedtebb a kínai MI-piacon (pl. Alibaba), és célja, hogy a közösségi ökoszisztéma szélesedjen, miközben a fejlett, üzletileg kulcsfontosságú technológiák stabil bevételi forrást biztosítsanak.

Fejlesztői visszajelzések: Egyheti munkát két nap alatt

A fejlesztői közösség pozitívan fogadta a kiadást, kiemelve a GLM-5.1 üzembiztosságát, önállóságát és azt, hogy nincs szükség prompt-optimalizálásra. Sokan arról számoltak be, hogy olyan feladatokat, amelyek korábban egy-egy hétig tartottak volna – kód előfeldolgozása, logika és hiperparaméterek hangolása – most két nap alatt sikerült lezárniuk. A fejlesztők számára ez azt is jelenti, hogy bátrabban dolgozhatnak, és nem kell tartaniuk az MI-k erőforrás- vagy memóriaszűkössége miatt bekövetkező holtpontoktól. A nyolcórás autonóm teljesítmény különösen nagy visszhangot keltett a közösségi médiában.

A hosszú távú MI-munka: Új korszak kezdete

Mindezek nyomán az MI-fejlesztés elsőbbségét már nem a másodpercenként feldolgozott tokenek száma, hanem a felügyelet nélküli, összefüggő munkaidő fogja meghatározni. Egy modell, amely nyolc órán át ember nélkül dolgozik, átírja a szoftverfejlesztés eddigi menetét. Bár komoly kihívások maradtak (például az önértékelés numerikus mérőszámok nélküli finomhangolása), a GLM-5.1 bemutatásával új mércét állítottak fel. A kérdés így már nem az, hogy mit kérdezhetsz az MI-től, hanem hogy milyen projektet adhatsz ki neki teljes munkaidőre. A fókusz így egyre inkább azokra a rendszerekre tolódik, amelyek valódi, több lépéses projekteket tudnak végigvinni minimális emberi kontroll mellett. Ez az ügynökszerű mérnöki megközelítés új fejezetet nyithat a globális MI-gazdaságban.

2026, adminboss, venturebeat.com alapján

  • Te mit éreznél, ha egy mesterséges intelligencia önállóan dolgozna helyetted több órán keresztül?
  • Te megengednéd, hogy egy ilyen MI teljesen kontroll nélkül oldjon meg egy fontos feladatot?


Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 5/23

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     War Mongrels (iPhone/iPad) Monthly Dystopia (iPhone/iPad) FormatX – All Media Converter (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ContactVault...

péntek 21:55

A szendvicsmolekulák titokzatos, rejtett állapota

Az 1950-es évek óta fontos szerepet töltenek be a metallocének a fémorganikus kémia világában...

péntek 21:45

A Subnautica 2 hátborzongató lenne, ha végre csendben maradna

🦈 A Subnautica 2 bemutatja, milyen is az, amikor valaki igazán egyedül marad egy idegen világban...

péntek 21:34

A világ legősibb sziklarajza 67 800 éves? Inog a bizonyíték?

Fontos kérdés, hogy mennyire megbízhatóak azok az eredmények, amelyek szerint a világ legősibb barlangrajzainak kora akár 67 800 év...

péntek 21:22

Péntek estére gyengül a bitcoin, Warsh átveszi a Fed irányítását

📈 Ez a jelenség jól illusztrálható azzal, hogy péntek délután a kriptodevizák árfolyama csendben csúszik lefelé, miközben a tőzsdék egyelőre kitartanak...

péntek 21:12

Az Einstein–Rosen-híd felfedheti az idő rejtett tükrét

Felmerül a kérdés, hogy valóban kaput nyit-e Einstein féreglyuka az univerzum különböző pontjai között, vagy inkább egy sokkal izgalmasabb és kevésbé megfogható jelentést hordoz...

péntek 20:56

A Riot új rendszere 2 milliós papírnehezékké teszi a csaló hardvereket

A videojátékosok és a csalók közötti küzdelem új fordulatot vett. A fejlesztők eszköztára egyre bővül, de a csalók is évről évre új módszerekkel próbálkoznak...

péntek 20:23

Az elavult B12-ajánlások az agyadra is veszélyt jelenthetnek

💡 Az időskorúak egészségesnek tűnő B12-vitaminszintje mögött lappanghatnak agyi károsodások és romló gondolkodási képességek...

péntek 20:12

A fókakölykök rejtélyes halála mögött: kannibál fókák a Sable-szigeten

Évtizedeken át rejtély övezte a Sable-sziget fókakölykeit sújtó különös haláleseteket. Az Atlanti-óceán északkeleti részén, Új-Skócia partjaitól nem messze fekvő szigetről folyamatosan jelentettek elpusztult fókakölyköket, testükön hátborzongató, spirális sebekkel...

péntek 19:55

A milliárdosklubban már Messi is Beckham oldalán, Inter Miamival

Érdemes megvizsgálni, hogyan vált Lionel Messi a világ egyik legsikeresebb futballista-befektetőjévé alig három év alatt az Egyesült Államokban...

péntek 19:45

A D&B 642 milliós cégadatbázisát újraépítette az MI-ügynököknek

💻 Közel két évszázados munka eredményeként a Dun & Bradstreet (D&B) kialakított egy hatalmas, világszerte 642 millió céget lefedő üzleti adattárházat...

péntek 19:34

A foci-vb-re készülve ez az 5 tévéfunkció számít

A foci-világbajnokság közeledtével sokan döntenek úgy, hogy érdemes új, nagyobb vagy jobb minőségű tévét beszerezni...

péntek 19:23

Az IREN társalapítója: Az MI-t az infrastruktúra fogja vissza, nem a chipek

A világ MI-fejlesztési láza töretlen, ám a növekedés igazi akadálya már nem a chipek elérhetősége, hanem a fizikai infrastruktúra...

péntek 19:12

Az új Modern Warfare mindent visz: soha nem látott élmény jön

Hivatalosan is visszatér a Modern Warfare-sorozat – az Activision bejelentette, hogy a következő Call of Duty-játék egy meghatározó, új epizód lesz, amelyet az Infinity Ward fejleszt...

péntek 19:01

A nagy fordulat: a marhahús nem növeli a cukorbetegség kockázatát

Az Egyesült Államokban több mint 135 millió felnőtt szenved 2-es típusú cukorbetegségben vagy tartozik a veszélyeztetettek közé...

péntek 18:56

A Spotify új AI-ja engedélyezett, fizetett remixeket és feldolgozásokat generál

Érdemes megvizsgálni, hogy a Spotify egy olyan új eszközt fejleszt, amellyel a felhasználók mesterséges remixeket és feldolgozásokat készíthetnek kedvenc dalaikból...

péntek 18:34

A hétköznapi ételek rejtett rákkeltő vegyszerei leleplezve

Első pillantásra talán egészségesnek tűnik minden, ami a tányérodon van, hiszen figyelsz a napi mozgásra, a kalóriákra, és szívesen válogatsz zöldségekből, gyümölcsökből...

péntek 18:23

A fogyasztói bizalom rekordmélyen májusban, az iráni háború szítja az inflációs félelmeket

Májusban többéves mélypontra zuhant a fogyasztói bizalom, miközben az amerikai–iráni háború és a magas olajárak miatt egyre többen tartanak az árak újabb emelkedésétől...

péntek 16:22

Az Ark Invest négy nap alatt 12,5 millió dollárért Bullish-részvényt vett

Miközben a digitális eszközök árfolyama hetek óta hullámzik, az Ark Invest ismét kihasználta az alkalmat, hogy megerősítse pozícióját a kriptoszektorban...

péntek 16:12

A Microsoft orvosolta az eltűnő Windows 11-asztal gondját: jön a javítás

Az utóbbi hetekben sok Windows 11-felhasználó találkozott különös hibákkal: az asztal teljesen eltűnt, a tálca megfagyott, a Fájlkezelő (File Explorer) vagy a Feladatnézet (Task View) akadozott, vagy éppen egyáltalán nem válaszolt...

péntek 16:01

Az ősi kémiai trükk új üveget hoz: CO2-t és hidrogént fog be

🧠 Az üveggyártás múltjából ismert trükköt a jövő szolgálatába állították a kutatók, akik egy új típusú üveget fejlesztettek ki, amely képes megkötni a szén-dioxidot és a hidrogént...

péntek 15:56

A mesterséges intelligencia gyorsabban ontja a sérülékeny kódot, mint javítani tudnánk

A vállalatok egyre gyakrabban engednek át hibás, ismerten sebezhető kódot az éles rendszerekbe, és mára ez a hozzáállás szinte általánossá vált...

péntek 15:45

A Nereid kilóg a sorból: a James Webb kulcsa a Naprendszerhez

Neptunusz története évmilliárdokkal ezelőtt kezdődött, amikor a bolygó még épp csak kialakult a Naprendszerben...

péntek 15:34

Az MI utoléri az emberi gondolkodást? Kutatók szerint csak mintázatokat magolt.

💡 Bár a tudományos világot megrázta egy tanulmány, amely azt állította, hogy egy haladó nyelvi modell képes az emberi gondolkodás pontos szimulálására, most mindez más megvilágításba került...

péntek 15:23

A Steam Controller töltője állandóan áram alatt – egy érintés is ráz

⚠ A modern vezeték nélküli kontrollerek egyre magasabb árat képviselnek, de az extra költségekért cserébe általában kényelmes töltőrendszert is kínálnak – például a Steam Controller mágneses töltőtalpát...

péntek 15:12

A 11 legjobb hűtőláda a kánikulára, egykori szabadtéri rovat szerkesztőjének ajánlásával

🍺 A nyári kalandokhoz elengedhetetlen egy jó hűtőláda, legyen szó tengerparti kirándulásról, baráti grillezésről vagy parkbeli piknikezésről...

péntek 15:01

A Dune: Awakening szakít az MMO-val – új irányt vesz

🌙 A Dune: Awakening fejlesztői úgy döntöttek, végre tiszta vizet öntenek a pohárba a játékmenet műfaját illetően...

péntek 14:56

Az Ebola tombol: lángokban áll egy kongói egészségügyi központ

Az északkelet-kongói Bunia városa közelében fekvő Rwampara településen helyiek gyújtottak fel egy egészségügyi központot, miután nem engedték, hogy egy elhunyt ismerősük holttestét hazavigyék temetésre...