2026. 01. 27., 08:52

Az új Kimi K2.5: gépi látású MI, önálló ügynökhadsereggel

A Kimi K2.5 vadonatúj, nyílt forráskódú modell, amely egyszerre hoz áttörést a vizuális intelligenciában, a kódfejlesztésben és az önállóan szerveződő ügynökalapú munkafolyamatokban. Az új modell a Kimi K2 továbbfejlesztett változata, amely körülbelül 15 billió vegyes vizuális és szöveges tokenen tanult. Natív módon multimodális, vagyis képeket és szövegeket is gond nélkül kezel – mindezt a legmodernebb kódolási és vizuális képességekkel ötvözve, miközben képes saját, önirányított ügynökrendszert létrehozni.

Vizuális kódolás: képből kód, videóból alkalmazás

Első pillantásra úgy tűnhetett, hogy a kódolás a múltban pusztán szöveges utasításokra épült, de a Kimi K2.5 áttöri a határokat. Segítségével egyszerű beszélgetésekből készülhetnek komplex front-end felületek és animációk, például görgetésre induló effektek. A K2.5 a szöveges promptokon túl képek és videók alapján is képes kódot generálni, illetve vizuális hibakeresést végezni – így bárki könnyedén vizuálisan fejezheti ki az ötleteit.

A részletek fényében minden más megvilágításba kerül, amikor a K2.5 egy teljes weboldalt képes rekonstruálni pusztán egy videó alapján, vagy bonyolult feladványokon keresztül logikusan keres rövid utat egy labirintusban. Egy ilyen példában a K2.5 Pythonban dolgoz fel egy 1500×3000 pixeles labirintust, megtalálja a kezdő- és végpontot, majd a BFS-algoritmussal (szélességi keresés) 113 557 lépésből álló, biztosan legrövidebb utat jelöl meg vizuálisan. A folyamat közben ellenőrzi és színes vizualizációval ábrázolja az útvonalat, külön hangsúlyt fektetve a valódi, optimális megoldásra.

Ezzel szemben a régi algoritmusok gyakran elakadtak, vagy túl lassúnak bizonyultak – itt azonban egy közel 4,5 millió pixeles útvesztő sem akadály.

Ügynöksereg: párhuzamosítás mesterséges intelligenciával

Az igazi áttörést a Kimi K2.5 önálló ügynökserege jelenti: akár 100 ügynök hozható létre automatikusan egyetlen feladathoz, amelyek akár 1 500 eszközhívást képesek párhuzamosan, egymással összedolgozva végrehajtani. Ez az új szemlélet átírja a MI-munkafolyamatokról alkotott képünket.

A Parallel-Agent Reinforcement Learning (Párhuzamos ügynöktanulás, röviden PARL) keretrendszerrel a rendszer képes bontott, párhuzamosítható részfeladatokat generálni: ehhez ügynökorchesztrátort használ, amely önállóan dolgozó alügynököket hoz létre az adott problémához illeszkedően. Az ilyen típusú párhuzamos végrehajtás akár 4,5-szeres gyorsulást eredményez a klasszikus, soros ügynökvégrehajtáshoz képest.

A nehézséget a késleltetett, szétszórt visszacsatolások kezelése adja, de a fokozatos jutalmazásra épülő képzési eljárás megoldja, hogy valódi párhuzamosítás jöjjön létre, ne csak álpárhuzamosság. Ráadásul a rendszer úgy méri a teljesítményt, hogy a szűk keresztmetszetek valóban optimalizálásra kerüljenek: csak annyi részfeladatot indít, amennyitől érdemben rövidül a megvalósítás ideje.

Egy konkrét példában a K2.5 Agent Swarm 100 alügynököt indít el, amelyek mindegyike más-más réspiaci YouTube-csatorna vezető készítőjét kutatja fel, majd a végeredményt összesíti egyetlen táblázatba. A komplex kereséseknél így akár 80%-os futásidő-csökkenést is elért.

Irodai szuperasszisztens: Kimi a munkahelyen

A Kimi K2.5 az irodai produktivitást sem hagyja érintetlenül. Képes nagy sűrűségű bemenetek (óriási dokumentumok, táblázatok, PDF-ek, prezentációk) feldolgozására, többlépcsős eszközhasználatra és szakértői szintű kimenetek előállítására, mindezt csevegés formájában.

A belső, szakértői munkára kifejlesztett benchmarkokon (AI Office Benchmark, General Agent Benchmark) 59,3% és 24,3%-os javulást ért el a korábbi generációhoz képest. Már nem akadály egy 10 000 szavas értekezés vagy egy 100 oldalas dokumentum sem.

Olyan feladatokat is elvégez, mint:
– Jegyzetek hozzáadása Word-dokumentumban
– Pénzügyi modellek (Kimutatás/Pivot tábla) építése Excelben
– LaTeX-egyenletek szerkesztése PDF-ben

Ami korábban órákat vagy napokat vett igénybe, ezzel az eszközzel percek alatt megvan.


Valós teljesítmény, valós adatok

A mért tesztek szerint a Kimi K2.5 – bár nyílt forráskódú és költséghatékony – a vezető, zárt MI-modelleket is képes megszorongatni. A Reasoning & Knowledge (érvelési és tudás) feladatoknál 30–96% közötti eredményeket hoz benchmarkokon (pl. HLE-Full, AIME 2025). Képfeldolgozásnál (MMMU-Pro, MathVision, OCRBench) szintén a legjobbak között szerepel.

Ezzel szemben korábban a nyílt modellek rendre alulmaradtak a nagy ipari versenytársakkal szemben, de a K2.5 új korszakot nyithat a hozzáférhető MI-közösség számára.

Következtetés: a nyílt MI új szintje

A Kimi K2.5 mérföldkő a nyílt MI-k világában: ötvözi a látásalapú kódolás erejét, a koordinált ügynöksereget és a valódi irodai hasznosulást. Az MI-tanulás, a praktikus kódfejlesztés és a termelékenység olyan szintjét éri el, amely a valós életben is megállja a helyét. Az ütemterv további fejlődést ígér, és újradefiniálja az MI szerepét a tudásalapú munkában.

Ezzel szemben a klasszikus MI-modellek csak egy-egy részterületre koncentráltak, de a Kimi K2.5 már a valódi, sokoldalú, önálló, tudásalapú intelligencia előfutára lehet.

2025, adminboss, www.kimi.com alapján

  • Te kipróbálnád ezt a rendszert a saját munkádban?
  • Szerinted milyen veszélyeket kellene elsőként figyelembe venni egy ilyen MI bevezetésénél?


Legfrissebb posztok

szombat 21:23

A terhesség tudománya: Teszteld, mennyit tudsz a babafejlődésről!

👶 A babák világra jövetele különleges, mégis megdöbbentően összetett folyamat. Az emberi terhesség átlagosan kilenc hónapig tart, három szakaszra – trimeszterre – oszlik, és már a fogantatás előtt, a menstruációs ciklus kezdőnapjától számítják...

szombat 21:12

A CME-n már a bitcoin árhullámzására is lehet fogadni

A világ legnagyobb származékos tőzsdéje, a CME Group június 1-jén elindítja a bitcoin volatilitásalapú határidős ügyleteit, amint megkapja a szükséges szabályozói engedélyeket...

szombat 21:01

Az egyszerű zenei trükk, amitől 20%-kal tovább bírod az edzést

🎶 Kiderült, hogy egy igazán ütős lejátszási lista többet tehet érted edzés közben, mint hinnéd...

szombat 20:56

A svájci jegybank bitcointerve elbukott – nem jött össze elég aláírás

Svájcban ismét elhalt egy merész kezdeményezés, amely arra irányult, hogy a Svájci Nemzeti Bank arany- és külföldi devizatartalékai mellett bitcoint is felhalmozzon...

szombat 20:36

A hangtalan, de nem makulátlan ZimaBoard 2 mini NAS tesztje

💻 A ZimaBoard 2 minden porcikájában azt üzeni: itt a saját adataid feletti teljes kontroll, kompromisszumokkal, de jelentős újításokkal...

szombat 20:24

Jön az új doméncunami: kié lesz a .trump?

📢 Tizennégy év után ismét lehetőség nyílik arra, hogy vállalatok, szervezetek vagy akár városok saját felső szintű domainnevet (top-level domain, röviden TLD) birtokoljanak az interneten...

szombat 20:13

A világbajnokságra hangolva: a legjobb Dolby Atmos hangprojektorok

Ha már készül az ember a 2026-os labdarúgó-világbajnokságra, érdemes nemcsak egy új tévén gondolkozni, hanem a hangminőségre is fókuszálni...

szombat 20:03

Az Ugreen DXP4800 Pro: apró változás, komoly következmények?

⚠ Jellemző példa erre, hogy az Ugreen újra rátette a kezét a népszerű, négyfiókos NAS-piacra...

szombat 19:56

A feltörekvő piacokon banki appként használják a kriptotőzsdéket

Felmerül a kérdés, miért váltak a kriptovaluták ilyen népszerűvé a feltörekvő országokban...

szombat 19:45

A fülesfókák szíve csak partraszállás után pörög fel

A hosszú, mély merülések extrém terhelést jelentenek a tengeri emlősöknek. Ilyenkor a szív és az agy kivételével a többi szerv áttér oxigén nélküli anyagcserére, aminek következtében tejsav halmozódik fel...

szombat 19:34

A bistrifluron 95%-ban irtja a termeszeket, emberre veszélytelen

A szárazfatermeszek mesterien rejtőzködnek, fából készült épületek belsejében csendben táplálkoznak és gyarapodnak, míg a tulajdonosok csak a károk észlelése után szembesülnek a jelenlétükkel...

szombat 19:25

A OnePlus 15R két hét alatt új szintre tette az üzemidőt

🔋 Két hét használat után a OnePlus 15R egészen új szintre emelte az okostelefonos üzemidő fogalmát...

szombat 19:13

A fizikusok olyan kvantumrészecskéket fedeztek fel, amelyek felrúgják a valóság szabályait

Különösen említést érdemel, hogy a fizikusok hosszú ideig két típusba sorolták az elemi részecskéket: boszonokra és fermionokra...

szombat 19:01

A jégkori kínaiak megdöbbentően fejlett kőeszközöket készítettek 146 ezer éve

🔨 Érdemes megvizsgálni, hogy a modern ember ősrokonai mennyire képesek voltak alkalmazkodni a szélsőséges körülményekhez: a közép-kínai Lingjing lelőhely feltárásán kivételesen fejlett kőeszközökre bukkantak, amelyek körülbelül 146 ezer évvel ezelőtt készültek...

szombat 18:57

A szándékalapú káoszteszt akkor kell, amikor az MI magabiztosan téved

A mai vállalatok egyre bátrabban telepítenek autonóm MI-rendszereket, ám ezek magától értetődő magabiztossággal képesek váratlanul, akár katasztrofálisan hibázni...

szombat 18:34

Lehet, hogy már elkéstünk: bajban a Bitcoin a kvantumkor előtt

A kvantumszámítógépek megjelenése alapvetően fenyegeti a világgazdaság digitális alapjait, ráadásul már most csak néhány év maradt a védekezésre...

szombat 18:23

Az Abiotic Factor brutál frissítése: okosabb kedvencek, őrült kémia, végre felmosó

🚀 Érdemes megjegyezni, hogy az Abiotikus tényező fejlesztői ismét egy hatalmas frissítést adtak ki, amely tovább bővíti a játék eleve hatalmas világát...

szombat 14:46

Az EU a VPN-ekre készül rászállni – közeleg a tiltóhullám?

😱 Az online világ minden eddiginél bonyolultabbá vált, különösen, ha a fiatalok védelméről van szó...

szombat 14:35

Az emberiség már a Marsig vezető gyorssáv küszöbén áll?

🚀 Érdekes, hogy a tudományos világ ezen a héten egyszerre foglalkozik különös víruskitöréssel, űrutazási forradalommal és kvantumakkumulátorral...

szombat 14:24

A téridő királynője, Max Caulfield, átveszi Gordon Freeman helyét

👑 Mi történik, ha a Half-Life világában nem csendes tudós, hanem egy időutazós tinédzser lesz a főhős?..

szombat 13:24

A hét 7 legnagyobb tech-sztorija: Apple-kártérítés, vadonatúj Fitbit

Május második hetének technológiai újdonságai minden eddiginél színesebbek: fizetős kárpótlás az iPhone-tulajdonosoknak, egy új „zseniális” Google Fitbit, legendás játék visszatérése Switch 2 konzolra, valamint a Vine feltámadása is elfért a hét legfontosabb techhírei között...

szombat 13:12

Az okosodás ára: miért zsugorodik az agyunk?

Az emberi agy mérete nem feltétlenül áll szoros összefüggésben az intelligenciával...

szombat 13:02

A nagy MI-per: Musk kontra Altman 55 ezermilliárdért

Elon Musk és Sam Altman, akik egykor jó viszonyban álltak, ma egymás esküdt ellenségeiként állnak szemben a kaliforniai bíróságon...

szombat 12:56

Az első futóórádhoz: ezek a legjobb olcsó órák és karpántok

Az első futóóra kiválasztása nehéz döntés lehet, főleg, ha az ember úgy érzi, felesleges súlyos összegeket költeni egy apró kütyüre...

szombat 12:45

Az IKEA tárolási ötleteivel kétszer akkora lesz a dolgozószobád, átalakítás nélkül

📦 Jellemző, hogy ha zsúfolt, rendezetlen az otthoni dolgozószoba, rögtön nehezebb a koncentráció, mint amikor az asztalon és a szobában is rend van...

szombat 12:35

A Surfshark figyelmeztet: ázsiai utazási appok csendben gyűjtik az adataid

👑 Aki Ázsiába utazik, hamar szembesül azzal, hogy a helyi közlekedéshez, ételrendeléshez és tájékozódáshoz kötelező letölteni az ottani appokat, hiszen az európai vagy magyar alkalmazások gyakran használhatatlanok...

szombat 12:23

Az 899 dolláros, AI-kész RTX 5060-as PC: megéri?

Ilyen eset például, amikor egy új játékra vagy irodai munkára keresel számítógépet, de a RAM-árak az egekben járnak, így nehéz jó ár-érték arányú, előre összeszerelt gépet találni...

szombat 11:01

Az Elder Scrolls után a hős modder Pip-Boyra vitte a Falloutot

Modderek körében népszerű ötlet, hogy klasszikus játékokat integrálnak a modern környezetbe, de kevesen viszik ezt olyan extrém szintre, mint RPGKing117, aki sorra varázsolja be a legendás szerepjátékokat a Fallout 4 univerzumába...

szombat 10:52

Az új TCL QM8L: lenyűgöző mini-LED tévé remek áron, apró furcsákkal

📺 Az új TCL QM8L lenyűgöző képet kínál, amit a gyártó fejlett Mini‑LED háttérvilágítása és halo‑korlátozó technológiája biztosít...