
Vége a túlárazott MI-óriások korának?
A vállalatok eddig kénytelenek voltak vagy hatalmas összegeket fordítani MI API-hívásokra, vagy kompromisszumokat kötni a helyi futtatás minőségében. A MiroThinker 1.5 egy új irányt mutat: úgynevezett open-weight modell, amelyet kimondottan eszközhasználatra és többlépéses következtetésre terveztek. A trend is megváltozni látszik: a szűk profilú szakértői rendszerek helyett mindinkább az univerzális, több területre alkalmazható MI-k válnak keresetté – eddig ilyen teljesítmény csak zárt rendszereknél volt elérhető, most azonban a MiroThinker 1.5 komoly nyílt alternatívát kínál.
Kevesebb hallucináció, átlátható kutatás
Az MI-k egyik legnagyobb kihívása továbbra is a kitalált válaszok veszélye, különösen amikor nyílt modelleket kell bevezetni ipari környezetben. A MiroThinker 1.5 ebben áttörést jelent: a kutatói mód (scientist mode) révén a rendszer nem pusztán találgat, hanem tudományos kutatási ciklusban dolgozik – hipotéziseket alkot, külső forrásokat kérdez, eltéréseket keres, módosítja a következtetést, majd újra ellenőriz. A tanítás során kifejezetten büntetik a bizonyíték nélküli, magabiztos válaszokat.
Ennek következtében felügyelhető, auditálható kutatási folyamatot biztosít, ami különösen értékes a pénzügyi, egészségügyi vagy jogi szektorban. Itt az MI nemcsak a választ, hanem a gondolatmenetet és a forrást is igazolni tudja. A magabiztos, de téves következtetések is jelentősen ritkábbak.
Teljesítmény: a kis modell nagyot üt
A MiroThinker-v1.5-30B a 30 milliárd paraméterével a BrowseComp-ZH kutatási teszten 69,8-as pontszámot ért el, amellyel le is győzte a 900 milliárd paraméteres Kimi-K2-Thinkinget, és a rekordot is megdöntötte. Az üzemeltetési költségek is lenyűgözők: mindössze 25 forint (~$0.07) egy teljes lekérdezés, a tempója pedig szintén kiemelkedő. Egy még nagyobb, 235 milliárd paraméteres változat (szakértőcsoportos architektúrával – Mixture-of-Experts) is elérhető, amely a világ élvonalába tartozik keresőügynök-teszteken. A legnagyobb riválisok – DeepSeek V3.2, Minimax, GLM – szintjén teljesít, a GPT-5 szintjét közelítve.
Eszközhasználat mesterfokon
A MiroThinker 1.5 valódi különlegessége a hosszan fenntartható eszközhasználat. A modell 256 ezer tokennyi kontextust tud kezelni, és akár 400 eszközhívást képes egy munkamenetben végrehajtani. Ez elengedhetetlen a komoly kutatási, tartalomgyártási vagy riportkészítési folyamatokban.
Időérzékeny tanítás a valósághű tudásért
A modellképzés egyik forradalmi újítása az Időérzékeny tanítási homokozó (Time-Sensitive Training Sandbox), ahol az MI csak olyan információt érhet el, amely az adott időpont előtt megjelent. Ennek köszönhetően eltűnik az utólagos tudásból eredő túlzott torzítás. A tanításban a Group Relative Policy Optimization módszert alkalmazzák, amelynek célja a megfelelő eszköz időben történő kiválasztásának fejlesztése.
Üzemeltetés és kompatibilitás
Fontos szempont: még a 30 milliárd paraméteres verzió is jelentős GPU-memóriát igényel, kisebb hardveren nehézkes a futtatás. Ugyanakkor a rendszer teljesen kompatibilis a vLLM-szerverekkel és az OpenAI API-val, így könnyű integrálni a meglévő munkafolyamatokba. Mindkét modell elérhető MIT-licenccel a Hugging Face platformon, így a vállalatok szabadon bevezethetik vagy tovább is taníthatják.
Megéri-e az interaktív skálázás?
Ebből adódóan nyilvánvaló, hogy a brutális paraméternövelés helyett talán az eszközhasználat, az interakció és a valóságos kutatás lesz a következő nagy ugrás az MI-iparban. A MiroMind csapata szerint nem mindent kell tudni fejből, elég, ha egy modell ügyesen kutat, keres és forrásokat von be. Ez lehet a jóval olcsóbb, rugalmas MI-ügynökök kora – és lehet, hogy a MiroThinker 1.5 csak az előfutára.
