
Ügynökalapú „claw” feladatok újraírva
A Xiaomi modelljei különösen jól teljesítenek olyan felhasználási területeken, ahol az MI‑ügynökök közvetlenül, például csevegőalkalmazásokon keresztül kapnak utasításokat. Ezek az ügynökök a felhasználók helyett végeznek el bonyolult feladatokat: például marketingtartalmakat generálnak, közösségimédia‑fiókokat menedzselnek, e‑maileket rendszereznek vagy időpontokat szerveznek.
A MiMo‑V2.5‑Pro 63,8%-os sikerességi aránnyal vezeti az open source mezőnyt, úgy, hogy átlagosan mindössze 70 000 token/folyamat felhasználásával végzi el a feladatokat – ez akár 40–60‑szor kevesebb token, mint amennyit a versenytársak, például az Anthropic Claude Opus 4.6, a Google Gemini 3.1 Pro vagy az OpenAI GPT‑5.4 használnak ugyanehhez az eredményhez. Ennek köszönhetően látványosan csökkennek a költségek is, miközben a teljesítmény maradéktalanul versenyképes.
Két modell, két célcsoport
A Xiaomi kétféle verziót kínál: a MiMo‑V2.5 az „Omni” multimodális, általános modell, míg a MiMo‑V2.5‑Pro az „Agent” specialistája, amelyet hosszú távú feladatsorok és összetett szoftverfejlesztési kihívások megoldására optimalizáltak.
A Pro verzió a GDPVal‑AA (Elo) benchmarkon 1581 pontot szerzett, ezzel többek között a Kimi K2.6 és a GLM 5.1 modellt is megelőzte. A gyakorlatban a Pro modell képes volt mindössze 4,3 óra alatt egy teljes Rust‑fordító (Rust compiler) megalkotására (ami tipikusan heteken átívelő egyetemi projekt), 8 192 soros videószerkesztőt készített 11,5 óra alatt, valamint mérnöki optimalizációkban 22‑szeres előrelépést ért el a kiinduló állapothoz képest – mindezt önállóan, folyamatos koherenciával.
Előnyös árak és aduász licencek
A modellek ára globálisan nagyon kedvező. A Pro verzió nemzetközi fejlesztők számára 1,00 USD/millió bemeneti token (cache‑miss esetén) és 3,00 USD/millió kimeneti token 256 000 tokenig; 256 000–1 000 000 tokenes, ultrahosszú feladatoknál pedig kétszeres áron, de cache‑találat esetén akár 0,20–0,40 USD/millióig is csökkenhet a költség. A bázismodell 0,4 USD/millió bemeneti és 2 USD/millió kimeneti token költséggel a legolcsóbb harmadba tartozik a világ MI‑mezőnyében.
Fontos, hogy a modellek MIT‑licenc alatt érhetők el, így a vállalkozások saját igényeikre szabhatják, kereskedelmi célokra is bevethetik, további engedélykérés nélkül.
Sparse MoE architektúra a hatékonyság mögött
A MiMo‑V2.5 egy 310 milliárd paraméteres, míg a Pro széria egy elképesztő, 1,02 billió paraméteres Sparse Mixture‑of‑Experts architektúrára épül. A ténylegesen aktív paraméterek száma egyik esetben sem haladja meg a 42 milliárdot; egyszerre 15–42 milliárd paraméter dolgozik, így a rendszer pont az adott feladathoz „hívja be” a szükséges mesterséges szakértőket, hasonlóan egy kutatókórház szakorvosi rendszeréhez.
Az alapmodell öt lépcsőben fejlődött: először szöveges előtanításon estek át, integrálták a multimodális (audio/vizuális) tudást, szisztematikusan növelték a kontextusablakot 32 000-ről akár 1 millió tokenre, majd RL‑lel és multimodális preferenciaoptimalizálással csiszolták tovább a valós életbeli gondolkodást és érzékelést is.
A Pro modellt kifejezetten arra optimalizálták, hogy hosszú, komplex ügynöki folyamatok során is megőrizze a koherenciát: akár több ezer lépésen keresztül tud önállóan dolgozni, szinte emlékezve a teljes előzményre.
Nagyon olcsó előfizetések és fejlesztőbarát csomagok
A Xiaomi rendkívül fejlesztőbarát csomagokat is kínál: a „Lite Starter Pack” évi körülbelül 23 000 forintért (63,36 USD) 720 millió kreditet ad, míg a „Max” csomag 19,2 milliárd kreditet kínál nagyvállalati felhasználóknak évi 392 000 forintért (1 056 USD). Minden előfizetéshez kedvező API‑árak, 20%-os csúcsidőn kívüli árcsökkentés és speciális MI‑fejlesztői támogatás jár.
A belépési küszöb csökkentése érdekében a cache‑írás egyelőre teljesen ingyenes, a szövegből beszédet előállító, illetve hangklónozó modulokat is díjmentessé tette a cég.
Infrastruktúra és ökoszisztéma-támogatás
A fejlesztők első pillanattól kezdve élvezhetik olyan népszerű MI‑infrastruktúramotorok támogatását, mint az SGLang vagy a vLLM, mindezt AWS, AMD, T‑HEAD, Enflame hardvertámogatással. Fuli Luo projektvezető 100 billió tokenes ösztöndíjprogrammal ösztönzi a fejlesztőket, hogy rizikó nélkül kísérletezzenek az egymilliós kontextusablakkal.
A fentiek tükrében a Xiaomi új MI‑modelljei jelentősen újrapozícionálják a zárt forráskódú, magas költségű MI‑korszakot, és közelebb hozzák a vállalkozások és fejlesztők számára a valódi, testre szabható MI‑ügynökök tömeges alkalmazását.
