
Gyorsabb és olcsóbb képgenerálás nagyvállalatoknak
Az új MAI-Image-2-Efficient 1 millió szöveges bemeneti tokenért körülbelül 1 820 forintot (5 USD), míg 1 millió képi kimeneti tokenért 7 100 forintot (19,5 USD) számít fel. Ez jelentős csökkentés az MAI-Image-2 korábbi, 1 millió képi tokenenkénti 12 000 forintos (33 USD) árához képest. A modell 22%-kal gyorsabban dolgozik, négyszer nagyobb GPU-hatékonysággal, mérve NVIDIA H100 hardveren, 1024×1024 pixeles felbontás esetén. Az új MI-modell a p50 késleltetési értékekben átlagosan 40%-kal előzi meg olyan versenytársait, mint a Google.
Az MAI-Image-2-Efficient több platformon debütált egyszerre, köztük az MAI Playgroundban és különféle Microsoft-szolgáltatásokban, további integrációk pedig tervben vannak.
Kétlépcsős stratégiával a teljes üzleti igények lefedésére
A Microsoft stratégiája szerint az MAI-Image-2-Efficient és az eredeti MAI-Image-2 nem egymás riválisai, hanem egymást kiegészítő eszközök. Előbbi a nagytömegű, árérzékeny felhasználásra készült: termékfotók, marketingvizuálok, UI-tervek, márkázott tartalomgyártás és valós idejű alkalmazások. Kiemelten jól kezeli a rövid képaláírásokat és címeket is.
Az MAI-Image-2 inkább a prémium igényeket – például fotórealisztikus minőségű képek, összetettebb stílusok (anime, illusztráció), hosszabb és bonyolultabb tipográfiai elemek – szolgálja ki. Lényegében: az Efficient modell az üzemszerű munkára való, a zászlóshajó pedig a bemutatóra.
Ez az üzleti modell az MI-piacon már bevált az OpenAI-nál, az Anthropnál és a Google-nél – a Microsoft most a képgenerálás területére adaptálja, ahol a képalkotás költsége meghatározó a tömeges termelésben.
Villámgyors fejlesztés, startup-szellemiséggel
Az új modell fejlesztési sebessége kiemelkedő: az MAI-Image-2 mindössze március 19-én mutatkozott be az MAI Playgroundban, április 2-án pedig bővült a hozzáférés, együtt két további alapmodellel: MAI-Transcribe (beszéd-szöveg MI 25 nyelven) és MAI-Sonic (hanggeneráló MI). Kevesebb mint egy hónap múlva máris itt az optimalizált, termelési változat.
A fejlesztést Mustafa Suleyman vezeti, és a cég új MI-csapata startupokra jellemző gyors iterációval dolgozik. A felhasználói visszajelzések is pozitívak: az MAI-Image-2-Efficient gyorsan a harmadik helyet szerezte meg az MI-képgenerálás toplistáján (a Google és az OpenAI után), és különösen kiemelték a fotórealizmusát, valamint azt, ahogyan precízen adja vissza a szöveges utasításokat.
Az eredeti változatot azonban több korlátozás is jellemezte: 30 másodperces várakozási idő két generálás között, napi 15 képes plafon a natív felületen, kizárólag 1:1-es képarány, nem volt kép–kép alapú generálás és szigorú tartalomszűrés. Egyelőre nem világos, hogy az Efficient változat mennyiben lazít ezek közül bármelyiken; különbségek lehetnek a vállalati API-felhasználás és a Playground verzió korlátai között is.
Microsoft és OpenAI: baráti szálak helyett önállóság
A Microsoft lépései nem értelmezhetők a tágabb MI-piaci kontextus nélkül. A cég viszonya az OpenAI-hoz – ami eddig az MI-korszak egyik fő partnersége volt – mostanra láthatóan inogni kezdett. Nemrégiben az OpenAI-tól kiszivárgott egy belső közlés, amelyben hangsúlyozták: a partnerség a saját növekedési lehetőségeiket is akadályozta, ezért már az Amazon Web Services, illetve a Bedrock platform felé is nyitottak. Eközben az OpenAI infrastruktúrája is sokkal diverzifikáltabbá vált, kevésbé függ az Azure-tól.
A MAI-Image-2-Efficient épp e stratégiai szétválás egyik kulcspillére. Ha a Microsoft ilyen áron tud gyártási minőségű képeket generálni, drasztikusan csökken az igény az OpenAI-tól licencelt modellek után fizetendő díjakra. A MAI-modell további fejlesztése tehát saját költségstruktúrát teremt.
A vállalat szervezeti struktúrája is ezt támogatja: Satya Nadella márciusban jelentett be jelentős átszervezést, amellyel egyesítette a Copilot-csapatokat, és Suleyman feladatkörét is átstrukturálta. A stratégiai fókusz: házon belüli MI-fejlesztés a valós termékhatásért és a költségek csökkentéséért, hiszen minden, partnerségen megspórolt forint azonnal javítja a margót.
Az MI-alapú ügynökök forradalmához kell az olcsó képgenerálás
Az új modell jelentőségét tovább növeli a Microsoft MI-ügynökökre épülő jövőképe. A vállalat épp most teszteli a Microsoft 365 Copilotban az OpenClaw-szerű funkciókat, amelyek önállóan, többlépéses feladatokat végeznek el, mindig aktív üzemmódban.
Megjelent a Copilot Cowork (ügynök a Microsoft 365-alkalmazásokban), a Copilot Tasks (többlépéses produktivitási feladatokra) és az Agent 365. Az ügynökszerű MI-világban a képgenerálás programozott alapelem lesz: egy marketingügynök például automatikusan, tömegesen hoz létre termékképeket, grafikai anyagokat, prezentációkat – emberi közbeavatkozás nélkül.
Ennek alapján megállapítható, hogy a gyorsaság és a minél alacsonyabb ár közel sem csupán marketingérték: ezek elengedhetetlenek a mindennapi ügynöki MI-felhasználáshoz. Ha egy rendszer naponta több ezer képet generál, minden megtakarított fillér számít, és a legkisebb késleltetési idő is nélkülözhetetlen a zavartalan működéshez.
Kérdések és kihívások az új MI-modell körül
A részletek fényében minden más megvilágításba kerül, ugyanakkor több kérdés is nyitott maradt. Nem derült ki, hogy az Efficient változat oldja-e az eddigi képarány-szabályokat, illetve csökkenti-e a túlzottan szigorú tartalomszűrést. Nem egyértelmű, hogy a gyorsaság hogyan hat a minőségre bonyolultabb képek esetén.
Az elért teljesítményadatokat szűkebb tesztfeltételek között mérték (NVIDIA H100, 1024×1024 képek, optimalizált kötegelés mellett), az összehasonlításokat pedig medián (p50) alapján értékelték, ami nem feltétlenül tükrözi a legsúlyosabb leterheltség alatti működést. Az API elérhetősége is egyelőre korlátozott, az EU-ba például csak később érkezik.
Ennek alapján megállapítható, hogy a Microsoft mindössze hónapok alatt radikálisan átalakította MI-stratégiáját, miközben saját képgeneráló modellt fejleszt, szervezetet épít, lezárja az OpenAI-val való közös időszakát, és az MI-ügynökök korszakát készíti elő – minden eddiginél gyorsabban, saját feltételek szerint. A következő hónapokban eldől, sikerül-e felzárkózni az OpenAI vagy akár az Anthropic előretöréséhez, de a Microsoft minden korábbinál aktívabb szereplőként lép fel az MI-piacon, és most már saját termékével diktálja a tempót.
