szerda 13:13

Itt az olcsóbb, gyorsabb képgenerálás: a Microsoft új MI-modellt dobott piacra

Itt az olcsóbb, gyorsabb képgenerálás: a Microsoft új MI-modellt dobott piacra
A Microsoft bemutatta legújabb képgeneráló MI-modelljét, amely olcsóbb és gyorsabb, mint elődjei. Az MAI-Image-2-Efficient névre keresztelt rendszer szinte fele annyiba kerül, mint a vállalat zászlóshajója, ráadásul magasabb sebességet is kínál. Az azonnal elérhető modell a Microsoft stratégiai váltását jelzi: a vállalat saját MI-stacket épít, és egyre kevésbé függ az OpenAI-tól.

Gyorsabb és olcsóbb képgenerálás nagyvállalatoknak

Az új MAI-Image-2-Efficient 1 millió szöveges bemeneti tokenért körülbelül 1 820 forintot (5 USD), míg 1 millió képi kimeneti tokenért 7 100 forintot (19,5 USD) számít fel. Ez jelentős csökkentés az MAI-Image-2 korábbi, 1 millió képi tokenenkénti 12 000 forintos (33 USD) árához képest. A modell 22%-kal gyorsabban dolgozik, négyszer nagyobb GPU-hatékonysággal, mérve NVIDIA H100 hardveren, 1024×1024 pixeles felbontás esetén. Az új MI-modell a p50 késleltetési értékekben átlagosan 40%-kal előzi meg olyan versenytársait, mint a Google.

Az MAI-Image-2-Efficient több platformon debütált egyszerre, köztük az MAI Playgroundban és különféle Microsoft-szolgáltatásokban, további integrációk pedig tervben vannak.

Kétlépcsős stratégiával a teljes üzleti igények lefedésére

A Microsoft stratégiája szerint az MAI-Image-2-Efficient és az eredeti MAI-Image-2 nem egymás riválisai, hanem egymást kiegészítő eszközök. Előbbi a nagytömegű, árérzékeny felhasználásra készült: termékfotók, marketingvizuálok, UI-tervek, márkázott tartalomgyártás és valós idejű alkalmazások. Kiemelten jól kezeli a rövid képaláírásokat és címeket is.

Az MAI-Image-2 inkább a prémium igényeket – például fotórealisztikus minőségű képek, összetettebb stílusok (anime, illusztráció), hosszabb és bonyolultabb tipográfiai elemek – szolgálja ki. Lényegében: az Efficient modell az üzemszerű munkára való, a zászlóshajó pedig a bemutatóra.

Ez az üzleti modell az MI-piacon már bevált az OpenAI-nál, az Anthropnál és a Google-nél – a Microsoft most a képgenerálás területére adaptálja, ahol a képalkotás költsége meghatározó a tömeges termelésben.

Villámgyors fejlesztés, startup-szellemiséggel

Az új modell fejlesztési sebessége kiemelkedő: az MAI-Image-2 mindössze március 19-én mutatkozott be az MAI Playgroundban, április 2-án pedig bővült a hozzáférés, együtt két további alapmodellel: MAI-Transcribe (beszéd-szöveg MI 25 nyelven) és MAI-Sonic (hanggeneráló MI). Kevesebb mint egy hónap múlva máris itt az optimalizált, termelési változat.

A fejlesztést Mustafa Suleyman vezeti, és a cég új MI-csapata startupokra jellemző gyors iterációval dolgozik. A felhasználói visszajelzések is pozitívak: az MAI-Image-2-Efficient gyorsan a harmadik helyet szerezte meg az MI-képgenerálás toplistáján (a Google és az OpenAI után), és különösen kiemelték a fotórealizmusát, valamint azt, ahogyan precízen adja vissza a szöveges utasításokat.

Az eredeti változatot azonban több korlátozás is jellemezte: 30 másodperces várakozási idő két generálás között, napi 15 képes plafon a natív felületen, kizárólag 1:1-es képarány, nem volt kép–kép alapú generálás és szigorú tartalomszűrés. Egyelőre nem világos, hogy az Efficient változat mennyiben lazít ezek közül bármelyiken; különbségek lehetnek a vállalati API-felhasználás és a Playground verzió korlátai között is.


Microsoft és OpenAI: baráti szálak helyett önállóság

A Microsoft lépései nem értelmezhetők a tágabb MI-piaci kontextus nélkül. A cég viszonya az OpenAI-hoz – ami eddig az MI-korszak egyik fő partnersége volt – mostanra láthatóan inogni kezdett. Nemrégiben az OpenAI-tól kiszivárgott egy belső közlés, amelyben hangsúlyozták: a partnerség a saját növekedési lehetőségeiket is akadályozta, ezért már az Amazon Web Services, illetve a Bedrock platform felé is nyitottak. Eközben az OpenAI infrastruktúrája is sokkal diverzifikáltabbá vált, kevésbé függ az Azure-tól.

A MAI-Image-2-Efficient épp e stratégiai szétválás egyik kulcspillére. Ha a Microsoft ilyen áron tud gyártási minőségű képeket generálni, drasztikusan csökken az igény az OpenAI-tól licencelt modellek után fizetendő díjakra. A MAI-modell további fejlesztése tehát saját költségstruktúrát teremt.

A vállalat szervezeti struktúrája is ezt támogatja: Satya Nadella márciusban jelentett be jelentős átszervezést, amellyel egyesítette a Copilot-csapatokat, és Suleyman feladatkörét is átstrukturálta. A stratégiai fókusz: házon belüli MI-fejlesztés a valós termékhatásért és a költségek csökkentéséért, hiszen minden, partnerségen megspórolt forint azonnal javítja a margót.

Az MI-alapú ügynökök forradalmához kell az olcsó képgenerálás

Az új modell jelentőségét tovább növeli a Microsoft MI-ügynökökre épülő jövőképe. A vállalat épp most teszteli a Microsoft 365 Copilotban az OpenClaw-szerű funkciókat, amelyek önállóan, többlépéses feladatokat végeznek el, mindig aktív üzemmódban.

Megjelent a Copilot Cowork (ügynök a Microsoft 365-alkalmazásokban), a Copilot Tasks (többlépéses produktivitási feladatokra) és az Agent 365. Az ügynökszerű MI-világban a képgenerálás programozott alapelem lesz: egy marketingügynök például automatikusan, tömegesen hoz létre termékképeket, grafikai anyagokat, prezentációkat – emberi közbeavatkozás nélkül.

Ennek alapján megállapítható, hogy a gyorsaság és a minél alacsonyabb ár közel sem csupán marketingérték: ezek elengedhetetlenek a mindennapi ügynöki MI-felhasználáshoz. Ha egy rendszer naponta több ezer képet generál, minden megtakarított fillér számít, és a legkisebb késleltetési idő is nélkülözhetetlen a zavartalan működéshez.

Kérdések és kihívások az új MI-modell körül

A részletek fényében minden más megvilágításba kerül, ugyanakkor több kérdés is nyitott maradt. Nem derült ki, hogy az Efficient változat oldja-e az eddigi képarány-szabályokat, illetve csökkenti-e a túlzottan szigorú tartalomszűrést. Nem egyértelmű, hogy a gyorsaság hogyan hat a minőségre bonyolultabb képek esetén.

Az elért teljesítményadatokat szűkebb tesztfeltételek között mérték (NVIDIA H100, 1024×1024 képek, optimalizált kötegelés mellett), az összehasonlításokat pedig medián (p50) alapján értékelték, ami nem feltétlenül tükrözi a legsúlyosabb leterheltség alatti működést. Az API elérhetősége is egyelőre korlátozott, az EU-ba például csak később érkezik.

Ennek alapján megállapítható, hogy a Microsoft mindössze hónapok alatt radikálisan átalakította MI-stratégiáját, miközben saját képgeneráló modellt fejleszt, szervezetet épít, lezárja az OpenAI-val való közös időszakát, és az MI-ügynökök korszakát készíti elő – minden eddiginél gyorsabban, saját feltételek szerint. A következő hónapokban eldől, sikerül-e felzárkózni az OpenAI vagy akár az Anthropic előretöréséhez, de a Microsoft minden korábbinál aktívabb szereplőként lép fel az MI-piacon, és most már saját termékével diktálja a tempót.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     PostalCal (iPhone/iPad)A Postal Employee Day Off Calendar egy egyszerű, célzott alkalmazás, amely a USPS postai dolgozók és családtagjaik számára készült...

MA 08:52

Az óriás nyelvi modellek futtatásának új korszaka

💻 Amit látunk, az túlmutat a megszokotton: a nagyméretű nyelvi modellek (LLM-ek) üzemeltetése ma már nem csupán jó algoritmusokról szól, hanem komoly hardvertervezési és optimalizálási kérdés is lett...

MA 08:43

Az okosóráról irányítható mobilkamera: megérkezett a Blackmagic újdonsága

A Blackmagic Camera alkalmazás iOS-re újabb szintre lépett, hiszen mostantól Apple Watchról is egyszerűen vezérelhető és monitorozható...

MA 08:37

Az univerzum rejtett arca: fekete lyukak és titkos dimenziók

Erre utal többek között az, hogy a fekete lyukak soha nem tűnnek el teljesen, még akkor sem, ha Hawking sugárzása révén látszólag folyamatosan veszítik tömegüket...

MA 08:29

Az új Walmart Onn 4K Pro megéri a pénzét?

Érdekes, hogy a Walmart ismét egy váratlan termékbejelentéssel borzolja a kedélyeket, most éppen az Onn 4K Pro streaming boxszal...

MA 08:24

Az MI-alapú keresés új szintre emeli az ügyfélszolgálati ügynökök tudását

A mai digitális világban elengedhetetlen, hogy a különféle MI-ügynökök hatékonyan tudjanak keresni az információk között...

MA 08:16

Az MI-háború új felvonása: a Claude Opus 4.7 visszaveszi a trónt

A mesterséges intelligencia fejlesztésének újabb mérföldkövéhez érkeztünk: az Anthropic piacra dobta legújabb, mindenki számára elérhető nagy nyelvi modelljét, a Claude Opus 4...

MA 08:08

A hosszú élet titka: a rettegett „halálfehérje” nyomában

Fontos kérdés, hogy miért gyengül az immunrendszer és a vérképzés az életkor előrehaladtával...

MA 08:01

Az északi fények tánca Amerikáig ér a Nap koronalyuka miatt

Észak-Amerika egyes részein különleges látványosság várható ezen a hétvégén: ritkán látható északi fények festik az eget, mindezt egy jelentős, a Nap légkörében, a koronában keletkezett koronalyuknak köszönhetően...

MA 07:57

Az áttörés még várat magára: a Bitcoin újra beszakadt

A Bitcoin árfolyama csütörtök délelőtt hirtelen esett vissza, miután sorozatosan kudarcot vallott a 27,5–28 millió forintos (75 000–76 000 USD) árfolyamszint áttörésében...

MA 07:43

Az IBM-et 6 milliárdos DEI-botrány rázza meg

Erre utal többek között az, hogy az IBM 6 milliárd forint (17 millió dollár) összegben kötött megállapodást egy, a sokszínűség, esélyegyenlőség és befogadás (DEI) programjai miatt indult vizsgálat ügyében...

MA 07:36

Az elhízást tényleg legyőzheti egy természetes hormon?

🥗 Ami először apróságnak tűnt, most áttörésnek számít a tudósok szerint: egy természetes hormon, az FGF21 képes visszafordítani az elhízást egerekben...

MA 07:29

A Robloxot milliárdos bírság sújtja, szigorodik a gyerekvédelem

Az egyik legnépszerűbb online játékplatform, a Roblox összesen több mint 4,4 milliárd forintot (12 millió USD) fizet, és új biztonsági intézkedéseket vezet be, miután Nevadában per elé került a gyermekvédelem hiányosságai miatt...

MA 07:15

Az MI szolgálatában álló hekkerek kifosztották Mexikót

Felmerül a kérdés, meddig vagyunk biztonságban a digitális világban: Mexikó történetének egyik legsúlyosabb kiberbiztonsági támadását egy maroknyi hacker hajtotta végre mesterséges intelligencia segítségével...

MA 07:08

Az Opera turbózza a böngészést: AI-chatbotok egy kattintásra

Élvezetes újítás érkezett az Opera böngészőhöz, aminek garantáltan örülni fognak azok, akik imádják a mesterséges intelligenciával felturbózott netezést...

MA 07:01

Az iPhone–Visa rémálom: 4 millió forint tűnt el pillanatok alatt

💸 Egy trükkös módszerrel teljesen zárolt iPhone-ról sikerült 4 millió forintot ellopni, ráadásul anélkül, hogy a tulajdonos bármi gyanúsat észrevett volna...

MA 06:57

Az ivóvíz új réme: veszélyben a víztisztítók

Egy most felfedezett kártevő, a ZionSiphon kifejezetten az ipari vezérlőrendszerek ellen készült, és víztisztító- és sótalanító üzemek működését fenyegeti...

MA 06:51

Az első holdbázis közelebb van, mint gondolnád

🌚 Amikor az Artemis II legénysége megközelítette a Holdat, könnyen rácsodálkoztak arra, milyen hihetetlen érzés egy karnyújtásnyira lenni tőle...

MA 06:43

Az új Thunderbolt MI‑kliens felforgatja a helyi infrastruktúrát

⚡ A Mozilla legújabb fejlesztéseként bemutatta a Thunderbolt MI-klienst, amely lehetővé teszi, hogy magánszemélyek és vállalkozások saját, helyben futó MI-infrastruktúrát építsenek ki, teljesen függetlenül felhőalapú külső szolgáltatóktól...

MA 06:36

Az OpenAI berobban: jön a biológiára hangolt MI

Az OpenAI bemutatta legújabb nyelvi modelljét, a GPT-Rosalindot, amelyet kifejezetten biológiai kutatásra fejlesztettek...

MA 06:29

Az Intel végre új életet lehel az alap Core processzorokba

💻 Az Intel hosszú idő után frissíti a nem-Ultra Core processzorokat, amelyekre eddig a korosodó Raptor Lake architektúrára épülő meglévő Core-szériák voltak jellemzők...

MA 06:22

Elkészült az univerzum eddigi legnagyobb, legélesebb 3D-s térképe

💫 Áttörő eredményt értek el a csillagászok: elkészült a valaha készült legnagyobb felbontású 3D-s térkép az univerzumról...

MA 06:15

A mesterséges intelligencia lehet az amerikai kriptófelügyelet megmentője?

Az amerikai Commodity Futures Trading Commission (CFTC) élén Mike Selig egyre növekvő felügyeleti feladatokkal néz szembe, miközben az ügynökség létszáma az utóbbi években jelentősen csökkent...

MA 06:09

A tokenizáció forradalma: kézzelfogható eszközök, valódi lehetőségek?

💰 Az elmúlt másfél évben a tokenizáció robbanásszerű fejlődésen ment keresztül: eddig csak koncepció volt, de ma már a portfólióépítés legitim eleme lett...

MA 06:05

Történelmi események a mai napon (Április 17.)

Kiemelkedő nap a történelemben: szerződés, lázadás, köztársaság és űrdrámából csoda. A legemlékezetesebb pillanatok között ott van a Republic of Ireland kikiáltása, a The Canterbury Tales (Canterbury mesék) első udvari előadása és az Apollo 13 biztonságos hazatérése...

MA 06:01

Az okos robotmadarak új életet lehelnek a Grand Teton madárvilágába

A Grand Teton Nemzeti Parkban elképesztő módon léptek fel a fogyatkozó fürjtyúk-populáció megmentéséért: nemcsak hagyományos madárcsali figurákat használnak, hanem rendkívül ötletes, robotizált példányokat is...

csütörtök 21:46

Az MI-ügynökök új rémálma: foltozás után is szivárognak a bizalmas adatok

🚩 A legfrissebb kutatások rávilágítanak arra, mennyire sérülékenyek maradtak a vállalati MI-ügynökök, hiába foltozták be a friss biztonsági réseket...

csütörtök 21:13

Az igazi kvantumgyerek: kilencéves csodagyerek podcastel a jövőről

Érdekes, hogy a kilencéves Kai Moskvitch hobbiból podcastet indított, amelyben azt kutatja, miként változtatja meg a mindennapjainkat a kvantumtechnológia...

csütörtök 21:02

Az Anna’s Archive 115 milliárdos kártérítést fizet a Spotifynak és kiadóknak

💸 Az Anna’s Archive nevű nyílt könyvtárat és keresőmotort 115 milliárd forint (322 millió dollár) kártérítés megfizetésére kötelezték, miután állítólag letöltötte és elmentette a Spotify teljes zenegyűjteményét...