2026. 04. 02., 14:36

Az MI-háború forr: a Microsoft három új modellt dob piacra

Az MI-háború forr: a Microsoft három új modellt dob piacra
A Microsoft szerdán bejelentette, hogy három vadonatúj, teljesen saját fejlesztésű MI-modellt indít el, amelyek hangfelismerésre és -átalakításra, valamint képalkotásra specializálódtak. A három modell – a MAI-1 Voice-to-Text, a MAI-1 Voice és a MAI-Image-2 – azonnal elérhetők az Azure platformon és a Microsoft Foundry új fejlesztői környezetében. Ezekkel a lépésekkel a technológiai óriás végre nyíltan kihívja az OpenAI-t, a Google-t és mindazokat, akik eddig az MI-fejlesztés élvonalában jártak.

Rekordpontosság 25 nyelven – a hangátírás új korszaka

A MAI-1 Voice-to-Text a piac egyik legpontosabb beszédfelismerő rendszereként debütált. A modell átlagosan 3,8%-os hibaarányt produkál a legtöbbet használt 25 nyelven, felülmúlva az OpenAI, a Google és az ElevenLabs megoldásait – az utóbbit minden nyelven, a Google-t 25-ből 22 esetben. A rendszer modern, kétirányú hangkódoló architektúrát használ, és villámgyors: egy 200 MB-os mp3-, wav- vagy flac-fájl feldolgozása az Azure Fast kínálat sebességének 2,5-szeresével történik. A következő hónapokban érkezik hozzá beszélőazonosítás és valós idejű feldolgozás is. Ráadásul a Microsoft már saját szolgáltatásai, például a Teamsben és a Copilotban, beépített funkcióként is teszteli, így rövidesen teljesen leválthatja a külső vagy elavult belső modelleket.

Természetes hangok, saját szövegből, villámgyorsan

A MAI-1 Voice egy szövegfelolvasó megoldás, amely képes 60 másodpercnyi élethű, természetes emberi beszédet generálni egyetlen másodperc alatt. A modell felismeri és megőrzi a beszélő hangszínét és karakterét hosszabb szövegeknél is, sőt mostantól már néhány másodpercnyi mintából saját, személyes hangprofilt készíthetünk a Microsoft Foundry felületén. Az ár 1 millió karakterre vetítve 8 100 forint. A MAI-Image-2 a Microsoft képalkotó rendszere, amely mostantól kétszer gyorsabban dolgozik, mint elődje, elérhető a Foundryban és a Copilot funkcióban, itt 1 millió tokennyi szövegbemenet 1 850 forint, 1 millió token képkimenet pedig 12 200 forint.

A szerződések harca: A Microsoft végre önálló lehet

A Microsoft MI-fejlesztési rohamának hátterében egy jelentős szerződésmódosítás áll. Korábban, tavaly októberig szerződés tiltotta, hogy a cég az OpenAI-tól függetlenül fejlesszen mesterséges általános intelligenciát (AGI). Az eredeti, 2019-es megállapodás szerint a Microsoft építette fel az OpenAI adatközpontjait, ezért cserébe azonban lemondott az önálló fejlesztés jogáról. Amikor az OpenAI ki akarta terjeszteni infrastruktúráját más szolgáltatókhoz (például a SoftBankhoz), elérkezett a stratégiai váltás: most először fejleszthet a Microsoft önálló „frontier”, azaz élvonalbeli modelleket – miközben az OpenAI termékeihez is megtartja a licencet 2032-ig. Ráadásul a vállalat továbbra is szoros partnerséget ápol mind az OpenAI-val, mind az Anthropiccal, így sajátos hidat képez a nagy MI-laborok között.


Kis csapat, óriási teljesítmény: A Microsoft áttörési stratégiája

Érdekes részlet, hogy mindhárom új modell csupán tízfős csapatok munkájával született. Mustafa Suleyman, a Microsoft szuperintelligencia-részlegének vezetője hangsúlyozta, hogy a valós áttörést nem a létszám, hanem az adatkészlet minősége és a modellarchitektúra adja – így a gyorsaság, hatékonyság és pontosság páratlan. Ennek ellenére, a Google vagy az OpenAI óriási csapataival ellentétben, a Microsoft hatékonyabb működésével jelentős költségelőnyre tesz szert: ha mindezt kevesebb mérnökkel és kisebb GPU-felhasználással éri el, az anyavállalat MI-üzletágának megtérülése ugrásszerűen javul.

Emberközpontú MI, transzparens adatkészlet

Suleyman filozófiája az MI-fejlesztésben az emberközpontúság. Cél, hogy az MI ténylegesen az emberiség szolgálatában álljon, az ember maradjon felül, és az irányítás soha ne kerüljön ki a kezéből. Ráadásul a „tiszta” adatkészlet kiemelten fontos: a Microsoft szerint a legtöbb versenytárssal szemben kizárólag jogtiszta, átlátható forrásokra támaszkodnak, ami csökkenti a jogi és reputációs kockázatot. Ez nagy vonzerő azokra a vállalatokra vagy üzemekre, ahol MI-törvények és compliance-követelmények bonyolítják a bevezetést.

Árharc, versenytársak célkeresztben: Amazon, Google, startupok

A hangátírás, beszédszintetizálás és képalkotás hármas modelljeivel a Microsoft egyszerre támadja a szinte minden piaci területet uraló Google-t, az OpenAI-t és az ígéretes MI-startupokat. Az új árpolitika leszorítja a költségeket: a felhasználók és a fejlesztők olcsóbban juthatnak prémium minőséghez, miközben a Microsoft óriási ügyfélbázisa toronymagas versenyelőnyt jelent. Ráadásul az új modellek az eddigi fejlesztés költségeinek töredékéért futnak, így a vállalat potenciálisan sokkal nyereségesebbé válhat az MI-szektorban.

A következő nagy dobás: független, saját nyelvi modell

A jelenlegi trió – hang, beszéd, kép – csak a kezdet. Suleyman szerint rövid időn belül készül a következő generációs, önálló, GPT-szintű nagy nyelvi modell, amely új korszakot nyithat. A cél: a szuperintelligencia területén is teljes önállóság, a versenytársak utolérése vagy megelőzése, minden eddiginél nagyobb skálán, minden lehetséges hatékonysággal. A nagy kérdés: vajon a türelmetlen befektetők és a piac hajlandók-e kivárni, hogy a Microsoft szuperintelligencia-csapata valóban végig tudja-e vinni ezt a forradalmat?

2026, adminboss, venturebeat.com alapján

  • Te félnél attól, hogy az MI egy nap átveszi az irányítást az ember felett?
  • Szerinted mennyire fontos, hogy egy cég minden adatforrását jogtisztán használja fel?


Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...