MA 20:02

Az MI végre megért: a Voxtral Transcribe 2 forradalma

Az MI végre megért: a Voxtral Transcribe 2 forradalma
A párizsi székhelyű Mistral újabb lendületet adott az MI-harcmezőn: bemutatta a Voxtral Transcribe 2 nevű, teljesen nyílt forráskódú hangfelismerő modelljét. A fejlesztés lényege, hogy a legmagasabb szintű pontosság és gyorsaság mellett fillérekért, akár mobiltelefonon vagy laptopon is, adatküldés nélkül fut. Mindebből fakadóan a technológia biztosítja a teljes adatvédelmet, hiszen az audiofájlok nem vándorolnak az internet sötét zugaiba.

Valódi áttörés a hangfelismerésben

Nem elhanyagolható tényező, hogy a Mistral két célra fejlesztette a Voxtral Transcribe 2-t: tömeges feldolgozásra, valamint valós idejű alkalmazásokhoz. Az egyik modell előre rögzített hanganyagokat képes nagy sebességgel, óriási pontossággal szöveggé alakítani – mindezt mindössze 1,1 forintért percenként, ami az amerikai vetélytársak árának ötöde. Tizenhárom nyelvet kezel, köztük angolt, mandarin kínait, japánt, arabot, hindit és számos európai nyelvet.

A valós idejű változat akár 200 milliszekundum alatti késleltetéssel képes élő beszédet leírni, így tökéletes például élő feliratozáshoz, hangalapú ügyfélszolgálatokhoz vagy fordításhoz. A fejlesztés alapvetően új szintre emeli a valós idejű hangfeldolgozást: többé nem kell kínos másodpercekig várni, mire az MI reagál.

Az adatvédelem európai specialitása

A Voxtral Transcribe 2 modellek teljes mértékben eszközön futtathatók, 4 milliárd paraméterrel olyan kicsik, hogy egy okosórában is elférnek. Mindebből fakadóan a vállalat ráérzett arra, amit az európai ügyfelek különösen fontosnak tartanak: a bizalmas adattovábbítás kiiktatását. Az egészségügy, a pénzügyi szektor vagy a védelmi ipar számára ezért sorsdöntő, hogy minden hangadat helyben marad. A Mistral nemcsak technológiában, hanem szemléletben is kihívója az amerikai óriásoknak, akik gyakran nem adnak ilyen lehetőséget.

Továbbá a nyílt forráskódú, úgynevezett Apache 2.0 licenc megengedi, hogy fejlesztők letöltsék, módosítsák, majd szabadon továbbhasznosítsák a modellt, mindenféle licencdíj vagy kötöttség nélkül. Ha valaki mégis inkább az API-szolgáltatást választaná, szintén nem kell vagyonokat fizetnie: percenként 2,2 forintért elérhető.

A pontosságon és árakon túl: MI okosan, valódi problémákra

A hangtranszkripció kapcsán a döntő kérdés: mit kezd a modell a zajjal és az ipari szakszavakkal? Nem elhanyagolható tényező, hogy a Voxtral két megoldással is kiemelkedik a mezőnyből. Az első, úgynevezett context biasing lehetővé teszi, hogy előre megadjunk saját szókészletet – például speciális kifejezéseket, céges rövidítéseket vagy orvosi műszavakat –, a rendszer pedig automatikusan ezeket preferálja, méghozzá tanítás vagy újratanítás nélkül. Csak egy szöveges lista kell, és az MI máris felismeri és előnyben részesíti ezeket a szavakat az átiratban.

Második erőssége, hogy a zajos gépgyári környezetekben vagy ügyfélszolgálatokon is képes kristálytiszta szöveget produkálni. Példaként jöhet egy üzem auditja: a gépek zúgásában dolgozó mérnökök beszédét is pontosan naplózza, sőt, azt is rögzíti, ki mit mondott (beszélő-azonosítás). Hasonló a helyzet call centerek esetén: még mielőtt az ügyfél elmondaná panaszát, a háttérrendszer már kiadja a megoldási javaslatot az operátor képernyőjére – lerövidítve a hosszas telefonos várakozást.


Élő fordítás: a következő nagy ugrás

A hangfelismerés csak az első lépés. A Mistral célja a valós idejű, emberközeli beszédfordítás, ahol franciául kérdezve azonnal magyarul vagy angolul hallhatjuk a választ, minimális késleltetéssel. Mindebből fakadóan az empátiát sem öli meg a gép: nem lesznek elcsúszott hang–arc elcsúszások a képernyőn, tényleg élő kommunikáció születik.

Nem elhanyagolható tényező, hogy ezen a pályán már jelenleg is verseng az OpenAI, a Google és a kínai fejlesztők – állításuk szerint a Mistral már most gyorsabb válaszidejű, költséghatékonyabb és rugalmasabb.

Bizalom kontra gigászi MI

A francia startup saját ösvényt tapos: a hatalmas amerikai adatközpontokkal szemben ők az okosabb, helyi számítási és adatvédelmi megközelítésre esküsznek. Nem elhanyagolható tényező, hogy a cégbe 2023 óta 2 milliárd dollár (kb. 680 milliárd forint) érkezett befektetésként, miközben a szerverparkjuk jóval szerényebb az amerikai versenytársakénál.

Továbbá Franciaország kormánya már megállapodott a Mistrallal: a hadsereg csak helyi infrastruktúrán futtathatja azokat, így az érzékeny adatok végképp nem hagyják el az országot. Számukra kulcsfontosságú az európai technológiai önállóság és a bizalom – amit elsősorban a helyben futó, helyi kontrollt garantáló MI-modellek biztosítanak.

Kemény verseny, de hosszú távon a minőség és a bizalom nyerhet

A leiratpiacon a Google, az OpenAI, valamint számos kínai és független fejlesztő is jelen van, de a Mistral pontosabb és jóval olcsóbb megoldást kínál. Mindebből fakadóan nincs más hátra, mint hogy a vállalati ügyfelek kipróbálják az új rendszert – ehhez már ma elérhető az audió játszótér.

Legfontosabb azonban, hogy a verseny nem pusztán arról szól, ki tud nagyobb vagy gyorsabb MI-modellt építeni. A valódi tét az, melyik az a modell, amelyben annyira megbízol, hogy rábízd az ügyfelekkel folytatott beszélgetéseidet, géptermi jegyzőkönyveidet vagy akár a holnap reggeli orvosi konzultációd leiratát. A Mistral szerint a jövő nem a nagy, távoli MI-ké, hanem a kicsi, helyi és megbízható mesterséges intelligenciáé.

2025, adminboss, venturebeat.com alapján

  • Te mennyire bíznál egy ilyen helyben futó MI-ben a személyes adataiddal kapcsolatban?
  • Te mit tennél, ha a cégednél döntenéd el, milyen hangfelismerő rendszert használjanak?


Legfrissebb posztok

MA 20:55

Az MI-őrület felfalja a memóriát, szabadesésben a Qualcomm

💸 A Qualcomm részvényei 7%-ot estek, miután a vállalat aggasztó előrejelzést adott ki a memóriachip-hiány miatt...

MA 20:37

A legnagyobb olasz egyetem térdre rogyott: hackerek blokkolták rendszereit

Olaszország legnagyobb egyeteme, a római La Sapienza, nagyszabású kibertámadás áldozata lett, emiatt teljesen leálltak az oktatási intézmény informatikai rendszerei...

MA 20:19

Az igazi tét: a blokklánc a pénzügyeké, nem a játékoké

A Solana Alapítvány elnöke, Lily Liu szerint ideje, hogy a blokklánc visszataláljon eredeti küldetéséhez: a pénzügyi szektor megújításához...

MA 19:56

Az MI is hős lehet: a Dungeons & Dragons lett a tesztlabor

Képzeld el, hogy a Dungeons & Dragons (D&D) már nemcsak baráti asztaltársaságok kedvenc játéka, hanem igazi tesztpálya a legújabb MI-modellek számára is...

MA 19:38

A hangalapú vezérlés az MI következő nagy dobása

🔈 Az MI világában új korszak kezdődhet: a hangalapú vezérlés átveheti az uralmat a megszokott érintőképernyős és szöveges interakció felett...

MA 19:20

Az igazság a hálóban lapul: mit rejtenek a felhőnaplók?

A digitális világ átalakulásával a cégek tömegesen költöznek a felhőbe, ám ez a lépés új biztonsági vakfoltokat teremthet...

MA 19:01

Az MI-forradalom csúcsán Mark Cuban bulizni küldi a világot

🎉 Mark Cuban, aki gyakran hangoztatja, hogy az MI a jövő, most váratlan fordulattal egy élő eseményeket szervező cégbe, a Burwoodlandbe fektetett...

MA 18:55

Az Nvidia az MI miatt parkolópályára teszi a gamer kártyákat

Az Nvidia jelentősen átrendezi a prioritásait: a legújabb RTX 50-es széria Super frissítése elmarad, és akár 2028-ig sem várható új RTX 60-as sorozat...

MA 18:37

Az új űrruha forradalmasítja a holdraszállást

🚀 Érdemes megvizsgálni, hogy a NASA 1972 óta először készül holdraszállásra, és ehhez a következő generációs űrruha is hamarosan bemutatkozik...

MA 18:19

Vége az AirDrop egyeduralmának: megérkezett az Android válasza

🚀 Végre elérkezett az, amire minden Android-felhasználó régóta vágyott: a Google hivatalosan is bejelentette, hogy a Quick Share és az AirDrop közötti átjárhatóság hamarosan már nemcsak a Pixel 10 modellek kiváltsága lesz...

MA 18:02

Az évszázad vérholdja márciusban érkezik

Március 3-án hajnalban ritka látványban lehet része azoknak, akik az Egyesült Államok nyugati felén és Észak-Amerika több pontján laknak: teljes holdfogyatkozás, vagyis vérhold látható majd az égbolton...

MA 17:38

Az ultravékony felület, amely kétszer is becsapja a fényt

Érdemes megérteni, hogy a legújabb optikai fejlesztésnek köszönhetően egy ultravékony metafelület segítségével már lehetséges a fényt két teljesen eltérő módon téríteni, fókuszálni és irányítani – úgy, hogy mindkét spin-csatorna függetlenül működik, mégis az egész színskálán stabil eredményt ad...

MA 17:19

Az MI-ügynökök felemelhetnek, vagy romba dönthetik az életed

🤖 A ChatGPT ma már kevés újdonságot nyújt ahhoz képest, ami a következő generációs MI-ügynökök fejlesztésében zajlik...

MA 17:02

A leépítési hullám már a 2009-esnél is durvább

📈 Az amerikai munkaerőpiac januárban olyat produkált, amire 15 éve nem volt példa: a vállalatok 108 435 dolgozótól váltak meg, ami 118%-os emelkedés az előző évhez képest és 205%-os növekedés decemberhez képest...

MA 16:37

A rejtélyes földalatti óriások formálják Földünk mágneses terét

Kutatások szerint mélyen a Föld felszíne alatt elképesztően nagy és forró kőzetstruktúrák rejtőznek, amelyek évmilliók óta befolyásolják bolygónk mágneses terének alakulását...

MA 15:55

Az ünnepek alatt bezuhantak a PS5‑eladások

📉 A Sony eddig világszerte 92,2 millió PlayStation 5‑konzolt szállított ki, azonban az ünnepi szezonban 16 százalékkal kevesebb PS5 talált gazdára, mint tavaly...

MA 15:39

Az Amazfit Active Max: tényleg a legjobb olcsó fitneszóra?

💪 Az olcsó, mégis megbízható okosórák között régóta vezető szerepet tölt be az Amazfit...

MA 15:19

A floridai partok felett táncoló felhőutcák: a hideg levegő játéka

Fagyos levegő lepte el az Egyesült Államok keleti részét, Florida partjainál pedig különleges, szemet gyönyörködtető felhősávok rajzolódtak ki a műholdképeken...

MA 15:02

A mesterséges intelligencia memóriaéhsége padlóra küldi az okostelefonos piacot és a Qualcommot

📶 A Qualcomm történelmi, 12,3 milliárd dolláros (kb. 4 375 milliárd forintos) negyedéves bevétellel zárt, főleg a prémium okostelefonoknak és az egyre népszerűbb okosszemüvegeknek, autóipari és IoT-termékeknek köszönhetően...

MA 14:01

A nagy NGINX-átverés: titokban eltérített szerverek

⚠ Egy új, kifinomult támadássorozatban hackerek sikeresen kompromittálnak NGINX-szervereket, hogy a felhasználói forgalmat titokban a saját háttér-infrastruktúrájukra irányítsák át...

MA 13:56

Az FBI is beletört a bicskája: kifogott rajtuk az Apple Lockdown mód

Érdekes felvetés, hogy még az Egyesült Államok Szövetségi Nyomozó Irodája (FBI) is kudarcot vallhat, ha egy újságíró iPhone-ját próbálja feltörni, köszönhetően az Apple által fejlesztett Lockdown módnak...

MA 13:39

A véralvadásgátlók életet mentenek – de súlyos vérzést okozhatnak

💉 Több mint 8 millió amerikai szed alvadásgátlót veszélyes vérrögök megelőzésére. Ennek ellenére ezek a gyógyszerek évente több százezer, komoly vérzéssel végződő esetért felelősek...

MA 13:03

A brutális Android 16 QPR3-frissítés a Pixel mobilokra érkezik

🔥 A március izgalmas újdonságokat hoz a Pixel telefonokra. Az Android 16 QPR3 nagy platformfrissítése hamarosan elérhető lesz, ráadásul ezúttal nem csupán apró biztonsági javításokra, hanem valóban látványos, a napi használatot érintő változásokra számíthatnak a felhasználók...

MA 12:55

Az agy megtéveszti az immunrendszert: a tüdőrák titkos fegyvere

🧠 A tüdőrák évtizedek óta csak a kontrollt vesztett sejtosztódás hibájaként szerepelt az orvosi gondolkodásban, de friss kutatások feltárták: a daganatok aktívan kommunikálnak az aggyal, hogy kijátsszák az immunrendszert...

MA 12:37

Az MI felforgatja az ügyvédi irodák mindennapjait

Felmerül a kérdés, hogy egy MI-alapú startup hogyan képes átformálni egy olyan hagyományos területet, mint az ügyvédi irodák piaca...

MA 12:19

A Substack adatbotránya: kiszivárogtak a felhasználói adatok

Októberben súlyos biztonsági résen keresztül szivárogtak ki a Substack-felhasználóinak e-mail-címei és telefonszámai, ám a vállalat csak február elején észlelte az incidenst...

MA 12:02

Az egészséges Barry Manilow mégis halasztja Las Vegas-i koncertjeit

A 81 éves Barry Manilow sikeres műtét után kiválóan érzi magát, de orvosa tanácsára átszervezi közelgő Las Vegas-i koncertjeit, hogy maradéktalanul a felépülésre és az év eleji turnéjára tudjon koncentrálni...

MA 11:38

A pénztárcabarát, 12 portos 10GbE switch, ami felülmúl minden várakozást

💰 A Sodola SL-SWTGW2C48NS 12 portos 10GbE switch első ránézésre feltűnően olcsó, hiszen mindössze 84 000 forintért (230 USD) kínálják, sőt, egyes akciókkal akár 77 000 forintért is beszerezhető...

MA 11:19

Az Alphabet történelmet írt: a Google bevétele átlépte a 400 milliárd dollárt

🏆 A Google anyavállalata, az Alphabet idén először lépte át a 400 milliárd dolláros (kb...