2026. 02. 05., 20:02

Az MI végre megért: a Voxtral Transcribe 2 forradalma

Az MI végre megért: a Voxtral Transcribe 2 forradalma
A párizsi székhelyű Mistral újabb lendületet adott az MI-harcmezőn: bemutatta a Voxtral Transcribe 2 nevű, teljesen nyílt forráskódú hangfelismerő modelljét. A fejlesztés lényege, hogy a legmagasabb szintű pontosság és gyorsaság mellett fillérekért, akár mobiltelefonon vagy laptopon is, adatküldés nélkül fut. Mindebből fakadóan a technológia biztosítja a teljes adatvédelmet, hiszen az audiofájlok nem vándorolnak az internet sötét zugaiba.

Valódi áttörés a hangfelismerésben

Nem elhanyagolható tényező, hogy a Mistral két célra fejlesztette a Voxtral Transcribe 2-t: tömeges feldolgozásra, valamint valós idejű alkalmazásokhoz. Az egyik modell előre rögzített hanganyagokat képes nagy sebességgel, óriási pontossággal szöveggé alakítani – mindezt mindössze 1,1 forintért percenként, ami az amerikai vetélytársak árának ötöde. Tizenhárom nyelvet kezel, köztük angolt, mandarin kínait, japánt, arabot, hindit és számos európai nyelvet.

A valós idejű változat akár 200 milliszekundum alatti késleltetéssel képes élő beszédet leírni, így tökéletes például élő feliratozáshoz, hangalapú ügyfélszolgálatokhoz vagy fordításhoz. A fejlesztés alapvetően új szintre emeli a valós idejű hangfeldolgozást: többé nem kell kínos másodpercekig várni, mire az MI reagál.

Az adatvédelem európai specialitása

A Voxtral Transcribe 2 modellek teljes mértékben eszközön futtathatók, 4 milliárd paraméterrel olyan kicsik, hogy egy okosórában is elférnek. Mindebből fakadóan a vállalat ráérzett arra, amit az európai ügyfelek különösen fontosnak tartanak: a bizalmas adattovábbítás kiiktatását. Az egészségügy, a pénzügyi szektor vagy a védelmi ipar számára ezért sorsdöntő, hogy minden hangadat helyben marad. A Mistral nemcsak technológiában, hanem szemléletben is kihívója az amerikai óriásoknak, akik gyakran nem adnak ilyen lehetőséget.

Továbbá a nyílt forráskódú, úgynevezett Apache 2.0 licenc megengedi, hogy fejlesztők letöltsék, módosítsák, majd szabadon továbbhasznosítsák a modellt, mindenféle licencdíj vagy kötöttség nélkül. Ha valaki mégis inkább az API-szolgáltatást választaná, szintén nem kell vagyonokat fizetnie: percenként 2,2 forintért elérhető.

A pontosságon és árakon túl: MI okosan, valódi problémákra

A hangtranszkripció kapcsán a döntő kérdés: mit kezd a modell a zajjal és az ipari szakszavakkal? Nem elhanyagolható tényező, hogy a Voxtral két megoldással is kiemelkedik a mezőnyből. Az első, úgynevezett context biasing lehetővé teszi, hogy előre megadjunk saját szókészletet – például speciális kifejezéseket, céges rövidítéseket vagy orvosi műszavakat –, a rendszer pedig automatikusan ezeket preferálja, méghozzá tanítás vagy újratanítás nélkül. Csak egy szöveges lista kell, és az MI máris felismeri és előnyben részesíti ezeket a szavakat az átiratban.

Második erőssége, hogy a zajos gépgyári környezetekben vagy ügyfélszolgálatokon is képes kristálytiszta szöveget produkálni. Példaként jöhet egy üzem auditja: a gépek zúgásában dolgozó mérnökök beszédét is pontosan naplózza, sőt, azt is rögzíti, ki mit mondott (beszélő-azonosítás). Hasonló a helyzet call centerek esetén: még mielőtt az ügyfél elmondaná panaszát, a háttérrendszer már kiadja a megoldási javaslatot az operátor képernyőjére – lerövidítve a hosszas telefonos várakozást.


Élő fordítás: a következő nagy ugrás

A hangfelismerés csak az első lépés. A Mistral célja a valós idejű, emberközeli beszédfordítás, ahol franciául kérdezve azonnal magyarul vagy angolul hallhatjuk a választ, minimális késleltetéssel. Mindebből fakadóan az empátiát sem öli meg a gép: nem lesznek elcsúszott hang–arc elcsúszások a képernyőn, tényleg élő kommunikáció születik.

Nem elhanyagolható tényező, hogy ezen a pályán már jelenleg is verseng az OpenAI, a Google és a kínai fejlesztők – állításuk szerint a Mistral már most gyorsabb válaszidejű, költséghatékonyabb és rugalmasabb.

Bizalom kontra gigászi MI

A francia startup saját ösvényt tapos: a hatalmas amerikai adatközpontokkal szemben ők az okosabb, helyi számítási és adatvédelmi megközelítésre esküsznek. Nem elhanyagolható tényező, hogy a cégbe 2023 óta 2 milliárd dollár (kb. 680 milliárd forint) érkezett befektetésként, miközben a szerverparkjuk jóval szerényebb az amerikai versenytársakénál.

Továbbá Franciaország kormánya már megállapodott a Mistrallal: a hadsereg csak helyi infrastruktúrán futtathatja azokat, így az érzékeny adatok végképp nem hagyják el az országot. Számukra kulcsfontosságú az európai technológiai önállóság és a bizalom – amit elsősorban a helyben futó, helyi kontrollt garantáló MI-modellek biztosítanak.

Kemény verseny, de hosszú távon a minőség és a bizalom nyerhet

A leiratpiacon a Google, az OpenAI, valamint számos kínai és független fejlesztő is jelen van, de a Mistral pontosabb és jóval olcsóbb megoldást kínál. Mindebből fakadóan nincs más hátra, mint hogy a vállalati ügyfelek kipróbálják az új rendszert – ehhez már ma elérhető az audió játszótér.

Legfontosabb azonban, hogy a verseny nem pusztán arról szól, ki tud nagyobb vagy gyorsabb MI-modellt építeni. A valódi tét az, melyik az a modell, amelyben annyira megbízol, hogy rábízd az ügyfelekkel folytatott beszélgetéseidet, géptermi jegyzőkönyveidet vagy akár a holnap reggeli orvosi konzultációd leiratát. A Mistral szerint a jövő nem a nagy, távoli MI-ké, hanem a kicsi, helyi és megbízható mesterséges intelligenciáé.

2025, adminboss, venturebeat.com alapján

  • Te mennyire bíznál egy ilyen helyben futó MI-ben a személyes adataiddal kapcsolatban?
  • Te mit tennél, ha a cégednél döntenéd el, milyen hangfelismerő rendszert használjanak?


Legfrissebb posztok

MA 21:23

A terhesség tudománya: Teszteld, mennyit tudsz a babafejlődésről!

👶 A babák világra jövetele különleges, mégis megdöbbentően összetett folyamat. Az emberi terhesség átlagosan kilenc hónapig tart, három szakaszra – trimeszterre – oszlik, és már a fogantatás előtt, a menstruációs ciklus kezdőnapjától számítják...

MA 21:12

A CME-n már a bitcoin árhullámzására is lehet fogadni

A világ legnagyobb származékos tőzsdéje, a CME Group június 1-jén elindítja a bitcoin volatilitásalapú határidős ügyleteit, amint megkapja a szükséges szabályozói engedélyeket...

MA 21:01

Az egyszerű zenei trükk, amitől 20%-kal tovább bírod az edzést

🎶 Kiderült, hogy egy igazán ütős lejátszási lista többet tehet érted edzés közben, mint hinnéd...

MA 20:56

A svájci jegybank bitcointerve elbukott – nem jött össze elég aláírás

Svájcban ismét elhalt egy merész kezdeményezés, amely arra irányult, hogy a Svájci Nemzeti Bank arany- és külföldi devizatartalékai mellett bitcoint is felhalmozzon...

MA 20:36

A hangtalan, de nem makulátlan ZimaBoard 2 mini NAS tesztje

💻 A ZimaBoard 2 minden porcikájában azt üzeni: itt a saját adataid feletti teljes kontroll, kompromisszumokkal, de jelentős újításokkal...

MA 20:24

Jön az új doméncunami: kié lesz a .trump?

📢 Tizennégy év után ismét lehetőség nyílik arra, hogy vállalatok, szervezetek vagy akár városok saját felső szintű domainnevet (top-level domain, röviden TLD) birtokoljanak az interneten...

MA 20:13

A világbajnokságra hangolva: a legjobb Dolby Atmos hangprojektorok

Ha már készül az ember a 2026-os labdarúgó-világbajnokságra, érdemes nemcsak egy új tévén gondolkozni, hanem a hangminőségre is fókuszálni...

MA 20:03

Az Ugreen DXP4800 Pro: apró változás, komoly következmények?

⚠ Jellemző példa erre, hogy az Ugreen újra rátette a kezét a népszerű, négyfiókos NAS-piacra...

MA 19:56

A feltörekvő piacokon banki appként használják a kriptotőzsdéket

Felmerül a kérdés, miért váltak a kriptovaluták ilyen népszerűvé a feltörekvő országokban...

MA 19:45

A fülesfókák szíve csak partraszállás után pörög fel

A hosszú, mély merülések extrém terhelést jelentenek a tengeri emlősöknek. Ilyenkor a szív és az agy kivételével a többi szerv áttér oxigén nélküli anyagcserére, aminek következtében tejsav halmozódik fel...

MA 19:34

A bistrifluron 95%-ban irtja a termeszeket, emberre veszélytelen

A szárazfatermeszek mesterien rejtőzködnek, fából készült épületek belsejében csendben táplálkoznak és gyarapodnak, míg a tulajdonosok csak a károk észlelése után szembesülnek a jelenlétükkel...

MA 19:25

A OnePlus 15R két hét alatt új szintre tette az üzemidőt

🔋 Két hét használat után a OnePlus 15R egészen új szintre emelte az okostelefonos üzemidő fogalmát...

MA 19:13

A fizikusok olyan kvantumrészecskéket fedeztek fel, amelyek felrúgják a valóság szabályait

Különösen említést érdemel, hogy a fizikusok hosszú ideig két típusba sorolták az elemi részecskéket: boszonokra és fermionokra...

MA 19:01

A jégkori kínaiak megdöbbentően fejlett kőeszközöket készítettek 146 ezer éve

🔨 Érdemes megvizsgálni, hogy a modern ember ősrokonai mennyire képesek voltak alkalmazkodni a szélsőséges körülményekhez: a közép-kínai Lingjing lelőhely feltárásán kivételesen fejlett kőeszközökre bukkantak, amelyek körülbelül 146 ezer évvel ezelőtt készültek...

MA 18:57

A szándékalapú káoszteszt akkor kell, amikor az MI magabiztosan téved

A mai vállalatok egyre bátrabban telepítenek autonóm MI-rendszereket, ám ezek magától értetődő magabiztossággal képesek váratlanul, akár katasztrofálisan hibázni...

MA 18:34

Lehet, hogy már elkéstünk: bajban a Bitcoin a kvantumkor előtt

A kvantumszámítógépek megjelenése alapvetően fenyegeti a világgazdaság digitális alapjait, ráadásul már most csak néhány év maradt a védekezésre...

MA 18:23

Az Abiotic Factor brutál frissítése: okosabb kedvencek, őrült kémia, végre felmosó

🚀 Érdemes megjegyezni, hogy az Abiotikus tényező fejlesztői ismét egy hatalmas frissítést adtak ki, amely tovább bővíti a játék eleve hatalmas világát...

MA 14:46

Az EU a VPN-ekre készül rászállni – közeleg a tiltóhullám?

😱 Az online világ minden eddiginél bonyolultabbá vált, különösen, ha a fiatalok védelméről van szó...

MA 14:35

Az emberiség már a Marsig vezető gyorssáv küszöbén áll?

🚀 Érdekes, hogy a tudományos világ ezen a héten egyszerre foglalkozik különös víruskitöréssel, űrutazási forradalommal és kvantumakkumulátorral...

MA 14:24

A téridő királynője, Max Caulfield, átveszi Gordon Freeman helyét

👑 Mi történik, ha a Half-Life világában nem csendes tudós, hanem egy időutazós tinédzser lesz a főhős?..

MA 13:24

A hét 7 legnagyobb tech-sztorija: Apple-kártérítés, vadonatúj Fitbit

Május második hetének technológiai újdonságai minden eddiginél színesebbek: fizetős kárpótlás az iPhone-tulajdonosoknak, egy új „zseniális” Google Fitbit, legendás játék visszatérése Switch 2 konzolra, valamint a Vine feltámadása is elfért a hét legfontosabb techhírei között...

MA 13:12

Az okosodás ára: miért zsugorodik az agyunk?

Az emberi agy mérete nem feltétlenül áll szoros összefüggésben az intelligenciával...

MA 13:02

A nagy MI-per: Musk kontra Altman 55 ezermilliárdért

Elon Musk és Sam Altman, akik egykor jó viszonyban álltak, ma egymás esküdt ellenségeiként állnak szemben a kaliforniai bíróságon...

MA 12:56

Az első futóórádhoz: ezek a legjobb olcsó órák és karpántok

Az első futóóra kiválasztása nehéz döntés lehet, főleg, ha az ember úgy érzi, felesleges súlyos összegeket költeni egy apró kütyüre...

MA 12:45

Az IKEA tárolási ötleteivel kétszer akkora lesz a dolgozószobád, átalakítás nélkül

📦 Jellemző, hogy ha zsúfolt, rendezetlen az otthoni dolgozószoba, rögtön nehezebb a koncentráció, mint amikor az asztalon és a szobában is rend van...

MA 12:35

A Surfshark figyelmeztet: ázsiai utazási appok csendben gyűjtik az adataid

👑 Aki Ázsiába utazik, hamar szembesül azzal, hogy a helyi közlekedéshez, ételrendeléshez és tájékozódáshoz kötelező letölteni az ottani appokat, hiszen az európai vagy magyar alkalmazások gyakran használhatatlanok...

MA 12:23

Az 899 dolláros, AI-kész RTX 5060-as PC: megéri?

Ilyen eset például, amikor egy új játékra vagy irodai munkára keresel számítógépet, de a RAM-árak az egekben járnak, így nehéz jó ár-érték arányú, előre összeszerelt gépet találni...

MA 11:01

Az Elder Scrolls után a hős modder Pip-Boyra vitte a Falloutot

Modderek körében népszerű ötlet, hogy klasszikus játékokat integrálnak a modern környezetbe, de kevesen viszik ezt olyan extrém szintre, mint RPGKing117, aki sorra varázsolja be a legendás szerepjátékokat a Fallout 4 univerzumába...

MA 10:52

Az új TCL QM8L: lenyűgöző mini-LED tévé remek áron, apró furcsákkal

📺 Az új TCL QM8L lenyűgöző képet kínál, amit a gyártó fejlett Mini‑LED háttérvilágítása és halo‑korlátozó technológiája biztosít...