2026. 02. 05., 20:02

Az MI végre megért: a Voxtral Transcribe 2 forradalma

Az MI végre megért: a Voxtral Transcribe 2 forradalma
A párizsi székhelyű Mistral újabb lendületet adott az MI-harcmezőn: bemutatta a Voxtral Transcribe 2 nevű, teljesen nyílt forráskódú hangfelismerő modelljét. A fejlesztés lényege, hogy a legmagasabb szintű pontosság és gyorsaság mellett fillérekért, akár mobiltelefonon vagy laptopon is, adatküldés nélkül fut. Mindebből fakadóan a technológia biztosítja a teljes adatvédelmet, hiszen az audiofájlok nem vándorolnak az internet sötét zugaiba.

Valódi áttörés a hangfelismerésben

Nem elhanyagolható tényező, hogy a Mistral két célra fejlesztette a Voxtral Transcribe 2-t: tömeges feldolgozásra, valamint valós idejű alkalmazásokhoz. Az egyik modell előre rögzített hanganyagokat képes nagy sebességgel, óriási pontossággal szöveggé alakítani – mindezt mindössze 1,1 forintért percenként, ami az amerikai vetélytársak árának ötöde. Tizenhárom nyelvet kezel, köztük angolt, mandarin kínait, japánt, arabot, hindit és számos európai nyelvet.

A valós idejű változat akár 200 milliszekundum alatti késleltetéssel képes élő beszédet leírni, így tökéletes például élő feliratozáshoz, hangalapú ügyfélszolgálatokhoz vagy fordításhoz. A fejlesztés alapvetően új szintre emeli a valós idejű hangfeldolgozást: többé nem kell kínos másodpercekig várni, mire az MI reagál.

Az adatvédelem európai specialitása

A Voxtral Transcribe 2 modellek teljes mértékben eszközön futtathatók, 4 milliárd paraméterrel olyan kicsik, hogy egy okosórában is elférnek. Mindebből fakadóan a vállalat ráérzett arra, amit az európai ügyfelek különösen fontosnak tartanak: a bizalmas adattovábbítás kiiktatását. Az egészségügy, a pénzügyi szektor vagy a védelmi ipar számára ezért sorsdöntő, hogy minden hangadat helyben marad. A Mistral nemcsak technológiában, hanem szemléletben is kihívója az amerikai óriásoknak, akik gyakran nem adnak ilyen lehetőséget.

Továbbá a nyílt forráskódú, úgynevezett Apache 2.0 licenc megengedi, hogy fejlesztők letöltsék, módosítsák, majd szabadon továbbhasznosítsák a modellt, mindenféle licencdíj vagy kötöttség nélkül. Ha valaki mégis inkább az API-szolgáltatást választaná, szintén nem kell vagyonokat fizetnie: percenként 2,2 forintért elérhető.

A pontosságon és árakon túl: MI okosan, valódi problémákra

A hangtranszkripció kapcsán a döntő kérdés: mit kezd a modell a zajjal és az ipari szakszavakkal? Nem elhanyagolható tényező, hogy a Voxtral két megoldással is kiemelkedik a mezőnyből. Az első, úgynevezett context biasing lehetővé teszi, hogy előre megadjunk saját szókészletet – például speciális kifejezéseket, céges rövidítéseket vagy orvosi műszavakat –, a rendszer pedig automatikusan ezeket preferálja, méghozzá tanítás vagy újratanítás nélkül. Csak egy szöveges lista kell, és az MI máris felismeri és előnyben részesíti ezeket a szavakat az átiratban.

Második erőssége, hogy a zajos gépgyári környezetekben vagy ügyfélszolgálatokon is képes kristálytiszta szöveget produkálni. Példaként jöhet egy üzem auditja: a gépek zúgásában dolgozó mérnökök beszédét is pontosan naplózza, sőt, azt is rögzíti, ki mit mondott (beszélő-azonosítás). Hasonló a helyzet call centerek esetén: még mielőtt az ügyfél elmondaná panaszát, a háttérrendszer már kiadja a megoldási javaslatot az operátor képernyőjére – lerövidítve a hosszas telefonos várakozást.


Élő fordítás: a következő nagy ugrás

A hangfelismerés csak az első lépés. A Mistral célja a valós idejű, emberközeli beszédfordítás, ahol franciául kérdezve azonnal magyarul vagy angolul hallhatjuk a választ, minimális késleltetéssel. Mindebből fakadóan az empátiát sem öli meg a gép: nem lesznek elcsúszott hang–arc elcsúszások a képernyőn, tényleg élő kommunikáció születik.

Nem elhanyagolható tényező, hogy ezen a pályán már jelenleg is verseng az OpenAI, a Google és a kínai fejlesztők – állításuk szerint a Mistral már most gyorsabb válaszidejű, költséghatékonyabb és rugalmasabb.

Bizalom kontra gigászi MI

A francia startup saját ösvényt tapos: a hatalmas amerikai adatközpontokkal szemben ők az okosabb, helyi számítási és adatvédelmi megközelítésre esküsznek. Nem elhanyagolható tényező, hogy a cégbe 2023 óta 2 milliárd dollár (kb. 680 milliárd forint) érkezett befektetésként, miközben a szerverparkjuk jóval szerényebb az amerikai versenytársakénál.

Továbbá Franciaország kormánya már megállapodott a Mistrallal: a hadsereg csak helyi infrastruktúrán futtathatja azokat, így az érzékeny adatok végképp nem hagyják el az országot. Számukra kulcsfontosságú az európai technológiai önállóság és a bizalom – amit elsősorban a helyben futó, helyi kontrollt garantáló MI-modellek biztosítanak.

Kemény verseny, de hosszú távon a minőség és a bizalom nyerhet

A leiratpiacon a Google, az OpenAI, valamint számos kínai és független fejlesztő is jelen van, de a Mistral pontosabb és jóval olcsóbb megoldást kínál. Mindebből fakadóan nincs más hátra, mint hogy a vállalati ügyfelek kipróbálják az új rendszert – ehhez már ma elérhető az audió játszótér.

Legfontosabb azonban, hogy a verseny nem pusztán arról szól, ki tud nagyobb vagy gyorsabb MI-modellt építeni. A valódi tét az, melyik az a modell, amelyben annyira megbízol, hogy rábízd az ügyfelekkel folytatott beszélgetéseidet, géptermi jegyzőkönyveidet vagy akár a holnap reggeli orvosi konzultációd leiratát. A Mistral szerint a jövő nem a nagy, távoli MI-ké, hanem a kicsi, helyi és megbízható mesterséges intelligenciáé.

2025, adminboss, venturebeat.com alapján

  • Te mennyire bíznál egy ilyen helyben futó MI-ben a személyes adataiddal kapcsolatban?
  • Te mit tennél, ha a cégednél döntenéd el, milyen hangfelismerő rendszert használjanak?


Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...