2026. 02. 05., 20:02

Az MI végre megért: a Voxtral Transcribe 2 forradalma

Az MI végre megért: a Voxtral Transcribe 2 forradalma
A párizsi székhelyű Mistral újabb lendületet adott az MI-harcmezőn: bemutatta a Voxtral Transcribe 2 nevű, teljesen nyílt forráskódú hangfelismerő modelljét. A fejlesztés lényege, hogy a legmagasabb szintű pontosság és gyorsaság mellett fillérekért, akár mobiltelefonon vagy laptopon is, adatküldés nélkül fut. Mindebből fakadóan a technológia biztosítja a teljes adatvédelmet, hiszen az audiofájlok nem vándorolnak az internet sötét zugaiba.

Valódi áttörés a hangfelismerésben

Nem elhanyagolható tényező, hogy a Mistral két célra fejlesztette a Voxtral Transcribe 2-t: tömeges feldolgozásra, valamint valós idejű alkalmazásokhoz. Az egyik modell előre rögzített hanganyagokat képes nagy sebességgel, óriási pontossággal szöveggé alakítani – mindezt mindössze 1,1 forintért percenként, ami az amerikai vetélytársak árának ötöde. Tizenhárom nyelvet kezel, köztük angolt, mandarin kínait, japánt, arabot, hindit és számos európai nyelvet.

A valós idejű változat akár 200 milliszekundum alatti késleltetéssel képes élő beszédet leírni, így tökéletes például élő feliratozáshoz, hangalapú ügyfélszolgálatokhoz vagy fordításhoz. A fejlesztés alapvetően új szintre emeli a valós idejű hangfeldolgozást: többé nem kell kínos másodpercekig várni, mire az MI reagál.

Az adatvédelem európai specialitása

A Voxtral Transcribe 2 modellek teljes mértékben eszközön futtathatók, 4 milliárd paraméterrel olyan kicsik, hogy egy okosórában is elférnek. Mindebből fakadóan a vállalat ráérzett arra, amit az európai ügyfelek különösen fontosnak tartanak: a bizalmas adattovábbítás kiiktatását. Az egészségügy, a pénzügyi szektor vagy a védelmi ipar számára ezért sorsdöntő, hogy minden hangadat helyben marad. A Mistral nemcsak technológiában, hanem szemléletben is kihívója az amerikai óriásoknak, akik gyakran nem adnak ilyen lehetőséget.

Továbbá a nyílt forráskódú, úgynevezett Apache 2.0 licenc megengedi, hogy fejlesztők letöltsék, módosítsák, majd szabadon továbbhasznosítsák a modellt, mindenféle licencdíj vagy kötöttség nélkül. Ha valaki mégis inkább az API-szolgáltatást választaná, szintén nem kell vagyonokat fizetnie: percenként 2,2 forintért elérhető.

A pontosságon és árakon túl: MI okosan, valódi problémákra

A hangtranszkripció kapcsán a döntő kérdés: mit kezd a modell a zajjal és az ipari szakszavakkal? Nem elhanyagolható tényező, hogy a Voxtral két megoldással is kiemelkedik a mezőnyből. Az első, úgynevezett context biasing lehetővé teszi, hogy előre megadjunk saját szókészletet – például speciális kifejezéseket, céges rövidítéseket vagy orvosi műszavakat –, a rendszer pedig automatikusan ezeket preferálja, méghozzá tanítás vagy újratanítás nélkül. Csak egy szöveges lista kell, és az MI máris felismeri és előnyben részesíti ezeket a szavakat az átiratban.

Második erőssége, hogy a zajos gépgyári környezetekben vagy ügyfélszolgálatokon is képes kristálytiszta szöveget produkálni. Példaként jöhet egy üzem auditja: a gépek zúgásában dolgozó mérnökök beszédét is pontosan naplózza, sőt, azt is rögzíti, ki mit mondott (beszélő-azonosítás). Hasonló a helyzet call centerek esetén: még mielőtt az ügyfél elmondaná panaszát, a háttérrendszer már kiadja a megoldási javaslatot az operátor képernyőjére – lerövidítve a hosszas telefonos várakozást.


Élő fordítás: a következő nagy ugrás

A hangfelismerés csak az első lépés. A Mistral célja a valós idejű, emberközeli beszédfordítás, ahol franciául kérdezve azonnal magyarul vagy angolul hallhatjuk a választ, minimális késleltetéssel. Mindebből fakadóan az empátiát sem öli meg a gép: nem lesznek elcsúszott hang–arc elcsúszások a képernyőn, tényleg élő kommunikáció születik.

Nem elhanyagolható tényező, hogy ezen a pályán már jelenleg is verseng az OpenAI, a Google és a kínai fejlesztők – állításuk szerint a Mistral már most gyorsabb válaszidejű, költséghatékonyabb és rugalmasabb.

Bizalom kontra gigászi MI

A francia startup saját ösvényt tapos: a hatalmas amerikai adatközpontokkal szemben ők az okosabb, helyi számítási és adatvédelmi megközelítésre esküsznek. Nem elhanyagolható tényező, hogy a cégbe 2023 óta 2 milliárd dollár (kb. 680 milliárd forint) érkezett befektetésként, miközben a szerverparkjuk jóval szerényebb az amerikai versenytársakénál.

Továbbá Franciaország kormánya már megállapodott a Mistrallal: a hadsereg csak helyi infrastruktúrán futtathatja azokat, így az érzékeny adatok végképp nem hagyják el az országot. Számukra kulcsfontosságú az európai technológiai önállóság és a bizalom – amit elsősorban a helyben futó, helyi kontrollt garantáló MI-modellek biztosítanak.

Kemény verseny, de hosszú távon a minőség és a bizalom nyerhet

A leiratpiacon a Google, az OpenAI, valamint számos kínai és független fejlesztő is jelen van, de a Mistral pontosabb és jóval olcsóbb megoldást kínál. Mindebből fakadóan nincs más hátra, mint hogy a vállalati ügyfelek kipróbálják az új rendszert – ehhez már ma elérhető az audió játszótér.

Legfontosabb azonban, hogy a verseny nem pusztán arról szól, ki tud nagyobb vagy gyorsabb MI-modellt építeni. A valódi tét az, melyik az a modell, amelyben annyira megbízol, hogy rábízd az ügyfelekkel folytatott beszélgetéseidet, géptermi jegyzőkönyveidet vagy akár a holnap reggeli orvosi konzultációd leiratát. A Mistral szerint a jövő nem a nagy, távoli MI-ké, hanem a kicsi, helyi és megbízható mesterséges intelligenciáé.

2025, adminboss, venturebeat.com alapján

  • Te mennyire bíznál egy ilyen helyben futó MI-ben a személyes adataiddal kapcsolatban?
  • Te mit tennél, ha a cégednél döntenéd el, milyen hangfelismerő rendszert használjanak?


Legfrissebb posztok

MA 11:57

A sarkvidéki hideg drámai betörése Floridába

❄ Egy szokatlanul intenzív hidegfront felkavarta a tengerfenék üledékét Florida partjainál, amelynek eredményeként meseszép, világoskék üledékfelhő fodrozódott végig a Mexikói-öböl délnyugati térségében...

MA 11:35

Az aszály nyomán ránk szabadulhatnak a szuperbaktériumok

🦠 A Föld gyorsuló felmelegedése és az egyre gyakoribb szárazság már most kimutathatóan kedvez az antibiotikumoknak ellenálló baktériumok terjedésének...

MA 11:23

Baltimore perre megy Elon Musk cégével az AI-meztelenképek miatt

Na most kapaszkodj, mert Baltimore városa most tényleg megtolta: beperelte Elon Musk AI cégét, az xAI-t, mert a Grok nevű chatbotja durván átlépett egy határt a deepfake meztelen képekkel...

MA 11:12

Az európai bankok is a Bitpanda blokkláncához csatlakoznak

💸 Az osztrák Bitpanda új blokkláncot indít, amely lehetővé teszi, hogy bankok és fintechcégek digitális, tokenizált eszközöket bocsássanak ki és számoljanak el a szigorú uniós szabályozások, például a MiCA és a MiFID II előírásai szerint...

MA 11:01

A Huawei csúcsmobilja szó szerint a rajongóknak készült – ventilátorral!

A HUAWEI Mate 80 Pro Max Wind Edition váratlan fordulattal érkezett: a korábbi passzív hűtés helyett beépített turbóventilátort kapott...

MA 10:57

Hamarosan személyre szabható hangposta érkezik a Google Pixel készülékekre

A Google Take a Message funkciója egyre nagyobb hangsúlyt kap a Pixel készülékeken, alternatívát kínálva a hagyományos hangposták helyett...

MA 10:50

A külföldi routereket végleg száműzik az amerikai piacról

Az Egyesült Államok rádiófrekvenciás szabályozó hatósága, az FCC mostantól megtiltja az összes olyan új otthoni router forgalmazását, amelyet külföldön gyártanak...

MA 10:31

Az elfelejtett gyilkos visszatér: terjed a TBC Amerikában

Jó példa erre, ami a San Franciscó-i Archbishop Riordan High Schoolban történt tavaly ősszel...

MA 10:22

Az Android Automotive túlmutat a műszerfalon: jön a Google-szörnyagy az autókba

Oké, eddig csak a szórakoztató rendszeredet irányíthatta a Google az autódban, de most emelik a tétet...

MA 10:17

Az iOS 26.4 nagy dobásai: minden, ami megváltozott az iPhone-okon

Az Apple kiadta az iOS 26.4-et, amely számos hasznos és szórakoztató újdonsággal érkezik, még ha nem is hozza el a várt forradalmat...

MA 10:01

Az élő és elhunyt zenészeket védi a Spotify újítása

Blaze Foley neve alatt jelent meg egy vadonatúj, Together című dal a Spotify-on, holott az amerikai countryénekes már több mint húsz éve nincs köztünk...

MA 09:57

A BlackBerry feltámad: hódít a billentyűzetes Titan 2 Elite

A modern okostelefonok világában az üveg előlapos, érintőképernyős készülékek uralkodnak, de még mindig sokan nosztalgiáznak a fizikai billentyűzetek után...

MA 09:50

A NASA nem engedi: amerikai bázis készül a Holdon

A NASA új, 11 100 milliárd forintos (kb. 30 milliárd dolláros) programot jelentett be, amelynek célja, hogy 2036-ig állandó, amerikai holdbázist hozzon létre a Hold déli pólusán...

MA 09:37

A HP új laptopjaiba költözik az MI: forradalom vagy rémálom?

A HP most bemutatott üzleti laptopjai egészen új szintre viszik a munkavégzést – vagy épp adnak okot némi aggodalomra...

MA 09:29

A mesterséges intelligencia LEGO-robotokkal pörgeti fel az evolúciót

🤖 Érdemes megvizsgálni, miként fejlődnek azok a moduláris, mesterségesintelligencia-vezérelt robotok, amelyek mindenféle terepen képesek önállóan mozogni, sőt, súlyos sérülések után is folytatni tudják útjukat...

MA 09:22

Az USA holdbázisra vált: leállították a Gateway űrállomás építését

Erre utal többek között az is, hogy az amerikai űrkutatási hivatal, a NASA leállította a Gateway holdkörüli űrállomás fejlesztését, és ehelyett egyenesen megkezdi az első holdi bázis építését...

MA 08:57

Az Android Auto összeomlott, a Google már küldi a javítást

Mostanában valami nagyon nincs rendben az Android Autóval: egyre több felhasználó tapasztal elképesztő kapcsolatproblémákat, legyen szó akár vezetékes, akár vezeték nélküli használatról...

MA 08:50

A kormányzati bénázás miatt összeomlott a repülőtéri biztonság

A kormányzati leállás miatt közel 61 000 repülőtéri biztonsági (TSA-) alkalmazott maradt fizetés nélkül, miközben továbbra is dolgozniuk kell, hiszen alapvető fontosságú feladatot látnak el...

MA 08:44

Az egyre súlyosabb vízhiány a Colorado folyót is térdre kényszeríti

💧 Az Egyesült Államok hét tagállama a Colorado folyó vízhasználata miatt hosszú ideje képtelen megegyezésre jutni, miközben az egyre súlyosbodó aszály és a klímaváltozás tovább apasztja a már most is szűkös vízkészleteket...

MA 08:38

Az igazi túlélőharc: a Marathon mindent visz

🏁 A Bungie visszatérő alkotása, a Marathon egészen friss színt visz az extrakciós lövöldék világába...

MA 08:29

A 137 milliárdos rekordbírság: megbüntették a Metát gyerekbiztonság miatt

Egy új-mexikói esküdtszék kimondta, hogy a Meta komolyan veszélyeztette a gyerekeket, ráadásul még kamuzott is arról, mennyire biztonságosak a platformjai...

MA 08:22

Az Outlook bakija bénította le a Gmailt – mi történt?

Érdekes fejlemény, hogy a Microsoft klasszikus Outlookjában február végétől sokaknak teljesen leállt a Gmail- és Yahoo-postafiókok szinkronizálása, a háttérben pedig nem elhanyagolható technikai probléma állt...

MA 08:15

Az új Gyűrűk Ura: Colbert és Jackson közös nagy dobása

Hamarosan új A Gyűrűk Ura-film érkezik, amely Stephen Colbert és Peter Jackson közreműködésével kapott lendületet...

MA 08:01

Az ADA előtt újra nagy ugrás? Két fordulópont jelző villog egyszerre

📈 Az elmúlt évben Cardanót vásárlók most átlagosan 43%-os veszteségben ülnek, ami a kriptovaluta elemzői szerint az „opportunity zone” mélyén helyezkedik el...

MA 07:22

Az Apple végre feltámasztja Sirit? Jön a nagy AI-robbanás

Oké, Sirit ismerjük: évek óta ugyanaz a langyos segéd, aki többet nem tud, mint viccet mesélni vagy zenét kapcsolni...

MA 07:15

Az új Vizio tévékhez már kötelező a Walmart-fiók

📺 Felmerül a kérdés, mennyire okos döntés új Vizio tévét venni, ha valaki el akarja kerülni a nagyszabású adatgyűjtési és reklámgépezetbe való belépést...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/25

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Super Investor (iPhone/iPad)Az SEC jelentések részletesen bemutatják egy vállalat pénzügyi és működési állapotát, így biztosítva az átláthatóságot és az elszámoltathatóságot...

MA 07:08

A Windchill súlyos sebezhetősége kaput nyithat az ipari kémkedésnek

🔐 A Windchill és a FlexPLM rendszerekben most feltárt sérülékenység teljes iparágakat fenyeget...

MA 07:01

Véget ér a légkondi korszaka az adatközpontokban?

A mesterséges intelligencia robbanásszerű fejlődése újabb kihívás elé állítja az adatközpontokat: a hagyományos váltakozó áramú (AC) energiaellátás helyét egyre inkább az egyenáramú (DC) rendszerek veszik át...