MA 17:47

A Mistral MI nagy dobása: ingyen adja hanggenerátorát

A Mistral MI nagy dobása: ingyen adja hanggenerátorát
Az MI-alapú hangmegoldások piaca forrong, és mindenki az aranytojást tojó tyúkot keresi a vállalati ügyfelekért vívott harcban. Ebbe a versenybe robbant most be a párizsi Mistral MI, amely saját fejlesztésű szöveg-beszéd (text-to-speech, TTS) modelljének a súlyait is teljesen szabadon elérhetővé tette. Ez a lépés nemcsak technológiailag, hanem üzleti szempontból is egyedülálló: a vállalatok letölthetik a Voxtral TTS-t, saját szervereiken vagy akár okostelefonjaikon futtathatják, és közben nem kell egyetlen hangmintát sem harmadik félhez továbbítaniuk.

Hárommilliárd paraméterrel, szuperhatékonyan

A Voxtral TTS fejlesztésekor a megszokott iparági trenddel szembementek. Míg a legtöbb élvonalbeli TTS-modell óriási erőforrás-igényű, a francia csapat mintegy háromszor kisebb modellt alkotott ugyanazzal a minőséggel. A rendszer három fő részből áll: egy több mint 3 milliárd paraméteres transformer dekóderből, egy 390 milliós akusztikus transformerből, valamint egy 300 milliós, saját fejlesztésű audiokodekből. Maga a modell a Mistral 7B-re – a cég saját nyelvi MI-jére – épül, ami remekül példázza az erőforrás-hatékonyságot és a moduláris gondolkodást.

A gyakorlatban ez azt jelenti, hogy egy átlagos bemenetnél mindössze 90 ezredmásodperc alatt kezd el hangot generálni, a beszéd pedig a valós idejű lejátszásnál hatszor gyorsabb. A legfontosabb: mindössze 3 GB RAM kell a futtatásához, így bármilyen laptopon, de akár régi okostelefonon is valós időben fut, még kvantált üzemmódban is.

Egyedi hang, kilenc nyelven, már öt másodperc hangminta alapján

A Voxtral TTS kilenc nyelven beszél: angolul, franciául, németül, spanyolul, hollandul, portugálul, olaszul, hindiül és arabul. Jelentős, hogy egyedi hang kialakításához elég akár öt másodpercnyi referenciahang. Ennél is meghökkentőbb, hogy a rendszer képes úgynevezett “zero-shot” hang- és nyelvi átképzésre is: például bemutathatod neki néhány másodpercig a saját francia akcentusodat, majd kérhetsz német nyelvű szöveget, a rendszer pedig ugyanazzal a hanggal, akcentussal mondja el németül a kívánt üzenetet. Ez különösen értékes a multinacionális cégeknek – például ügyfélszolgálatban, értékesítésben vagy a belső kommunikációban.

Voxtral kontra ElevenLabs: az MI-hanggal új szintre lép a céges beszéd

A Mistral nyíltan célba vette a piacvezető ElevenLabs-ot, amely sokak szerint az MI-hangminőség etalonját képviseli. Saját összehasonlító vizsgálataik szerint a Voxtral TTS-t az esetek majdnem 70%-ában jobbnak ítélték a többnyelvű hangszabás és személyre szabhatóság terén, mint az ElevenLabs v2.5 Flash modelljét, és még az ElevenLabs csúcskategóriás v3-as modellel is felveszi a versenyt az érzelemkifejezés terén, jóval alacsonyabb válaszidő mellett.

Az ElevenLabs a minőségét fizetős, zárt platformmal garantálja, amely céges ügyfeleknél már havi 180 000 forint fölé is kúszhat. A Mistral ezzel szemben nem kényszerít választásra: a szabadon elérhető súlyoknak köszönhetően bárki saját infrastruktúrájára illesztheti, egyedi igényei szerint.


A hangadat vállalati szinten érzékeny – mindenki birtokolni akarja

Emellett a Mistral üzleti filozófiája egy ponton válik igazán hangsúlyossá: nemcsak a teljes MI-rendszerüket engedik a cégeknek birtokolni, hanem a legérzékenyebb – hangalapú – adatokat is saját kézben tarthatják. Jelentős, hogy a hangadatok nem csupán szavakat, hanem érzelmeket és személyes információkat is tartalmaznak, így pénzügyi szolgáltatóknál, állami vagy egészségügyi szektorban már jogi és megfelelőségi okokból sem engedhető meg a harmadik félhez történő továbbítás.

A Mistral ezt az adatfüggetlenséget és szuverenitást helyezi előtérbe, főként Európában, ahol az amerikai felhőszolgáltatóktól való függőség 2026-ra egyre égetőbb kérdéssé vált. A cég célja, hogy valóban európai gyökerű, teljesen önálló alternatívát kínáljon.

Most már teljes a vállalati MI-csomag

A Voxtral TTS egy olyan folyamat végső darabja, amelyet a Mistral tudatosan épített fel: a Voxtral Transcribe végzi a diktálás átírását, a vállalat nyelvi modelljei (Mistral Small, Mistral Large) biztosítják a szövegértést, a Forge lehetővé teszi a személyre szabást, az MI Studio az üzemeltetést, míg a Mistral Compute GPU-parkot nyújt. Így mostantól a vállalatok egyetlen kézben tarthatják az egész beszédalapú MI-folyamataikat – az ügyfélszolgálattól a valós idejű fordításon át a játéktervezésig.

Emellett a Voxtral TTS különlegessége, hogy minimális várakozási idővel – 90 ezredmásodperces válaszidővel – reagál, ami a beszédfelismerés és beszédgenerálás során már létfontosságú: egy beszélgetős MI-nek már nem bocsáthatunk meg percekig tartó “gondolkodást”.

Az MI-jövőt a nyílt súlyokkal igyekeznek uralni

Jelentős, hogy a Mistral filozófiája illeszkedik ahhoz az iparági trendhez, amit már az Nvidia is zászlajára tűzött: a jövő az, ahol a nyílt és a zárt modellek egymás mellett léteznek. A mostani lépéssel nem csupán a fejlesztők, hanem a vállalati ügyfelek is elköteleződés nélkül próbálgathatják, beépíthetik saját rendszereikbe, a Mistral API-t vagy az MI Studio-t használva, miközben minden vállalati adatot és testreszabást saját környezetükben birtokolhatnak.

A cég hosszú távú célja világos: le akarja cserélni a szoftverbérlettel működő megoldásokat saját, MI-alapú, helyben üzemeltethető, gyorsan testreszabható termékeire, amelyeket a vállalatok maguk uralhatnak.

Következő lépések: több nyelv, még emberibb beszéd

A Mistral két fő irányba fejleszt tovább: egyrészt nyelvi és kulturális sokszínűséget akar biztosítani – például a párizsi francia és a montreali francia árnyalt különbségeit is érzékelve. Másrészt egy teljesen végponttól végpontig működő audio-MI-t céloznak, amely már nemcsak szövegből beszédet generál, hanem képes lesz a beszélő érzelmeit, hangsúlyait, szándékait is pontosan felismerni és visszaadni.

Ez az MI-kutatás igazi vadnyugata: egy olyan mesterséges intelligencia, amely okostelefonon elfut, természetes emberi beszéddel kommunikál, és pontosan érti, miről is van szó. A Voxtral TTS ennek az útnak az első nagy mérföldköve – és most minden vállalkozás eldöntheti: ha lehetséges, miért ne birtokolnád az egész MI-hangrendszeredet, ha olcsóbban, biztonságosabban is megteheted?

2026, adminboss, venturebeat.com alapján

  • Te elbíznád-e magadban annyira, hogy teljesen saját kézbe vedd a céged hangadatait?
  • Te kísérleteznél egy új, nyílt MI-hangrendszerrel, vagy inkább maradnál a jól beváltnál?


Legfrissebb posztok

MA 21:15

Az Intel Core Ultra 270K és 250K Plus jók, csak minden drága

Különösen igaz ez akkor, ha új gép építésén vagy fejlesztésén gondolkodsz: ma már nem elég egy jó ár-értékű processzort találni, hiszen a memória-, SSD- és videokártya-árak miatt minden PC-alkatrész nehezen elérhető „jó vétel”...

MA 20:25

Az új Wi‑Fi 7 routerekbe tényleg megéri beruházni?

Például nemrég még felesleges pénzkidobásnak tartottam a Wi‑Fi 7 routerek beszerzését: túl drágák voltak, ráadásul csupán marketingfogásnak tűntek...

MA 20:12

Az északi-sarki jégolvadás újabb ijesztő csúcsot döntött

🔥 Az északi-sarki tengeri jégtakaró idén ismét történelmi mélypontra zsugorodott, miután a téli növekedési időszak végén mindössze 14,29 millió km²-re terjedt ki...

MA 20:01

A Pentagon új titkos fegyvere: az Xbox-kontroller

🕹 Az amerikai hadsereg legújabb csúcstechnológiás lézerfegyverei mögött egy egészen meglepő titok rejtőzik: nem más, mint a jól ismert Xbox-kontroller...

MA 19:56

Az antiprotonok megindulnak: történelmi áttörés a CERN-ben

A CERN kutatói történelmi bravúrt hajtottak végre: először sikerült teherautón szállítaniuk egy antiprotonfelhőt...

MA 19:44

A kínai AI-bizniszben ragadnak a Manus vezetői, miközben a Meta kaszál

Van itt egy kis kavar a kínai AI-szcénában! A Manus nevű, mesterséges intelligenciával foglalkozó startup Kínában indult, de tavaly áthelyezte bázisát és fő csapatát Szingapúrba...

MA 19:34

Az új Meta-csomag tényleg megkönnyíti a vállalkozók életét?

💼 Érdekes fejlemény, hogy a Meta nagyszabású újítással igyekszik fellendíteni a kisvállalkozói szférát, miközben a mesterséges intelligencia térnyerése meghatározza az üzleti világ jövőját...

MA 19:25

Az Intercom új MI-je letarolja az ügyfélszolgálati piacot

Felmerül a kérdés, hogy egy 15 éves, alapvetően ügyfélszolgálati platform hogyan tudja megelőzni a legnagyobb MI-óriásokat – mégis pontosan ezt állítja most az Intercom...

MA 17:57

A Hold rejtett árnyéka pajzsként védhet az űrsugárzás ellen

A Hold felszínén eddig ismeretlen, kozmikus sugárzástól védett „üregre” bukkantak a kínai Chang’e–4 szonda adatai alapján...

MA 17:34

Az iPhone-okra vadászó Coruna-kémszoftver még veszélyesebb lett

Az iOS-t futtató eszközökre leselkedő veszélyek új szintre léptek: a Coruna nevű exploitkeretrendszer a korábbi, hírhedtté vált Operation Triangulation továbbfejlesztett változata, amely már az Apple legújabb A17 és M3 processzorait, valamint az iOS 17...

MA 17:24

Az online csalók új csapdái: így védekezz most

Az online csalások ma már profi váltófutásra emlékeztetnek: különböző eszközök és szereplők alkotnak egy szövevényes láncot, amelyben mindenki a saját szakaszára specializálódott...

MA 17:13

A biztonság rémálma: közeleg a kvantumszámítógépek kora?

A digitális világban egyre többen tartanak attól, hogy az MI önállósodása alapjaiban forgathatja fel a társadalmat...

MA 17:01

A TikTokon tarol az új csaláshullám: üzleti fiókok a célpontok

💸 TikTok Business-fiókok estek visszaélések célpontjává egy új, kifinomult adathalász-támadásban. Az elkövetők olyan hamis weboldalakra csábítják az áldozatokat, amelyeket kifejezetten azért hoztak létre, hogy a biztonsági botok ne tudják felismerni őket...

MA 16:57

Az űrtávcsövet egy robot mentheti meg a pusztulástól

A NASA Neil Gehrels Swift Obszervatórium lassan végzetes pályát fut be...

MA 16:45

A deepfake röntgenek még az orvosokat is megtévesztik

Érdemes megvizsgálni, hogy milyen veszélyeket rejtenek a mesterségesen generált, úgynevezett deepfake-röntgenfelvételek, amelyek megtévesztően valósághűek – olyannyira, hogy még képzett radiológusok számára is szinte lehetetlen felismerni a hamisítványokat...

MA 16:34

Az agy titkos védőszelepe: áttörés a Parkinson-kutatásban

Az emberi sejtek védekezőképessége mindig is lenyűgözte a kutatókat, most pedig egy újabb titok lepleződött le, amely segíthet a Parkinson-kór leküzdésében...

MA 14:04

Az Avata 360: drónforradalom, vagy csak pörgünk körbe-körbe?

🚀 A DJI legfrissebb dobása, az Avata 360 drón nemcsak a panorámadrónozás világát forgatja fel, hanem az otthoni filmezés, vlogolás és kalandvideók piacát is...

MA 13:57

Az Intel Battlemage végre megérkezett, de a játékosok csalódhatnak

Az Intel hosszú várakozás után bemutatta új grafikus kártyáját, az Arc Pro B70-et, amely a régóta pletykált Big Battlemage GPU-ra épül, ám ezúttal nem a játékosokat, hanem az MI-alkalmazásokat célozza meg...

MA 13:45

Az Uber robotaxijai megrohanják Horvátországot – kínai technikával

Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...

MA 13:23

Az Exynos 2800: végre tanult a hibáiból a Samsung?

Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...

MA 12:01

Az új PolyShell-támadás a Magento-áruházak felét fenyegeti

Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...

MA 11:56

Az MI megeszi az adatközpontok akkumulátorait – új korszakot nyit a Panasonic

A nagy memóriagyártók már minden idei moduljukat eladták, így hiányok és áremelkedések alakultak ki a piacon...

MA 11:45

Az új Razer Blade 16: karcsú, brutális és piszkosul drága

A Razer legújabb, 16 hüvelykes laptopja látványos hardverfrissítéssel érkezik: az Intel vadonatúj Core Ultra lapkáival és ultragyors, 9600 MHz-es LPDDR5X memóriával kapható, legalább 32 GB-tal szerelve...

MA 11:34

Az új Galaxy A57 végre könnyebben javítható

🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...

MA 11:12

A techóriások pórul jártak: kétmilliárdos bírság a közösségi oldalaknak

💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...

MA 11:02

Az elektronikus hadviselés felforgatta a Perzsa-öböl rendjét

A Perzsa-öböl térségében az utóbbi hetekben a helymeghatározó rendszerek zavarása szinte mindennapossá vált...

MA 10:58

Az Intel új Arc Pro kártyái forradalmat hoznak a munkaállomások piacán

Az Intel most masszív lendületet ad az Arc B-sorozatú videokártyáinak, két új modellel: megérkezett az Arc Pro B70 és az Arc Pro B65...

MA 10:51

Az amerikai Hold-állomásról indul az atommeghajtású Mars-küldetés

🚀 Érdekes felvetés, hogy mi lesz a sorsa annak a több milliárd dollárért fejlesztett Hold körüli űrállomásnak, amelynek építését az Egyesült Államok most jegeli, hogy az erőforrásokat inkább más, nagyobb szabású célokra összpontosítsa...

MA 10:43

A Ring új videócsengői végre vezeték nélküliek és 4K-sak

A Ring új szintre emelte kültéri biztonsági eszközeit: elérhetővé váltak a vezeték nélküli, akkumulátoros verziók a 4K-s és 2K-s felbontású videócsengőkből is, már 29 000 Ft-tól...