MA 07:36

Az új ASR-modell kiváltja a méregdrága feliratozó API-kat

Az új ASR-modell kiváltja a méregdrága feliratozó API-kat
A cégek, amelyek hangvezérelt munkafolyamatokat akarnak létrehozni, eddig két rossz közül választhattak: vagy megbízható, de zárt és adatvédelmi szempontból kockázatos API-kat, vagy nyílt, de – a telepítés rugalmasságáért cserébe – pontatlanabb modelleket. Esetünkben ez azt jelenti, hogy megjelenik egy harmadik út: a Cohere által fejlesztett Transcribe nevű automatikus beszédfelismerő (ASR-)modell, amely minden kulcsterületen versenyképes, legyen szó szöveghűségről, gyorsaságról, felhasználói kontrollról vagy költségekről.

Új szint a pontosságban

A Transcribe 2 milliárd paraméterrel dolgozik, Apache-2.0-licenc alatt fut, és 14 nyelvet támogat – többek között angolt, franciát, németet, olaszt, spanyolt, görögöt, hollandot, lengyelt, portugált, kínait, japánt, koreait, vietnámit és arabot –, bár a kínai változat esetében nem árultak el részleteket a dialektusról. Az átlagos hibaarány mindössze 5,42%, vagyis kevesebb félrehallásra lehet számítani, mint a riválisoknál. Ez az érték felveszi a versenyt a jelenlegi vezető modellekkel, például a ChatGPT-ben dolgozó Whisper Large v3-mal (7,44%), az ElevenLabs Scribe v2-vel (5,83%) vagy a Qwen3-ASR-1.7B-vel (5,76%).

Végre saját GPU-n is futtatható

Eddig az volt a megszokott, hogy a mesterséges intelligenciás feliratozást csak külső szolgáltatókon keresztül lehetett igénybe venni, ami óhatatlanul adatvédelmi aggályokat vetett fel. Most azonban a Transcribe már saját helyi infrastruktúrán és GPU-kon is fut, így az érzékeny hangadatok teljes mértékben házon belül maradhatnak. Az új modell jóval kevesebb erőforrást igényel, és a vállalatok már közvetlenül automatizált folyamatokba, keresőrendszerekbe is beépíthetik.

Kiemelkedő eredmények a teszteken

A Hugging Face vizsgálataiban, például az AMI adathalmazán (értekezletek, párbeszédek) a Transcribe 8,15%-os eredményt ért el, míg a VoxPopuli akcentustesztjén 5,87%-os pontosságot produkált, amelyet csak a Zoom Scribe múlt felül. A legnagyobb előny, hogy a vállalatok számára így végleg leáldozhat a külső API-król való függés ideje, és a teljes beszédfeldolgozás immár helyben, gyorsan, saját eszközön is megvalósítható.

2026, adrienne, venturebeat.com alapján

Legfrissebb posztok

MA 09:29

Az MI a szövetségesed: így használd, hogy ne maradj le

Jerome Powell, az amerikai jegybank elnöke a Harvardon tett látogatásán szókimondó véleményt fogalmazott meg a Z generációnak...

MA 09:22

Az alvás titkos kapcsolója: több izom, kevesebb zsír, élesebb agy

😴 Felmerül a kérdés, hogy miért képes a mélyalvás annyira felpörgetni testünket és agyunkat, hogy nemcsak kipihentnek érezzük magunkat, hanem erősebbek, magasabbak, karcsúbbak, sőt akár élesebb gondolkodásúak is leszünk tőle...

MA 09:15

Az űr hőskora: Így indult útnak a két Voyager

Egy NASA-munkatárs egy kézikamerával járja be azokat a termeket, ahol a Voyager-program számítógépei teljesítettek szolgálatot 1977-ben...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 3/31

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Slayaway Camp (iPhone/iPad)A Slayaway Camp egy sötét humorú, 80-as évekbeli horrorfilmekre emlékeztető logikai játék...

MA 09:08

Az Instagram Plus új előfizetése titokzatos extrákkal csábít

💰 A Meta új előfizetéses szolgáltatást tesztel az Instagramon, amely exkluzív funkciókat kínál a felhasználóknak, például 24 óránál tovább látható sztorikat...

MA 09:02

A hétköznapi folyadékok is repednek, akár a szilárd anyagok

💧 A Drexel Egyetem kutatócsoportja alapjaiban forgatta fel a folyadékok fizikájával kapcsolatos eddigi elképzeléseket: egy hétköznapi folyadékot nyújtva olyan erős szakítóhatást fejtettek ki rá, amelynél úgy tört el, mint egy szilárd anyag...

MA 08:57

Az AirDrop végre megérkezik a Galaxy A-készülékekre?

🚀 A legújabb Samsung Galaxy S26-széria múlt héten már megkapta a várva várt AirDrop-támogatást a Quick Share szolgáltatáson keresztül, de úgy tűnik, hogy a funkció hamarosan elérhető lehet más készülékeken is...

MA 08:50

Az MI-adatszivárgás legújabb húzása: DNS-csempészés a ChatGPT-ben

OpenAI ismét reflektorfénybe került, miután egy súlyos biztonsági rést kellett befoltoznia a népszerű ChatGPT rendszerében...

MA 08:43

A Samsung új appja leszámol az utazási rosszulléttel

A fejlesztők gyakran kínálnak különféle trükköket az utazás közben fellépő rosszullét ellen, de a Samsung most egy egészen új megközelítéssel állt elő: a Galaxy-telefonokra letölthető Hearapy alkalmazás hanghullámokkal veszi fel a harcot a mozgás okozta panaszok ellen...

MA 08:36

Az egészségügyi óriásnál kitört az adatbotrány: páciensek adatai szivárogtak ki

💉 Egy nyolcórás hálózati leállással járó betörés során hackerek jutottak hozzá a CareCloud egyik kritikus rendszeréhez...

MA 08:29

A kvantumkorszak vártnál előbb csaphat le a Bitcoinra

Ami először apróságnak tűnt, most alapjaiban rengetheti meg a kriptovaluták védelmét: a Google kvantumszakértői szerint a Bitcoin és az Ethereum meglévő titkosítása már a vártnál jóval kevesebb kvantumkapacitással is legyőzhető...

MA 08:23

A kritikus nyersanyagok aranyárban: Kína fogságában a világ ellátása

💰 Az elmúlt hetekben három kevéssé ismert, ám nélkülözhetetlen nyersanyag ára szállt el világszerte: a volfrám, a kén és a hélium mind masszív drágulást produkált, néhol az olajhoz képest is nagyobb mértékben...

MA 08:15

Az Android Auto hibája eltünteti a térerőjelzőket – nyugi, van megoldás

Az utóbbi hetekben egyre több Android Auto-felhasználó vette észre, hogy eltűnt a térerőjelző a jármű műszerfaláról...

MA 08:08

Az Apple nagy dobása közeleg: érkezik az iPhone Fold?

Az Apple hamarosan nagyot léphet előre: a hajlítható iPhone teljesen új korszakot nyithat a mobilok világában...

MA 08:01

Az Artemis II zöld utat kapott: indulhat a Hold felé

A NASA történelmi jelentőségű küldetése, az Artemis II végre elindulhat: a 10 napos küldetés minden engedélyt megkapott egy átfogó repüléskészségi felülvizsgálat után, az időjárás-előrejelzés pedig biztató...

MA 07:57

Az amerikai nyugdíjvagyon is kriptóba áramolhat

💰 Az Egyesült Államok Munkaügyi Minisztériuma új szabályozást terjesztett elő, amely megnyithatja az utat a nyugdíj-megtakarítási programokban felhalmozott több ezermilliárd dollárnyi vagyon számára a kriptovaluták, a magántőke és az ingatlanbefektetések felé...

MA 07:50

Az új, 3000 milliárdos katonai GPS továbbra is működésképtelen

🚩 Tizenhat évnyi fejlesztés, 3000 milliárd forintnál is drágább projekt, és még mindig működésképtelen a hadsereg legújabb GPS-vezérlőrendszere...

MA 07:29

A nők ismét átvették a vezetést az amerikai munkaerőpiacon

💪 Jellemző példa, hogy évtizedeken át makacs nemi szakadék uralta a foglalkoztatást, noha a nők már régóta többen szereznek diplomát, mint a férfiak...

MA 07:22

A sertések ihlette forradalmi terápia a szemrák ellen

A szem hátsó részén kialakuló ritka daganattípus kezelésére most egészen szokatlan megoldással álltak elő: sertés ondójából származó molekulák segítségével juthat el a kemoterápia a nehezen hozzáférhető területekre...

MA 07:15

A hackerek már lecsaptak az új Citrix-sebezhetőségre

A Citrix NetScaler ADC és NetScaler Gateway rendszerekben súlyos biztonsági rést fedeztek fel, amelyet a hackerek aktívan kihasználnak érzékeny adatok megszerzéséhez...

MA 07:09

Az MI-ügynökök már-már kártevőként működnek

Érdemes megvizsgálni, milyen veszélyeket hordoznak az MI-ügynökök, és miként kezelhetők biztonságosan egy olyan világban, ahol a vállalatok egyre bátrabban vetik be őket...

MA 07:01

Az újranyitás után is maradnak a kígyózó reptéri sorok

🛫 Életbe lépett az a döntés, amelynek nyomán a Közlekedésbiztonsági Hivatal dolgozói visszakapják fizetésüket, véget vetve ezzel a csaknem hathetes leállásnak...

MA 06:58

A legújabb Meta-botrány: szerzői diadal, a torrentezés árnyéka

Ebből következően érdemes megérteni, hogy a Meta egyre súlyosabb szerzői jogi perekbe keveredett azzal kapcsolatban, ahogyan a tartalmakat torrent­hálózatokon keresztül kezeli...

MA 06:50

Az SSD-óriás: 246 TB egyetlen DapuStor-meghajtóban

Első pillantásra úgy tűnt, hogy a tárhelybővítés alapjait írják újra, amikor a DapuStor kihozta legújabb, Roealsen6 R6060 nevű SSD-jét...

MA 06:43

A Google Drive új trükkjei megmenthetik fájljaidat zsarolóvírus-támadáskor

🔒 Érdemes megérteni, hogy napjainkban a felhőalapú tárolás sem jelent automatikus védelmet a zsarolóvírusok ellen, amelyek még mindig komoly veszélyt jelentenek...

MA 06:36

A régebbi Samsungok már tudják az Apple-féle fájlmegosztást – vagy mégsem?

A Samsung mostanság igencsak rákapcsolt: hamarosan már a régebbi Galaxy készülékeken is elérhető lesz az a menő fájlmegosztási funkció, ami eddig csak az új csúcsmodelleken futott...

MA 06:29

Az erőre kapó kínai ipar felforgatja a világpiacot

Márciusban a kínai gyártás teljesítménye egy éve a legnagyobb ütemben nőtt, miközben a gyárak az ünnepek után új lendületet vettek...

MA 06:22

Az olcsó PC-k éve jön, mégis zuhanhatnak az eladások Amerikában

📈 Az Egyesült Államok PC-piacát idén komoly visszaesés sújtja: a kiszállított mennyiség várhatóan 13 százalékkal csökken, a folytatódó memória- és adattárolóválság miatt...

MA 06:15

A Sora eltűnt, de máris özönlenek az új MI‑videókészítők

📺 Az internetes közösséget alaposan meglepte, amikor az OpenAI szinte egyik napról a másikra leállította a népszerű Sora nevű MI‑videógeneráló eszközét...