MA 07:36

Az új ASR-modell kiváltja a méregdrága feliratozó API-kat

Az új ASR-modell kiváltja a méregdrága feliratozó API-kat
A cégek, amelyek hangvezérelt munkafolyamatokat akarnak létrehozni, eddig két rossz közül választhattak: vagy megbízható, de zárt és adatvédelmi szempontból kockázatos API-kat, vagy nyílt, de – a telepítés rugalmasságáért cserébe – pontatlanabb modelleket. Esetünkben ez azt jelenti, hogy megjelenik egy harmadik út: a Cohere által fejlesztett Transcribe nevű automatikus beszédfelismerő (ASR-)modell, amely minden kulcsterületen versenyképes, legyen szó szöveghűségről, gyorsaságról, felhasználói kontrollról vagy költségekről.

Új szint a pontosságban

A Transcribe 2 milliárd paraméterrel dolgozik, Apache-2.0-licenc alatt fut, és 14 nyelvet támogat – többek között angolt, franciát, németet, olaszt, spanyolt, görögöt, hollandot, lengyelt, portugált, kínait, japánt, koreait, vietnámit és arabot –, bár a kínai változat esetében nem árultak el részleteket a dialektusról. Az átlagos hibaarány mindössze 5,42%, vagyis kevesebb félrehallásra lehet számítani, mint a riválisoknál. Ez az érték felveszi a versenyt a jelenlegi vezető modellekkel, például a ChatGPT-ben dolgozó Whisper Large v3-mal (7,44%), az ElevenLabs Scribe v2-vel (5,83%) vagy a Qwen3-ASR-1.7B-vel (5,76%).

Végre saját GPU-n is futtatható

Eddig az volt a megszokott, hogy a mesterséges intelligenciás feliratozást csak külső szolgáltatókon keresztül lehetett igénybe venni, ami óhatatlanul adatvédelmi aggályokat vetett fel. Most azonban a Transcribe már saját helyi infrastruktúrán és GPU-kon is fut, így az érzékeny hangadatok teljes mértékben házon belül maradhatnak. Az új modell jóval kevesebb erőforrást igényel, és a vállalatok már közvetlenül automatizált folyamatokba, keresőrendszerekbe is beépíthetik.

Kiemelkedő eredmények a teszteken

A Hugging Face vizsgálataiban, például az AMI adathalmazán (értekezletek, párbeszédek) a Transcribe 8,15%-os eredményt ért el, míg a VoxPopuli akcentustesztjén 5,87%-os pontosságot produkált, amelyet csak a Zoom Scribe múlt felül. A legnagyobb előny, hogy a vállalatok számára így végleg leáldozhat a külső API-król való függés ideje, és a teljes beszédfeldolgozás immár helyben, gyorsan, saját eszközön is megvalósítható.

2026, adrienne, venturebeat.com alapján

Legfrissebb posztok

MA 10:50

Az emberiség visszatér a Holdra: hamarosan startol az Artemis II

A NASA új fejezetet ír az űrkutatásban, hiszen hónapok előkészítő munkája után most végre elindult a visszaszámlálás a történelmi Artemis II Hold-misszióhoz...

MA 10:43

A látszólag ártalmatlan laborkesztyű a mikroműanyag-vadászok réme

A laborélet egy újabb csavart kap: kiderült, hogy még a legprofibb kutatók is rendre beleszaladnak egy bosszantó hibába, amikor a környezetből vett mintáikban mikroműanyagokra vadásznak...

MA 10:36

Az Eidos Montréalnál brutális leépítés: 124 embert elküldenek, a főnök is

🙁 Jó, jó, persze, csak épp közben újabb baljós hullám söpör végig a gamer világon: az Eidos Montréal 124 dolgozójától válik meg, még a főnök, David Anfossi is állás nélkül marad...

MA 10:32

Az olcsó fejhallgatók titkos ászai: prémium hang fillérekért

Sokan még ma is azt gondolják, hogy a jó fejhallgató bizony mélyen a pénztárcába nyúl, pedig az utóbbi években igencsak felzárkóztak a pénztárcabarát darabok...

MA 10:22

Az OkCupid titokban hárommillió felhasználói szelfit adott a Clarifainak

Na most kapaszkodj, mert az OkCupidnál a 2014-es év kicsit másképp zajlott, mint gondolnád!..

MA 10:10

Az olcsó MacBook visszatér: iPhone-chipre épül az új Neó

Az Apple legújabb belépő szintű laptopja, a MacBook Neo komoly meglepetést hoz a piacon: iPhone-ból átemelt A18 Pro chip dolgozik benne, miközben az élmény sokkal többet nyújt az alap MacBookoknál, pénztárcabarát áron...

MA 10:01

Az MI-tanácsadás sötét oldala: Tényleg rosszabb emberré tesz?

🕵 Miközben az MI egyre inkább beépül mindennapjainkba, munkahelyeinkre és online kommunikációnkba, egy új kutatás szerint jobb, ha személyes vagy érzelmi problémáinkra nem tőle várjuk a választ...

MA 09:57

A Sony nagy szünete: az MI-láz felfalja a memóriakártyákat

A Sony most parkolópályára tette a CFexpress- és SD-memóriakártyái megrendeléseinek felvételét, egy brutális NAND flash-hiány miatt...

MA 09:50

Az északi fény visszatér: látványos jelenség 15 amerikai államban

A tavaszi időszak ellenére az égbolt az utóbbi hetekben meglehetősen nyugodt maradt, csak pár szerényebb sarki fény jelent meg...

MA 09:36

Az Android már előre szól, hol van baj: itt az új segélyriasztás

🚨 Mostantól az Android rendszerszintű segélyriasztásai szintet lépnek: az új Google Play-szolgáltatások frissítésének (v26...

MA 09:29

Az MI a szövetségesed: így használd, hogy ne maradj le

Jerome Powell, az amerikai jegybank elnöke a Harvardon tett látogatásán szókimondó véleményt fogalmazott meg a Z generációnak...

MA 09:22

Az alvás titkos kapcsolója: több izom, kevesebb zsír, élesebb agy

😴 Felmerül a kérdés, hogy miért képes a mélyalvás annyira felpörgetni testünket és agyunkat, hogy nemcsak kipihentnek érezzük magunkat, hanem erősebbek, magasabbak, karcsúbbak, sőt akár élesebb gondolkodásúak is leszünk tőle...

MA 09:15

Az űr hőskora: Így indult útnak a két Voyager

Egy NASA-munkatárs egy kézikamerával járja be azokat a termeket, ahol a Voyager-program számítógépei teljesítettek szolgálatot 1977-ben...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 3/31

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Slayaway Camp (iPhone/iPad)A Slayaway Camp egy sötét humorú, 80-as évekbeli horrorfilmekre emlékeztető logikai játék...

MA 09:08

Az Instagram Plus új előfizetése titokzatos extrákkal csábít

💰 A Meta új előfizetéses szolgáltatást tesztel az Instagramon, amely exkluzív funkciókat kínál a felhasználóknak, például 24 óránál tovább látható sztorikat...

MA 09:02

A hétköznapi folyadékok is repednek, akár a szilárd anyagok

💧 A Drexel Egyetem kutatócsoportja alapjaiban forgatta fel a folyadékok fizikájával kapcsolatos eddigi elképzeléseket: egy hétköznapi folyadékot nyújtva olyan erős szakítóhatást fejtettek ki rá, amelynél úgy tört el, mint egy szilárd anyag...

MA 08:57

Az AirDrop végre megérkezik a Galaxy A-készülékekre?

🚀 A legújabb Samsung Galaxy S26-széria múlt héten már megkapta a várva várt AirDrop-támogatást a Quick Share szolgáltatáson keresztül, de úgy tűnik, hogy a funkció hamarosan elérhető lehet más készülékeken is...

MA 08:50

Az MI-adatszivárgás legújabb húzása: DNS-csempészés a ChatGPT-ben

OpenAI ismét reflektorfénybe került, miután egy súlyos biztonsági rést kellett befoltoznia a népszerű ChatGPT rendszerében...

MA 08:43

A Samsung új appja leszámol az utazási rosszulléttel

A fejlesztők gyakran kínálnak különféle trükköket az utazás közben fellépő rosszullét ellen, de a Samsung most egy egészen új megközelítéssel állt elő: a Galaxy-telefonokra letölthető Hearapy alkalmazás hanghullámokkal veszi fel a harcot a mozgás okozta panaszok ellen...

MA 08:36

Az egészségügyi óriásnál kitört az adatbotrány: páciensek adatai szivárogtak ki

💉 Egy nyolcórás hálózati leállással járó betörés során hackerek jutottak hozzá a CareCloud egyik kritikus rendszeréhez...

MA 08:29

A kvantumkorszak vártnál előbb csaphat le a Bitcoinra

Ami először apróságnak tűnt, most alapjaiban rengetheti meg a kriptovaluták védelmét: a Google kvantumszakértői szerint a Bitcoin és az Ethereum meglévő titkosítása már a vártnál jóval kevesebb kvantumkapacitással is legyőzhető...

MA 08:23

A kritikus nyersanyagok aranyárban: Kína fogságában a világ ellátása

💰 Az elmúlt hetekben három kevéssé ismert, ám nélkülözhetetlen nyersanyag ára szállt el világszerte: a volfrám, a kén és a hélium mind masszív drágulást produkált, néhol az olajhoz képest is nagyobb mértékben...

MA 08:15

Az Android Auto hibája eltünteti a térerőjelzőket – nyugi, van megoldás

Az utóbbi hetekben egyre több Android Auto-felhasználó vette észre, hogy eltűnt a térerőjelző a jármű műszerfaláról...

MA 08:08

Az Apple nagy dobása közeleg: érkezik az iPhone Fold?

Az Apple hamarosan nagyot léphet előre: a hajlítható iPhone teljesen új korszakot nyithat a mobilok világában...

MA 08:01

Az Artemis II zöld utat kapott: indulhat a Hold felé

A NASA történelmi jelentőségű küldetése, az Artemis II végre elindulhat: a 10 napos küldetés minden engedélyt megkapott egy átfogó repüléskészségi felülvizsgálat után, az időjárás-előrejelzés pedig biztató...

MA 07:57

Az amerikai nyugdíjvagyon is kriptóba áramolhat

💰 Az Egyesült Államok Munkaügyi Minisztériuma új szabályozást terjesztett elő, amely megnyithatja az utat a nyugdíj-megtakarítási programokban felhalmozott több ezermilliárd dollárnyi vagyon számára a kriptovaluták, a magántőke és az ingatlanbefektetések felé...

MA 07:50

Az új, 3000 milliárdos katonai GPS továbbra is működésképtelen

🚩 Tizenhat évnyi fejlesztés, 3000 milliárd forintnál is drágább projekt, és még mindig működésképtelen a hadsereg legújabb GPS-vezérlőrendszere...

MA 07:29

A nők ismét átvették a vezetést az amerikai munkaerőpiacon

💪 Jellemző példa, hogy évtizedeken át makacs nemi szakadék uralta a foglalkoztatást, noha a nők már régóta többen szereznek diplomát, mint a férfiak...

MA 07:22

A sertések ihlette forradalmi terápia a szemrák ellen

A szem hátsó részén kialakuló ritka daganattípus kezelésére most egészen szokatlan megoldással álltak elő: sertés ondójából származó molekulák segítségével juthat el a kemoterápia a nehezen hozzáférhető területekre...