Az agy-beszéd átirat forradalma: új esély a lebénultaknak

Az agy-beszéd átirat forradalma: új esély a lebénultaknak
Stephen Hawking, a legendás brit fizikus, az amyotróf laterálszklerózis (ALS) egyik legismertebb arca volt. Kommunikációját évekig egy speciális, szemüvegbe szerelt szenzor tette lehetővé, amely egy arcizom apró mozdulatát érzékelte. Így választotta ki a betűket a képernyőn, nagyjából percenként egy szó sebességgel. Amikor elkészült a mondat, azt szintetizátor szóvá alakította – innen származik Hawking jellegzetes, robotikus hangja.

Út a gondolattól a beszédig

2018 óta óriási előrelépések történtek az agy-számítógép interfészek (BCI) területén. Míg korábban ezek a rendszerek csak korlátozott szókészlettel, jelentős késéssel, és a beszéd árnyalatainak elvesztésével működtek, ma már valós idejű, hangalapú átalakításra is képesek. A Kaliforniai Egyetem (UC Davis) kutatócsapatának új fejlesztése elsőként képes az agyi jeleket azonnal, közvetlenül hangokká – akár szavakká – alakítani. Ez lehet az első igazi lépés egy digitális hangképző apparátus felé.

Áttörés a szövegből a hangba

Korábban a legfejlettebb neuroprotézisek leginkább szövegalapú megoldások voltak: a páciens gondolatai szavakként jelentek meg a kijelzőn. Egy stanfordi kutatócsoport 25%-os hibaaránnyal dolgozó rendszert épített – vagyis a szavak háromnegyedét helyesen visszaadták. Ez ugyan óriási előrelépést jelentett, de a beszéd árnyaltsága, az interakció lehetősége hiányzott.

Egy évvel később, 2024-ben a UC Davis csapatának sikerült a pontosságot 97,5%-ra növelni – a legtöbb szó helyes volt, de továbbra is csak szöveges kommunikációra adott lehetőséget. Ez pedig nem pótolja a hangos beszéd előnyeit: az interakciót, az élő közlést, az éneklést vagy a szleng szavak szabad használatát. A legtöbb rendszerben a beszéd szintézise is csak késleltetéssel történt, gyakran egy szűk, kb. 1300 szavas szótárból dolgozva, ami az idegen nyelvi, összetett vagy ritka kifejezések elmondását ellehetetlenítette.

Ezért a kutatók célja az lett, hogy agyi jelekből közvetlenül hangokat állítsanak elő – valós időben.

Hang a gondolatból: hogyan működik?

Az első sikeres tesztekben egy 46 éves, ALS-ben szenvedő, súlyosan lebénult beteg (kódneve: T15) vett részt. Beszéde szinte érthetetlen volt; korábban egy giroszkópos fejegerrel, a kurzor mozgatásával kommunikált. A korai agy-szöveg rendszert 256 mikroelektródával oldották meg, melyeket a hangképzésért felelős agyterületbe ültettek.

Az új, agy-hang rendszer is ezt az elektródahálót alkalmazta. Az elektródák egyenkénti idegsejt-aktivitást rögzítettek – a legnagyobb felbontásban. Ezeket az adatokat egy MI-algoritmus (neural decoder) dolgozta fel, és nyerte ki belőlük a beszéd jellemzőit: például a hangmagasságot és a hangképzést. A következő lépésben ezeket egy vokóder nevű algoritmus használta fel, hogy a T15 eredeti, betegség előtti hangját szimulálja. A teljes átalakítás kevesebb mint 10 ezredmásodpercig tartott – a hangképzés szinte azonnali volt.

Mivel a rendszer nem szótárból dolgozott, a beteg bármilyen szót, hangutánzó szavakat és érzelmi árnyalatokat is képes volt közvetíteni, akár a beszéd dallamosságát, kérdő hangsúlyt, sőt, rövid éneklést is.


Hatékonyság és korlátok

Az első teszteken emberi hallgatók 100%-os pontossággal tudták a szintetizált mondatokat az írott szöveggel párosítani. Nyitottabb, transzkripciós feladatnál, amikor nem voltak meg a lehetséges mondatok, a szavak több mint felét még ekkor is sikeresen azonosították – szemben a beteg segédeszköz nélküli beszédével, ahol csak minden huszadik szó volt felismerhető. Azonban a technológia azonnali, hétköznapi kommunikációra még nem elég megbízható. Ennek ellenére kétségtelenül bizonyította a koncepció működőképességét.

A kutatók a további fejlődéstől legalább 1000-2000 elektródás rendszereket várnak, amelyek minden eddiginél pontosabb átalakítást tesznek majd lehetővé. Már most folynak a következő generációs, több ezer elektródás kísérletek is, többek között az austini Paradromics cégnél, akik 1600 elektródás rendszert tesztelnek. Ezek klinikai próbái a UC Davisnél kezdődhetnek el, remélhetőleg néhány éven belül.

Mostanra tehát az agyhullám-alapú beszédszintetizálás nem csupán sci-fi: a technológia már a kísérleti stádiumban is fényéveket lépett előre, és egyre közelebb viszi az embereket ahhoz, hogy gondolataikat a saját, korábbi hangjukon szólaltathassák meg.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 19:49

Az iskolanyitás villámgyorsan javította a gyerekek lelkiállapotát

Az iskolák újbóli megnyitása a COVID-járvány után világszerte komoly változásokat hozott a gyerekek mentális egészségében...

MA 19:33

Az új macOS Tahoe 26.2 forradalmasítja a videóhívásokat

📞 Az Apple a napokban adta ki a macOS Tahoe 26.2 frissítést, amely minden eddiginél kényelmesebbé teszi a videóhívásokat Macen és MacBookon...

MA 19:19

A mesterséges intelligencia új életet lehel a bezárt atomerőművekbe

A Michigan-tó keleti partján, dűnék között bújik meg a Palisades Atomerőmű, amely 2022-ben gazdasági okokból bezárta kapuit...

MA 19:01

Az utolsó szög a szénkorszak koporsójában

New England utolsó széntüzelésű erőműve, a New Hampshire-ben található Merrimack Station a tervezettnél három évvel korábban végleg leállt...

MA 18:50

Az agy rejtett kapcsolója: áttörés a mentális zavarok kezelésében

Lényeges szempont, hogy az agy alkalmazkodóképessége döntő szerepet játszik abban, hogyan birkózunk meg a stresszel, és ez új irányt mutathat a jövőbeli mentális egészségügyi kezelések területén...

MA 18:34

Az élet nem unalmas: a fagyott sós víz trükkjei

❄ Képzeld el, hogy egy vékony csövet teleöntesz sós vízzel, majd megfigyeled, ahogy lassan, egyik végéről indulva megfagy...

MA 18:18

A szintetikus fonika csapdája: válságban az angol olvasástanítás

2012 óta az angliai általános iskolákban egyre szűkebb módszert írnak elő az olvasástanításra...

MA 18:01

A német energiaforradalom: az áram fele már zöld

Németországban 2025-ben a teljes áramfogyasztás közel 56 százalékát fedezték megújuló energiaforrásokból, egy nehéz év ellenére is...

MA 16:51

Az olcsó Bose hangprojektor: ár-érték bajnok vagy csalódás?

Mindenki ismeri azt az érzést, amikor a tévéből érkező hang tompa, a párbeszédeket alig értjük, a basszus lapos, és a hangerő csak élesebbé teszi a problémákat...

MA 16:33

Az FDA újabb vakcinariadója: jön a pánik?

2025. december 12. Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) a hírek szerint fontolóra vette, hogy „feketedoboz-figyelmeztetést” helyez el a COVID-vakcinákon, noha a kutatási eredmények és a gyakorlati adatok világszerte a biztonságukat igazolják...

MA 16:18

Az űripar nagy dobása: tőzsdére lép a SpaceX

Több mint húsz évvel az alapítása után a SpaceX, amely forradalmasította az űripart, végre tőzsdére készül lépni...

MA 16:02

A mesterséges intelligencia emberibbé teszi a bionikus kezek mozgását

Érdemes megvizsgálni, hogy a bionikus kezek fejlesztése mennyire javítja az amputáltak életminőségét, és milyen szerepet játszik az MI ebben az új hullámban...

MA 15:51

Itt a Shark TurboBlade: tényleg vége a hőháborúnak?

🐟 Ez a jelenség jól illusztrálható azzal, hogy sok háztartásban folyamatos harc folyik a termosztát feletti felügyeletért...

MA 15:34

A legjobb ízületkímélő erősítő gyakorlatok 50 felett: öt bevált tipp

Az életkor előrehaladtával a testünk változik, és gyakran épp akkor kezd nehezebben épülni az izomzat, amikor a legnagyobb szükség lenne rá...

MA 15:17

Az IKEA trükkös töltői mostantól hangulatfényt is adnak

Az IKEA három vadonatúj vezeték nélküli töltővel bővíti kínálatát, amelyek támogatják a Qi 2...

MA 15:01

A Zootropolis 2 rekordidő alatt átlépte az egymilliárdot

Kevesebb mint három hét alatt a Zootropolis 2 (Zootopia 2) már több mint 1 milliárd dollárt, azaz körülbelül 368 milliárd forintot hozott a Disney-nek, rekordgyorsasággal érve el ezt az összeget egy PG-besorolású filmhez képest...

MA 14:49

Az Amazon törli a hibás MI-generált Fallout-összefoglalókat

Az Amazon Prime Video gyorsan eltávolította a Radioaktív kihullás (Fallout) sorozat első évadához készült, MI által generált összefoglalókat, miután azok súlyos hibákat tartalmaztak...

MA 14:34

Az amerikai gazdagság délibábja: Mit ér a nettó vagyon valójában?

Úgy tűnhet, elképesztően gazdagok az amerikaiak, hiszen a 2024-es UBS-jelentés szerint az átlagos nettó vagyon 620 654 dollár, ami több mint 224 millió forintnak felel meg...