A világ első robotarca, amely úgy mozgatja ajkát, mint egy ember

Felmerül a kérdés, hogy vajon meg tudod-e különböztetni a robotot az embertől beszéd közben — lehet, hogy hamarosan már nem lesz ilyen egyszerű. A Columbia Egyetem kutatói megalkották az EMO nevű humanoid robotot, amely elsőként képes emberi pontossággal mozgatni a száját és az ajkait. Ez a fejlesztés átlépi az úgynevezett „kísérteties völgyet” (uncanny valley), vagyis megszünteti azt a bizarr érzést, amikor egy robot mozgása hátborzongatóan hasonlít az emberéhez, de valami mégis hiányzik belőle.

Az EMO a tükröt és a YouTube-ot választotta tanárának

Az EMO arca 26 motorból áll, amelyek mindegyike tíz különböző irányba tud mozogni. A robot először saját magát figyelte a tükörben: véletlenszerű arckifejezéseket és ajakmozdulatokat próbált ki, és elemezte, milyen változásokat eredményeznek az egyes motorok.

Ezt követően a kutatók leültették az EMO-t, és órákon át nézett YouTube-videókat, ahol emberek különböző nyelveken beszéltek, vagy énekeltek. Az MI-alapú VLA-modell (vision-to-action language model) segítségével az EMO megtanulta összekötni az ajakmozdulatokat a hangokkal — ráadásul anélkül, hogy ténylegesen értette volna, mit mondanak. Végül tíz különböző nyelven tudott szinte tökéletesen szinkronban mozogni a beszéddel vagy énekkel.

A fejlesztők szerint a legnehezebb feladatot a kemény hangok, például a „B”, illetve az ajakcsücsörítéssel képzett hangok (például a „W”) jelentették, de ezek is javulni fognak a gyakorlással.

Tesztelés valódi emberekkel: az EMO is nyerő volt

A robot bemutatásához 1 300 önkéntest kértek fel. A résztvevők három módszert néztek meg: a VLA-modell szerinti ajakmozgást, egy hangerőalapú változatot és egy mintakövető algoritmust (amely hasonló hangoknál másolt korábbi arcmozdulatokat). A legtöbben (62,46%) a VLA-modell által mozgatott szájmozgást tartották a legélethűbbnek.

Mire lesz jó ez a barátságos robotarc?

Az emberek kommunikációjának nagy része az arcon keresztül zajlik, a tekintet 87%-a a partner arcára, ennek 10–15%-a pedig a szájára irányul. Az ajakmozgás annyira fontos, hogy még a hallott szavakat is felülírhatja.

A kutatók szerint korábban sok humanoid robot fejlesztése bukott el, mert elhanyagolták az arc és a mimika szerepét. Az EMO sikere rámutat: ha a gépek barátságosan és természetesen tudnak viselkedni, sokkal hatékonyabbak lehetnek a gyógyászatban, oktatásban vagy az ügyfélszolgálaton.

A robotarcok versenye élesedik

Ebből adódóan az MI-vel vezérelt robotarcok fejlesztése új lendületet vesz. Kínai cégek már olyan androidokat mutattak be, amelyek egészen élethű arckifejezésekre képesek, japán kutatók pedig mesterséges bőrt dolgoztak ki a robotarcokra. Úgy tűnik, a jövő beszélgetőpartnere egyre inkább hasonlíthat majd az emberre, mint valaha.

2025, adminboss, www.livescience.com alapján