
Az EMO a tükröt és a YouTube-ot választotta tanárának
Az EMO arca 26 motorból áll, amelyek mindegyike tíz különböző irányba tud mozogni. A robot először saját magát figyelte a tükörben: véletlenszerű arckifejezéseket és ajakmozdulatokat próbált ki, és elemezte, milyen változásokat eredményeznek az egyes motorok.
Ezt követően a kutatók leültették az EMO-t, és órákon át nézett YouTube-videókat, ahol emberek különböző nyelveken beszéltek, vagy énekeltek. Az MI-alapú VLA-modell (vision-to-action language model) segítségével az EMO megtanulta összekötni az ajakmozdulatokat a hangokkal — ráadásul anélkül, hogy ténylegesen értette volna, mit mondanak. Végül tíz különböző nyelven tudott szinte tökéletesen szinkronban mozogni a beszéddel vagy énekkel.
A fejlesztők szerint a legnehezebb feladatot a kemény hangok, például a „B”, illetve az ajakcsücsörítéssel képzett hangok (például a „W”) jelentették, de ezek is javulni fognak a gyakorlással.
Tesztelés valódi emberekkel: az EMO is nyerő volt
A robot bemutatásához 1 300 önkéntest kértek fel. A résztvevők három módszert néztek meg: a VLA-modell szerinti ajakmozgást, egy hangerőalapú változatot és egy mintakövető algoritmust (amely hasonló hangoknál másolt korábbi arcmozdulatokat). A legtöbben (62,46%) a VLA-modell által mozgatott szájmozgást tartották a legélethűbbnek.
Mire lesz jó ez a barátságos robotarc?
Az emberek kommunikációjának nagy része az arcon keresztül zajlik, a tekintet 87%-a a partner arcára, ennek 10–15%-a pedig a szájára irányul. Az ajakmozgás annyira fontos, hogy még a hallott szavakat is felülírhatja.
A kutatók szerint korábban sok humanoid robot fejlesztése bukott el, mert elhanyagolták az arc és a mimika szerepét. Az EMO sikere rámutat: ha a gépek barátságosan és természetesen tudnak viselkedni, sokkal hatékonyabbak lehetnek a gyógyászatban, oktatásban vagy az ügyfélszolgálaton.
A robotarcok versenye élesedik
Ebből adódóan az MI-vel vezérelt robotarcok fejlesztése új lendületet vesz. Kínai cégek már olyan androidokat mutattak be, amelyek egészen élethű arckifejezésekre képesek, japán kutatók pedig mesterséges bőrt dolgoztak ki a robotarcokra. Úgy tűnik, a jövő beszélgetőpartnere egyre inkább hasonlíthat majd az emberre, mint valaha.
