
Bővülő képességek: gondolkodó robotok
Míg a korábbi modellek csupán egyszerű utasításokat tudtak végrehajtani, például egy banánt a kosárba helyezni, az új Gemini-modellek már összetett feladatokat is megoldanak. Ilyen például a különböző gyümölcsök színek szerinti szétválogatása – mindezt két robotkar (Aloha 2) segítségével, miközben a robot természetes nyelven elmagyarázza, mit miért tesz. Ez a képesség lehetővé teszi, hogy a gépek ne csak a kapott parancsokat hajtsák végre, hanem folyamatosan értékeljék a környezetüket, lépésről lépésre gondolkodjanak, alkalmazkodjanak, és – ha szükséges – döntéseiket megindokolják.
Együttműködő MI-modellek: agy és kezek
A rendszer két fő modellből áll: a Robotics-ER 1.5 az „agy”, amely a környezet vizuális és nyelvi megértéséért, valamint a feladatok elemzéséért felelős, és képes internetes forrásokat – például a Google Keresőt – is információszerzésre használni. Ezután a Robotics 1.5, amely a „kezek és szemek”, végrehajtja a fizikai feladatot, mindig visszajelzést adva az elvégzett munkáról. Ez az együttműködés lehetővé teszi a robot számára, hogy egyszerű iránymutatások alapján teljes folyamatokat kezeljen, akár több lépésben is, miközben magyarázza a gondolkodását.
Tanulás több rendszeren keresztül
Nem elhanyagolható tényező, hogy a DeepMind MI-modelljei már nem kizárólag egy adott robotra vannak optimalizálva: ugyanaz a tudás átvihető az Aloha 2 robotkaros rendszerről az Apollo humanoid robotra vagy éppen a Franka kétkaros egységre. Ez azt jelenti, hogy minden új tanulás alkalmával az egész robotflotta okosabbá válik – a tapasztalatokat az összes robot egységesen tudja hasznosítani.
Valós alkalmazás: színek, újrahasznosítás, alkalmazkodás
Bár egy gyümölcsszortírozós bemutató triviálisnak tűnhet, valójában összetett felismerési, kategorizálási és indoklási képességeket igényel. A kutatók ennél is tovább mentek: megmutatták, hogy a robot képes egy San Franciscó-i újrahasznosítási szabályrendszer szerint szétválogatni a szemetet, komposztot és szelektív hulladékot, internetes keresés és helymeghatározás alapján. Egy másik példában a humanoid Apollo robot mozgó kosarakat és ruhákat is kezelt, gyorsan újratervezve a szortírozást.
A fentiek tükrében nem kétséges, hogy a Gemini-modellek jelentős előrelépést jelentenek a mindennapi feladatokat ellátó, valóban gondolkodó robotok korszakához – ráadásul most először családtagként és kollégaként is megállják a helyüket.