A Google DeepMind bemutatta a Gemini Robotics On-Device nevű nyelvi MI-modellt, amely a márciusi Gemini Robotics továbbfejlesztett változata. Ez az új modell képes közvetlenül vezérelni a robotok mozgását, és a fejlesztők természetes nyelvű utasításokkal is finomhangolhatják, hogy többféle feladatra alkalmas legyen. A Google mérései szerint az eszközön futó verzió teljesítménye közel áll a felhőalapú Gemini Robotics modelléhez, ráadásul minden eddiginél jobb a saját kategóriájában – bár a riválisokat nem nevezték meg.
Feladatok betanítása otthoni hardveren
Egy bemutató során a helyi MI-modell például táskák cipzározását és ruhák hajtogatását is elvégezte robotkarokkal. A rendszer eredetileg ALOHA-robotokon futott, de a fejlesztők már sikeresen adaptálták a kétkarú Franka FR3 robotra és az Apptronik által készített Apollo humanoidra is. A Google szerint a Franka FR3 gond nélkül birkózott meg ismeretlen tárgyakkal, illetve összeszerelési feladatokkal. A fejlesztők 50–100 példafeladattal, mindössze természetes nyelven is képesek betanítani új kihívásokat a robotoknak, a MuJoCo fizikai szimulátor használatával.