Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?

Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?
Hosszú évek fejlesztése után már nemcsak a virtuális MI-csevegőrobotok (mint a Gemini vagy a ChatGPT) számítanak áttörésnek, hanem a valódi, fizikai robotok is hatalmas előrelépést értek el. A Google DeepMind legújabb fejlesztése, a helyben futó VLA (Vision Language Action, vagyis képi-nyelvi-akció) modell már lehetővé teszi, hogy a robotok teljes önállósággal működjenek. Ez a rendszer a fejlesztők számára is testreszabhatóvá vált, így sosem látott rugalmasságot kínál a robotfejlesztés terén.

Generatív MI, mint robotagy

A robotika különösen nagy kihívás az MI számára, hiszen nemcsak egy programozott szoftverről van szó, hanem egy olyan gépről, amely folyamatosan alakítja a környezetét. Eddig a robotokat leginkább megerősítéses tanulással, lassan lehetett tanítani, és így minden lehetséges helyzetre külön kellett reagálást fejleszteni. Az új generatív MI azonban képes a világ multimodális értelmezésére, így akár teljesen új feladathoz is alkalmazkodhat – például ahogy a Gemini képes verset írni vagy képet generálni, ugyanígy képes robot-akciókat is létrehozni.

Robothadak a felhő nélkül

Az előző Gemini Robotics modell még hibrid rendszerként működött: a roboton egy kisebb MI futott, a bonyolultabb döntésekhez pedig felhőalapú feldolgozást használtak. A valós idejű robotika azonban a másodperc törtrésze alatt döntéseket követel, ezért a DeepMind most elérhetővé tette a kizárólag helyben futó VLA-t. Ez meglepően robusztusnak bizonyult: mindössze kicsivel marad el pontosságban a hibrid változathoz képest. Sőt, sok feladat már előzetes programozás nélkül is működik, és a fejlesztők csupán 50-100 példával új műveletekre taníthatják be a robotokat.

Tanítás néhány mozdulattal

A robotok betanítása főként úgynevezett demonstrációval történik: a kutató vezérli a robotot, hogy egy adott feladatot emberi irányítással hajtson végre, ezután a modell már önállóan is képes lesz hasonló műveleteket végrehajtani. Bár a szimulációk segítenek, a legösszetettebb, ügyességet igénylő feladatoknál továbbra is valódi, fizikai adat szükséges. Egyszerűbb dolgokat, például cipőfűzést vagy pólóhajtogatást azonban már a helyi VLA is hibátlanul elvégez, de egy bonyolultabb feladathoz, mint például egy szendvics elkészítése, feltehetően már fejlettebb MI szükséges.


Biztonság mindenekelőtt

A robotoknál kiemelten fontos a biztonság – elég csak elképzelni, mi történik, ha egy MI vezérelte gép hibázik. A Gemini Robotics ezért összetett, többrétegű védelmet alkalmaz: a felső szinten egy MI-modell ellenőrzi, mi számít biztonságos cselekedetnek, az akciós VLA alternatívákat ajánl fel, majd egy alacsonyabb szintű vezérlő kritikus biztonsági paraméterek (pl. mozgási erő, sebesség) mentén szabályozza a robot mozgását. A most kiadott helyi modell azonban önmagában csak egy VLA, így a fejlesztőknek maguknak kell beépíteniük ezeket a védelmi szinteket. A Google azt javasolja, hogy használjanak alapvető biztonsági API-t is, és mindenhol vezessenek be alacsony szintű kontrollt.

Robotok a mindennapokban

A Gemini Robotics On-Device modell elsősorban ott lehet életképes, ahol a felhőkapcsolat gyenge vagy egyáltalán nincs – például egészségügyi intézményekben, ahol az adatok helyben tartása különösen lényeges. Akik kipróbálnák az új robot-MI-t, jelentkezhetnek a Google bizalmas tesztelői programjába. Carolina Parada, a fejlesztés vezetője szerint az elmúlt három évben számos áttörés született, és még csak most járunk az út elején: a robotok jelenleg egy fejlesztéssel le vannak maradva a chatbot verziókhoz képest, de hamarosan őket is a legfejlettebb Gemini MI hajthatja majd.

2025, adminboss, arstechnica.com alapján


Legfrissebb posztok

Az örökké tartó vegyi anyagok végjátéka: napfényes csapda a PFAS-nak

MA 10:40

Az örökké tartó vegyi anyagok végjátéka: napfényes csapda a PFAS-nak

☀ A kutatók áttörést értek el az úgynevezett „örökéletű vegyi anyagok” – perfluor- és polifluoralkil anyagok (PFAS; Per- and Polyfluoroalkyl Substances) – lebontásában, amelyek rendkívül ellenállóak, és évezredekig szennyezhetik...

Sötét titkok a mesterséges intelligenciáról, Meta gyerekbiztonsági botrányba keveredett

MA 10:27

Sötét titkok a mesterséges intelligenciáról, Meta gyerekbiztonsági botrányba keveredett

Meta kiszivárgott MI-irányelvei óriási vihart kavartak, miután nyilvánosságra került, hogyan képezte a cég mesterséges intelligencia rendszereit a tabutémák ügyes kikerülésére. A vállalat elismerte a dokumentum hitelességét, és sürgős...

Ezért az árért kár lenne kihagyni ezt az elektromos fogkefét

MA 10:14

Ezért az árért kár lenne kihagyni ezt az elektromos fogkefét

Az Oral-B Genius X Limited most minden eddiginél kedvezőbb áron vásárolható meg, hiszen a modell ára 120 000 forinttal csökkent, így csupán 28 000 forintért (79,99 USD, azaz...

A trükk, amit talán nem tudtál a bankkártyaszámodról

MA 10:02

A trükk, amit talán nem tudtál a bankkártyaszámodról

🔑 Mindenki ismeri azt a bosszantó pillanatot, amikor egy internetes vásárlás végén, a fizetési oldalra érve beírod a bankkártyaszámodat, majd piros hibaüzenet ugrik fel: „Érvénytelen kártyaszám.” A gép szinte...

A denevérek bejelentkeztek a szállodába – és jött velük a veszettségpara

MA 09:53

A denevérek bejelentkeztek a szállodába – és jött velük a veszettségpara

🕵 Több mint 200 vendég szállt meg május és július között a Grand Teton Nemzeti Park egyik szállodájában anélkül, hogy tudtak volna arról: denevérek költöztek a tetőtérbe, és fennállt...

Az iráni elit tinédzser sírja és a skorpiós sminkdoboz titka

MA 09:27

Az iráni elit tinédzser sírja és a skorpiós sminkdoboz titka

🦗 Több mint 3000 éves, rendkívül gazdag sírt tártak fel Északkelet-Iránban, a távoli Észak-Horászán tartományban, a Tepe Chalow nevű régészeti helyszínen. Egy körülbelül 18 éves, feltehetően természetes okból elhunyt...

Ujjlenyomatok rejtőznek az ausztráliai csillogó barlangban

MA 09:15

Ujjlenyomatok rejtőznek az ausztráliai csillogó barlangban

👚 A GunaiKurnai nép földjén, az ausztráliai Victorian Alpok előhegyeiben húzódó mészkőbarlang mélyén különleges felfedezés született: látványos, csillogó barlangokban, a természetes fénytől elzárt helyeken ősi ujjnyomok bukkantak elő a...

APPok, Amik Ingyenesek MA, 8/17
APP

MA 09:12

APPok, Amik Ingyenesek MA, 8/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     One Hit. (iPhone/iPad)A One Hit egy gyors tempójú, nagyon addiktív játék, ahol a célod a forgó...

Miért olyan fontos a NASA-nak az első holdi reaktor megépítése

MA 09:03

Miért olyan fontos a NASA-nak az első holdi reaktor megépítése

🚀 Az ötlet, hogy a NASA atomreaktort épít a Holdra, elsőre sci-fi őrületnek tűnhet – pedig egyre inkább kézzelfogható valósággá válik. Az amerikai űrügynökség célja, hogy a következő öt...