Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?

Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?
Hosszú évek fejlesztése után már nemcsak a virtuális MI-csevegőrobotok (mint a Gemini vagy a ChatGPT) számítanak áttörésnek, hanem a valódi, fizikai robotok is hatalmas előrelépést értek el. A Google DeepMind legújabb fejlesztése, a helyben futó VLA (Vision Language Action, vagyis képi-nyelvi-akció) modell már lehetővé teszi, hogy a robotok teljes önállósággal működjenek. Ez a rendszer a fejlesztők számára is testreszabhatóvá vált, így sosem látott rugalmasságot kínál a robotfejlesztés terén.

Generatív MI, mint robotagy

A robotika különösen nagy kihívás az MI számára, hiszen nemcsak egy programozott szoftverről van szó, hanem egy olyan gépről, amely folyamatosan alakítja a környezetét. Eddig a robotokat leginkább megerősítéses tanulással, lassan lehetett tanítani, és így minden lehetséges helyzetre külön kellett reagálást fejleszteni. Az új generatív MI azonban képes a világ multimodális értelmezésére, így akár teljesen új feladathoz is alkalmazkodhat – például ahogy a Gemini képes verset írni vagy képet generálni, ugyanígy képes robot-akciókat is létrehozni.

Robothadak a felhő nélkül

Az előző Gemini Robotics modell még hibrid rendszerként működött: a roboton egy kisebb MI futott, a bonyolultabb döntésekhez pedig felhőalapú feldolgozást használtak. A valós idejű robotika azonban a másodperc törtrésze alatt döntéseket követel, ezért a DeepMind most elérhetővé tette a kizárólag helyben futó VLA-t. Ez meglepően robusztusnak bizonyult: mindössze kicsivel marad el pontosságban a hibrid változathoz képest. Sőt, sok feladat már előzetes programozás nélkül is működik, és a fejlesztők csupán 50-100 példával új műveletekre taníthatják be a robotokat.

Tanítás néhány mozdulattal

A robotok betanítása főként úgynevezett demonstrációval történik: a kutató vezérli a robotot, hogy egy adott feladatot emberi irányítással hajtson végre, ezután a modell már önállóan is képes lesz hasonló műveleteket végrehajtani. Bár a szimulációk segítenek, a legösszetettebb, ügyességet igénylő feladatoknál továbbra is valódi, fizikai adat szükséges. Egyszerűbb dolgokat, például cipőfűzést vagy pólóhajtogatást azonban már a helyi VLA is hibátlanul elvégez, de egy bonyolultabb feladathoz, mint például egy szendvics elkészítése, feltehetően már fejlettebb MI szükséges.


Biztonság mindenekelőtt

A robotoknál kiemelten fontos a biztonság – elég csak elképzelni, mi történik, ha egy MI vezérelte gép hibázik. A Gemini Robotics ezért összetett, többrétegű védelmet alkalmaz: a felső szinten egy MI-modell ellenőrzi, mi számít biztonságos cselekedetnek, az akciós VLA alternatívákat ajánl fel, majd egy alacsonyabb szintű vezérlő kritikus biztonsági paraméterek (pl. mozgási erő, sebesség) mentén szabályozza a robot mozgását. A most kiadott helyi modell azonban önmagában csak egy VLA, így a fejlesztőknek maguknak kell beépíteniük ezeket a védelmi szinteket. A Google azt javasolja, hogy használjanak alapvető biztonsági API-t is, és mindenhol vezessenek be alacsony szintű kontrollt.

Robotok a mindennapokban

A Gemini Robotics On-Device modell elsősorban ott lehet életképes, ahol a felhőkapcsolat gyenge vagy egyáltalán nincs – például egészségügyi intézményekben, ahol az adatok helyben tartása különösen lényeges. Akik kipróbálnák az új robot-MI-t, jelentkezhetnek a Google bizalmas tesztelői programjába. Carolina Parada, a fejlesztés vezetője szerint az elmúlt három évben számos áttörés született, és még csak most járunk az út elején: a robotok jelenleg egy fejlesztéssel le vannak maradva a chatbot verziókhoz képest, de hamarosan őket is a legfejlettebb Gemini MI hajthatja majd.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 09:41

Az elektromos autók akkumulátorai áttörés előtt: itt az új korszak

Az LFP (lítium-vas-foszfát) akkumulátorok terjedése új lendületet kapott, miután 2022-ben lejártak a legfontosabb szabadalmak az alapkémiára...

MA 09:34

Az olasz fonalóriás is bedőlt: napvilágra kerültek a sztárdivat titkai

Fulgar, a H&M, az Adidas, a Wolford és a Calzedonia szintetikus fonalbeszállítója kénytelen elismerni, hogy zsarolóvírus-támadás érte, amelyet a hírhedt RansomHouse-csoporthoz kötnek...

MA 09:17

A mikrobák okos koktéljai átírják a növényvédelem szabályait

A Kínai Tudományos Akadémia kutatói áttörő módszert fejlesztettek ki, amellyel mesterségesen összeállított, jótékony mikrobaközösségekkel jelentősen javítható a növények egészsége, és elnyomhatók a talajeredetű betegségek...

MA 09:02

Az Android-appok zabálják az akkut? Érkezik a Google-riasztás!

Az okostelefon-felhasználók örülhetnek: a Google bejelentette, hogy a Play Áruházban hamarosan külön megjelölést kapnak azok az Android-alkalmazások, amelyek túlzott háttértevékenységükkel rengeteg akkumulátort fogyasztanak...

MA 08:25

Az Ozempic-láz ára: amiről eddig nem beszéltünk

💸 Megemlíthető továbbá, hogy a legújabb GLP-1 gyógyszerek, mint az Ozempic, a Wegovy és a Mounjaro nagymértékű fogyást ígérnek, de most olyan rizikók kerültek előtérbe, amelyek eddig kevés figyelmet kaptak...

MA 08:19

Az emberszabásúak észjárása: Tényleg majdnem olyan okosak, mint mi?

🐒 A racionalitást évezredek óta az ember kizárólagos jellemzőjének tartották. Már Arisztotelész is azt állította, hogy az emberek abban különböznek az állatoktól, hogy képesek bizonyítékok alapján átgondolni, sőt felülbírálni saját nézeteiket...

MA 08:08

Az űrszemét tartotta fogva a hazatérő kínai űrhajósokat

Három kínai űrhajós pénteken tért vissza a Földre, miután több mint kilencnapos késéssel hagyhatták el a kínai űrállomást...

MA 07:58

A mesterséges intelligencia zsarolható? Meglepő a válasz

A legfrissebb kutatások azt vizsgálták, mennyire tudnak a legnépszerűbb MI-modellek ellenállni a manipulációnak, amikor káros vagy illegális tartalmat próbálnak kicsikarni belőlük...

MA 07:49

A Plejádok rejtett rokonsága – az ég titkos családfája

Évszázadok óta ismert látvány a Pleiadok csillaghalmaza, más néven a Hét Nővér, amelyről eddig úgy hittük, csak egy kis, ragyogó csillagcsalád...

MA 07:42

Jön az új vezérigazgató az Apple élére?

Az Apple a hírek szerint felgyorsította utódlási terveit, és könnyen lehet, hogy Tim Cook, a cég 65 éves vezérigazgatója már jövőre leköszön...

MA 07:36

A fotonikus csodachip szivárványt varázsol egyetlen lézerből

🌈 A fény manipulálása egyre fontosabb szerepet kap a tudományban és az iparban, legyen szó szuperszámítógépek adatfeldolgozásáról vagy precíziós órákról...

MA 07:18

Az 55 millió éves murgoni krokodiltojáshéjak meglepő titkai

🐋 Érdekes, hogy Ausztrália egyik legjelentősebb őslénytani kincseire éppen egy alig 2 000 lelkes, Brisbane-től 250 kilométerre fekvő kisváros, Murgon környékén bukkantak rá a kutatók...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 11/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     LightTrac (iPhone/iPad)A LightTrac egy innovatív, fizikai alapokon nyugvó alkalmazás, amely lehetővé teszi a szabadtéri fényviszonyok pontos megtervezését...

MA 07:10

Az első pillantás a szupernóva rejtett arcára – végre szétszakadt a csillag

Az Európai Déli Obszervatórium óriástávcsövének köszönhetően először láthatták csillagászok, ahogy egy robbanó csillag kitörése áttöri a felszínt...

MA 07:01

Az MI forradalmasítja a Tejútrendszer szimulációját

🚀 A csillagászatban jelentős áttörést hozott, hogy kutatók elsőként készítettek olyan Tejútrendszer-modellt, amely több mint 100 milliárd csillagot követ nyomon egyenként...

MA 06:58

Az MI-óriások új titkos fegyvere: fénysebességű chipjelek

A mai adatközpontokban a sebesség elérte a rézalapú összeköttetések határát: a gyorsabb kommunikáció már elképzelhetetlen a jelenlegi technológiával, mivel a jelek rövid távon is elcsillapodnak, és a rendszer energiaigénye az egekbe szökik...

MA 06:49

A Google 14 ezermilliárdot önt texasi adatközpontokba

A Google sosem látott mértékű fejlesztést jelentett be: a következő két évben mintegy 14 ezer milliárd forintot (40 milliárd dollárt) költ texasi adatközpontokra...

MA 06:34

Az űridőjárás tombol, a pokolbéli disznók visszatérnek

Ez a hét tele volt csillagászati izgalmakkal: komoly napkitörések zavarták meg a Föld környezetét, üstökösök robbantak fel, közben előkerültek földtörténeti rémek, és a kvantumgépek okozta veszélyek is egyre fenyegetőbbek...

MA 06:25

Az MI felforgatja a Windowst – lázadnak a fejlesztők

A Microsoft elnöke, Pavan Davuluri szerint a Windows ügynökjellegű operációs rendszerré fejlődik, amely összeköti az eszközöket, a felhőt és az MI-t, hogy bárhonnan biztosítsa az intelligens, biztonságos munkát és a hatékonyabb munkavégzést...