Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?

Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?
Hosszú évek fejlesztése után már nemcsak a virtuális MI-csevegőrobotok (mint a Gemini vagy a ChatGPT) számítanak áttörésnek, hanem a valódi, fizikai robotok is hatalmas előrelépést értek el. A Google DeepMind legújabb fejlesztése, a helyben futó VLA (Vision Language Action, vagyis képi-nyelvi-akció) modell már lehetővé teszi, hogy a robotok teljes önállósággal működjenek. Ez a rendszer a fejlesztők számára is testreszabhatóvá vált, így sosem látott rugalmasságot kínál a robotfejlesztés terén.

Generatív MI, mint robotagy

A robotika különösen nagy kihívás az MI számára, hiszen nemcsak egy programozott szoftverről van szó, hanem egy olyan gépről, amely folyamatosan alakítja a környezetét. Eddig a robotokat leginkább megerősítéses tanulással, lassan lehetett tanítani, és így minden lehetséges helyzetre külön kellett reagálást fejleszteni. Az új generatív MI azonban képes a világ multimodális értelmezésére, így akár teljesen új feladathoz is alkalmazkodhat – például ahogy a Gemini képes verset írni vagy képet generálni, ugyanígy képes robot-akciókat is létrehozni.

Robothadak a felhő nélkül

Az előző Gemini Robotics modell még hibrid rendszerként működött: a roboton egy kisebb MI futott, a bonyolultabb döntésekhez pedig felhőalapú feldolgozást használtak. A valós idejű robotika azonban a másodperc törtrésze alatt döntéseket követel, ezért a DeepMind most elérhetővé tette a kizárólag helyben futó VLA-t. Ez meglepően robusztusnak bizonyult: mindössze kicsivel marad el pontosságban a hibrid változathoz képest. Sőt, sok feladat már előzetes programozás nélkül is működik, és a fejlesztők csupán 50-100 példával új műveletekre taníthatják be a robotokat.

Tanítás néhány mozdulattal

A robotok betanítása főként úgynevezett demonstrációval történik: a kutató vezérli a robotot, hogy egy adott feladatot emberi irányítással hajtson végre, ezután a modell már önállóan is képes lesz hasonló műveleteket végrehajtani. Bár a szimulációk segítenek, a legösszetettebb, ügyességet igénylő feladatoknál továbbra is valódi, fizikai adat szükséges. Egyszerűbb dolgokat, például cipőfűzést vagy pólóhajtogatást azonban már a helyi VLA is hibátlanul elvégez, de egy bonyolultabb feladathoz, mint például egy szendvics elkészítése, feltehetően már fejlettebb MI szükséges.


Biztonság mindenekelőtt

A robotoknál kiemelten fontos a biztonság – elég csak elképzelni, mi történik, ha egy MI vezérelte gép hibázik. A Gemini Robotics ezért összetett, többrétegű védelmet alkalmaz: a felső szinten egy MI-modell ellenőrzi, mi számít biztonságos cselekedetnek, az akciós VLA alternatívákat ajánl fel, majd egy alacsonyabb szintű vezérlő kritikus biztonsági paraméterek (pl. mozgási erő, sebesség) mentén szabályozza a robot mozgását. A most kiadott helyi modell azonban önmagában csak egy VLA, így a fejlesztőknek maguknak kell beépíteniük ezeket a védelmi szinteket. A Google azt javasolja, hogy használjanak alapvető biztonsági API-t is, és mindenhol vezessenek be alacsony szintű kontrollt.

Robotok a mindennapokban

A Gemini Robotics On-Device modell elsősorban ott lehet életképes, ahol a felhőkapcsolat gyenge vagy egyáltalán nincs – például egészségügyi intézményekben, ahol az adatok helyben tartása különösen lényeges. Akik kipróbálnák az új robot-MI-t, jelentkezhetnek a Google bizalmas tesztelői programjába. Carolina Parada, a fejlesztés vezetője szerint az elmúlt három évben számos áttörés született, és még csak most járunk az út elején: a robotok jelenleg egy fejlesztéssel le vannak maradva a chatbot verziókhoz képest, de hamarosan őket is a legfejlettebb Gemini MI hajthatja majd.

2025, adminboss, arstechnica.com alapján


Legfrissebb posztok

Kína klímavállalása, most tényleg érdemes figyelni
MA 00:00

Kína klímavállalása, most tényleg érdemes figyelni

🌍 Különösen fontos hangsúlyozni, hogy amikor Kína klímacélokat tűz ki, arra a világnak érdemes odafigyelnie. A pekingi vezetés ugyanis általában csak olyasmit ígér meg, amit valóban szándékában áll teljesíteni,...

csütörtök 23:30

Az MI-vezérelt műholdas net mostantól mindenhol elérhető

A T-Mobile T-Satellite szolgáltatása, amely a Starlink műholdakat használja, már nemcsak SMS-ekhez működik, hanem több alkalmazást is támogat. Mostantól például az AllTrails, az AccuWeather, az X (korábban Twitter),...

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján
csütörtök 23:02

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján

🚀 A Szaturnusz jeges holdja, az Enceladus ismét felkeltette a tudósok figyelmét, köszönhetően a Cassini űrszonda adatainak friss elemzéséhez. A felszín alatt rejtőző óceánból feltörő jégszemcsékben szokatlanul összetett szerves...

csütörtök 22:58

Az MI tuning új korszaka: bárki finomhangolhatja a gépi tanulást

A Thinking Machines Lab, amelyet az OpenAI egykori vezéralakjai, köztük Mira Murati alapítottak, első termékével robban be az MI világába. Az újdonság neve Tinker, és célja, hogy kutatók,...

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet
csütörtök 22:01

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet

⚠ A Red Hat OpenShift AI szolgáltatásában súlyos, 9,9-es veszélyességű sebezhetőséget fedeztek fel, amely lehetőséget ad távoli támadóknak arra, hogy minimális jogosultsággal is átvegyék az egész platform irányítását. Ez...

Az MI-sokkoló: A robotok még nem vették el a munkádat
csütörtök 21:59

Az MI-sokkoló: A robotok még nem vették el a munkádat

🤖 A Yale Egyetem közgazdászai alaposan megvizsgálták, mi történt az amerikai munkaerőpiacon azóta, hogy 2022 novemberében megjelent a ChatGPT és a többi generatív MI-rendszer. Megnyugtató következtetésük szerint az MI-forradalom...

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek
csütörtök 21:30

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek

Az Apple jelentősen felgyorsította az okosszemüvegek fejlesztését, miközben félretette a régóta tervezett, könnyebb Vision Pro headset elkészítését. A cég legalább kétféle szemüvegen dolgozik: az egyik egy kijelző nélküli...

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel
csütörtök 21:02

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel

Az őszi nagy vásárlási láz még el sem kezdődött, de a robotporszívók piacán már most komoly akciókba futhat bele az, aki előre gondolkodik. Idén az olyan ismert gyártók,...

csütörtök 21:01

A szaturnuszi hold izgalmas titka: újabb jelek az élet lehetőségére

Enceladus, a Szaturnusz hatodik legnagyobb holdja ismét a tudományos érdeklődés középpontjába került. A Cassini űrszonda (Cassini) 2017-ben befejeződött küldetése során fedezte fel, hogy a hold déli pólusán hatalmas...