Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?

Az MI vezérelte robotok végre szabadlábon – mi baj lehet ebből?
Hosszú évek fejlesztése után már nemcsak a virtuális MI-csevegőrobotok (mint a Gemini vagy a ChatGPT) számítanak áttörésnek, hanem a valódi, fizikai robotok is hatalmas előrelépést értek el. A Google DeepMind legújabb fejlesztése, a helyben futó VLA (Vision Language Action, vagyis képi-nyelvi-akció) modell már lehetővé teszi, hogy a robotok teljes önállósággal működjenek. Ez a rendszer a fejlesztők számára is testreszabhatóvá vált, így sosem látott rugalmasságot kínál a robotfejlesztés terén.

Generatív MI, mint robotagy

A robotika különösen nagy kihívás az MI számára, hiszen nemcsak egy programozott szoftverről van szó, hanem egy olyan gépről, amely folyamatosan alakítja a környezetét. Eddig a robotokat leginkább megerősítéses tanulással, lassan lehetett tanítani, és így minden lehetséges helyzetre külön kellett reagálást fejleszteni. Az új generatív MI azonban képes a világ multimodális értelmezésére, így akár teljesen új feladathoz is alkalmazkodhat – például ahogy a Gemini képes verset írni vagy képet generálni, ugyanígy képes robot-akciókat is létrehozni.

Robothadak a felhő nélkül

Az előző Gemini Robotics modell még hibrid rendszerként működött: a roboton egy kisebb MI futott, a bonyolultabb döntésekhez pedig felhőalapú feldolgozást használtak. A valós idejű robotika azonban a másodperc törtrésze alatt döntéseket követel, ezért a DeepMind most elérhetővé tette a kizárólag helyben futó VLA-t. Ez meglepően robusztusnak bizonyult: mindössze kicsivel marad el pontosságban a hibrid változathoz képest. Sőt, sok feladat már előzetes programozás nélkül is működik, és a fejlesztők csupán 50-100 példával új műveletekre taníthatják be a robotokat.

Tanítás néhány mozdulattal

A robotok betanítása főként úgynevezett demonstrációval történik: a kutató vezérli a robotot, hogy egy adott feladatot emberi irányítással hajtson végre, ezután a modell már önállóan is képes lesz hasonló műveleteket végrehajtani. Bár a szimulációk segítenek, a legösszetettebb, ügyességet igénylő feladatoknál továbbra is valódi, fizikai adat szükséges. Egyszerűbb dolgokat, például cipőfűzést vagy pólóhajtogatást azonban már a helyi VLA is hibátlanul elvégez, de egy bonyolultabb feladathoz, mint például egy szendvics elkészítése, feltehetően már fejlettebb MI szükséges.


Biztonság mindenekelőtt

A robotoknál kiemelten fontos a biztonság – elég csak elképzelni, mi történik, ha egy MI vezérelte gép hibázik. A Gemini Robotics ezért összetett, többrétegű védelmet alkalmaz: a felső szinten egy MI-modell ellenőrzi, mi számít biztonságos cselekedetnek, az akciós VLA alternatívákat ajánl fel, majd egy alacsonyabb szintű vezérlő kritikus biztonsági paraméterek (pl. mozgási erő, sebesség) mentén szabályozza a robot mozgását. A most kiadott helyi modell azonban önmagában csak egy VLA, így a fejlesztőknek maguknak kell beépíteniük ezeket a védelmi szinteket. A Google azt javasolja, hogy használjanak alapvető biztonsági API-t is, és mindenhol vezessenek be alacsony szintű kontrollt.

Robotok a mindennapokban

A Gemini Robotics On-Device modell elsősorban ott lehet életképes, ahol a felhőkapcsolat gyenge vagy egyáltalán nincs – például egészségügyi intézményekben, ahol az adatok helyben tartása különösen lényeges. Akik kipróbálnák az új robot-MI-t, jelentkezhetnek a Google bizalmas tesztelői programjába. Carolina Parada, a fejlesztés vezetője szerint az elmúlt három évben számos áttörés született, és még csak most járunk az út elején: a robotok jelenleg egy fejlesztéssel le vannak maradva a chatbot verziókhoz képest, de hamarosan őket is a legfejlettebb Gemini MI hajthatja majd.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 19:02

A Windows 11 tarol a Steamen, a Linux lendülete megtörik

🚀 A decemberi Steam-felmérés meglepő eredményeket hozott a PC-s játékosok rendszerválasztása terén: a Windows 11 használati aránya kiemelkedően nőtt, miközben a Linux népszerűség-növekedése gyakorlatilag megállt...

MA 18:49

A természet igazi fúrógépe: így működik a harkály teste

A harkályok elképesztő gépezetek: másodpercenként akár 13-szor kopognak, az ütés ereje pedig több mint harmincszorosa saját testsúlyuknak...

MA 18:34

A milliárdos MI-verseny: Amazon, Meta, Alphabet – most indul a nagy menet

🚀 Stanley Druckenmiller, a világhírű milliárdos befektető, újabb jelentős lépést tett az MI-részvények piacán...

MA 18:18

Az okoshűtő, ami helyetted intézi a bevásárlást

Fontos kérdés, hogy mennyire lehet automatizálni a mindennapi bevásárlást, és hogyan teheti egyszerűbbé egy hűtőszekrény a tervezést...

MA 18:04

A tudomány idei szenzációi, amikről kis híján lemaradtál

December izgalmas tudományos eredményekben bővelkedett: különleges őskövületektől kezdve az univerzum titkain át egészen a stresszoldó videojátékokig szinte minden területen születtek új, meglepő megállapítások...

MA 17:50

Az üstökös, amely véget vethetett a mamutok korának?

🚀 Egy lényeges felvetés, hogy 13 000 évvel ezelőtt egy üstökös robbanása pusztítást hozhatott Észak-Amerikára, ami drámai változásokat idézett elő az állatvilágban és az ősi emberi kultúrában...

MA 17:17

A Samsung Freestyle+ még sosem volt ilyen fényes és okos

💡 A Samsung felturbózta népszerű Freestyle hordozható projektorát: a Freestyle+ a korábbi verzió fényerejének kétszeresét, 430 ISO lumen fényerőt kínál...

MA 16:52

A 2026-os játékforradalom: brutális árrobbanás, abszurd fordulatok

🎮 Ebből következően érdemes megérteni, hogy a videojáték-ipar jövője egészen vad irányba halad a következő években...

MA 16:33

A parányi ideg, amely örök fiatalságot ad a szívnek

💚 Egy rejtett ideg, amely az agyat és a szívet köti össze, kulcsfontosságú lehet abban, hogy a szív tovább maradjon fiatalos...

MA 16:20

Az oltott dán nők szinte teljesen megszabadultak a legveszélyesebb HPV-típusoktól

😊 Több mint másfél évtizede zajlik Dániában a humán papillomavírus (HPV) elleni vakcinációs program, amelynek hosszú távú hatását most először sikerült részletesen vizsgálni...

MA 15:50

Az eltűnt bolygó titka: ütközés törölte a térképről?

Az elmúlt évtizedekben a NASA Hubble űrteleszkópja különös fényforrásokat figyelt meg a Fomalhaut csillag körül, alig 25 fényévre a Földtől...

MA 15:35

Az ifjú csillag kettős arcát tárja fel

A V1180 Cassiopeiae nevű fiatal csillag hosszú távú megfigyelése alaposan felbolygatta a csillagászok elképzeléseit a csillagok kialakulásáról...

MA 15:17

Az MI a hangra épít – jön a háború a kijelzők ellen?

Az OpenAI komolyan veszi a hangalapú MI fejlesztését: az elmúlt két hónapban több mérnöki, kutatási és termékfejlesztő csapatot szervezett át, hogy forradalmasítsa hangmodelleit...

MA 15:01

A kiválasztottaknak jár egy hónap ingyen ChatGPT Plus az OpenAI-tól

🎉 Ha már előfizettél a ChatGPT Plus-ra, ami havonta 7400 forintba (20 USD) kerül, most meglepetés érhet: lemondási szándék esetén az OpenAI automatikusan felajánlhat egy hónap ingyenes használatot...

MA 14:33

Az ausztrál nyugdíóriás kihátrál az MI-lázból

Ausztrália legnagyobb nyugdíjalapja, az AustralianSuper radikális döntésre készül: csökkenti globális részvénybefektetéseit, mivel az MI-láz a tengerentúlon egyre kockázatosabbnak tűnik...

MA 14:17

Az év első szuperholdja: farkasüvöltés és Jupiter-randevú

2026 első teliholdja, a Farkas Hold január 3-án ragyog majd fel, amikor a Föld épp a legközelebb jár a Naphoz...

MA 14:03

Az anonimitás végnapjai: a korhatár-ellenőrzés átírja az internetet

2025-re az amerikai lakosság fele már kénytelen igazolni a korát, ha bizonyos internetes tartalmakhoz szeretne hozzáférni...

MA 13:33

Az űrzsúfoltságra a Starlink válasza: lejjebb viszi a műholdakat

A Starlink idén mintegy 4400 műholdját bocsátja alacsonyabb pályára, hogy csökkentse az ütközés kockázatát...

MA 13:18

Afrika ősi kultúrájának sötét titka: a legkorábbi ismert kremáció

Mintegy 9500 évvel ezelőtt egy közösség Közép-Afrikában, a Malawi északi részén található Mount Hora lábánál egy apró termetű nőt hamvasztott el egy nyílt máglyán...