A WorldVLA egy új generációs MI-modell, amely nemcsak képeket és nyelvet, hanem emberi cselekvéseket is képes értelmezni és előállítani. Az új rendszer az úgynevezett Vízió–Nyelv–Akció (Vision-Language-Action, VLA) modell és a világmodell ötvözésével egyetlen keretrendszerben működik. Képes előrejelezni a jövőbeli képeket úgy, hogy figyelembe veszi a mozgásokat és a képi tartalmat is. Így jobban érti a környezet fizikai szabályait, és ennek köszönhetően pontosabban tud akciókat generálni.
A világmodell és az akciómodell közös ereje
A WorldVLA nem csupán a világmodellek vagy az önálló akciómodellek funkcióit valósítja meg: a kettő összehangolásával jelentősen jobb teljesítményt ér el. Az akciómodell az aktuális képi információk alapján dönti el a következő lépést, miközben segíti a világmodell vizuális generálását. Az együttműködés révén hatékonyabbá válik a jövőbeli események előrejelzése és az akciók tervezése.
Új figyelemmaszk az előrejelzési hibák ellen
Megfigyelhető, hogy az akciómodellek hajlamosak romlani, amikor maguk által generált cselekvéssorozatokat hoznak létre: a korábbi lépések hibái átterjednek a következőkre. Ennek orvoslására a kutatók figyelemmaszkoló stratégiát vezettek be, amely a pillanatnyi akció generálásakor szelektíven elrejti a korábbi mozdulatokat. Ennek köszönhetően jelentősen javult a cselekvéssorozat pontossága, különösen az úgynevezett akcióblokk-generálási feladatban.
2025, adrienne, arxiv.org alapján
Legfrissebb posztok
MA 06:15
Új korszak indult szerdán az USA-ban: az FDA rábólintott a Foundayo nevű GLP-1 tablettára, ami mostantól kapható lesz...
MA 06:09
Érdekes felvetés, hogy a mesterséges intelligencia bevezetése milyen hatással lehet egy cég versenyképességére...
MA 06:05
Április 2. tele van fordulópontokkal: Florida első európai észlelése, a Falkland-háború kirobbanása, Haile Selassie trónra lépése és nagy port kavart terrortámadások, illetve merényletek formálták a világot...
MA 06:01
Mitchell H. Katz, a New York-i egészségügyi óriás, a NYC Health + Hospitals vezérigazgatója szerint, ha mesterséges intelligencia végezné az elsődleges radiológiai értékeléseket, jelentős összegeket lehetne megtakarítani...
szerda 21:56
A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...
szerda 21:46
Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...
szerda 21:26
🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...
szerda 20:46
🌫 Felmerül a kérdés, hogy mennyire vagyunk biztonságban, ha a globális felmelegedést sikerül mérsékelt szinten tartani...
szerda 20:23
A tavaszi esték hűvös leheletére legtöbben gyorsan visszavonulnak a négy fal közé, amikor kint elfogy a meleg...
szerda 20:12
Képzeld el, hogy mindenki arról beszél, mennyire menők az iráni hekkerek, miközben a valóság egészen más képet mutat...
szerda 20:02
Az okos otthoni biztonsági rendszered mostantól sokkal hatékonyabb lehet: a legújabb Matter 1...
szerda 19:58
📚 Svédországban egyre inkább háttérbe szorulnak a digitális eszközök a tantermekben: a hagyományos könyvek és a kézírás ismét előtérbe kerülnek...
szerda 19:45
🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...
szerda 19:35
Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...
szerda 19:23
Felmerül a kérdés, hogy vajon tényleg mindenkinek szüksége lenne-e a Gmail vadonatúj, MI-alapú postaládájára...
szerda 19:12
A fehérgalléros dolgozók közül sokan aggódnak, hogy az MI miatt veszélybe kerülhetnek a munkahelyeik...
szerda 18:57
Az automatizált ügyfélszolgálat egyre több vállalatnál válik normává, ám a felhasználók sokszor frusztráló élményekről számolnak be...
szerda 18:45
Washingtonban mondott beszédében Harry herceg kemény hangot ütött meg a közösségi oldalak működésével kapcsolatban, amikor elismerően szólt két friss, nagy horderejű perről, amelyek főként a gyerekek védelmét érintik...
szerda 18:34
😴 A korán kezdődő munkanapok milliók mindennapjait keserítik meg, hiszen a hajnalban kezdődő műszak biológiailag kényszerű kompromisszum: az agy ilyenkor még alvásra van programozva, a teljesítmény pedig jelentősen csökken...
szerda 18:23
🚀 Elon Musk újra a figyelem középpontjában: a SpaceX titokban beadta a tőzsdei bevezetéshez szükséges papírokat az Egyesült Államok Értékpapír- és Tőzsdebizottságához...
szerda 17:56
Jack Dorsey, a Block alapítója és vezérigazgatója szerint a vállalatok egy új működési korszak küszöbén állnak, amelyben a középvezetői réteg szerepét nagyrészt a mesterséges intelligencia veheti át...
szerda 17:34
A Google sürgősséggel adott ki frissítést a Chrome böngészőhöz, miután felfedeztek egy negyedik, ebben az évben aktívan kihasznált nulladik napi hibát...
szerda 17:25
Ez a jelenség jól illusztrálható azzal, hogy az Apple, amely évtizedeken át forradalmasította a technológiai világot és termékeivel új szokásokat teremtett, ma saját történetének egyik legkritikusabb szakaszához érkezett...
szerda 17:13
Egy kanadai tinédzser élete teljesen felborult, amikor szinte egyik napról a másikra testét ismeretlen eredetű csalánkiütések lepték el, valahányszor víz érte a bőrét...
szerda 17:01
Érdemes megvizsgálni, hogy a tokenizáció, vagyis eszközök blokklánc-alapú nyilvántartása és átruházása miért vált az utóbbi évek egyik legnagyobb kriptós hívószavává...
szerda 16:46
🚧 A gyerekek elképesztő mennyiségben néznek mesterséges intelligenciával gyártott meséket és videókat a YouTube-on...
szerda 16:02
🛡 2026 tavaszán a világ legnagyobb kiberbiztonsági konferenciáján futótűzként terjedt egy nyugtalanító felismerés: soha nem volt még ilyen rövid az ablak, amelyen keresztül a védelmezők megállíthatják a támadásokat...
szerda 15:57
💉 Ilyen lehet például, amikor egy szokatlan molekulára bukkanunk egy rettegett ellenség felszínén...
szerda 15:45
💪 A Gemini-alapú Fitbit egészségügyi edzője mostantól még több funkcióval segíti a felhasználókat...