2025. 10. 04., 07:47

Mesterséges intelligencia, amely már képes meglepődni a világon

Mesterséges intelligencia, amely már képes meglepődni a világon
Az emberek már csecsemőkorukban felismerik, ha valami ellentmond a fizikai törvényeknek: például egy tárgy, amely hirtelen eltűnik, vagy szilárd testeken halad át, meglepetést okoz. Ezt a képességet, az ún. fizikai intuíciót már néhány modern MI-rendszer is kezdi elsajátítani. A Meta kutatói legújabb, Video Joint Embedding Predictive Architecture (V-JEPA) nevű modelljük segítségével azt vizsgálták, hogyan képes egy MI videók tanulmányozásán keresztül tanulni a világról, sőt – úgymond – „meglepődni” azon, ha valami szembe megy az addig tapasztalt világismeretével.

Absztrakciók szintjén gondolkodik a gép

Az önvezető autók fejlesztői jól tudják, mennyire nehéz egy MI-nek megbízhatóan értelmezni a környezetet. A hagyományos megközelítések, amelyek pixelről pixelre vizsgálják a képeket, gyakran elvesznek a részletekben: például túlságosan fókuszálhatnak a lombkorona mozgására, miközben figyelmen kívül hagyják a valóban fontos információkat, mint például a lámpa színét vagy az autók helyzetét.

Lényeges szempont, hogy a V-JEPA architektúra 2024-ben éppen azért készült, hogy ezt a problémát megoldja. Ahelyett, hogy minden egyes pixelt azonos súllyal kezelne, a rendszer magasabb szintű, úgynevezett látens (rejtett) reprezentációkat hoz létre, amelyekben már csak a lényegi információk maradnak meg. Így például egy henger vonalas ábrázolásából a rendszer csak a magasságot, szélességet, tájolást és helyzetet jegyzi fel számok formájában, nem az egész képet másolja le.

Így működik a V-JEPA rendszer

A V-JEPA három fő komponensből áll: két kódolóból (1-es és 2-es) és egy előrejelzőből. A rendszer a videók egyes képkockáin mindig ugyanazt a pixelkészletet maszkolja, és az így „kitakart” képeket először az 1-es kódoló dolgozza fel, létrehozva a látens reprezentációkat. A teljes, maszkolatlan képeket közben a 2-es kódoló értelmezi hasonló módon. Ezután az előrejelző a maszkolt képekből készült látens reprezentációk alapján megpróbálja megjósolni, mit „gondolt” volna a rendszer a teljes képek esetén.

Ezzel a módszerrel a rendszer olyan sémát tanul ki, amely csak a legszükségesebb információkat tartalmazza az adott feladathoz. Ennek köszönhetően, amikor konkrét célhoz, például akciófelismeréshez vagy jelenetazonosításhoz kell igazítani, már jóval kevesebb ember által címkézett adat szükséges, mintha az elejétől végig kellene megtanítani a rendszert az adott célfeladatra. Ráadásul az alap architektúrát különböző feladatokra is adaptálni lehet.

Az MI már meg tud lepődni

2024 februárjában tesztelték, mennyi „intuitív fizikai tudása” van a modellnek. A teszten, amelyen a videókban bemutatott események fizikai valószínűségét kellett felismerni (például egy tárgy eltűnik-e, amikor elhalad mögötte egy másik), a V-JEPA közel 98%-os pontosságot ért el – szemben a hagyományos, pixelen alapuló modellekkel, amelyek alig voltak jobbak, mint a véletlenszerű találgatás.

Külön érdekesség, hogy a V-JEPA a meglepettség mértékét is számszerűsíteni tudja. A kutatók elemezték, mennyire tér el az MI előrejelzése a valóságtól: ha például egy labda eltűnik egy tereptárgy mögött, majd mégsem jelenik meg újra, az előrejelzési hiba hirtelen nő, ami jól tükrözi a csecsemőkhöz hasonló meglepődést.


Mi hiányzik még az MI-ből?

Ennek ellenére, bár a V-JEPA már egészen közel áll ahhoz, ahogyan az agyunk tanul és modellezi a világot, hiányzik még egy-két lényeges komponens. Ilyen például a bizonytalanság megfelelő kezelése: ha a múltbeli információk alapján nem lehet pontosan megjósolni a jövő eredményeit, a modell ezt nem rögzíti kellő rugalmassággal.

V-JEPA 2: nagyobb tudás, még rövidebb emlékezet

2024 júniusától már a második generáció, a V-JEPA 2 is elérhető: a most 1,2 milliárd paraméteres modell több mint 22 millió videón tanult, sőt, robotikai alkalmazásokban is sikeresen tesztelték – mindössze kb. 60 órányi robotadat birtokában képes volt viszonylag bonyolult feladatokat is megoldani, például tárgyakat manipulálni.

Az újabb, nehezebb, úgynevezett Physion++ (Physion++) teszten azonban a V-JEPA 2 és a többi modell is csak alig haladta meg a véletlen eredményt. Ennek oka lényegében az, hogy a rendszer csak néhány másodperces videókat képes értelmezni és előrejelezni; minden, ami ennél hosszabb, gyorsan feledésbe merül. Így jelenleg még inkább egy aranyhal emlékezőképességére hasonlít, semmint egy emberére.

Összességében elmondható, hogy a V-JEPA áttörést hozott az MI-k fizikai intuíciójának fejlesztésében: a gép immár csodálkozva tekinthet a világra, még ha memóriája egyelőre rövid is marad.

2025, adminboss, www.quantamagazine.org alapján

Legfrissebb posztok

MA 14:01

Az Autopilot-botrány: a Tesla hadat üzen a kaliforniai hatóságoknak

A Tesla beperelte a kaliforniai Közlekedési Hatóságot (DMV), miután az megtiltotta az Autopilot és a Full Self-Driving elnevezések használatát az autók értékesítésekor...

MA 13:59

A mikroműanyagok rejtélye: ártanak nekünk, vagy túlzás a félelem?

🤔 Érdemes megvizsgálni, mennyire megalapozottak a mikroműanyagok egészségkárosító hatásairól szóló figyelmeztetések. Az elmúlt években félelmet keltő hírek terjedtek el: mikroműanyagok már mindenütt jelen vannak, az élelmiszerektől a vízen át a tisztítószerekig, és lassan felhalmozódnak a szervezetünkben – legalábbis ezt állították...

MA 13:40

Az MI leleplezi a nyílt forráskódú világ 500+ sebezhetőségét

A szoftvervilágban most olyan történések zajlanak, amelyek alapjaiban rengetik meg azt, amit eddig a biztonságról gondoltunk...

MA 13:20

A Pentagon titkos hálózatain bukkant fel Elon Musk MI-je

🕵 Az amerikai védelmi minisztérium hamarosan hadrendbe állítja Elon Musk tulajdonában lévő Grok nevű MI-t, amelyet titkos katonai rendszerekben is bevethetnek...

MA 12:01

Az OpenClaw MI-ügynöke kis híján lenullázta a teljes postaládát

📥 A Meta egyik MI-biztonsági kutatója, Summer Yue szerint kis híján komoly adatvesztésbe torkollott egy kísérlete az OpenClaw ügynökkel...

MA 11:39

Az új GL.iNet Flint 3: Wi‑Fi 7, sci-fibe csomagolva

🚀 A GL.iNet Flint 3 BE9300 router igazi erőmű a Wi‑Fi 7-es szabvány terén, és első látásra akár egy sci-fi regényből is érkezhetett volna...

MA 11:21

Az MI felforgat mindent: hová tűnt a befektetők hűsége?

Az MI-őrület mostanra teljesen felforgatta a kockázatitőke-piac jól bevált szabályait. A közelmúltban az OpenAI hatalmas tőkebevonásának árnyékában az Anthropic is soha nem látott, 10 800 milliárd forint értékű befektetést szerzett...

MA 11:02

Az új Dyson PencilWash tarol: ultravékony és szuperkönnyű

A Dyson most mutatta be legújabb padlótisztító találmányát, amely szinte forradalmasítja a takarítást az otthonokban...

MA 10:56

A jövő páncélszekrénye: üvegmemória, amely túléli az évszázadokat

Az emberiség egyre több adatot termel és gyűjt, minden eddiginél gyorsabb ütemben – a mesterséges intelligencia elterjedésével pedig a tárolandó információ mennyisége robbanásszerűen nő...

MA 10:46

Itt a várva várt élő helymegosztás a Google Messages-ben

Az elmúlt években a Google Messages egy egyszerű üzenetküldő alkalmazásból fejlett, modern platformmá nőtte ki magát Androidon...

MA 10:37

Az MI‑pánik újra padlóra küldi a kriptoárfolyamokat

Az utóbbi hét napban a főbb kriptodevizák látványos, 8–11%-os veszteségeket szenvedtek el...

MA 10:19

A baktériumok belülről falják fel a daganatokat

💉 Különleges génmódosítással készült baktériumok hamarosan képesek lehetnek arra, hogy felfalják a rákos daganatokat belülről kifelé...

MA 10:02

Az MI-ügynökök vadnyugatának vége: a Google tiltólistára teszi az OpenClaw-t

🕵 A hétvégén kitört a botrány a Google körül, miután számos fejlesztő hozzáférését korlátozták a népszerű Antigravity-platformhoz...

MA 09:56

Az ember visszatér a Holdra, az egér az új szupervakcinára tüsszent

2026. február 23. Az elmúlt hét bővelkedett a meglepetésekben: váratlan fordulat a Moderna új mRNS-influenza-vakcinája engedélyezése körül, biztató kísérleti eredmények egy univerzális, belélegezhető oltásról, veszélyesnek bizonyuló légszennyezés és egy sivatagi dinólelelet, ami átírja a spinosauridák történetét...

MA 09:46

Az MI energiaéhsége: Sam Altman mindent bevetne, hogy ne legyen igazuk

Sam Altman, az OpenAI vezérigazgatója újabb hullámokat keltett azzal, hogy minden MI-t támadó hangot visszautasított az India AI Impact csúcstalálkozón, mondván, igazán elfogadhatatlan az a „csúnya” vád, hogy sok vizet és energiát zabál az MI – hiszen tessék, az emberek is 20 évig csak esznek, nőnek és tanulnak, mire okossá válnak...

MA 09:37

Az indiai Xflow felforgatja a nemzetközi vállalati pénzáramlást

🌍 Az Xflow egy indiai fintech startup, amely jelentős támogatást kapott a Stripe-tól és a PayPal Ventures-től, miután 6 milliárd forintnyi (16,6 millió USD) tőkét vont be...

MA 09:28

Az Atlanti-óceán ősi erői feltártak egy hatalmas föld alatti kanyont

Mintegy 1000 kilométerre Portugália partjaitól, mélyen az Atlanti-óceán alatt, egy hatalmas föld alatti kanyonrendszer húzódik, amely minden szárazföldi képződményt felülmúl – köztük a Nagy-kanyont (Grand Canyon) is...

MA 09:20

Az agy rejtélyes átalakulása menopauzában: amit még nem értünk

🧠 A menopauza komoly változást hoz a nők életében, és gyakran nem csupán testi tüneteket okoz...

MA 09:10

A nagy hóháború: kinek a dolga a lapátolás?

❄ Kezdetben egy hóvihar igazi próbája annak, mennyire működik a társadalmi szerződés...

MA 09:01

A Fairphone végre felzárkózik: jön az Android 16

Na jó, szóval végre érkezik az Android 16 a Fairphone Gen 6-ra – és ha már a nagy riválisoknál ez megoldódott, igazán ideje volt, nem?..

MA 08:46

A spanyol hatóságok lecsaptak: hacktivisták a kormány elleni DDoS mögött

Négy feltételezett hacktivistát vett őrizetbe a spanyol Polgárőrség, akik a gyanú szerint több kormányzati minisztérium, politikai párt és közintézmény ellen indítottak kibertámadásokat...

MA 08:37

A rekord dől: nullaórás szerződések csapdájába esnek egyre többen

📈 A nullaórás szerződések száma rekordot döntött az Egyesült Királyságban, mivel decemberben már 1,23 millió munkavállalót érintett ez a foglalkoztatási forma...

MA 08:29

A leggyengébb láncszem már nem az identitás, hanem a hozzáférés

Megemlíthető továbbá, hogy a vállalati biztonságban évek óta központi szerepet tölt be a felhasználói identitás...

MA 08:19

Az új Microsoft-játékfőnök hadat üzen a gyenge MI-nek

🗡 Lényeges szempont, hogy a Microsoft játékdivíziója élére idén Asha Sharma került, aki korábban két évig a cég egy másik részlegét vezette...

MA 07:55

Az Artemis rakéta újabb csúszása: ismét halasztják a Hold-missziót

A fejlemények villámgyorsan követték egymást az Artemis II történetében: a NASA történelmi holdrakétája újabb akadályba ütközött, miután egy héliumáramlási probléma miatt ismét csúszik a régóta várt indítás...

MA 07:37

Az amerikai gazdák fellázadnak: milliárdos adatközpont-ajánlatokra mondanak nemet

Májusban két idegen kopogtatott Ida Huddleston, egy kentucky-i gazdálkodó ajtaján. Több mint 11 milliárd forint értékű szerződést hoztak, cserébe a 260 hektáros, generációk óta családja megélhetését biztosító gazdaságáért...

MA 07:28

Az okosórák földrengéskor is életet menthetnek – telefon nélkül

Fontos kérdés, hogy mennyire lehet önálló vészhelyzeti riasztásra számítani a csuklón lévő okoseszközökre...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/24

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     OneLLM : Private & Online LLM (iPhone/iPad)A OneLLM egy korszerű, kétmotoros mesterséges intelligencia-megoldás, amely a legújabb AI technológiát hozza el közvetlenül az eszközödre...

MA 07:10

Az Autopilot-botrány: ki győz, Tesla vagy Kalifornia?

Mindenki azt hitte, hogy a Tesla végre lezárta Kaliforniával az évek óta húzódó vitáját, de Elon Musk és csapata nem hagyta annyiban...