Még az MI is kételkedik magában, ha a kacsa nyúllá változik

Még az MI is kételkedik magában, ha a kacsa nyúllá változik
Az MI-képfeldolgozás legújabb fejlesztései egyre inkább az emberi gondolkodás sajátosságait utánozzák – többek között abban is, hogy néha olyan mintákat „látnak”, amelyek valójában nem is léteznek. Erre kiváló példa, hogy a ChatGPT legfrissebb, GPT-5-alapú változata képes teljesen egyértelmű képen is optikai illúziót észlelni, ahol az emberek számára egyáltalán nincs semmiféle kétértelműség.

Optikai illúziók ott is, ahol nincsenek

A Harvard Egyetem egyik pszichológia professzora, Tomer Ullman, egy kísérletéhez csupán egy kacsa képét töltötte fel a ChatGPT rendszerébe. Ennek ellenére a ChatGPT azonnal felismerte (pontosabban félreismerte) az illusztrációt: szerinte ez egy híres kacsa-nyúl optikai illúzió (Duck-Rabbit illusion). Pedig ebben az esetben a kép kizárólag egy kacsát ábrázolt, semmiféle vizuális kétértelműséget nem tartalmazott.

Érdemes megemlíteni, hogy a ChatGPT részletesen el tudta magyarázni, hogyan lehetne a képen a kacsán túl a nyulat is meglátni – mindezt pusztán statisztikai következtetések alapján, nem a valóban látott kép alapján.

Az illúzió-illúzió jelensége

Ullman legújabb tanulmányában – „Az illúzió-illúzió: amikor a látásalapú nyelvi MI-k illúziókat látnak ott, ahol nincsenek” („The Illusion-Illusion: When Vision-Language Models See Illusions Where There Are None”) – rámutat, hogy az ilyen téves felismerések fontos diagnosztikai eszközök lehetnek mind a kognitív tudományban, mind a mesterséges intelligencia kutatásában. Az emberi agy észlelési hibái, például az apofénia (amikor jelentés nélküli mintákban is ismerős alakzatot látunk, például egy felhőben vagy kávéfoltban emberi arcot), azért érdekesek, mert megmutatják a valóság és annak észlelése közötti szakadékot.

Amikor azonban a mesterséges intelligencia hibázik, sok kutató párhuzamot próbál vonni az emberi apoféniával. Ullman azonban hangsúlyozza, hogy ez a fajta tévedés inkább egy eltérő típusú gondolkodási rövidítés: az MI hajlamos azt feltételezni, hogy egy új probléma nagyon hasonlít egy korábbihoz, ezért automatikusan ugyanúgy kezeli, és így hibás következtetésre jut.

Különböző MI-modellek, különböző hibák

A kutató több általánosan használt, látásalapú nyelvi MI-modellt vizsgált: GPT-4o, Claude 3, Gemini Pro Vision, miniGPT, Qwen-VL, InstructBLIP, BLIP2, LLaVA-1.5. Mindegyik modell hajlamos volt optikai illúziókat felismerni ott, ahol az emberek semmilyen kétértelműséget nem látnak. A három piacvezető modell (GPT-4, Claude 3, Gemini 1.5) ugyan felismeri a valódi optikai illúziókat is, ám ugyanúgy hajlamosak „illúzió-illúziókat” is látni. A többi modell eredményei vegyesek, ám ez Ullman szerint nem azt jelenti, hogy kevésbé hagyják magukat becsapni – inkább arról van szó, hogy ezek az MI-k eleve gyengébbek a képfelismerésben.


Hibák, hallucinációk és a jövő veszélyei

Az ilyen félreértelmezéseket az MI-világban gyakran hallgatólagosan „hallucinációnak” nevezik. Ullman szerint azonban ez a fogalom mára kiüresedett vagy félreértelmezett lett, hiszen a „hallucináció” eredetileg azt jelentette, hogy egy válasz statisztikai valószínűség alapján igaznak tűnik, de valójában hamis. Ebben az esetben azonban egyszerűen téves következtetésről van szó: az MI hibázik, ráadásul vélhetően nem is túl meggyőző módon.

Összefoglalva elmondható, hogy a jelenlegi látásalapú nyelvi MI-modellek gyakran nincsenek összhangban a képfeldolgozás és a nyelvi értelmezés között. Mivel ezek a technológiák egyre gyakrabban kerülnek alkalmazásra a robotikában vagy más szolgáltatásokban, egyre sürgetőbb, hogy a két terület valóban összehangoltan működjön. Ennek hiánya komoly veszélyeket is rejthet magában, ha vakon megbízunk az MI-k „látásában” – hiszen ezek a rendszerek továbbra is könnyen besétálnak a saját illúzióik csapdájába.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy egy gép hibázik ugyanúgy, mint egy ember?
  • Szerinted etikailag rendben van, ha veszélyes területen bízunk teljesen egy MI döntésében?
  • Te hagynád, hogy egy ilyen MI önállóan hozzon fontos döntést, vagy inkább mindig ellenőriznéd?



Legfrissebb posztok

szombat 09:57

Az orosz télnél is halálosabb betegségek tizedelték meg Napóleon seregét

🔫 1812-ben Napóleon hatalmas sereggel – mintegy 500 000 katonával – rohanta meg Oroszországot...



kedd 22:59

Az ős-szúnyog, amely átírhatja az evolúciót

🐛 Szinte hihetetlen leletre bukkantak német kutatók: a mianmari Kachin régióban talált borostyánban egy 99 millió éves szúnyoglárva rejtőzött megdöbbentően jó állapotban...

kedd 22:30

Az új Fed-elnök: öt név maradt, Trump hamarosan dönt

Már csak öt jelölt maradt versenyben a Federal Reserve elnöki posztjáért Jerome Powell utódjaként, és Donald Trump bejelentette, hogy még az év vége előtt megnevezi az új vezetőt...



kedd 22:01

Az Adobe új MI-eszközei átírják a képszerkesztést

Az Adobe bejelentette a Creative Cloud alkalmazáscsomag és a Firefly frissítéseit, amelyek látványosan leegyszerűsítik a fotók és videók szerkesztésének eddig pepecselős, időrabló műveleteit...



kedd 21:30

A Közel-Kelet most a ritkafémekért küzd olaj helyett

💰 Jelentős, hogy a Közel-Kelet országai egyre aktívabban fektetnek a ritkafémek iparába, ezzel próbálva visszaszorítani Kínát a világ kritikus ásványainak piacán...

kedd 21:00

Az ingatlanpiacon most jön az MI-zűrzavar korszaka

Képzeld el, hogy ingatlanhirdetéseket böngészel Franklinben, Tennessee-ben, amikor egy látványos videóba botlasz: tágas szobák, baldachinos ágy, borkimérés, habfürdő és egy mosolygó ingatlanközvetítő mutatja be az álomházadat meggyőző hangon...

kedd 20:59

Véget ér a Twitter-korszak: így menekülhetsz a zárolástól

🔒 Hamarosan végleg eltűnik a Twitter, ugyanis november 10-től hivatalosan is nyugdíjba vonul a Twitter...

kedd 20:30

MI-vel hamis számlákkal trükköznek – egyre több a lebukás

💸 A költségelszámolások régi trükkjei új szintre léptek a mesterséges intelligencia megjelenésével...

kedd 20:00

A hamis számlák új hulláma: az MI átveri a cégeket

A dolgozók egyre gyakrabban használnak MI-t hamis költségelszámolások készítésére. Az OpenAI és a Google fejlettebb képgenerátorai jelentősen megkönnyítették a hamis bizonylatok gyártását, ami komoly fejtörést okoz a költségkezelő szoftvereket fejlesztő cégeknek...

kedd 19:59

Az új Windows BSOD-frissítés most a memóriádat fürkészi

👀 A Microsoft hamarosan új funkcióval bővíti a Windows 11-et: minden egyes kellemetlen kék halál (BSOD) után emlékeztetni fog, hogy vizsgáld át a memóriád állapotát...



kedd 19:31

Újragondolt Wikipédia, mesterséges intelligenciával kreatívan átdolgozva

Elon Musk friss projektje, a Grokipedia, elindult – és első pillantásra szinte összekeverhető a Wikipédiával...

kedd 19:03

A Windows-frissítés biztonsági okból letiltja a fájlok előnézetét

A Microsoft októberi frissítésével jelentős változtatást vezetett be a Windows rendszerben: a File Explorer (korábbi nevén Windows Explorer) mostantól automatikusan letiltja az internetes forrásból letöltött fájlok előnézetét...

kedd 18:59

Az ausztrál kráter, ami átírja a Föld történetét?

A Föld ősi múltja tele volt hatalmas ütközésekkel, amikor még a légkör sem tompította a becsapódásokat...



kedd 18:30

Az elektromos autók akkumulátorai lassabban öregszenek, mint gondoltuk

Egy svéd használt autókereskedő több mint 1 300 elektromos és plug-in hibrid autó akkumulátorának állapotát vizsgálta meg, hogy kiderítse, mennyit veszítettek kapacitásukból az évek és a kilométerek során...



kedd 18:01

Az MI forradalma az iskolákban: Haszon vagy zsákutca?

🧠 A generatív mesterséges intelligencia (MI) villámgyors terjedése alapjaiban alakítja át az oktatási rendszereket...

kedd 17:59

Az új Grokipedia: Musk enciklopédiája nagyobb, elfogulatlanabb?

📚 Elon Musk új projektje, a Grok-motorral hajtott Grokipedia rövid leállást követően ismét elérhető online...



kedd 17:31

Japán királyi pompában fogadta az amerikai elnököt

Donald Trump amerikai elnököt hétfőn rendkívüli ceremóniával fogadta Japán, ázsiai látogatásának következő állomásán...



kedd 16:59

Az új Eufy biztonsági kamera: végre nincs havi díj!

🔒 A biztonsági kamerák világában igazi újdonsággal állt elő az Eufy: a vadonatúj, MI-alapú EufyCam C35 nemcsak mesterséges intelligenciával, színes éjjellátóval és arcfelismeréssel érkezik, hanem végre megszabadulhatsz a bosszantó havi előfizetési díjaktól is...



kedd 16:30

Régi szer felfedezése segíthet a szuperbaktériumok ellen

Az antibiotikum-rezisztencia világszerte égető egészségügyi problémává vált, hiszen az évek során egyre kevesebb hatékony gyógyszer maradt a fertőzések leküzdésére...