Még az MI is kételkedik magában, ha a kacsa nyúllá változik

Még az MI is kételkedik magában, ha a kacsa nyúllá változik
Az MI-képfeldolgozás legújabb fejlesztései egyre inkább az emberi gondolkodás sajátosságait utánozzák – többek között abban is, hogy néha olyan mintákat „látnak”, amelyek valójában nem is léteznek. Erre kiváló példa, hogy a ChatGPT legfrissebb, GPT-5-alapú változata képes teljesen egyértelmű képen is optikai illúziót észlelni, ahol az emberek számára egyáltalán nincs semmiféle kétértelműség.

Optikai illúziók ott is, ahol nincsenek

A Harvard Egyetem egyik pszichológia professzora, Tomer Ullman, egy kísérletéhez csupán egy kacsa képét töltötte fel a ChatGPT rendszerébe. Ennek ellenére a ChatGPT azonnal felismerte (pontosabban félreismerte) az illusztrációt: szerinte ez egy híres kacsa-nyúl optikai illúzió (Duck-Rabbit illusion). Pedig ebben az esetben a kép kizárólag egy kacsát ábrázolt, semmiféle vizuális kétértelműséget nem tartalmazott.

Érdemes megemlíteni, hogy a ChatGPT részletesen el tudta magyarázni, hogyan lehetne a képen a kacsán túl a nyulat is meglátni – mindezt pusztán statisztikai következtetések alapján, nem a valóban látott kép alapján.

Az illúzió-illúzió jelensége

Ullman legújabb tanulmányában – „Az illúzió-illúzió: amikor a látásalapú nyelvi MI-k illúziókat látnak ott, ahol nincsenek” („The Illusion-Illusion: When Vision-Language Models See Illusions Where There Are None”) – rámutat, hogy az ilyen téves felismerések fontos diagnosztikai eszközök lehetnek mind a kognitív tudományban, mind a mesterséges intelligencia kutatásában. Az emberi agy észlelési hibái, például az apofénia (amikor jelentés nélküli mintákban is ismerős alakzatot látunk, például egy felhőben vagy kávéfoltban emberi arcot), azért érdekesek, mert megmutatják a valóság és annak észlelése közötti szakadékot.

Amikor azonban a mesterséges intelligencia hibázik, sok kutató párhuzamot próbál vonni az emberi apoféniával. Ullman azonban hangsúlyozza, hogy ez a fajta tévedés inkább egy eltérő típusú gondolkodási rövidítés: az MI hajlamos azt feltételezni, hogy egy új probléma nagyon hasonlít egy korábbihoz, ezért automatikusan ugyanúgy kezeli, és így hibás következtetésre jut.

Különböző MI-modellek, különböző hibák

A kutató több általánosan használt, látásalapú nyelvi MI-modellt vizsgált: GPT-4o, Claude 3, Gemini Pro Vision, miniGPT, Qwen-VL, InstructBLIP, BLIP2, LLaVA-1.5. Mindegyik modell hajlamos volt optikai illúziókat felismerni ott, ahol az emberek semmilyen kétértelműséget nem látnak. A három piacvezető modell (GPT-4, Claude 3, Gemini 1.5) ugyan felismeri a valódi optikai illúziókat is, ám ugyanúgy hajlamosak „illúzió-illúziókat” is látni. A többi modell eredményei vegyesek, ám ez Ullman szerint nem azt jelenti, hogy kevésbé hagyják magukat becsapni – inkább arról van szó, hogy ezek az MI-k eleve gyengébbek a képfelismerésben.


Hibák, hallucinációk és a jövő veszélyei

Az ilyen félreértelmezéseket az MI-világban gyakran hallgatólagosan „hallucinációnak” nevezik. Ullman szerint azonban ez a fogalom mára kiüresedett vagy félreértelmezett lett, hiszen a „hallucináció” eredetileg azt jelentette, hogy egy válasz statisztikai valószínűség alapján igaznak tűnik, de valójában hamis. Ebben az esetben azonban egyszerűen téves következtetésről van szó: az MI hibázik, ráadásul vélhetően nem is túl meggyőző módon.

Összefoglalva elmondható, hogy a jelenlegi látásalapú nyelvi MI-modellek gyakran nincsenek összhangban a képfeldolgozás és a nyelvi értelmezés között. Mivel ezek a technológiák egyre gyakrabban kerülnek alkalmazásra a robotikában vagy más szolgáltatásokban, egyre sürgetőbb, hogy a két terület valóban összehangoltan működjön. Ennek hiánya komoly veszélyeket is rejthet magában, ha vakon megbízunk az MI-k „látásában” – hiszen ezek a rendszerek továbbra is könnyen besétálnak a saját illúzióik csapdájába.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy egy gép hibázik ugyanúgy, mint egy ember?
  • Szerinted etikailag rendben van, ha veszélyes területen bízunk teljesen egy MI döntésében?
  • Te hagynád, hogy egy ilyen MI önállóan hozzon fontos döntést, vagy inkább mindig ellenőriznéd?



Legfrissebb posztok

Könnyen kiszivároghatnak adatok az új Claude MI funkcióval

MA 23:51

Könnyen kiszivároghatnak adatok az új Claude MI funkcióval

🚫 Az Anthropic, a Claude MI fejlesztője, új fájl-létrehozási lehetőséget adott MI-asszisztenséhez, amellyel Excel-táblázatokat, PowerPoint-prezentációkat és egyéb dokumentumokat hozhatunk létre közvetlenül egy beszélgetésen belül, akár a webes felületen, akár...

Az új FAFSA szabályok: Amit minden diák és szülő tudni szeretne

MA 23:26

Az új FAFSA szabályok: Amit minden diák és szülő tudni szeretne

💡 Október 1-jén ismét elérhető lesz az ingyenes FAFSA (Szövetségi Hallgatói Támogatás Igénylő Lap), ám ezúttal több változás is várható. Bár évek óta októberben indul a jelentkezési időszak, tavaly...

Az új káros rovar ellepte Georgiát – veszélyben a gyapot

MA 23:01

Az új káros rovar ellepte Georgiát – veszélyben a gyapot

🐜 Georgia mezőgazdasági ültetvényein villámgyorsan terjed a gyapot jasszid nevű új, invazív rovar, amely súlyos károkat okozhat a gyapotban, földimogyoróban és más fontos növénykultúrákban is. Az apró, mindössze 2,5...

Mi vezérli valójában az igazgatókat, Machiavelli vagy Assisi Szent Ferenc?

MA 22:51

Mi vezérli valójában az igazgatókat, Machiavelli vagy Assisi Szent Ferenc?

A vezetők motivációi gyakran két véglet között mozognak: a rideg hatalomvágy és az önzetlen alázat között. Machiavelli, a 16. századi uralkodás fortélyainak mestere, az ideális vezető képét vázolta...

Olvad a permafroszt, ezért nőtt a szén-dioxid a jégkorszak után

MA 21:51

Olvad a permafroszt, ezért nőtt a szén-dioxid a jégkorszak után

🌨 Évmilliók óta váltakoznak a jégkorszakok és az azokat követő melegebb időszakok, amelyek során a légkör szén-dioxid-szintje is jelentősen változik. Egy új, göteborgi kutatás szerint azonban a jégkorszak utáni...


MA 21:26

Az amerikai bíróság betiltotta a helyadat-bizniszt

Több nagy amerikai mobilszolgáltatót, köztük a Verizont tavaly komoly bírságokkal sújtott az amerikai távközlési hatóság (FCC), miután 2018-ban engedély nélkül adták el ügyfeleik helymeghatározási adatait. A vállalatok bíróságra...

Az újabb svéd hackertámadás 200 önkormányzatot bénított meg

MA 21:01

Az újabb svéd hackertámadás 200 önkormányzatot bénított meg

🔒 Svédországban ismét egy nagyszabású kibertámadás bénította meg az önkormányzati rendszereket: a Miljdata nevű szoftvercég elleni akció több mint 200 önkormányzatot és régiót érintett. A cég az ország településeinek...

Az új MI-törvény kedvezhet a nagy techcégeknek

MA 20:52

Az új MI-törvény kedvezhet a nagy techcégeknek

🤔 Ted Cruz texasi szenátor új MI-javaslata alaposan felkavarta az amerikai közvéleményt. A törvénytervezet – hivatalos nevén a SANDBOX törvény (Strengthening Artificial Intelligence Normalization and Diffusion By Oversight and...

Amerika már MI-vel nyomja el a vitákat, terjed a világszintű propaganda

MA 20:27

Amerika már MI-vel nyomja el a vitákat, terjed a világszintű propaganda

💡 A Pentagon legfrissebb beszerzési tervei szerint az Egyesült Államok különleges műveleti parancsnoksága (SOCOM) intenzíven keresi a gépi tanuláson alapuló technológiákat, hogy MI-vezérelt propagandakampányokat indíthasson külföldön. E célból olyan...