Még az MI is kételkedik magában, ha a kacsa nyúllá változik

Még az MI is kételkedik magában, ha a kacsa nyúllá változik
Az MI-képfeldolgozás legújabb fejlesztései egyre inkább az emberi gondolkodás sajátosságait utánozzák – többek között abban is, hogy néha olyan mintákat „látnak”, amelyek valójában nem is léteznek. Erre kiváló példa, hogy a ChatGPT legfrissebb, GPT-5-alapú változata képes teljesen egyértelmű képen is optikai illúziót észlelni, ahol az emberek számára egyáltalán nincs semmiféle kétértelműség.

Optikai illúziók ott is, ahol nincsenek

A Harvard Egyetem egyik pszichológia professzora, Tomer Ullman, egy kísérletéhez csupán egy kacsa képét töltötte fel a ChatGPT rendszerébe. Ennek ellenére a ChatGPT azonnal felismerte (pontosabban félreismerte) az illusztrációt: szerinte ez egy híres kacsa-nyúl optikai illúzió (Duck-Rabbit illusion). Pedig ebben az esetben a kép kizárólag egy kacsát ábrázolt, semmiféle vizuális kétértelműséget nem tartalmazott.

Érdemes megemlíteni, hogy a ChatGPT részletesen el tudta magyarázni, hogyan lehetne a képen a kacsán túl a nyulat is meglátni – mindezt pusztán statisztikai következtetések alapján, nem a valóban látott kép alapján.

Az illúzió-illúzió jelensége

Ullman legújabb tanulmányában – „Az illúzió-illúzió: amikor a látásalapú nyelvi MI-k illúziókat látnak ott, ahol nincsenek” („The Illusion-Illusion: When Vision-Language Models See Illusions Where There Are None”) – rámutat, hogy az ilyen téves felismerések fontos diagnosztikai eszközök lehetnek mind a kognitív tudományban, mind a mesterséges intelligencia kutatásában. Az emberi agy észlelési hibái, például az apofénia (amikor jelentés nélküli mintákban is ismerős alakzatot látunk, például egy felhőben vagy kávéfoltban emberi arcot), azért érdekesek, mert megmutatják a valóság és annak észlelése közötti szakadékot.

Amikor azonban a mesterséges intelligencia hibázik, sok kutató párhuzamot próbál vonni az emberi apoféniával. Ullman azonban hangsúlyozza, hogy ez a fajta tévedés inkább egy eltérő típusú gondolkodási rövidítés: az MI hajlamos azt feltételezni, hogy egy új probléma nagyon hasonlít egy korábbihoz, ezért automatikusan ugyanúgy kezeli, és így hibás következtetésre jut.

Különböző MI-modellek, különböző hibák

A kutató több általánosan használt, látásalapú nyelvi MI-modellt vizsgált: GPT-4o, Claude 3, Gemini Pro Vision, miniGPT, Qwen-VL, InstructBLIP, BLIP2, LLaVA-1.5. Mindegyik modell hajlamos volt optikai illúziókat felismerni ott, ahol az emberek semmilyen kétértelműséget nem látnak. A három piacvezető modell (GPT-4, Claude 3, Gemini 1.5) ugyan felismeri a valódi optikai illúziókat is, ám ugyanúgy hajlamosak „illúzió-illúziókat” is látni. A többi modell eredményei vegyesek, ám ez Ullman szerint nem azt jelenti, hogy kevésbé hagyják magukat becsapni – inkább arról van szó, hogy ezek az MI-k eleve gyengébbek a képfelismerésben.


Hibák, hallucinációk és a jövő veszélyei

Az ilyen félreértelmezéseket az MI-világban gyakran hallgatólagosan „hallucinációnak” nevezik. Ullman szerint azonban ez a fogalom mára kiüresedett vagy félreértelmezett lett, hiszen a „hallucináció” eredetileg azt jelentette, hogy egy válasz statisztikai valószínűség alapján igaznak tűnik, de valójában hamis. Ebben az esetben azonban egyszerűen téves következtetésről van szó: az MI hibázik, ráadásul vélhetően nem is túl meggyőző módon.

Összefoglalva elmondható, hogy a jelenlegi látásalapú nyelvi MI-modellek gyakran nincsenek összhangban a képfeldolgozás és a nyelvi értelmezés között. Mivel ezek a technológiák egyre gyakrabban kerülnek alkalmazásra a robotikában vagy más szolgáltatásokban, egyre sürgetőbb, hogy a két terület valóban összehangoltan működjön. Ennek hiánya komoly veszélyeket is rejthet magában, ha vakon megbízunk az MI-k „látásában” – hiszen ezek a rendszerek továbbra is könnyen besétálnak a saját illúzióik csapdájába.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy egy gép hibázik ugyanúgy, mint egy ember?
  • Szerinted etikailag rendben van, ha veszélyes területen bízunk teljesen egy MI döntésében?
  • Te hagynád, hogy egy ilyen MI önállóan hozzon fontos döntést, vagy inkább mindig ellenőriznéd?


Legfrissebb posztok

MA 20:51

Az MI-paradoxon a Stack Overflow-n: használják, mégsem bíznak benne

🤔 Amit látunk, az túlmutat a megszokotton: a Stack Overflow fejlesztői közösségébe berobbant az MI, és alaposan felforgatta a mindennapokat...

MA 20:33

A Microsoft kötelező Copilotja megérkezett az LG okostévékre

Az LG okostévé-tulajdonosok hétvégén arra lettek figyelmesek, hogy a legutóbbi webOS-frissítés után akaratukon kívül megjelent a Microsoft Copilot alkalmazás a készülékeiken, és az alkalmazást nem lehet eltávolítani...

MA 20:17

A brit meztelenfotó-blokkolás már az Apple-t és a Google-t is eléri

A brit kormány jelentős nyomást gyakorol az Apple-re és a Google-re: a techóriásoknak blokkolniuk kellene a meztelen képek megosztását és megjelenítését minden iOS- és Android-eszközön, ha a felhasználó életkorát nem igazolták...

MA 20:01

Az ingyenes MI-funkció eltűnése felbőszítette a Google-felhasználókat

😡 Sokan bosszankodnak, mert a Google Home-on megszokott egyik legfontosabb MI-funkció fizetős lett...

MA 19:49

A szennyezett ivóvíz növelheti a Parkinson-kór kockázatát?

Az elmúlt évtizedekben a Parkinson-kór kutatása főként a genetikai tényezőkre koncentrált, a kutatási támogatások több mint fele genetikai vizsgálatokra jutott...

MA 19:34

Az űrbaleset küszöbén: kínai műhold 200 méterre a Starlinktől

A SpaceX egyik vezetője állítja, hogy egy kínai műhold indítása során mindössze 200 méterre haladt el egy Starlink-műhold mellett – hajszálon múlt egy potenciális baleset...

MA 19:19

Az 5K monitor harmadáron: tényleg ennyire jó?

Érdemes megvizsgálni, hogy érdemes-e a méregdrága Apple Studio Display helyett olcsóbb alternatíván gondolkodni, ha 5K felbontású monitorra vágyik az ember...

MA 18:49

Az egyszerű szokások, amelyek akár 8 évvel fiatalítják az agyat

💡 Új kutatás szerint az agy valós életkora sokkal inkább függ a napi szokásoktól, mint a születési dátumtól...

MA 18:34

Az ősi himalájai égetés visszahozhatná az erdők életét

A tél beköszöntével december és január folyamán Uttarakhand hegyvidéki régióiban a helyi közösségek régi hagyomány szerint irányított égetésekkel újítják meg a hegyi legelők füvét...

MA 18:17

Az Apple újra foltoz: súlyos MI-támadás érte

Két komoly, eddig ismeretlen sebezhetőséget javított az Apple, miután egy rendkívül kifinomult támadást fedeztek fel, amely akár magas rangú személyek elleni kibertámadás része is lehetett...

MA 18:03

Az évszázad forrósága, a hobbitok kihalásának rejtélye és a K-vitamin-vita

🌎 Rekordközeli hőmérsékletek, újabb járványügyi fejlemények, valamint egy közel 50 000 éves kihalás titkának megfejtése – az elmúlt hét tudományos hírei nemcsak izgalmasak, hanem meghatározók is mindannyiunk jövője szempontjából...

MA 17:49

Az olcsó SSD-k kora lejárt?

Vészesen közeledik a korszak vége azok számára, akik olcsó SSD-t keresnek: a hírek szerint a Samsung hamarosan leállítja a költséghatékony SATA SSD-k gyártását...

MA 17:17

Az űrben káosz: veszélyes kínai műhold a Starlink közelében

A SpaceX súlyos aggályokat fogalmazott meg, miután egy kínai rakétával pályára állított műhold mindössze 200 méterre haladt el az egyik működő Starlink-műhold mellett, 560 kilométeres magasságban...

MA 17:02

Az MI-fejlesztésekbe tovább ömlik a pénz

A vezetők többsége úgy látja, hogy az MI-beruházások nemcsak elbocsátásokat hoznak, hanem új munkahelyeket is teremtenek – még ha eddig kevesebb projekt vált is be, mint várták...

MA 16:50

Az év végi hajrában így döntenek jobban a vezetők decemberben

📈 Decemberben a cégeknél szinte csodával határos változás történik: a hónapokig húzódó döntések hirtelen megszületnek, projekteket hagynak jóvá, költségvetéseket véglegesítenek, és végre pont kerül a sokáig vitatott ügyek végére...

MA 16:33

Az MI új aranybányája: Fél év alatt elszálltak a bevételek

Brendan Foody mindössze 19 évesen alapította két középiskolai barátjával a Mercor nevű céget, hogy segítse ismerőseik induló vállalkozásait szoftvermérnökök felvételével, főként külföldről...

MA 16:17

A legújabb Windows-frissítés lebénítja a vállalati üzenetküldőket

🔴 A Microsoft megerősítette, hogy a 2025. decemberi biztonsági frissítések súlyos problémát okoznak a Message Queuing (MSMQ) szolgáltatásban, amely leginkább a nagyvállalati alkalmazásokat és az Internet Information Services (IIS) webhelyeket érinti...

MA 16:01

Az újabb hekkertámadás a francia minisztériumok ellen: veszélyben az érzékeny e-mailek

A francia Belügyminisztérium elismerte, hogy kibertámadás érte a tárca e-mail-szervereit: az ismeretlen támadók több dokumentumfájlokhoz is hozzáfértek...

MA 15:52

A pénztárcabarát okoskarkötő, amit minden kezdő sportoló imád

Aki most kezdene neki a rendszeres mozgásnak vagy csak szeretné a hétköznapokat sportosabbá és egészségesebbé tenni, annak az új Xiaomi Smart Band 10 több szempontból is kiváló választás lehet...