Még az MI is kételkedik magában, ha a kacsa nyúllá változik

Még az MI is kételkedik magában, ha a kacsa nyúllá változik
Az MI-képfeldolgozás legújabb fejlesztései egyre inkább az emberi gondolkodás sajátosságait utánozzák – többek között abban is, hogy néha olyan mintákat „látnak”, amelyek valójában nem is léteznek. Erre kiváló példa, hogy a ChatGPT legfrissebb, GPT-5-alapú változata képes teljesen egyértelmű képen is optikai illúziót észlelni, ahol az emberek számára egyáltalán nincs semmiféle kétértelműség.

Optikai illúziók ott is, ahol nincsenek

A Harvard Egyetem egyik pszichológia professzora, Tomer Ullman, egy kísérletéhez csupán egy kacsa képét töltötte fel a ChatGPT rendszerébe. Ennek ellenére a ChatGPT azonnal felismerte (pontosabban félreismerte) az illusztrációt: szerinte ez egy híres kacsa-nyúl optikai illúzió (Duck-Rabbit illusion). Pedig ebben az esetben a kép kizárólag egy kacsát ábrázolt, semmiféle vizuális kétértelműséget nem tartalmazott.

Érdemes megemlíteni, hogy a ChatGPT részletesen el tudta magyarázni, hogyan lehetne a képen a kacsán túl a nyulat is meglátni – mindezt pusztán statisztikai következtetések alapján, nem a valóban látott kép alapján.

Az illúzió-illúzió jelensége

Ullman legújabb tanulmányában – „Az illúzió-illúzió: amikor a látásalapú nyelvi MI-k illúziókat látnak ott, ahol nincsenek” („The Illusion-Illusion: When Vision-Language Models See Illusions Where There Are None”) – rámutat, hogy az ilyen téves felismerések fontos diagnosztikai eszközök lehetnek mind a kognitív tudományban, mind a mesterséges intelligencia kutatásában. Az emberi agy észlelési hibái, például az apofénia (amikor jelentés nélküli mintákban is ismerős alakzatot látunk, például egy felhőben vagy kávéfoltban emberi arcot), azért érdekesek, mert megmutatják a valóság és annak észlelése közötti szakadékot.

Amikor azonban a mesterséges intelligencia hibázik, sok kutató párhuzamot próbál vonni az emberi apoféniával. Ullman azonban hangsúlyozza, hogy ez a fajta tévedés inkább egy eltérő típusú gondolkodási rövidítés: az MI hajlamos azt feltételezni, hogy egy új probléma nagyon hasonlít egy korábbihoz, ezért automatikusan ugyanúgy kezeli, és így hibás következtetésre jut.

Különböző MI-modellek, különböző hibák

A kutató több általánosan használt, látásalapú nyelvi MI-modellt vizsgált: GPT-4o, Claude 3, Gemini Pro Vision, miniGPT, Qwen-VL, InstructBLIP, BLIP2, LLaVA-1.5. Mindegyik modell hajlamos volt optikai illúziókat felismerni ott, ahol az emberek semmilyen kétértelműséget nem látnak. A három piacvezető modell (GPT-4, Claude 3, Gemini 1.5) ugyan felismeri a valódi optikai illúziókat is, ám ugyanúgy hajlamosak „illúzió-illúziókat” is látni. A többi modell eredményei vegyesek, ám ez Ullman szerint nem azt jelenti, hogy kevésbé hagyják magukat becsapni – inkább arról van szó, hogy ezek az MI-k eleve gyengébbek a képfelismerésben.


Hibák, hallucinációk és a jövő veszélyei

Az ilyen félreértelmezéseket az MI-világban gyakran hallgatólagosan „hallucinációnak” nevezik. Ullman szerint azonban ez a fogalom mára kiüresedett vagy félreértelmezett lett, hiszen a „hallucináció” eredetileg azt jelentette, hogy egy válasz statisztikai valószínűség alapján igaznak tűnik, de valójában hamis. Ebben az esetben azonban egyszerűen téves következtetésről van szó: az MI hibázik, ráadásul vélhetően nem is túl meggyőző módon.

Összefoglalva elmondható, hogy a jelenlegi látásalapú nyelvi MI-modellek gyakran nincsenek összhangban a képfeldolgozás és a nyelvi értelmezés között. Mivel ezek a technológiák egyre gyakrabban kerülnek alkalmazásra a robotikában vagy más szolgáltatásokban, egyre sürgetőbb, hogy a két terület valóban összehangoltan működjön. Ennek hiánya komoly veszélyeket is rejthet magában, ha vakon megbízunk az MI-k „látásában” – hiszen ezek a rendszerek továbbra is könnyen besétálnak a saját illúzióik csapdájába.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy egy gép hibázik ugyanúgy, mint egy ember?
  • Szerinted etikailag rendben van, ha veszélyes területen bízunk teljesen egy MI döntésében?
  • Te hagynád, hogy egy ilyen MI önállóan hozzon fontos döntést, vagy inkább mindig ellenőriznéd?



Legfrissebb posztok

MA 11:30

Megtalálhatták az univerzum legrégebbi galaxisát, vagy valami ennél is különösebbet

Az elmúlt hónapok egyik legizgalmasabb űrfelfedezése egy meglepően fényes és titokzatos objektumhoz kötődik, amelyet a James Webb-űrteleszkóp fedezett fel...



MA 10:49

Az olcsó elektromos pickup érkezik: a Slate javítási tervei

🚗 Az év elején robbant be a Slate Auto a piacra, amikor leleplezte saját, kompakt elektromos pickupját, amelynek ára kevesebb mint 11 millió forint (30 000 USD) lesz...



MA 10:41

Az űrverseny most Texas és Washington között dől el?

A NASA újra megnyitja a több milliárd forint értékű holdraszálló űrhajó fejlesztésére kiírt pályázatot, amely az Artemis-program egyik kulcsfontosságú eszköze lesz...

MA 10:34

Egyszerűbb lehetett a világegyetem forró kezdete?

A világegyetem születésének pillanata, több mint 13,8 milliárd éve, a korábbi elképzelések szerint egy rendkívül hideg, szinte üres állapotból indult, amely csak később hevült fel, hogy anyag keletkezzen benne...

MA 10:25

Amikor a gépek először beszéltek egymással, megszületett az internet

💻 1969. október 29-én este forradalmi áttörés történt a számítástechnika történetében: Los Angeles és Menlo Park között két számítógép között elsőként sikerült üzenetet küldeni...

MA 10:17

Az élet építőkövei a Tejúton túl is ott lapulnak

🚀 A James Webb-űrteleszkóp eddigi egyik legizgalmasabb felfedezése öt összetett szerves molekulát mutatott ki egy, a Tejútrendszeren kívüli fiatal csillag körül...



MA 09:57

Az okos WC-tartozék már egészséget is elemez – 350 ezer forintért

A Withings legújabb egészségügyi kiegészítője, a U-Scan, végre elérhető Európában és az USA-ban is...

MA 09:49

Az apró telefon, ami mindent tud – 40 ezer forintért

📱 A NanoPhone egy bankkártya-méretű okostelefon, amely meglepően sokat tud, mindössze 40 ezer forintért (109,99 USD)...



MA 09:34

Az új egyenlet, amely túljár a légszennyezés eszén

Minden egyes nap több millió részecskét lélegzünk be: korom, por, pollen, mikroműanyagok, vírusok és szintetikus nanorészecskék jutnak a tüdőnkbe...

MA 09:25

Az amerikai szenátorok betiltanák a gyerekeknek szóló MI-csevegőtársakat

Az Egyesült Államokban két szenátor közös törvénytervezetet nyújtott be, amely megtiltaná a techcégeknek, hogy MI-alapú csevegőtársakat kínáljanak kiskorúaknak...



MA 09:18

Nigériában új korszak kezdődhet a mesterséges intelligencia által vezérelt digitális elnyomásban

Az elmúlt években Nigéria kormánya egyre gyakrabban nyúlt a digitális technológiákhoz, hogy elnyomja az állampolgárok véleménynyilvánítását és mozgásterét...



MA 09:10

Jimmy Wales szerint az MI nem veszélyezteti a Wikipédiát, Musknak is üzent

💡 Jimmy Wales, a Wikipédia alapítója, nem aggódik sem Elon Musk Grokipedia nevű új MI-alapú tudásbázisa, sem más hasonló kihívók miatt...

MA 09:01

Az Apple MacBookra már Nvidia RTX-et is köthetsz – tényleg!

Az Nvidia RTX GPU-kkal működő Apple MacBook eddig sci-finek tűnt, most viszont a TinyCorp egy meglepően egyszerű megoldással új korszakot nyitott...



MA 08:57

Egy műholdon is sikerült elindítani a Doomot az űrben

A legendás Doom játékot időről időre szinte minden elképzelhető hardveren elindítják, bizonyítva, hogy ez a több évtizedes program valóságos túlélő...

MA 08:49

Újabb Dassault-sebezhetőség: veszélyben a gyártósorok

A Dassault Systèmes DELMIA Apriso rendszerében két, aktívan kihasznált sérülékenységet azonosítottak, amelyek világszerte számos iparág automatizálási és termeléstervezési folyamatait érintik...

MA 08:41

Az új szívgyógyszer körül forrnak az indulatok: Cytokinetics-láz a tőzsdén

A Cytokinetics nevű, San Franciscó-i biotechnológiai vállalat az utóbbi hónapok egyik leglátványosabb tőzsdei sikersztorija lett...



MA 08:35

Az éghajlatváltozás okozta tétlenség emberek millióinak életét követeli

🔥 A klímaváltozás következményeire való felkészületlenség és a fosszilis tüzelőanyagokhoz való ragaszkodás minden korábbinál súlyosabb egészségügyi veszélyeket okoz világszerte...



MA 08:17

Az mRNS COVID-oltás javítja a rákbetegek túlélési esélyeit

Az új kutatások szerint azok a tüdő- és bőrrákos betegek, akik a daganatellenes immunterápia kezdetétől számított 100 napon belül megkapták az mRNS-alapú COVID–19 oltást, jelentősen tovább éltek, mint azok, akik nem voltak beoltva...



MA 08:09

Az ültetvényerdők jelentősége: a koala a tét

🐨 Új kutatások kimutatták, hogy Észak-Új-Dél-Wales állami erdeiben – amelyeket jelenleg keményfás eukaliptusz-ültetvényként kezelnek, és 2025–2026-ra kivágásra terveznek – valójában a koalák számára létfontosságú élőhelyek találhatók...