2025. 09. 13., 22:02

Még az MI is kételkedik magában, ha a kacsa nyúllá változik

Még az MI is kételkedik magában, ha a kacsa nyúllá változik
Az MI-képfeldolgozás legújabb fejlesztései egyre inkább az emberi gondolkodás sajátosságait utánozzák – többek között abban is, hogy néha olyan mintákat „látnak”, amelyek valójában nem is léteznek. Erre kiváló példa, hogy a ChatGPT legfrissebb, GPT-5-alapú változata képes teljesen egyértelmű képen is optikai illúziót észlelni, ahol az emberek számára egyáltalán nincs semmiféle kétértelműség.

Optikai illúziók ott is, ahol nincsenek

A Harvard Egyetem egyik pszichológia professzora, Tomer Ullman, egy kísérletéhez csupán egy kacsa képét töltötte fel a ChatGPT rendszerébe. Ennek ellenére a ChatGPT azonnal felismerte (pontosabban félreismerte) az illusztrációt: szerinte ez egy híres kacsa-nyúl optikai illúzió (Duck-Rabbit illusion). Pedig ebben az esetben a kép kizárólag egy kacsát ábrázolt, semmiféle vizuális kétértelműséget nem tartalmazott.

Érdemes megemlíteni, hogy a ChatGPT részletesen el tudta magyarázni, hogyan lehetne a képen a kacsán túl a nyulat is meglátni – mindezt pusztán statisztikai következtetések alapján, nem a valóban látott kép alapján.

Az illúzió-illúzió jelensége

Ullman legújabb tanulmányában – „Az illúzió-illúzió: amikor a látásalapú nyelvi MI-k illúziókat látnak ott, ahol nincsenek” („The Illusion-Illusion: When Vision-Language Models See Illusions Where There Are None”) – rámutat, hogy az ilyen téves felismerések fontos diagnosztikai eszközök lehetnek mind a kognitív tudományban, mind a mesterséges intelligencia kutatásában. Az emberi agy észlelési hibái, például az apofénia (amikor jelentés nélküli mintákban is ismerős alakzatot látunk, például egy felhőben vagy kávéfoltban emberi arcot), azért érdekesek, mert megmutatják a valóság és annak észlelése közötti szakadékot.

Amikor azonban a mesterséges intelligencia hibázik, sok kutató párhuzamot próbál vonni az emberi apoféniával. Ullman azonban hangsúlyozza, hogy ez a fajta tévedés inkább egy eltérő típusú gondolkodási rövidítés: az MI hajlamos azt feltételezni, hogy egy új probléma nagyon hasonlít egy korábbihoz, ezért automatikusan ugyanúgy kezeli, és így hibás következtetésre jut.

Különböző MI-modellek, különböző hibák

A kutató több általánosan használt, látásalapú nyelvi MI-modellt vizsgált: GPT-4o, Claude 3, Gemini Pro Vision, miniGPT, Qwen-VL, InstructBLIP, BLIP2, LLaVA-1.5. Mindegyik modell hajlamos volt optikai illúziókat felismerni ott, ahol az emberek semmilyen kétértelműséget nem látnak. A három piacvezető modell (GPT-4, Claude 3, Gemini 1.5) ugyan felismeri a valódi optikai illúziókat is, ám ugyanúgy hajlamosak „illúzió-illúziókat” is látni. A többi modell eredményei vegyesek, ám ez Ullman szerint nem azt jelenti, hogy kevésbé hagyják magukat becsapni – inkább arról van szó, hogy ezek az MI-k eleve gyengébbek a képfelismerésben.


Hibák, hallucinációk és a jövő veszélyei

Az ilyen félreértelmezéseket az MI-világban gyakran hallgatólagosan „hallucinációnak” nevezik. Ullman szerint azonban ez a fogalom mára kiüresedett vagy félreértelmezett lett, hiszen a „hallucináció” eredetileg azt jelentette, hogy egy válasz statisztikai valószínűség alapján igaznak tűnik, de valójában hamis. Ebben az esetben azonban egyszerűen téves következtetésről van szó: az MI hibázik, ráadásul vélhetően nem is túl meggyőző módon.

Összefoglalva elmondható, hogy a jelenlegi látásalapú nyelvi MI-modellek gyakran nincsenek összhangban a képfeldolgozás és a nyelvi értelmezés között. Mivel ezek a technológiák egyre gyakrabban kerülnek alkalmazásra a robotikában vagy más szolgáltatásokban, egyre sürgetőbb, hogy a két terület valóban összehangoltan működjön. Ennek hiánya komoly veszélyeket is rejthet magában, ha vakon megbízunk az MI-k „látásában” – hiszen ezek a rendszerek továbbra is könnyen besétálnak a saját illúzióik csapdájába.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz arról, hogy egy gép hibázik ugyanúgy, mint egy ember?
  • Szerinted etikailag rendben van, ha veszélyes területen bízunk teljesen egy MI döntésében?
  • Te hagynád, hogy egy ilyen MI önállóan hozzon fontos döntést, vagy inkább mindig ellenőriznéd?


Legfrissebb posztok

hétfő 20:58

A DocuSign óva int: ne bízd az MI-re a szerződéseket

Hihetetlen, de igaz, hogy a digitális szerződéskötés sokkal több, mint néhány kattintás egy weboldalon...

hétfő 20:37

A mesterséges intelligencia már kiszúrja a gyomokat, a gazdák ujjonganak

🌾 A gazdák életét egy új MI-modell könnyíti meg Seattle-ben, ahol a Carbon Robotics nevű cég olyan robotokat gyárt, amelyek lézerekkel irtják a gyomnövényeket...

hétfő 20:20

Az állami hekkerek feltörték a Notepad++-t

A Notepad++ fejlesztői bejelentették, hogy a népszerű szövegszerkesztőt célzott kibertámadás érte, amelynek hátterében valószínűsíthetően egy államilag támogatott szereplő áll...

hétfő 20:01

A csodahozamot ígérő átverések világszerte terjednek

A hamis, szuperhozamot ígérő befektetési programok (HYIP) terjedése újabb csúcsra ért: ezek a csalások irreális hozamokat, például 40%-os nyereséget 72 óra alatt ígérnek, miközben semmilyen valódi megtérülést nem biztosítanak...

hétfő 19:57

A kezdő futó felszerelése: mi kell, és mi pénzkidobás?

Felmerül a kérdés, hogy mire van szükség, ha most kezdesz el futni...

hétfő 19:38

Az első MI-közösségi oldal, ahol robotok robotoknak posztolnak

🤖 Fontos kérdés, hogy mi történik, ha a közösségi oldalakon nem emberek, hanem MI-k kommunikálnak egymással...

hétfő 19:22

Az örökké változó Univerzum: üveglemezek és óriástávcsövek nyomában

Az éjszakai égbolt egy évszázadnyi története rejtőzik poros üveglemezeken és a legmodernebb csillagászati szuperszámítógépek adatfolyamában...

hétfő 19:01

A Starbucks robotokra bízná a nagy megújulást

A Starbucks hatalmas összegeket fektet MI-alapú automatizálásba: robotokat tesztelnek, amelyek átveszik az autós kiszolgálásnál a rendeléseket, virtuális asszisztensekkel segítik a baristák munkáját a receptek és a beosztások terén, valamint digitális rendszerekkel mérik a készleteket...

hétfő 18:55

Az új fehérje áttörést hozhat a depresszió és bélpanaszok kezelésében

💡 A krónikus stressz kikezdi a bél védőrétegét, fokozva az áteresztőképességet, amit a köznyelv csak „lyukas bél” szindrómaként emleget...

hétfő 18:37

Az óceán rejtőzködő zsenije, akit a saját esze veszélyeztet

Érdemes megvizsgálni, hogy egy látszólag sikeres evolúciós stratégia hogyan lehet végzetes gyengeség forrása a Föld egyik legelterjedtebb élőlénye számára...

hétfő 18:21

Az MI-uralta munkahelyek 2026-os rejtett buktatói

Érdemes megvizsgálni, hogy az MI-vel kapcsolatos várakozások és a valóság között milyen szakadék tátong napjainkban...

hétfő 18:01

Az MI a bűnbak, vagy máshol van a gond?

🤔 Az elmúlt évben több mint 50 ezer elbocsátást indokoltak hivatalosan mesterséges intelligenciával...

hétfő 17:37

Az iPhone-ra megérkezik a Vivo és az Oppo teleobjektív-kiegészítője

A PGYTech különleges kamerás szettel teszi profibbá az iPhone 16 Pro és Pro Max, illetve az iPhone 17 Pro és Pro Max készülékeket...

hétfő 17:19

A TikTok leáll, Amerika forrong – itt az új vihar

Amerikában napokra teljesen leállt a TikTok, miután a téli viharok miatt megsérült az Oracle egyik legfontosabb, általa üzemeltetett adatközpontja...

hétfő 17:02

Az indiai kormány gigantikus adókedvezménnyel vadássza a felhőóriásokat

💸 India újabb lépést tett, hogy a világ technológiai központjává váljon, és 20 évig tartó adómentességet kínál azoknak a külföldi cégeknek, amelyek Indiából kiszolgálva nyújtanak felhőalapú adatokat a világ bármely más országába...

hétfő 16:55

Az Oracle 18 ezermilliárdot önt az MI-lázba

💸 Az Oracle részvényei 5%-ot emelkedtek a hétfői kereskedésben, miután a vállalat bejelentette, hogy 2026-ban 16 500–18 300 milliárd forintnyi tőkét tervez bevonni adósság és részvénykibocsátás útján...

hétfő 16:20

Az MI feltárja a DNS sötét anyagát, orvosok tüdőt gyártanak

🔮 A tudomány világát új áttörések rázzák fel: az MI végre közelebb vihet minket a DNS titkainak megfejtéséhez, eközben orvosok először tartottak életben beteget mesterséges tüdővel, és egy egzotikus növény látványosan cáfolja az evolúció klasszikus elméleteit...

hétfő 16:02

Az új Pixel témacsomagok már úton, az MI-ikonokra még várunk

📱 A Google nemrég visszavonta a Gonosz témacsomagot (Wicked) a Pixel telefonokról, amelyet a Gonosz: Mindörökké (Wicked: For Good) című film bemutatója alkalmából indítottak Ariana Grande közreműködésével...

hétfő 15:55

Az MI-ben őrségváltás: a Microsoftnál tarol a Claude Code

A Microsoft fejlesztői már hónapok óta összevetik az Anthropic-féle Claude Code, az Anysphere Cursor és a GitHub Copilot előnyeit és hátrányait, keresve a legjobb MI-kódoló eszközt...

hétfő 15:38

Az MI bekeményít: a CFO-knak fel kell kötni a gatyát

🛡 A vállalati MI-stratégia középpontjába egyre gyakrabban a pénzügyi vezetők (CFO-k) kerülnek...

hétfő 15:19

Az olimpiai nyitóünnepség, amiről beszélni fog a világ

A 2026-os milánói-cortinai téli olimpia nyitóünnepsége minden eddiginél nagyobb látványosságot ígér...

hétfő 15:03

A 7 végzetes hely, ahová soha ne tedd az otthoni kamerát

Az okos otthoni biztonsági kamerák manapság tele vannak fejlett funkciókkal: vezeték nélküli megoldások, mozgásérzékelés, akár MI-alapú képességek...

hétfő 14:56

Az otthoni biztonsági kamerák üzemidő-bajnokai

Nem mindegy, mennyi ideig húzza egy akkumulátorról a kültéri, vezeték nélküli biztonsági kamerád – főleg, ha a cél az, hogy szinte teljesen megfeledkezhess arról, mikor kell majd töltened...

hétfő 14:38

Az új Pixel 10a unalmasnak látszik – épp ettől zseniális

👍 A Pixel 10a első pillantásra egyetlen izgalmat sem tartogat: a dizájn szinte ugyanaz, a hardver szintén, a fejlesztések inkább kozmetikaiak, mint forradalmiak...

hétfő 14:22

Az Oukitel RT10: ipari extrákkal turbózott, szuperstrapabíró tablet

🛡 Aki munkahelyi környezetbe keres igazán masszív táblagépet, az Oukitel Industry RT10-zel jó eséllyel nem nyúl mellé...

hétfő 14:01

Az új kriptóhullám: zuhannak a részvények, áll a Bitcoin

📈 A Bitcoin árfolyama közel 1%-ot emelkedett, most 77 000 dollár, azaz nagyjából 28,1 millió forint körül jár...

hétfő 13:55

Az első szingapúri űrügynökséggel elrajtol Ázsia új űrversenye

Szingapúr áprilisban elindítja első nemzeti űrügynökségét, hogy vezető szerepet vállaljon a gyorsan növekvő űriparban...

hétfő 13:18

A Pentagonnal csap össze az Anthropic: botrány a 72 milliárdos MI-szerződés miatt

Az Anthropic és a Pentagon között 72 milliárd forint (200 millió USD) értékű MI-szerződés sorsa komoly veszélybe került...

hétfő 12:55

A várva várt Bitcoin-szuperciklus elmarad? CZ lehűti a kedélyeket

💸 Hirtelen bizonytalanság: a szuperciklus lekerült a napirendről Changpeng Zhao, vagyis CZ, a Binance korábbi vezetője még hetekkel ezelőtt is arról beszélt, hogy soha nem látott kripto-szuperciklus jöhet a tömeges intézményi befektetések és a kriptóbarát szabályozás miatt...