MA 14:45

A klasszikus agyteszt leleplezte az MI legnagyobb gyengeségét

A klasszikus agyteszt leleplezte az MI legnagyobb gyengeségét
Miközben a mesterséges intelligencia már esszéket ír, kérdésekre válaszol és bonyolult problémákat old meg, meglepő gyengeségre is fény derült: nehezére esik koncentrálni, ha zavaró tényezők jelennek meg. Egy nemrégiben végzett kísérlet során kutatók a klasszikus Stroop-teszt elé állítottak több népszerű MI-modellt, és érdekes különbséget találtak az emberi és a gépi figyelem között.

A Stroop-teszt kihívása

A Stroop-tesztben színek nevét mutatják különböző színű betűkkel – például a „piros” szó zöld színnel írva. A feladat, hogy ne a szót olvasd el, hanem nevezd meg a betűk színét. Ez egyszerűnek hangzik, de valójában komoly önuralmat és koncentrációt igényel, mivel a szavak olvasása automatikus szokás. A teszt jól megmutatja, mennyire tudjuk irányítani a figyelmünket, ellenállni a zavaró ingereknek és egy konkrét célra fókuszálni.

MI-modellek a fókuszpróbán

A kutatók arra voltak kíváncsiak, hogy a modern nagy nyelvi modellek – például a ChatGPT (GPT-4o), a Claude 3.5 Sonnet és a Gemini 2.5 – mennyire teljesítenek hasonló feladatokban. Rövid, öt szóból álló listákkal még megbízhatóan dolgoztak, noha a lista hosszának növekedésével egyre rosszabb eredményt értek el. A GPT-4o például öt szónál 91%-os pontosságot ért el, de tíz szónál már csak 57%-ot, negyven szónál pedig mindössze 15%-ot. A Claude 3.5 Sonnet húsz szónál még tartotta magát, de negyvennél már 24%-ra zuhant vissza. Hasonló mintázatot mutattak a többi MI-rendszer esetében is.

Mi történik, amikor összezavarodik az MI?

A zavar még nagyobb lett, amikor egy listában vegyesen szerepeltek az egyező és eltérő szín–szó párok. Ennek következtében a pontosság szinte nullára csökkent a nehezebb esetekben. Az MI-modellek nem tudták követni az „inkább a színre figyelj” utasítást, és visszaestek eredeti, megszokott válaszukra: egyszerűen felolvasták a szót.


Az ember és a gép közötti szakadék

Noha az emberek is hajlamosak automatikusan olvasni, általában még számos zavaró szín–szó páros esetén is pontosak maradnak. Ez a különbség jól mutatja, hogy az MI jelenlegi rendszerei komoly hátrányban vannak, amikor összetett figyelmi vagy önkontrollt igénylő feladatokra kerül sor. A tanulmány emlékeztet: bármilyen fejlettnek tűnik is egy MI-rendszer, hosszú és zavaró információsorok esetén visszaesik a teljesítménye – az emberi agy ebben egyelőre verhetetlen.

2026, adminboss, www.sciencedaily.com alapján

  • Szerinted az emberek vagy a gépek jobban tudnak figyelni, ha zavaró dolgok vannak?
  • Te mit csinálnál, hogy jobban tudj koncentrálni?


Legfrissebb posztok

MA 17:01

A bíró lecsapott: MI-halucinációk miatt két év eltiltás, bírság, 60 nap szünet

🚧 Érdemes megérteni, hogy egy amerikai perben egyszerre négy ügyvédet is rajtakaptak azon, hogy valótlan, MI által kitalált jogi hivatkozásokat használtak...

MA 16:57

Az Anthropic mégis kiadta a túl veszélyesnek ítélt Fable 5-öt

😵 Lényeges szempont, hogy az Anthropic új MI-modellje, a Fable 5 most először válik közvetlenül elérhetővé a nagyközönség számára, noha korábban még maga a cég is túl kockázatosnak tartotta a nyilvános bevezetését...

MA 16:34

A Philips új égbolt-lámpája lenyűgöz, de okos funkciók nélkül túlárazott

A Philips bemutatta legújabb mennyezeti lámpáját, amely igazi tetőablak-hatását kelti, és a természetes napfény élményét nyújtja a lakásban...

MA 16:01

A Zcash és a Hyperliquid vezetik az esést, shortolják a bitcoint

📉 A kriptovaluta-piacokat ismét jelentős nyomás alatt tartja a közelgő amerikai inflációs adatok várakozása, miközben a bitcoin árfolyama újra 61 500 dollár (kb...

MA 15:56

Az MIT új űrhajtóműve akár Marsra repítheti a kisműholdakat

A világűr meghódítása az elmúlt években óriási fejlődésen ment keresztül, de a kis műholdak – az úgynevezett CubeSatok – még mindig komoly korlátokkal küzdenek...

MA 15:45

A Google Gemini világszerte akadozik: ezt tudjuk eddig a leállásról

⚠ Reggel óta rengetegen tapasztalják, hogy a Google Gemini nem működik rendesen: hibák sorozata jelenik meg az asztali és mobil változatban is, a felhasználók pedig valódi segítség nélkül maradnak...

MA 15:34

A Microsoft rekordot döntött: több mint 200 sebezhetőséget foltoztak be

A Microsoft minden eddiginél nagyobb javítócsomagot adott ki június közepén, amely majdnem 200 különböző biztonsági rést szüntetett meg a Windows operációs rendszerben és a kapcsolódó szoftverekben...

MA 15:23

A Kelet-antarktiszi jégtakaró mélyén óriási, legyező alakú szerkezetre bukkantak

🖼 Egy hatalmas, legyezőszerű formációt fedeztek fel a kelet-antarktiszi jégtakaró alatt, amely több, eddig is ismert medencét köt össze a felszín alatt...

MA 15:12

A júniusi Windows 11-frissítés három nagy dobása: villámgyors appok és menük

⚡ Megérkezett a Windows 11 júniusi frissítése, amely több fontos újdonságot hozott magával, és ha eddig lassúnak érezted a rendszert, most végre fellélegezhetsz...

MA 14:56

A Bitcoin DeFi-projekt lehúzta a rolót: senkit sem érdekelt

🛑 A Botanix, a Bitcoin második rétegű hálózata, mindössze egy évvel a főhálózat indulása után végleg leállította a működését...

MA 14:34

Az inflációs forgatókönyv, amely 60 ezer alá ütheti a bitcoint

📈 A bitcoin árfolyama hetek óta ingadozik a 61 ezer dolláros szint körül, miközben egyre nagyobb figyelem hárul az amerikai inflációs adatokra...

MA 14:23

A muslica teljes agytérképe váratlan titkot árult el

Egy nemzetközi kutatócsoportnak először sikerült minden idegsejt-kapcsolatot feltérképeznie egy felnőtt muslica teljes központi idegrendszerében...

MA 13:56

Az XRP-piacon pánikeladások – közel a mélypont?

📈 Az utóbbi időben egyre többen adják el veszteséggel az XRP-t, ami jelezheti, hogy a piaci lejtmenet a végéhez közeledik...

MA 13:45

Az Amazon egymilliárd fontot fektet be, 4 ezer új állást teremt Britanniában

💰 Az Amazon komoly lendületet ad az Egyesült Királyság gazdaságának: két vadonatúj létesítmény nyílik Northampton és Kettering városában, összesen több mint 4 000 új munkahelyet teremtve...

MA 13:34

A rossz ötletek lecsapolják az MI-költségvetést – vágd ki őket

Érdemes megvizsgálni, hogy a technológiák fejlődése, különösen a felhőalapú megoldások és a különféle szolgáltatások rohamos bővülése milyen gyökeres változásokat hozott a vállalati döntéshozatalban...

MA 13:22

A három legnagyobb japán bank márciusig közös stabilcoint indít.

💰 Japán három legnagyobb pénzintézete, a Mitsubishi UFJ Financial Group, a Sumitomo Mitsui Financial Group és a Mizuho Financial Group még március előtt saját stabilcoint kíván kibocsátani...

MA 12:56

Az XRP 4,5%-ot zuhan, eladási lavina töri a támaszszintet

📈 Erre utal többek között az, hogy az XRP pillanatok alatt 4,5%-ot veszített az értékéből, miután erős eladói hullám letörte az 1,13 dollár (kb...

MA 12:45

Az összecsukható Logitech Mobi Fold: 1 perc töltés, 22 óra munka

A Logitech bemutatta forradalmi, összecsukható egerét azoknak, akik gyakran dolgoznak útközben...

MA 12:34

A sebezhetőségi válság: az MI beszűkíti a védelem mozgásterét

⚠ Egyre gyorsabb ütemben bukkannak fel újabb sérülékenységek az interneten, ráadásul a védekezési idő pár nap helyett ma már néhány órára zsugorodott...

MA 12:23

A hamis X‑VPN telepítők adatot lopnak – így maradj biztonságban

A megbízhatónak tűnő program is komoly veszélyt jelenthet, ha nem hivatalos helyről származik: erre hívta fel a figyelmet egy hosszú ideje futó csalássorozat, amely során hamis X‑VPN telepítőkkel támadták meg az óvatlan felhasználókat...

MA 11:55

A kamatemelési fogadás minden fedezéket sújt: esik arany és bitcoin

📉 Az elmúlt héten rövid távú fellendülés után most egyszerre gyengül a bitcoin, az arany és a technológiai részvények, miközben a befektetők izgatottan várják a szerdai amerikai inflációs jelentést...

MA 11:45

A népszerű glükózamin gyorsíthatja az Alzheimer-kór romlását

Egy új kutatás összefüggést talált a glükózamin nevű étrend-kiegészítő használata és az Alzheimer-kór gyorsabb előrehaladása között...

MA 11:34

Az adatvédelem új korszaka: te döntöd el, mi derül ki

Noha a digitális világ egyre gyorsuló ütemben szivárog be a mindennapokba, a bizalom megingott: az emberek ma már nem hisznek feltétlenül abban, hogy adataik biztonságban vannak...

MA 11:23

A 11 nyerő projektor, hogy nagyban nézd a vébét

A 2026-os labdarúgó-világbajnokság közeleg – június 11-én indulnak a csoportmeccsek, és július 19-én jön a döntő...

MA 11:12

A Vanillaware huszonhárom év után végre PC-re költözik

🖥 Például a japán Vanillaware stúdió 23 éve tartó PC-kerülése hamarosan véget ér: a Muramasa: Visszatérő pengék (Revenant Blades) érkezik a Steamen is, ami nemcsak a rajongók régóta dédelgetett álma, hanem egy korszak vége is...

MA 11:01

Az Apple új architektúrája: helyi MI-ügynökök memóriakorlát nélkül

🚀 Az Apple legújabb fejlesztésével eddig sosem látott ugrást hozott a helyi MI-modellek világában...

MA 10:55

Az átok megtört: a Hotel Barcelona Steamen többnyire pozitívra váltott

A Hotel Barcelona, egy oldalnézetes akció-platformer, végre maga mögött hagyta a középszerű „Vegyes” minősítést a Steamen, és most „Többnyire pozitív” minősítéssel büszkélkedhet...

MA 10:46

A Hyperliquiden beszakadt a SpaceX pre-IPO árfolyama: mínusz 27% három hét alatt

🚀 Jelentős visszaesést mutat a SpaceX-hez köthető SPCX-szerződés a Hyperliquid platformon: három hét alatt 27%-ot esett, pedig még mindig magasabban forog, mint a cég rögzített, 135 dolláros (kb...

MA 10:38

Az Anthropic a tömegekhez viszi a Mythost a Claude Fable 5-tel

🦄 Az Anthropic jelentősen átrendezi a mesterségesintelligencia-piacot, miután most először széles körben elérhetővé tette új, kiemelkedően fejlett modelljét, a Claude Fable 5-öt...