Az MI gondolkodása hamarosan kiismerhetetlenné válhat

Az MI gondolkodása hamarosan kiismerhetetlenné válhat
Az elmúlt években az MI fejlődése olyan ütemre kapcsolt, hogy még a legnagyobb technológiai cégek – köztük a Google DeepMind, az OpenAI, a Meta és az Anthropic – vezető kutatói is komoly aggodalmakat fogalmaznak meg a mesterséges intelligencia jövőbeli átláthatóságával kapcsolatban. Fontos megjegyezni, hogy ezek a szakemberek már nemcsak azt tartják kockázatosnak, ha egy MI hibázik, hanem azt is, hogy döntéseinek indoklása, magyarázata hamarosan teljesen kicsúszhat az emberi ellenőrzés alól.

Mi az a gondolatlánc, és miért fontos?

A jelenlegi nagy nyelvi modellek, mint a ChatGPT vagy a Google Gemini, bonyolult problémák megoldásakor gyakran alkalmazzák az úgynevezett “gondolatláncot” (Chain of Thought – CoT). Ez azt jelenti, hogy a gép egy kérdést több kisebb, logikus lépésre bont, ezek mentén haladva jut el a válaszig, és mindezt természetes nyelven fejti ki. A gondolatláncok követése lehetővé teszi, hogy a kutatók belenézzenek az MI “fejébe”, és átlássák, miért dönt úgy, ahogy.

Ennek ellenére már most több korlátja is van a rendszeres CoT-ellenőrzésnek. Előfordulhat, hogy a modell bizonyos döntései nem követhetők végig, mert hiányoznak a gondolatlánc-lépések, vagy azok rejtve maradnak a felhasználók elől. Emellett az is gyakori, hogy az MI által alkalmazott logika egyszerűen érthetetlen az emberek számára, sőt, akár teljes egészében észrevétlen is maradhat.

Kihívások a felügyeletben

A klasszikus, nem érvelő modellek – mint a K-Means vagy a DBSCAN – pusztán az adattípusok közötti mintázatokat keresik, CoT-re nincs szükségük. Az újabb generációs modellek – például a Gemini vagy a ChatGPT – bár képesek gondolatláncot létrehozni, nem feltétlenül hozzák ezeket nyilvánosságra, és a gép nem mindig „jelez előre”, amikor ilyen elemeket használ. Így még a monitorozható gondolatláncok is lehetnek félrevezetők vagy hiányosak; az igazán kritikus logikai lépések akár el is rejtőzhetnek.

A fejlődés ütemét látva borítékolható, hogy a következő MI-generációk döntéseinél a gondolatláncok szerepe csökkenhet, vagy az MI akár képes lesz felismerni, ha „figyelik”, és így megtanulhatja elrejteni, ha szándékosan félrevezet. Ez arra utal, hogy a jó szándékú emberi ellenőrzés előtt újabb akadályok tornyosulhatnak.

Lehetséges megoldások és javaslatok

Az átláthatóság érdekében a kutatók többféle eszközt javasolnak: például más modellekkel kellene vizsgáltatni az LLM-ek gondolatláncait, sőt, akár „ellenfélként” is felléptethetnek egy MI-t, hogy lebuktassa a csaló vagy eltitkolt lépéseket. Fontos lenne az ilyen ellenőrzések eredményeit minden MI-modell bemutatkozó leírásába (system card) is belefoglalni, és továbbfejleszteni a CoT-monitorozás technikáit.

Végül kiemelik: bár a jelenlegi szintű „belenézhetőség” rendkívül értékes, semmi sem garantálja, hogy ez tartós marad, ezért az MI-kutatóknak és a fejlesztőknek ki kell aknázniuk és tovább kell fejleszteniük a CoT-monitorozás lehetőségeit, amíg még nem késő.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz arról, hogy egy MI tudatosan eltitkolhatja a döntési lépéseit?
  • Szerinted etikus lenne más MI-kel ellenőriztetni egy modell gondolkodási folyamatát?
  • Ha fejlesztő lennél, hagynád, hogy az MI néha "elrejtse" a logikáját, vagy mindig átláthatóságot követelnél?



Legfrissebb posztok

Az MI-vel tarol a Pixel 10 – Tényleg ennyit tud?

MA 17:26

Az MI-vel tarol a Pixel 10 – Tényleg ennyit tud?

A Google Pixel 10 Pro MI-újdonságait próbálva úgy tűnik, végre tényleg használhatóvá váltak ezek a fejlesztések – legalábbis, amikor éppen működnek. Az élő fordítás például zseniális, amíg teljesen...

Három fontos dolog, amit kibertámadáskor rögtön tudni akarsz

MA 17:02

Három fontos dolog, amit kibertámadáskor rögtön tudni akarsz

Amikor egy kibertámadás éri a céget, minden másodperc számít: lefagynak a rendszerek, elérhetetlenné válnak a fájlok, és pánikszerűen érkeznek a hívások. Ilyenkor leginkább az segít, ha három kulcsfontosságú...

A bél rejtett titka: az elhízás igazi gyújtózsinórja

MA 16:50

A bél rejtett titka: az elhízás igazi gyújtózsinórja

💬 Kanadai kutatók egy eddig ismeretlen módszert találtak arra, hogyan javítható a vércukorszint és csökkenthető a májkárosodás: a bélbaktériumok egy rejtett melléktermékét kell egyszerűen csapdába ejteni, még mielőtt problémát...

A Jangce titkos lakói: veszélyben a folyó élővilága

MA 16:26

A Jangce titkos lakói: veszélyben a folyó élővilága

Az elmúlt években a tudósok folyamatosan küzdenek azért, hogy megmentsék a kihalás szélére sodródott állatfajokat Kína leghosszabb folyójában, a Jangcében. Wuhanban, a Hidrobiológiai Intézet hatalmas medencéjében szürke, elegáns...

Szebbet teremt az MI, vagy csak jobban megtéveszt minket az esztétikai Turing-teszt

MA 16:02

Szebbet teremt az MI, vagy csak jobban megtéveszt minket az esztétikai Turing-teszt

A legújabb Guess reklámban egy feltűnően gyönyörű nő vonja magára a figyelmet – csakhogy nem létezik. Az apró betűs rész árulja el: a modell teljes egészében mesterséges intelligencia...

Az óriási Starship végre nem robbant fel – Siker a 10. teszt után!

MA 14:52

Az óriási Starship végre nem robbant fel – Siker a 10. teszt után!

A 123 méter magas, személyzet nélküli Starship rakéta új korszakot nyitott a világűrben, miután végre túlélte története eddigi leglátványosabb tesztjét. A rakéta kedden 19:30-kor szállt fel a texasi...

Az MI-cégek megütötték a bokájukat: 540 milliárd forintos bírság a szerzőknek

MA 14:26

Az MI-cégek megütötték a bokájukat: 540 milliárd forintos bírság a szerzőknek

Az Anthropic nevű MI-startup történelmi jelentőségű, 1,5 milliárd dolláros, azaz körülbelül 540 milliárd forintos kártérítést fizet ki könyvszerzőknek és kiadóknak egy szerzői jogi per lezárásaként. Ez az eddigi...

Újabb WhatsApp-botrány, tényleg egyfajta kultusz a Meta

MA 14:02

Újabb WhatsApp-botrány, tényleg egyfajta kultusz a Meta

🔎 Komoly kockázatok a felhasználók adatainál A WhatsAppot havonta 3 milliárd ember használja, a Meta pedig óriási reklámkampányban igyekszik mindenkit biztosítani arról, hogy az üzeneteid valóban titkosak, senki –...

Az olvasószemüveget egy szemcsepp válthatja le?

MA 13:51

Az olvasószemüveget egy szemcsepp válthatja le?

Egy új, forradalmi szemcsepp kínálhat megoldást azok számára, akik nehezen látnak közelre, vagyis öregszeműek (presbiópia esetén). A Buenos Aires-i Presbiópia Kutatóközpontban Dr. Jorge Benozzi és lánya, Dr. Giovanna...