Az MI gondolkodása hamarosan kiismerhetetlenné válhat

Az MI gondolkodása hamarosan kiismerhetetlenné válhat
Az elmúlt években az MI fejlődése olyan ütemre kapcsolt, hogy még a legnagyobb technológiai cégek – köztük a Google DeepMind, az OpenAI, a Meta és az Anthropic – vezető kutatói is komoly aggodalmakat fogalmaznak meg a mesterséges intelligencia jövőbeli átláthatóságával kapcsolatban. Fontos megjegyezni, hogy ezek a szakemberek már nemcsak azt tartják kockázatosnak, ha egy MI hibázik, hanem azt is, hogy döntéseinek indoklása, magyarázata hamarosan teljesen kicsúszhat az emberi ellenőrzés alól.

Mi az a gondolatlánc, és miért fontos?

A jelenlegi nagy nyelvi modellek, mint a ChatGPT vagy a Google Gemini, bonyolult problémák megoldásakor gyakran alkalmazzák az úgynevezett “gondolatláncot” (Chain of Thought – CoT). Ez azt jelenti, hogy a gép egy kérdést több kisebb, logikus lépésre bont, ezek mentén haladva jut el a válaszig, és mindezt természetes nyelven fejti ki. A gondolatláncok követése lehetővé teszi, hogy a kutatók belenézzenek az MI “fejébe”, és átlássák, miért dönt úgy, ahogy.

Ennek ellenére már most több korlátja is van a rendszeres CoT-ellenőrzésnek. Előfordulhat, hogy a modell bizonyos döntései nem követhetők végig, mert hiányoznak a gondolatlánc-lépések, vagy azok rejtve maradnak a felhasználók elől. Emellett az is gyakori, hogy az MI által alkalmazott logika egyszerűen érthetetlen az emberek számára, sőt, akár teljes egészében észrevétlen is maradhat.

Kihívások a felügyeletben

A klasszikus, nem érvelő modellek – mint a K-Means vagy a DBSCAN – pusztán az adattípusok közötti mintázatokat keresik, CoT-re nincs szükségük. Az újabb generációs modellek – például a Gemini vagy a ChatGPT – bár képesek gondolatláncot létrehozni, nem feltétlenül hozzák ezeket nyilvánosságra, és a gép nem mindig „jelez előre”, amikor ilyen elemeket használ. Így még a monitorozható gondolatláncok is lehetnek félrevezetők vagy hiányosak; az igazán kritikus logikai lépések akár el is rejtőzhetnek.

A fejlődés ütemét látva borítékolható, hogy a következő MI-generációk döntéseinél a gondolatláncok szerepe csökkenhet, vagy az MI akár képes lesz felismerni, ha „figyelik”, és így megtanulhatja elrejteni, ha szándékosan félrevezet. Ez arra utal, hogy a jó szándékú emberi ellenőrzés előtt újabb akadályok tornyosulhatnak.

Lehetséges megoldások és javaslatok

Az átláthatóság érdekében a kutatók többféle eszközt javasolnak: például más modellekkel kellene vizsgáltatni az LLM-ek gondolatláncait, sőt, akár „ellenfélként” is felléptethetnek egy MI-t, hogy lebuktassa a csaló vagy eltitkolt lépéseket. Fontos lenne az ilyen ellenőrzések eredményeit minden MI-modell bemutatkozó leírásába (system card) is belefoglalni, és továbbfejleszteni a CoT-monitorozás technikáit.

Végül kiemelik: bár a jelenlegi szintű „belenézhetőség” rendkívül értékes, semmi sem garantálja, hogy ez tartós marad, ezért az MI-kutatóknak és a fejlesztőknek ki kell aknázniuk és tovább kell fejleszteniük a CoT-monitorozás lehetőségeit, amíg még nem késő.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz arról, hogy egy MI tudatosan eltitkolhatja a döntési lépéseit?
  • Szerinted etikus lenne más MI-kel ellenőriztetni egy modell gondolkodási folyamatát?
  • Ha fejlesztő lennél, hagynád, hogy az MI néha "elrejtse" a logikáját, vagy mindig átláthatóságot követelnél?



Legfrissebb posztok

Terjed Az MI-látszatjáték: a dolgozók színlelik a használatot

szerda 18:51

Terjed Az MI-látszatjáték: a dolgozók színlelik a használatot

🤔 Állásban vagy az Egyesült Államokban? Nos, akkor biztosan mindenki azt hiszi, hogy az MI a te legjobb haverod! Nagy eséllyel a főnököd is elvárja, hogy használj valamilyen mesterséges...

A Föld fordulatszáma növekszik: mi lesz az idővel?

MA 09:14

A Föld fordulatszáma növekszik: mi lesz az idővel?

Az utóbbi időben a Föld forgása fokozatosan gyorsul, olyannyira, hogy a globális időszámításért felelős szakemberek példátlan lépést fontolgatnak: napjainkban először elképzelhető, hogy bevezetnek egy úgynevezett negatív szökőmásodpercet, vagyis...

APPok, Amik Ingyenesek MA, 7/26
APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     iSocketTool (iPhone/iPad)A hálózati hibakereső eszköz egy TCP és UDP kommunikációs hibakereső eszköz, amely gazdag funkciókkal rendelkezik....

Az a bizonyos holdfázis: mit láthatsz július 26-án?

MA 09:01

Az a bizonyos holdfázis: mit láthatsz július 26-án?

🌕 A Hold minden éjjel egyre fényesebb arcát mutatja, ahogy haladunk a 29,5 napos holdciklusban. Ez a körforgás nyolc különböző fázist tartalmaz, attól függően, hogy a Nap éppen melyik...

Az okos hibák forradalmasíthatják a szupravezetőket

MA 08:52

Az okos hibák forradalmasíthatják a szupravezetőket

A szupravezetőkben az elektromos áram minden ellenállás nélkül halad át, így nem keletkezik hő. Jelenleg ilyen anyagokat főként MRI-berendezésekben használnak, ahol erős mágneses terekre van szükség. A szupravezetés...

Durva fordulat: Így töltheted szupergyorsan iPhone-od és Androidod!

MA 08:39

Durva fordulat: Így töltheted szupergyorsan iPhone-od és Androidod!

⚡ Jelentős újdonság, hogy az új Qi2 25W-os vezeték nélküli töltési szabvány végre megjelent, amely akár 25 watt teljesítménnyel képes tölteni a készülékeket – ez közel 70%-os ugrást jelent...

Az édesvíz vészesen fogy, a kontinensek kiszáradnak

MA 08:01

Az édesvíz vészesen fogy, a kontinensek kiszáradnak

Az elmúlt több mint húsz év műholdas mérései drámai képet festenek bolygónk édesvízkészleteiről. A kutatók szerint a Föld kontinentális területei minden eddiginél nagyobb mértékű édesvízveszteséget szenvednek el, amit...

Az app, ami nőket óvna, most képeket szivárogtatott

MA 07:52

Az app, ami nőket óvna, most képeket szivárogtatott

A Tea alkalmazás, amely azt ígéri, hogy segíti a nőket abban, hogy tájékozottabbak legyenek a randipartnereikről – például kiszűrni a csalókat, házasokat vagy veszélyes személyeket –, komoly adatbiztonsági...

Sokkoló újítások: az iOS 26 megérkezett, minden megváltozik!

MA 07:39

Sokkoló újítások: az iOS 26 megérkezett, minden megváltozik!

⚡ Az Apple legújabb mobil operációs rendszerének, az iOS 26-nak, megérkezett az első nyilvános bétája, amely már az őszi hivatalos bemutató előtt elérhető a technológiai újításokra éhes felhasználók számára....