Az MI gondolkodása hamarosan kiismerhetetlenné válhat

Az MI gondolkodása hamarosan kiismerhetetlenné válhat
Az elmúlt években az MI fejlődése olyan ütemre kapcsolt, hogy még a legnagyobb technológiai cégek – köztük a Google DeepMind, az OpenAI, a Meta és az Anthropic – vezető kutatói is komoly aggodalmakat fogalmaznak meg a mesterséges intelligencia jövőbeli átláthatóságával kapcsolatban. Fontos megjegyezni, hogy ezek a szakemberek már nemcsak azt tartják kockázatosnak, ha egy MI hibázik, hanem azt is, hogy döntéseinek indoklása, magyarázata hamarosan teljesen kicsúszhat az emberi ellenőrzés alól.

Mi az a gondolatlánc, és miért fontos?

A jelenlegi nagy nyelvi modellek, mint a ChatGPT vagy a Google Gemini, bonyolult problémák megoldásakor gyakran alkalmazzák az úgynevezett “gondolatláncot” (Chain of Thought – CoT). Ez azt jelenti, hogy a gép egy kérdést több kisebb, logikus lépésre bont, ezek mentén haladva jut el a válaszig, és mindezt természetes nyelven fejti ki. A gondolatláncok követése lehetővé teszi, hogy a kutatók belenézzenek az MI “fejébe”, és átlássák, miért dönt úgy, ahogy.

Ennek ellenére már most több korlátja is van a rendszeres CoT-ellenőrzésnek. Előfordulhat, hogy a modell bizonyos döntései nem követhetők végig, mert hiányoznak a gondolatlánc-lépések, vagy azok rejtve maradnak a felhasználók elől. Emellett az is gyakori, hogy az MI által alkalmazott logika egyszerűen érthetetlen az emberek számára, sőt, akár teljes egészében észrevétlen is maradhat.

Kihívások a felügyeletben

A klasszikus, nem érvelő modellek – mint a K-Means vagy a DBSCAN – pusztán az adattípusok közötti mintázatokat keresik, CoT-re nincs szükségük. Az újabb generációs modellek – például a Gemini vagy a ChatGPT – bár képesek gondolatláncot létrehozni, nem feltétlenül hozzák ezeket nyilvánosságra, és a gép nem mindig „jelez előre”, amikor ilyen elemeket használ. Így még a monitorozható gondolatláncok is lehetnek félrevezetők vagy hiányosak; az igazán kritikus logikai lépések akár el is rejtőzhetnek.

A fejlődés ütemét látva borítékolható, hogy a következő MI-generációk döntéseinél a gondolatláncok szerepe csökkenhet, vagy az MI akár képes lesz felismerni, ha „figyelik”, és így megtanulhatja elrejteni, ha szándékosan félrevezet. Ez arra utal, hogy a jó szándékú emberi ellenőrzés előtt újabb akadályok tornyosulhatnak.

Lehetséges megoldások és javaslatok

Az átláthatóság érdekében a kutatók többféle eszközt javasolnak: például más modellekkel kellene vizsgáltatni az LLM-ek gondolatláncait, sőt, akár „ellenfélként” is felléptethetnek egy MI-t, hogy lebuktassa a csaló vagy eltitkolt lépéseket. Fontos lenne az ilyen ellenőrzések eredményeit minden MI-modell bemutatkozó leírásába (system card) is belefoglalni, és továbbfejleszteni a CoT-monitorozás technikáit.

Végül kiemelik: bár a jelenlegi szintű „belenézhetőség” rendkívül értékes, semmi sem garantálja, hogy ez tartós marad, ezért az MI-kutatóknak és a fejlesztőknek ki kell aknázniuk és tovább kell fejleszteniük a CoT-monitorozás lehetőségeit, amíg még nem késő.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz arról, hogy egy MI tudatosan eltitkolhatja a döntési lépéseit?
  • Szerinted etikus lenne más MI-kel ellenőriztetni egy modell gondolkodási folyamatát?
  • Ha fejlesztő lennél, hagynád, hogy az MI néha "elrejtse" a logikáját, vagy mindig átláthatóságot követelnél?



Legfrissebb posztok

hétfő 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...

MA 07:43

Az Athena-terv botránya felforgatja a NASA jövőjét

🚀 Washingtonban, a Capitol Hillen egyre inkább forrnak az indulatok egy titokzatos dokumentum, az Athena-terv nyilvánosságra kerülése miatt...

MA 07:36

Az MI végre feltöri a Crohn‑betegség titkos kódját

Évtizedes találgatások után a kutatók rájöttek, hogyan vezet a Crohn‑betegséghez két bélfehérje kapcsolatának megszakadása – és hogyan lehetne ezt helyreállítani a gyulladás megszüntetése érdekében...

MA 07:29

Az MI-modellek alig értik a saját működésüket

🤔 A nyelvi modellek önreflexiója továbbra is gyenge lábakon áll. Az Anthropic legújabb kutatása szerint ezek a nagy nyelvi modellek (LLM-ek) csak ritkán képesek felismerni és leírni saját belső folyamataikat, annak ellenére, hogy olykor mutatnak némi önismereti jelet...



MA 07:22

Az OpenAI az Amazonhoz költözik, de továbbra is Microsoft-függő

Az OpenAI hét évre szóló, közel 14 000 milliárd forintos (38 milliárd dolláros) megállapodást kötött az Amazon Web Services-szel (AWS), hogy biztosítsa növekvő MI-számítási kapacitásait...

MA 07:15

Az ellopott rendőrségi fiókok miatt lyukasak a Flock kamerái?

🔒 Az amerikai törvényhozók szerint komoly veszélynek vannak kitéve azok az autórendszám-felismerő kamerák, amelyeket a Flock Safety üzemeltet országszerte, miután kiderült, hogy a cég nem kötelezi ügyfeleit a többfaktoros hitelesítés (MFA) használatára...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 11/4

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     伙力火车票 (iPhone/iPad)A 高铁管家 egy kínai utazási app, amely először kínált valós idejű vonatinformációkat...

MA 07:08

Az elnök nem is tudja, kit mentett fel

🙄 Donald Trump, volt amerikai elnök a közelmúltban kegyelmet adott a Binance kriptotőzsde alapítójának és volt vezérigazgatójának, Changpeng Zhaónak (C...



MA 07:01

Az ál-Solidity bővítmény csapdába csalja a fejlesztőket

A fejlesztők újabb veszélyforrással néznek szembe: a SleepyDuck nevű távoli elérésű trójai a népszerű Solidity-kiterjesztés hamis változataként jelent meg az Open VSX nyílt forráskódú bővítménytárban...

MA 06:57

Az összefonódott atomok erősebbé teszik a fénykibocsátást

💡 A fizikusok új kutatásban kimutatták, hogy az atomok közti közvetlen kölcsönhatás képes jelentősen felerősíteni a szuperradianciát, vagyis az atomok tömeges, tökéletesen hangolt fénykibocsátását...



MA 06:53

Az iPhone üveghatásának szabályozása végre a te kezedbe kerülhet

Az iOS 26.1 már letölthető, és izgalmas újdonságokat hoz az iPhone-tulajdonosoknak...

MA 06:40

Profi orrfuvola: fújd az orroddal a show-t!

A Bocarina Professional fekete orrfuvola minden zenészkedvű kíváncsinak kiváló választás. Ez az orral fújható különleges hangszer egyedülálló módon, minimális gyakorlással is élvezetes zenei élményt nyújt...



hétfő 20:55

Az Xpeng lenyomja a nagyokat olcsó villanyautóival

A kínai Xpeng történelmi növekedést mutat az elektromos autók piacán: egymás után második hónapban szállított le több mint 40 000 autót, ezzel a szegmens robbanásszerű tömegpiaci stratégiájának egyik legnagyobb nyertesévé vált...

hétfő 20:46

Az élet mulandóságát hirdette egy pompeji mozaik

Egyedülálló mozaikot fedeztek fel Pompejiben, amely még a Vezúv kitörése előtt készült, és emlékezteti a szemlélőt: mindannyian halandók vagyunk...



hétfő 20:37

Az első engedélyezett BMW: itt a kéz nélküli autópályás vezetés

A BMW első autógyártóként kapta meg a friss ENSZ 171-es szabályozás szerinti jóváhagyást, amellyel Motorway Assistant nevű rendszerét már több országban is bevezethetik...



hétfő 20:28

Valóban nekünk szólnak az MI-böngészők?

A böngészők világa forradalmi változásokon megy keresztül, az MI-integráció egyre nagyobb teret hódít...

hétfő 20:19

Az Apple legolcsóbb okosórája most fillérekbe kerül

Az Apple Watch SE 3 most először lett igazán olcsó: az Amazonon 199,99 dollárért, vagyis nagyjából 73 000 forintért lehet megvásárolni, ami körülbelül 18 000 forintos árcsökkenést jelent...



hétfő 20:01

Az OpenAI már évi 4 700 milliárd forint körül jár?

Sam Altman, az OpenAI vezérigazgatója szerint a cég jóval 13 milliárd dollár, vagyis nagyjából 4 700 milliárd forint éves bevétellel büszkélkedhet – és nála most már tényleg elég a folytonos faggatózásból, hogy miből fizetik ki az elképesztő költségeket...



hétfő 19:46

Az élet szikráját az ifjú Nap dühöngése adhatta

A fiatal Naphoz hasonló csillagok óriási energiájú kitörései döntő szerepet játszhattak abban, hogy a Földön megjelenjen az élet...