Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.


Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

  • Te szerinted veszélyes, ha emberek teljesen megbíznak ezekben a gépekben?
  • Mit gondolsz, hol húznád meg a határt gépi és emberi döntés között?
  • Te mit tettél volna, ha egy ilyen MI hibázik egy fontos helyzetben?


Legfrissebb posztok

csütörtök 06:42

Az igazi Múmia visszatér: Fraser és Weisz újra együtt

🎬 Megint feltámad A múmia (The Mummy) filmsorozat, mégpedig a rajongók kedvenc párosával: Brendan Fraser és Rachel Weisz ismét visszatérnek a következő részben...

szombat 18:03

KVÍZ: Mennyit tudsz a mesterséges intelligenciáról?

A mesterséges intelligencia egyre nagyobb szerepet játszik az életünkben, az okostelefonoktól kezdve az önvezető autókig és az egészségügyi diagnosztikáig...

szombat 14:24

Tévedhetetlen szakértők? Az előrejelzések meglepő valósága

I. Egy szakértő a szakértőkről Pontosítsunk, mivel mi nem vagyunk szakértők, hogy a jövőt megjósoljuk: eddig általában ebből nem sok jó sült ki...

MA 20:21

Az új Pixel Watch vérnyomásmérője: most te is tesztelheted!

📏 A Fitbit új funkciókat tesztel a Pixel Watch 3 okosórán, amelyekkel hamarabb észlelhető a magas vérnyomás, valamint riasztások érkeznek, ha szokatlan változás történik az egészségi adataidban...

MA 20:11

Az indiai-óceáni szigetet nem az MI, hanem a kábelek érdeklik

📱 Az elmúlt napokban felröppentek a hírek, miszerint a Google hatalmas MI-adatközpontot építene az Ausztráliához tartozó Karácsony-szigeten (Christmas Island), nem messze a kínai érdekeltségű vizektől, az ausztrál hadsereggel kötött felhőalapú megállapodás részeként...

MA 19:52

A Tacoma Narrows híd összeomlása, mérnöki hibák és tanulságok

⚠ 1940. november 7-én, délelőtt 11 óra után néhány perccel a Tacoma Narrows híd hangos reccsenéssel a Puget-szorosba zuhant...

MA 19:41

Az új technológia tényleg a disztópikus sci-fikből másol?

A mai technológiai fejlesztések gyakran a múlt századi disztópikus sci-fi filmek és regények világát idézik...

MA 19:23

Bajban az emberiség, medvetámadások és elakadt űrhajósok fenyegetnek

Az elmúlt napokban a tudományos világban igazán színes hírek láttak napvilágot: Japánban medvetámadások miatt szokatlan intézkedést vezettek be, a kínai űrhajósok még mindig nem tudnak hazatérni, és a római utak kiterjedtsége is új megvilágításba került...

MA 18:52

Az MI-részvények zuhanása elsöpri az ázsiai piacokat

📈 Ázsia–Csendes-óceáni tőzsdék pénteken meredeken estek, miután az amerikai technológiai részvények lejtmenete átragadt rájuk...

MA 18:42

Az ausztrálok lehetnek a klímacsúcs főszereplői

🌍 Az elmúlt évtizedben a Párizsi Klímaegyezmény történelmi eredményei után világszerte komoly előrelépések történtek a kibocsátáscsökkentés és a tiszta energiára való átállás terén...

MA 18:31

Visszaszorul az indiai–orosz olajüzlet? Trump újra látogatna

📊 Az Egyesült Államok és India közötti kereskedelmi egyeztetések jó irányba haladnak, legalábbis Donald Trump szerint...

MA 18:21

Az Android Auto Gemini-frissítése forradalmasítja az utazást

🚗 A Google elindította a Gemini MI-t az Android Autóban, és fokozatosan egyre több autó fedélzeti rendszerében váltja le a korábbi Google Assistant segédet...

MA 18:11

Most derült ki, miért tudja kijátszani a vastagbélrák az immunrendszert, ez lehet a gyógyulás kulcsa

A vastagbélrák sorsát egyetlen, villámgyors esemény, az immunrendszer kijátszása pecsételi meg – derül ki új kutatásokból...

MA 18:01

Az űrben is hódít a Starlink: új légitársaságok, 8 millió előfizető

🚀 A SpaceX újabb nagy lépést tett a globális internethálózat kiépítésében: világszerte 8 millió ügyfelet ért el, és több mint 955 milliárd forint (2,6 milliárd USD) értékben vásárolt vezeték nélküli spektrumlicenceket az EchoStartól...

MA 17:40

Az amerikai gyártás aranykora, amely már sosem tér vissza

Az 1940-es évektől az 1970-es évekig az amerikai gyártás példátlan virágzását élte, olyan feltételek között, amelyek ma már elképzelhetetlenek...

MA 17:32

A Tejútrendszer rejtélyes hullámzásának titkai

🚀 A Tejútrendszer felépítéséről gyakran halljuk, hogy lapos, mint egy palacsinta – ám az újabb csillagászati megfigyelések teljesen más képet festenek...

MA 17:21

Az orosz hackerek újabb pusztítást hoznak Ukrajnára

Orosz állami támogatású hackercsoportok, köztük a hírhedt Sandworm, folyamatosan pusztító kibertámadásokat indítanak Ukrajna ellen...

MA 17:11

Az aknégyógyszer, ami megvédhet a skizofréniától

Egy sokak által ismert akné elleni szer, a doxiciklin (doxycycline), új reményt hozhat a skizofrénia megelőzésében...

MA 17:01

Az Amazon meghódítja az elektromos teherautók piacát

Az Amazon 2025 januárjában rekordméretű rendelést adott le elektromos nehézteher-gépjárművekre az Egyesült Királyságban, így már 160 eHGV-vel (elektromos teherautóval) rendelkezik az országban...