Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.


Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

  • Te szerinted veszélyes, ha emberek teljesen megbíznak ezekben a gépekben?
  • Mit gondolsz, hol húznád meg a határt gépi és emberi döntés között?
  • Te mit tettél volna, ha egy ilyen MI hibázik egy fontos helyzetben?



Legfrissebb posztok

szerda 15:59

Most már flörtölnek a mesterséges intelligenciák, és pénzt is termelnek

😉 Az OpenAI vezérigazgatója, Sam Altman nemrégiben bejelentette, hogy a ChatGPT hamarosan képes lesz felnőtt felhasználók számára erotikus tartalmakat is létrehozni, miután a vállalat szerinte már orvosolta a mesterséges intelligenciával folytatott beszélgetések okozta mentális egészségi kockázatokat...

MA 18:01

A texaszi új app-áruház törvény: főhet a feje a techóriásoknak

Texas január 1-jétől életbe lépteti új app-áruház törvényét, amely minden felhasználótól életkor-igazolást követel, mielőtt alkalmazást tölthetne le vagy alkalmazáson belüli vásárlást hajthatna végre...

MA 17:58

Az univerzum élesebben látszik a James Webb távcsővel

A James Webb űrtávcső új szintre emelte a kozmosz megfigyelését, de a maximális felbontást egy apró, intelligens eszköz, az apertúramaszk-interferométer (AMI) hozta el...



MA 17:31

Az Apophis aszteroida-missziót az utolsó pillanatban sikerült megmenteni

A NASA OSIRIS-APEX küldetése, amelyet a kormányzati megszorítások miatt le akartak állítani, váratlanul 20 millió dollár (kb...



MA 16:59

Az arany ára elképesztően magasra szökött, mi áll a háttérben

Az elmúlt hetekben az arany ára történelmi csúcsot döntött, amikor a New York-i tőzsdén csütörtökön 4 326 USD-ig, vagyis mintegy 1 232 540 forintig emelkedett unciánként...



MA 16:29

Az MI-s Reddit-válaszok veszélyeztetik az egészségedet

A Reddit “Családorvoslás” (Family Medicine) aloldalán egy moderátor figyelmeztetett: az MI-alapú Reddit-válaszok automatikusan felelnek a posztokra, de gyakran súlyosan veszélyes félretájékoztatást terjesztenek...



MA 16:03

Az MI a leépítések bűnbakja, valódi veszély vagy csak kifogás

Az utóbbi években világszerte egyre több vállalat döntött létszámcsökkentés mellett, miközben a mesterséges intelligenciára (MI) hivatkoznak, mint elsődleges okra...



MA 16:00

Forradalmasítják a MI-portrék a munkaerőpiacot, új arcok jelennek meg

Az álláskeresők egyre nagyobb arányban cserélik le drága stúdiófotóikat olcsó, percek alatt elkészülő MI-alapú portrékra...



MA 15:30

Az első csillagszívverés, amit egy űrbéli robbanás rejtett el

🛰 A csillagászoknak most először sikerült észlelniük egy újszülött csillag szabályos pulzálását egy hatalmas kozmikus robbanás közepette...

MA 15:00

Az éghajlat csak fokozódik: Rekordszintű a szén-dioxid 2024-ben

2024-ben soha nem látott magasságba emelkedett a légköri szén-dioxid szintje, újabb komoly figyelmeztetést adva a globális felmelegedésre...



MA 14:58

Az új Linux-őrület: Menekülés a Windows 10-ről

A Windows 10 végleges búcsúja után tömegek keresnek új otthont számítógépüknek...



MA 14:30

Meglepő, hogyan alakítja át álmaink a memóriánkat

Az éjszakai alvás nem csupán pihenés, hanem szinte laboratóriumi munka a memóriánknak: az egyes alvásfázisok szerint átrendeződnek az emlékek, így néhány részlet elhalványul, míg mások általános tudássá állnak össze...



APP
MA 09:11

APPok, Amik Ingyenesek MA, 10/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

szombat 23:59

Az Apple lenyúlta a Forma–1-et az amerikai nézőknek

Az Apple 750 millió dollárt, vagyis átszámítva mintegy 275 milliárd forintot fizetett azért, hogy a következő öt évben kizárólag az Apple TV közvetíthesse a Forma–1-es futamokat az Egyesült Államokban...



szombat 23:30

Az MI-vel készült óravázlatok unalmasak és elavultak

Az MI, mint az oktatás forradalmasításának egyik ígéretes eszköze, gyorsan elnyerte a tanárok figyelmét...



szombat 23:01

Az OpenAI leállította a Martin Luther King deepfake videókat

🚫 Az OpenAI felfüggesztette a Martin Luther King Jr.-ról mesterséges intelligenciával készült videók létrehozását Sora nevű alkalmazásában, miután több tiszteletlen klip is megjelent a platformon...

szombat 22:59

Az ázsiai fizika legendája: Yang Chen Ning 103 évesen elhunyt

A modern fizika egyik legnagyobb alakja, Yang Chen Ning 103 éves korában hunyt el Pekingben...



szombat 22:30

Az új Windows-frissítés mindenkit kiborított – de itt a javítás

🙁 Az utóbbi Windows-biztonsági frissítések súlyos hibát okoztak: sem a Windows 11-en, sem a Windows Server 2025 rendszeren nem lehetett HTTP/2 kapcsolattal elérni a localhost (127...

szombat 22:01

Az olvadó permafroszt újra felkorbácsolja a klímaaggodalmakat

🌨 A sarkvidéki örökfagy világa most új veszélyforrást rejt: a globális felmelegedés több tízezer éves baktériumokat éleszt fel...