Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.

Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

Share on Social Media

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Gondolkodik vagy csak ismétel?

Törékeny utánzás és megtévesztő megbízhatóság

Ne keverd össze az embert a géppel!

Legfrissebb posztok

Most már flörtölnek a mesterséges intelligenciák, és pénzt is termelnek

A texaszi új app-áruház törvény: főhet a feje a techóriásoknak

Az univerzum élesebben látszik a James Webb távcsővel

Az Apophis aszteroida-missziót az utolsó pillanatban sikerült megmenteni

Az arany ára elképesztően magasra szökött, mi áll a háttérben

Az MI-s Reddit-válaszok veszélyeztetik az egészségedet

Az MI a leépítések bűnbakja, valódi veszély vagy csak kifogás

Forradalmasítják a MI-portrék a munkaerőpiacot, új arcok jelennek meg

Az első csillagszívverés, amit egy űrbéli robbanás rejtett el

Az éghajlat csak fokozódik: Rekordszintű a szén-dioxid 2024-ben

Az új Linux-őrület: Menekülés a Windows 10-ről

Meglepő, hogyan alakítja át álmaink a memóriánkat

APPok, Amik Ingyenesek MA, 10/19

Az Apple lenyúlta a Forma–1-et az amerikai nézőknek

Az MI-vel készült óravázlatok unalmasak és elavultak

Az OpenAI leállította a Martin Luther King deepfake videókat

Az ázsiai fizika legendája: Yang Chen Ning 103 évesen elhunyt

Az új Windows-frissítés mindenkit kiborított – de itt a javítás

Az olvadó permafroszt újra felkorbácsolja a klímaaggodalmakat