Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.


Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

  • Te szerinted veszélyes, ha emberek teljesen megbíznak ezekben a gépekben?
  • Mit gondolsz, hol húznád meg a határt gépi és emberi döntés között?
  • Te mit tettél volna, ha egy ilyen MI hibázik egy fontos helyzetben?



Legfrissebb posztok

A SpaceX újabb Starship kudarcai, mire jutottak eddig

MA 13:04

A SpaceX újabb Starship kudarcai, mire jutottak eddig

🚀 2024-ben a SpaceX számára eddig hullámvasútra emlékeztetett a Starship szuperrakéta fejlesztése: bár tavaly jelentős áttöréseket értek el, idén két sikertelen tesztrepülés is hátráltatta a programot. Most végre kiderült,...

Az ablak bezárul: két hónap múlva véget ér a Windows 10 támogatása

MA 12:51

Az ablak bezárul: két hónap múlva véget ér a Windows 10 támogatása

🚪 Október 14-én hivatalosan is nyugdíjba vonul a Windows 10, megszűnik minden kiadás (Home, Pro, Enterprise, Education, IoT Enterprise) támogatása, beleértve a 22H2 főverziót, valamint a 2015-ös LTSB és...

Az új szupervezető anyag valóban trükkös dolgokra képes

MA 12:01

Az új szupervezető anyag valóban trükkös dolgokra képes

A Rice Egyetem és tajvani kutatók most először mutatták ki, hogy a különleges, úgynevezett kagome-fémszerkezetű, króm-alapú cézium-króm-antimonidban (CsCrSb) szupervezetőben aktív, lapos elektronikus sávok működnek. Ez a felfedezés új...

Űrből jön a net, a Starlink és Virginia összecsap

MA 11:27

Űrből jön a net, a Starlink és Virginia összecsap

A SpaceX, a Starlink műholdas internetszolgáltatás üzemeltetője, komoly harcot vív Virginia állammal, hogy a szövetségi támogatásokból jóval nagyobb részt kapjon. Jelenleg is több mint 1 milliárd forint támogatásra...

APPok, Amik Ingyenesek MA, 8/18
APP

MA 11:12

APPok, Amik Ingyenesek MA, 8/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     One Hit. (iPhone/iPad)A One Hit egy fizikára épülő ügyességi játék, ahol feladatod, hogy egyetlen lövéssel találd...

Idősebbek és a mesterséges intelligencia, bízhatunk benne vagy sem

MA 11:01

Idősebbek és a mesterséges intelligencia, bízhatunk benne vagy sem

👨 Az MI nem csupán a fiatalabb generációk eszköze: az idősebb amerikai lakosság több mint fele már kipróbálta valamilyen formában ezt a technológiát. A 65 év felettiek 55 százaléka...

Az MI átalakítja a munkahelyeket, kérdés, ki kapja őket

MA 10:51

Az MI átalakítja a munkahelyeket, kérdés, ki kapja őket

Pályafutásom elején idegtudományi tapasztalatokat szereztem, nem üzletből, mérnöki vagy HR-területről. Amikor a GitLab termékvezetője lettem, korábban még sosem irányítottam termékfejlesztési csapatot, és nem voltak klasszikus szakmai papírjaim sem....

Az egyik legnépszerűbb játékplatform, ahol a gyereked veszélyben lehet

MA 08:53

Az egyik legnépszerűbb játékplatform, ahol a gyereked veszélyben lehet

🚨 Louisiana állam pert indított a Roblox ellen, mert szerintük a platform szándékosan nem tesz eleget a gyerekek biztonságáért. Világszerte naponta több mint 111,8 millió aktív felhasználó lép be,...

Az MI-őrület újabb fordulata: ChatGPT-5 tarol, Grok megint ég

MA 08:40

Az MI-őrület újabb fordulata: ChatGPT-5 tarol, Grok megint ég

💻 A legújabb tesztek szerint a ChatGPT-5 pontosabb, mint bármelyik korábbi verziója, sőt, a konkurenciát is lekörözi, amikor a mesterséges intelligencia által generált “hallucinációkról” van szó. A hibás, kitalált...