Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.


Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

  • Te szerinted veszélyes, ha emberek teljesen megbíznak ezekben a gépekben?
  • Mit gondolsz, hol húznád meg a határt gépi és emberi döntés között?
  • Te mit tettél volna, ha egy ilyen MI hibázik egy fontos helyzetben?


Legfrissebb posztok

MA 16:49

Vége lehet Hollywood aranykorának az új Netflix–Warner Bros.-óriással?

🎥 Nehéz elhinni, de a Netflix és a Warner Bros. közötti friss felvásárlási megállapodás máris felforgatta a teljes hollywoodi piacot...

MA 16:34

A házi csodachip: több mint ezerszeres ugrás a garázslaborban

Fontos kérdés, hogy meddig juthat el egy lelkes egyetemista, ha házilag, garázsban barkácsolja össze saját integrált áramköreit...

MA 16:18

A pénzed turbója: egyszerű lépések a gyorsabb célokért

Rendszeres pénzügyi stressz: nem kell mindent túlbonyolítani A pénzügyek kezelése rengeteg ember számára jár állandó lelkiismeret-furdalással: folyamatosan azt sugallják, hogy a megtakarításon, a befektetésen és persze az adók optimalizálásán is dolgozni kell...

MA 16:04

Az Xgimi Horizon 20 Max: Luxusmozi és gamer élmény egy projektorban

Ebből következően érdemes megérteni, hogy a hordozható projektorok piacán is megjelentek a valódi prémium modellek...

MA 15:50

Az oroszországi aranyáldozatok rejtélye: 2400 éves kincs került elő

🏁 A dél-uráli Vysokaya Mogila sírmezőn egyedülálló, 2 400 éves áldozati komplexumot tártak fel orosz régészek, amely új fényt vet a nomádok temetkezési rítusaira...

MA 15:35

Az ingatlanpiac, amely még Warren Buffettet is szabályszegésre csábította

Érdekes felvetés, hogy még a legendás Warren Buffett is hajlandó volt felrúgni saját, kőbe vésett szabályait a mostani ingatlanpiaci körforgásban...

MA 15:04

Az óriás Doogee V Max Play: túlélőmobil vagy hordozható tégla?

A Doogee V Max Play nem aprózta el a strapatelefon fogalmát: ez a készülék méretével, tömegével és funkciókínálatával messze túlmutat a rutinos túrázók és kalandorok elvárásain...

MA 14:17

Az afrikai sertéspestis miatt öt spanyol labor került gyanúba

🐷 Spanyolországban pánikot okozott az afrikai sertéspestis felbukkanása, ezért a hatóságok öt laboratóriumban is vizsgálatot folytatnak, hogy kiderítsék, honnan indult ki a fertőzés...

MA 13:49

Az elviselhetetlen záptojásszag lehet a körömgomba végső ellenszere

Különösen igaz ez akkor, ha valaki évek óta küzd makacs körömgombával, amely semmilyen kezelésre nem reagál igazán...

MA 13:34

Az ítélet sorsa a megbánáson múlik – felismerjük az őszintét?

👳 Az igazságszolgáltatás világában a megbánás jelentőséggel bír – nemcsak a filmes bírósági tárgyalások kulcspillanataiban, hanem a valódi ítélethozatalban is...

MA 13:18

A valaha hallott legbrutálisabb hang: vulkánkitörés vagy meteoritbecsapódás?

💥 Érdemes megvizsgálni, mi számít a leghangosabb zajnak, amit valaha feljegyeztek a Földön...

MA 12:50

A techcégek legnagyobb aduja az MI-korszakban: a kiberbiztonság

🔒 Ma már a kiberbiztonság jóval többet jelent egyszerű IT-feladatnál: a technológiai vállalatok számára stratégiai eszközzé vált, amely közvetlenül befolyásolja a vállalat értékét, növekedését és ellenálló képességét...

MA 12:33

Az antivirális szerek rejtett csapdája: a vírusok társas élete

💉 Felmerül a kérdés, hogy a vírusok mennyire befolyásolják egymás sikerét a szervezetünkben, és milyen hatással van ez az antivirális kezelésekre...

MA 12:18

Az új Jolla Phone: független linuxos mobil – megéri kivárni?

Érdekes felvetés, hogy egy olyan piacon, ahol szinte minden okostelefon két nagy rendszer között osztozik, a Jolla ismét próbálkozik egy valódi, Linux-alapú, önálló telefon piacra dobásával...

MA 12:01

Az új holdrengések keresztülhúzhatják a NASA számításait

🌑 Különösen igaz ez akkor, ha egy biztonságos holdbázis tervezése a tét: most kiderült, hogy a Hold felszínén nemcsak meteoritbecsapódások formálták a domborzatot, hanem főként holdrengések rázták meg az Apollo 17 leszállóhelyének környékét...

MA 11:49

A siker titka: empátia és józan ész kéz a kézben

Az emberek gyakran vitáznak azon, hogy az empátia vagy a józan ész segít-e jobban a döntésekben, amikor másokon kell segíteni...

MA 11:18

Mi köti össze az elszigetelt emberiséget, az űrpörgettyűt és a koponyagödröt?

🧠 Felmerül a kérdés, hogy mennyire különleges volt egy elszigetelt emberi populáció Dél-Afrikában, hogyan borította fel Kína az aszály elleni védekezéssel a saját éghajlatát, és mi a magyarázata egy titokzatos mexikói koponyagödörnek...

MA 11:00

Az óriáspiac az Amazonas esőerdőjének sírját ássa

Fontos kérdés, hogy hol húzódik a határ a gazdasági fejlődés és a bolygó legnagyobb esőerdőjének túlélési esélyei között...

MA 10:25

Az AGM G3 Pro: páncéltelefon, amiért mélyen a zsebbe nyúlsz

🛡 Az AGM G3 Pro kiemelkedik a strapabíró telefonok mezőnyéből elegáns megjelenésével és meglepően hasznos hőkamerájával...