2025. 08. 18., 10:54

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.


Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

  • Te szerinted veszélyes, ha emberek teljesen megbíznak ezekben a gépekben?
  • Mit gondolsz, hol húznád meg a határt gépi és emberi döntés között?
  • Te mit tettél volna, ha egy ilyen MI hibázik egy fontos helyzetben?


Legfrissebb posztok

MA 16:19

Az amerikai adatok szerint tűzvészek fenyegetik milliók otthonát

Az Egyesült Államokban sokan úgy gondolják, hogy az otthonokat elsősorban a sűrű, erdős, tűzveszélyes területeken fenyegetik a bozóttüzek...

MA 16:01

Az évtizedek óta várt rákvakcina új reményt adhat

Egy húsz évvel ezelőtti emlőrák-vakcina kísérlet lenyűgöző eredményt hozott: minden résztvevő ma is életben van, pedig áttétes betegek voltak...

MA 15:38

A részecskegyorsító leplezte le Hipparkhosz elveszett csillagkatalógusát

Fontos kérdés, hogy mennyit tudhatunk meg az ókori tudományról, ha eltűnt iratokból nyerünk ki új információkat...

MA 15:19

Az MI újabb 4 500 állást tüntet el a Dow Chemicalnél

📈 A Dow Chemical, a világ egyik legrégebbi vegyipari cége, 4 500 dolgozótól – vagyis a munkaerő 12,5 százalékától – válik meg egy átfogó átalakítás részeként, amelynek középpontjában az MI-alapú automatizálás áll...

MA 15:01

Az MI csodafegyvere: kevesebb agresszív mellrák, nagyobb túlélési esélyek

Egy nagyszabású svéd kutatásban több mint 100 ezer nő mammográfiás vizsgálatát elemezték, és kimutatták, hogy az MI támogatásával a radiológusok hatékonyabban szűrik ki az agresszív mellrákot...

MA 14:55

Az új Windows 11-frissítés után megint jöhet a kék halál

A legutóbbi Windows 11-frissítések után sokan szembesültek azzal, hogy számítógépük nem indul el, helyette csak egy kék képernyő (BSOD) jelenik meg az “UNMOUNTABLE_BOOT_VOLUME” hibakóddal...

MA 14:37

A hosszú élet titka: tényleg a génjeinkben van?

🧠 Friss kutatások szerint a génjeink jóval nagyobb szerepet játszanak a várható élettartamunkban, mint eddig hittük...

MA 14:02

A James Webb-űrtávcső rábukkant az eddigi legősibb galaxisra

Jellemző példa erre: a James Webb Űrteleszkóp újabb rekordot döntött: sikerült megfigyelni a világegyetem eddig ismert legrégebbi galaxisát, a MoM-z14-et...

MA 13:56

A Starbucks visszatér az egyszerűséghez – itt az új csoda

☕ A Starbucks remek formában van, köszönhetően Brian Niccol vezérigazgatónak, aki két év után először tudott növekedést felmutatni...

MA 13:37

Az új MI-hullám: a Google Genie felforgathatja a játékipart

A Google új MI-prototípusa, a Project Genie már most fenyegetést jelent a videojáték-fejlesztők számára...

MA 13:19

Az MI miatt hadat üzentek a kiadók az Internet Archive-nak

📚 A kiadók egyre nagyobb számban blokkolják az Internet Archive-ot, attól tartva, hogy az MI-botjai az archívum segítségével mégis hozzáférhetnek a tartalmaikhoz, és le is menthetik azokat...

MA 13:02

Az új nagyhatalmi sakkjátszma: a vezetők Pekingben keresik az irányt

🎲 Egy lényeges szempont, hogy idén januárban már legalább öt ország vezetője utazott Pekingbe, hogy találkozzon Hszi Csin-ping kínai elnökkel, miközben egyre feszültebbé váltak a kapcsolatok az Egyesült Államokkal...

MA 12:55

A vak bizalom az MI-ben megbénítja a cégeket

👀 Az európai cégek egyre többet költenek MI-re, de hiányzik az igazi bizalom és a kellő hozzáértés...

MA 12:39

A portlandi netforradalom nyertesei: a legjobb szolgáltatók

Érdemes tudni, hogy Portlandben rengeteg különböző internetcsomag közül lehet választani, legyen szó gyorsaságról, ár-érték arányról vagy csak a legalapvetőbb szolgáltatásokról...

MA 12:19

Az IPIDEA-botrány: fertőzött appokból épült fel a kiberbűnözők birodalma

🕵 Az IPIDEA, az egyik legnagyobb lakossági proxyhálózat, súlyos csapást kapott a Google fenyegetésfelderítő csapatának és partnereinek köszönhetően...

MA 12:01

Az önvezető taxik már a San Franciscó-i reptéren várnak

Jönnek a robotaxik San Franciscóba: a Waymo önvezető autói már a város nemzetközi repülőterén is szolgálatba álltak...

MA 11:56

A hackerek már kihasználják az Ivanti EPMM kritikus sebezhetőségeit

Nehéz elhinni, de két súlyos sebezhetőség is napvilágra került az Ivanti Endpoint Manager Mobile (EPMM) eszközében, amelyeket már aktívan ki is használtak ismeretlen támadók...

MA 11:37

Az El Niño rekordtempóban olvasztja az orosz sarkvidék tengeri jegét

🌨 A tudósok felfedezték azt a fordulópontot, amikor az El Niño északi-sarki tengeri jég olvadására gyakorolt hatása hirtelen felerősödött...

MA 10:57

A Google végre engedné az MI-összefoglalók tiltását?

A Google azt fontolgatja, hogy engedélyezi a weboldaltulajdonosoknak, hogy letiltsák tartalmuk felhasználását az MI-alapú keresési összefoglalókban...

MA 10:49

Az MI ezerszer gyorsabban megfejti a természet rejtett mintázatait

A rend soha nem tökéletes, és ezek az apró tökéletlenségek gyakran kulcsfontosságúak lehetnek...

MA 10:41

A végtelen repülés kora: lézerrel töltik a drónokat menet közben

🛫 Képzeld el, hogy a drónok soha nem merülnének le, mert repülés közben is tölthetnék az akkumulátorukat – ez most valósággá válhat...

MA 10:34

Az internet új kedvence: tombol a Moltbot-őrület

Egy nyílt forráskódú MI-asszisztens, a Clawdbot, népszerűsége robbanásszerűen nőtt, majd egy villámgyors névváltás után Moltbotként vonult be a köztudatba – káoszt, csalásokat és hamis kriptovalutákat hagyva maga után...

MA 10:27

Az MI-ügynökök térhódítása: láthatatlan fenyegetés a vállalati rendszerekben

🕸 Az MI az elmúlt években viharos gyorsasággal terjedt el a vállalati szektorban...

MA 10:17

Az elveszett Windows-bizalom: a Microsoft nagy visszahódításra készül

A Windows 40 éves története során számos hullámvölgyet átélt, de a Windows 11 most egészen új kihívások elé állítja a felhasználókat...

MA 10:05

A segítőből zaklató: mikor fordult ellenünk a szoftver?

Tipikus eset, amikor egy technológiai vívmány pont az ellenkező hatást váltja ki, mint amit várnánk tőle...

MA 09:58

A zabpehely már két nap alatt leviszi a koleszterint

Egy rövid távú, zabpehely-alapú diéta meglepően hatékonynak bizonyult a koleszterinszint csökkentésében...

MA 09:49

Betörtek az önvezető taxik az SFO-ra – egyelőre korlátozottan

Több mint három évnyi huzavona után végre elindulnak a Waymo utasszállító járatai a San Franciscó-i nemzetközi repülőtéren...

MA 09:43

Az MI elárasztja a tudományt: közeleg a Prism-vihar?

💥 Felmerül a kérdés, hogy meddig marad hiteles a tudományos publikálás, ha a mesterséges intelligencia (MI) egyre könnyebbé és gyorsabbá teszi a tudományos cikkek írását, miközben a szakmaiság sérülhet...

MA 09:33

Az App Store kulisszatitkai: letöltés, elbírálás, siker

💻 Az App Store a legegyszerűbb módja annak, hogy iPhone, iPad, Mac, Apple TV vagy Apple Watch készülékekre alkalmazásokat fedezz fel, vásárolj meg és tölts le...