2025. 08. 18., 10:54

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Az MI tényleg gondolkodik, vagy csak utánzat az egész?

Mik azok a “gondolkodó” nyelvi modellek?

Az MI-iparban egyre népszerűbbek az úgynevezett “gondolkodó” nagy nyelvi modellek (LLM-ek), amelyek képesek bonyolult problémákat is lépésről lépésre, logikusnak tűnő módon végiggondolni. Fontos hangsúlyozni, hogy ezek a modellek valójában nem értik, amit csinálnak: egyszerűen azokat a szöveges mintázatokat másolják, amelyeket a képzés során láttak. Kutatók most alaposabban megvizsgálták, mire képesek valójában ezek a modellek, ha kissé eltérő, “doménen kívüli” feladatokat kapnak – vagyis olyasmit, amire nem lettek kifejezetten megtanítva.

Gondolkodik vagy csak ismétel?

Az Arizonai Egyetem kutatói egy speciális környezetet hoztak létre, ahol kisméretű modelljeiket szándékosan csak nagyon egyszerű szövegátalakításokra tanították meg. Ezután olyan tesztekkel szembesítették a mesterséges intelligenciát, amelyek eltértek a korábbi mintáktól: vagy a feladat típusa, vagy a formátuma, vagy akár a hosszúsága különbözött a begyakorolt példáktól. Ebben az új helyzetben a modellek teljesítménye drasztikusan romlott. Gyakran adtak logikusan felépített, de hibás válaszokat, vagy éppen helyes megoldásokat, amelyekhez nem vezetett érvényes “gondolkodási” útvonal.

Törékeny utánzás és megtévesztő megbízhatóság

A kísérletek során akkor is romlott az eredményesség, ha a bemeneti szöveg csupán néhány karakterrel tért el a megszokottól, vagy a feladatsor hosszabb vagy rövidebb volt. Egy egyszerű formátumváltoztatás – például ismeretlen betűk vagy szimbólumok bevezetése – már elegendő volt ahhoz, hogy az MI teljesítménye meredeken visszaessen.

Egyedül a supervised fine-tuning, azaz célzott utótanítás tudott valamennyit javítani a helyzeten, ha nagyon hasonló példákat kapott a modell. Ez azonban nem jelent valódi általánosítást: csupán az adott esetre ragasztunk tapasztalati “foltot” a rendszerre. Következésképpen az MI továbbra sem rendelkezik absztrakt, általánosító gondolkodással.


Ne keverd össze az embert a géppel!

Fontos hangsúlyozni, hogy a láncolt gondolkodásnak (chain-of-thought) nevezett modellek önmagukban nem képesek általános logikai következtetésekre. Ezek a rendszerek lényegében fejlett, de felszínes mintázatkövetők, amelyek a megszokottól való legkisebb eltérés esetén könnyen hibáznak. Megtévesztő lehet, hogy hibás válaszaikat is magabiztosan, jól hangzó szövegben adják elő: ez a hamis megbízhatóság érzetét keltheti.

A kutatók szerint különösen veszélyes lehet ezekre a technológiákra támaszkodni olyan területeken, mint az orvoslás, a pénzügy vagy a jog, ahol valódi, emberi gondolkodásra lenne szükség. Azt javasolják, hogy a jelenlegi teszteknek inkább a “tanításon túli” feladatokat kellene előnyben részesíteniük, hogy feltárhassák a modellek korlátait. Az MI igazi áttörését pedig csak az hozhatja el, ha képes lesz a felszíni mintakövetésen túl mélyebb logikai következtetésekre.

2025, adminboss, arstechnica.com alapján

  • Te szerinted veszélyes, ha emberek teljesen megbíznak ezekben a gépekben?
  • Mit gondolsz, hol húznád meg a határt gépi és emberi döntés között?
  • Te mit tettél volna, ha egy ilyen MI hibázik egy fontos helyzetben?


Legfrissebb posztok

MA 17:12

Az aszteroida, ami genetikailag megelőzhet minket: becsapódik a Ryugu?

Ryugu, a Földtől 300 millió kilométerre keringő aszteroida, igazi űrbéli sztár lett, miután a japán Hayabusa2 űrszonda két mintát is hazahozott róla: egyet a felszínről, egy másikat a mélyebb rétegekből...

MA 17:03

Az új gravitációs hullámok az univerzum rejtett dallamát játsszák

🎶 Például egy hatalmas csillagrobbanás vagy két szupernehéz fekete lyuk összeolvadása olyan zörejeket kelt a világegyetemben, amelyek a földi léptékkel felfoghatatlan távolságokon is átsöpörnek...

MA 16:57

Az MI-ügynökök védelmének öt kőkemény aranyszabálya

🛡 Az MI-ügynökök megjelenése új korszakot nyit a vállalati működésben. Ezek a rendszerek nem egyszerű segédprogramok, nem pusztán fejlettebb chatbotok, hanem autonóm szereplők, amelyek önállóan képesek tervezni, dönteni és végrehajtani...

MA 16:46

Az éjszakai tűzoltó drónok végre megérkeznek Aspenbe

🛰 Aspenben új fejezetéhez érkezik a csúcstechnológiás tűzoltás, ahol idén nyáron bevetik az első, kifejezetten erdőtüzek elleni harcra tervezett drónokat...

MA 16:35

Az El Niño tombolása: példátlan hőhullámok közelednek

🔥 A légkörkutatók egy különösen erős, úgynevezett szuper El Niño kialakulására figyelmeztetnek, amely akár már a 2026-os hurrikánszezon végére is bekövetkezhet...

MA 16:23

A Microsoft visszakozik: nem tolja rá a Copilotot a gépekre

December elején a Microsoft automatikusan elkezdte telepíteni a Microsoft 365 Copilot nevű MI-asszisztenst tartalmazó alkalmazást minden olyan Windows-gépre, ahol a Microsoft 365 irodai programcsomag megtalálható volt, kivéve a jogszabályok miatt az Európai Gazdasági Térség országaiban...

MA 13:56

A Denon DP-500BT, a Bluetooth-os lemezjátszó, ami odaver

🎵 A Denon most dobja piacra a DP-500BT nevű lemezjátszót, ami egyszerre hozza a klasszikus vinyl-élményt és a menő, nagy felbontású Bluetooth-streamelést...

MA 13:34

Az ADHD-s agy ébren is álomszerű transzba eshet

Különös agyi működést figyeltek meg a kutatók azoknál, akik figyelemhiányos hiperaktivitás-zavarral (ADHD) élnek: miközben látszólag éberek, agyuk mégis időnként álomszerű, alváshoz hasonló állapotba kerül...

MA 13:24

Az elveszett Doggerland erdei újraélednek az Északi-tenger mélyén

🌲 Az Északi-tenger mélyén rejtőzik Doggerland, egykor Nagy-Britanniát és Európát összekötő földsáv, amely 16 ezer évvel ezelőtt buja erdőkkel és változatos állatvilággal teli élőhelyet kínált – jóval korábban, mint azt eddig gondolták...

MA 11:56

Az Nvidia új csodafegyvere: végre biztonságos lesz az OpenClaw?

🛡 Az Nvidia komoly lépést tett az MI-biztonság terén: bemutatta a NemoClaw platformot, amely vállalati szintű MI-ügynökök futtatását teszi lehetővé saját, helyben működő hardveren...

MA 11:45

Egy elterjedt növényvédőszer drámaian megduplázhatja a Parkinson-kór kockázatát

🐛 Egy friss kutatás szerint a klórpirifosz nevű, világszerte elterjedten használt növényvédőszer hosszan tartó hatása összefüggésbe hozható a Parkinson-kór jelentős kockázatnövekedésével...

MA 11:34

Az új kriptóláz: minden zuhan, csak a Bitcoin hasít

📈 Fontos kérdés, hogy a kriptovaluták piacát mi mozgatja ezekben a kaotikus hetekben...

MA 11:22

A halálos meningitisz-járvány tarol az angliai egyetemeken

😷 Két diák már életét vesztette Angliában egy heveny bakteriális fertőzés miatt, további tizenegyen pedig súlyos állapotban vannak kórházban...

MA 11:13

Az MI sötét oldala: káosz, perek, milliárdos veszteségek fenyegetik a cégeket

⚠ A vállalatok mind a mai napig keresik a helyes módszereket, hogyan integrálhatják az MI-t a saját működésükbe, és ez nem is baj – hiszen idő kell ahhoz, hogy átlássák az MI által generált kód és tartalom valós problémáit...

MA 11:01

A Pokémon Go ártatlan játéka indította be a futárrobot-forradalmat

A Pokémon Go-játékosok fényképezési szokásai, amelyek először apróságnak tűntek, mára robotforradalmat indítottak el...

MA 10:57

A hatalmas föld alatti vezeték Québecből árammal látja el New Yorkot

Egy több mint 545 km hosszú, 6 milliárd dolláros (kb. 2 200 milliárd forint) föld alatti vezetékrendszer, a Champlain Hudson Power Express az elkövetkező hónapokban már képes lesz ellátni New York City-t a Montreal térségéből származó megújuló vízenergiával...

MA 10:37

A namíbiai Nagy Fehér Hely szellemtavait feltáró űrfotó lenyűgözi a világot

Namíbia északnyugati részén, a végtelennek tűnő Etosha Pan szélén meghökkentő, szivárványszínű tavak jelentek meg egy 2011-es katasztrofális árvíz után...

MA 10:23

Az OpenClaw tényleg a biztonsági rendszerek rémálma?

Például elképzelhető, hogy egyetlen utasítást rejt el egy támadó egy továbbított e-mailben...

MA 10:02

A világegyetem ősi fénye titokzatosabban csavarodik, mint gondoltuk

💫 A világegyetem legrégebbi fényében felfedezett finom csavarodás új lendületet adhat azoknak a kutatásoknak, amelyek az univerzum legnagyobb kérdéseire keresik a választ...

MA 09:57

Az Nvidia chipje az egybillió dolláros álomhatár kapujában

💰 Jensen Huang egy pillanatig sem fogta vissza magát a színpadon, amikor a vadonatúj Blackwell- és Vera Rubin-csipekről áradozott – és na most kapaszkodj, mert olyan számokat dobott be, hogy az ember csak pislog...

MA 09:43

Az Nvidia gyeplőre fogná az MI-ügynököket

🐒 Tipikus eset, amikor a technológiai játékosság komoly megoldásokat rejt: az Nvidia legújabb fejlesztése, a NemoClaw már nemcsak a jövőkutatók kedvenc témája, hanem valós segítséget jelenthet a vállalati MI-ügynökök biztonságának kezelésében...

MA 09:36

A Waymo betör és tarol: önvezetők felforgatják a fuvarpiacot

🚗 Hadd ordítsam bele a levegőbe, hogy itt az új főnök: a Waymo berobbant az utazásmegosztó buliba, és mindenkit lesöpör — Uber, Lyft, Tesla, szoronghattok!..

MA 09:29

Az Nvidia kétfrontos offenzívája: biztonságosabb MI, kevesebb para?

Az Nvidia legújabb GTC keynote-ján bedobta a köztudatba a NemoClaw-t, egy vadonatúj biztonsági réteget, ami extra védelmet ad az OpenClaw MI-ügynökeihez...

MA 09:22

Az MI-kriptók szárnyalnak: jön az ügynökalapú hullám

Az MI-alapú kriptovaluták értéke kiugró növekedést mutatott, miután az Nvidia vezérigazgatója, Jensen Huang vázolta a vállalat következő lépéseit az MI-infrastruktúra terén a GTC fejlesztői konferenciáján...

MA 08:57

A természet megőrült: hóvihar, árvíz és hőhullám egyszerre

Március szeszélyes arculatát idén is bizonyítja: miközben a Hawaii-szigeteket özönvízszerű esőzések sújtják, az Egyesült Államok középnyugati területein a hó vastagon borít mindent, máshol soha nem látott meleg tombol, az ország keleti részein pedig viharoktól és tornádóktól rettegnek...

MA 08:45

Az Nvidia Vera Rubin platformja hét chippel új MI-korszakot nyit

Egy lényeges szempont, hogy az Nvidia ismét felforgatta a MI-iparágat: bemutatták a Vera Rubin nevű hétchipes platformot, amely minden eddiginél nagyobb teljesítménnyel és energiahatékonysággal kecsegtet, és amely mögött olyan óriások sorakoztak fel, mint az OpenAI, az Anthropic, a Meta vagy a Mistral AI...

MA 08:38

Az Nvidia asztali szuperszámítógépe: trilliós paraméterű MI mindenkinek, felhő nélkül

💻 Nvidia új DGX Station gépe egy teljesen új korszakot nyit az asztali számítástechnikában...

MA 07:57

Az Nvidia felturbózza a játékokat: itt a DLSS 5, az AI‑csodaszűrő

Elképesztő, mit tud a DLSS 5: a legújabb Nvidia AI-alapú felskálázási technológia nem egyszerűen élesebb képet ad, hanem teljesen új szintre emeli a látványt — ráadásul úgy, hogy közben minden részlet valósághűbbnek hat...

MA 07:50

Az EU-t elárasztja a robotaxi-láz: Bolt és NVIDIA összefog

🚗 Nem hiszem el, de a Bolt összefogott az NVIDIA-val, hogy Európában is berobbanhasson a robotaxi-biznisz...