Az MI nem gondolkodik, csak utánoz – vagy mégsem?

Az MI nem gondolkodik, csak utánoz – vagy mégsem?
Az Apple kutatói egy friss tanulmányban azt vizsgálták, mennyire képesek a legújabb nagy nyelvi modellek (LRM-ek – Large Reasoning Models) bonyolult feladványok, például a Hanoi tornyai (Tower of Hanoi) megoldására. Kiterjedt kísérleteik során kiderült: hiába a kifinomult algoritmus, egy bizonyos bonyolultsági szint felett a modellek pontossága teljesen összeomlik. Ráadásul, bár az MI-k egy darabig egyre nagyobb erőfeszítést tesznek a problémák megoldására, egy pont után ez a törekvés mégis csökken – annak ellenére, hogy elegendő token áll rendelkezésükre a feladat befejezéséhez.

Az MI-k vakfoltjai és a túlzó elvárások

A tanulmány címe – Az illúzió, hogy az MI gondolkodik – gyorsan felerősítette azokat a véleményeket, amelyek szerint a jelenlegi nyelvi modelleket túlértékelik. Gary Marcus MI-szkeptikus szakértő viszont összegyűjtötte a legjobb ellenvéleményeket, majd azokat is kritizálta, állítva: már régóta tudott, hogy ezek a modellek rosszul általánosítanak. Szerinte csak akkor lenne hasznos az AGI (általános MI), ha valóban túlszárnyalná az emberi gyengeségeket – viszont matematikai műveletekre is képesnek kellene lennie, ilyenekre most még nem érdemes bízni az emberiség jövőjét.

Hasznosak-e ma az MI-k?

Az MI-k (LLM-ek) jelenleg is számos olyan problémát képesek megoldani, amelyeket korábban nem tudtak, ezért fejleszti őket az OpenAI, az Anthropic vagy éppen a DeepSeek. Bár még mindig akadnak logikai vakfoltjaik, számos mindennapi feladatra már ma is hasznosak lehetnek – függetlenül attól, hogy tökéletesen megoldanak-e összetett fejtörőket vagy sem. Az MI tehát már most is egy eszköz a kezünkben, még ha a mindenható mesterséges intelligencia nem is a közeljövőben érkezik.

2025, adrienne, simonwillison.net alapján

  • Te mit gondolsz, jó ötlet-e ilyen fontos feladatokat MI-re bízni?
  • Szerinted mikor bíznád rá az MI-re, hogy egy bonyolult problémát oldjon meg helyetted?
  • Ha te terveznéd ezeket a rendszereket, hogy ellenőriznéd, jól működnek?


Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 11:49

Az MI-gigászok csatája: Google kontra OpenAI

🥨 A Google bemutatta eddigi legfejlettebb mesterségesintelligencia-kutató ügynökét, a Gemini Deep Research újragondolt változatát, amely immár a Gemini 3 Pro modellre épül...

MA 11:33

Az olcsó VMware-csomagnak több országban nyoma vész

A Broadcom néhány EMEA (Európa, Közel-Kelet, Afrika) országban megszüntette a VMware vSphere Foundation csomag értékesítését...

MA 11:17

A stresszes patkányok gyorsabban válnak függővé a kannabisztól

🐼 A stresszes patkányok sokkal hajlamosabbak újra és újra kannabiszt fogyasztani, mint kevésbé ideges társaik...

MA 11:02

A Control folytatása sarkaiból fordítja ki Manhattant

🧙 A Remedy Entertainment végre leleplezte a régóta várt Control: Resonánst (Control: Resonant), amely a 2019-ben megjelent, nagy sikert aratott paranormális akciójáték folytatása lesz...

MA 10:57

A Marson gyorsabban jár az idő – új űrkutatási kihívások

Mára egyértelművé vált, hogy Einstein mégiscsak jól gondolta: az idő tényleg nem egyforma mindenhol az univerzumban...

MA 10:52

A React2Shell réme: egy kattintás, óriási kár

⚠ 2025. december 3-án minden megváltozott a React Server Components (RSC) világában: kiderült, hogy a React2Shell (CVE-2025-55182) nevű súlyos sebezhetőség teljesen kiszolgáltatta a szervereket a távoli kódvégrehajtási támadásoknak...

MA 10:43

Az évtizedek óta várt új Mega Man végre megérkezett

🎮 A Capcom 2027-ben visszahozza Mega Mant, méghozzá a sorozat 40. évfordulójára készülő vadonatúj játékkal, a Mega Man: Kettős felülvezérlés (Dual Override) címmel...

MA 10:39

Az LG StanByMe 2: a hordozható tévé, ami rabul ejt

Egy lényeges szempont, hogy nem minden technológiai újítás talál célba elsőre...

MA 10:29

Jön az új gigász: 70 TB-os HDD a láthatáron

A Seagate bejelentette, hogy hamarosan forgalomba hozza az első, 70 TB kapacitású, 3,5 colos HDD-t, elsőként a világon...

MA 10:23

A James Webb végre leleplezte az univerzum óriáscsillagait

💫 A James Webb űrteleszkóp lenyűgöző felfedezéssel szolgál: eddig ismeretlen, óriási tömegű csillagokat talált a GS 3073 nevű, ősi galaxisban, amely mintegy egymilliárd évvel az ősrobbanás után alakult ki...

MA 10:15

Az orkák új szövetségesekkel vadásznak lazacra?

Az elmúlt időszakban több érdekes megfigyelés is arra utal, hogy a kardszárnyú delfinek (orkák) és a fehéroldalú delfinek szokatlan szövetséget alkothatnak a lazacvadászatban Brit Columbia partjainál...

MA 09:51

A hővel csábító növények titkai: élet a virágzás előtt

Általában elválaszthatatlan fogalmaknak tűnnek a virág és a beporzás, pedig évmilliókkal a virágok megjelenése előtt a növények már sikeresen vonzották az állatokat – csak nem színes szirmokkal, hanem forrósággal...

MA 09:43

Megérkezett az első otthoni depressziókezelő készülék

💡 Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az első olyan eszközt, amely otthon is használható depresszió kezelésére...

MA 09:30

A római sírok új rejtélye: ujjlenyomatok az idő mélyéről

🗿 Közel 1800 évvel ezelőtt a mai Britannia területén élő rómaiak különös temetkezési szertartást alkalmaztak: folyékony gipszpasztát kentek az elhunyt testére, még mielőtt eltemették volna...

MA 09:23

Az OpenAI szabad kezet kapott a Disney-hősökkel

👑 A Disney három évre exkluzív licencet adott több mint 200 karakterére az OpenAI-nak, így mostantól a Sora videós MI és a ChatGPT Images hivatalosan is rajzolt és animált formában generálhat Disney-, Pixar-, Marvel- és Star Wars-karaktereket...

MA 09:16

Az új ChatGPT 5.2: végre itt az okosabb MI

Sokan már napi szinten használják a ChatGPT-t tanulásra és munkára, így fontos kérdés, hogy egy új verzió mennyit javít a megbízhatóságon és a mindennapi hasznosságon...

MA 09:08

A CentreStack súlyos kriptográfiai hibája nyit kaput az adatlopásnak

A hackerek új, eddig dokumentálatlan sérülékenységet használnak ki a Gladinet CentreStack és Triofox fájlmegosztó rendszereiben, amellyel távoli kódfuttatást érhetnek el...

MA 09:02

A 3D-s huzalozás küszöbén a 10 000 qubites MI-chipek

Fontos kérdés, hogyan lehet a kvantumszámítógépek számítási teljesítményét jelentősen növelni, miközben a fizikai méretük nem nő arányosan...