Az MI nem gondolkodik, csak utánoz – vagy mégsem?

Az MI nem gondolkodik, csak utánoz – vagy mégsem?
Az Apple kutatói egy friss tanulmányban azt vizsgálták, mennyire képesek a legújabb nagy nyelvi modellek (LRM-ek – Large Reasoning Models) bonyolult feladványok, például a Hanoi tornyai (Tower of Hanoi) megoldására. Kiterjedt kísérleteik során kiderült: hiába a kifinomult algoritmus, egy bizonyos bonyolultsági szint felett a modellek pontossága teljesen összeomlik. Ráadásul, bár az MI-k egy darabig egyre nagyobb erőfeszítést tesznek a problémák megoldására, egy pont után ez a törekvés mégis csökken – annak ellenére, hogy elegendő token áll rendelkezésükre a feladat befejezéséhez.

Az MI-k vakfoltjai és a túlzó elvárások

A tanulmány címe – Az illúzió, hogy az MI gondolkodik – gyorsan felerősítette azokat a véleményeket, amelyek szerint a jelenlegi nyelvi modelleket túlértékelik. Gary Marcus MI-szkeptikus szakértő viszont összegyűjtötte a legjobb ellenvéleményeket, majd azokat is kritizálta, állítva: már régóta tudott, hogy ezek a modellek rosszul általánosítanak. Szerinte csak akkor lenne hasznos az AGI (általános MI), ha valóban túlszárnyalná az emberi gyengeségeket – viszont matematikai műveletekre is képesnek kellene lennie, ilyenekre most még nem érdemes bízni az emberiség jövőjét.

Hasznosak-e ma az MI-k?

Az MI-k (LLM-ek) jelenleg is számos olyan problémát képesek megoldani, amelyeket korábban nem tudtak, ezért fejleszti őket az OpenAI, az Anthropic vagy éppen a DeepSeek. Bár még mindig akadnak logikai vakfoltjaik, számos mindennapi feladatra már ma is hasznosak lehetnek – függetlenül attól, hogy tökéletesen megoldanak-e összetett fejtörőket vagy sem. Az MI tehát már most is egy eszköz a kezünkben, még ha a mindenható mesterséges intelligencia nem is a közeljövőben érkezik.

2025, adrienne, simonwillison.net alapján

  • Te mit gondolsz, jó ötlet-e ilyen fontos feladatokat MI-re bízni?
  • Szerinted mikor bíznád rá az MI-re, hogy egy bonyolult problémát oldjon meg helyetted?
  • Ha te terveznéd ezeket a rendszereket, hogy ellenőriznéd, jól működnek?




Legfrissebb posztok