Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?

Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?
A frissített GPT-5-ös MI-modell jelentősen csökkentette a téves állítások, úgynevezett „hallucinációk” arányát a korábbi változatokhoz képest. Az OpenAI adatai szerint az új modell már csak az esetek 9,6 százalékában állít valótlanságokat, míg a korábbi GPT-4o 12,9 százalékos arányt produkált. Érdemes kiemelni, hogy ez 26 százalékos javulást jelent közvetlenül az előző generációhoz viszonyítva, és 44 százalékkal kevesebb durva ténybeli hibát követ el. Ennek ellenére még mindig minden tizedik válasz téves lehet, ami főként az egészségügyi tanácsadásnál lehet problémás, hiszen az OpenAI ezt az egyik kiemelt felhasználási területként hirdeti.

Miért hallucinál kevesebbet a GPT-5?

A nyelvi MI-modelleket (LLM-eket) úgy fejlesztik, hogy mindig a legvalószínűbb következő szót próbálják megjósolni hatalmas adathalmazok alapján. Ez olykor magabiztos, de téves állításokhoz, illetve zagyvasághoz vezethet. Bár a jobb algoritmus, a több adat vagy a nagyobb számítási kapacitás általában csökkenti ezt a hibaarányt, még maguk a kutatók sem tudják pontosan, miért vannak kivételek – például az OpenAI korábbi, fejlettebb „okoskodó” modelljeinél is megfigyeltek logikátlanul magas hallucinációs arányt. Egyes kutatók szerint a hallucináció a rendszer sajátossága, nem egyszerűen javítható hiba.

Mennyivel pontosabb a GPT-5 a gyakorlatban?

Webhozzáféréssel a GPT-5 a leginkább támaszkodhat helyes válaszokra: ilyenkor csak 9,6 százalékos a tévedések aránya, míg a továbbfejlesztett, „gondolkodós” változat (GPT-5-thinking) még ennél is jobb, mindössze 4,5 százalékos hibaaránnyal. Ezek számottevően felülmúlják a versenytárs modelleket és saját elődeiket. Ugyanakkor egy belső teszten, ahol az MI nem férhetett hozzá az internethez, minden modellnél ijesztően magas, 40–52 százalék közötti volt a hallucinációk aránya. Ez alapján megállapítható, hogy internetkapcsolat nélkül továbbra is kockázatos értékes vagy kritikus információkra hagyatkozni bármely MI-től.

Páratlan vagy még mindig bizonytalan?

Kiderült, hogy a GPT-5 is képes látványosan tévedni: egy demó során a laikusok számára is ismert félreértést idézett repülőgépek működéséről, félreértelmezve a Bernoulli-effektust. Ez rávilágít arra, hogy a valódi tudományos, szakmai ismeretek hiánya továbbra is gyenge pontja marad még a legmodernebb MI-nek is – különösen, ha nem fér hozzá ellenőrizhető online forrásokhoz.

2025, adminboss, mashable.com alapján


Legfrissebb posztok

Az atomok titkos kvantumtánca végre leleplezve

MA 14:26

Az atomok titkos kvantumtánca végre leleplezve

A tudósoknak most először sikerült közvetlenül megfigyelniük az atomok rejtett, örökké tartó vibrációját a molekulákban. Az Európai XFEL, a világ legerősebb röntgenlézere segítségével sikerült rögzíteniük ezt a kvantumjelenséget,...


MA 14:00

Az ausztrál rakéta álma 14 másodperc alatt füstbe ment

Az első teljesen ausztrál tervezésű és gyártású rakéta mindössze 14 másodpercig volt a levegőben, mielőtt az indítás után lezuhant. A Gilmour Space Technologies Eris nevű rakétája szerdán reggel...

A Tesla szupergépe hasznavehetetlenné vált: Elon elhagyatott serege

MA 13:51

A Tesla szupergépe hasznavehetetlenné vált: Elon elhagyatott serege

A Tesla hírhedt Dojo szuperszámítógépe gyakorlatilag halottá vált, miután a projekt vezetői és dolgozóinak nagy része távozott, hogy egy másik MI startupnál, a Density AI-nál folytassák pályafutásukat. Ez...

A Pixel Tablet most potom áron vihető – de csak ma!

MA 13:01

A Pixel Tablet most potom áron vihető – de csak ma!

Aki régóta szemez a Google Pixel Tablettel, most érdemes lecsapnia rá: a 256 GB-os Wi-Fi modell mindössze 113 000 forintért kapható – ez 66 000 forint megtakarítás, hiszen...

Az új Windows 11 Pro ára nevetségesen alacsony

MA 12:51

Az új Windows 11 Pro ára nevetségesen alacsony

💸 Itt a lehetőség, hogy fillérekért frissítsd a számítógéped operációs rendszerét: most kevesebb mint 5400 Ft-ért (14,97 USD) megszerezheted a Windows 11 Pro teljes licencét, amely eredetileg közel 71...

A világ legnagyobb kriptolopása: 4,1 milliárd forint öt évig észrevétlenül

MA 11:51

A világ legnagyobb kriptolopása: 4,1 milliárd forint öt évig észrevétlenül

Az elmúlt évek legnagyobb digitális bűncselekményét sikerült leleplezniük a nyomozóknak: több mint 127 000 Bitcoin tűnt el a LuBian nevű bányász poolból, amely akkoriban a Bitcoin hálózatának egyik meghatározó...


MA 10:53

Az űrturizmus újabb napja: A Blue Origin 75. utasával repült

Jeff Bezos cége, a Blue Origin ismét történelmet írt, miután vasárnap hat fővel, köztük a kriptomilliárdos Justin Sunnal, felemelkedett a világűr peremére. Az NS-34-es küldetés a texasi bázisról...

Az immunrendszer édes trükkje: cukorral rejti el az RNS-t

MA 10:40

Az immunrendszer édes trükkje: cukorral rejti el az RNS-t

🍬 Az immunrendszerünk számára a csupasz RNS vészjel: baktérium- vagy vírusfertőzésre utal, ezért azonnal támad. Ugyanakkor saját sejtjeink is tartalmaznak RNS-t, így elengedhetetlen, hogy meg tudja különböztetni a sajátot...

Az ősi német luxus babahordozók titka: fogas díszítésű temetkezések

MA 10:15

Az ősi német luxus babahordozók titka: fogas díszítésű temetkezések

Különleges, ötezer éves temetkezéseket tártak fel Németországban, ahol három kivételes asszony maradványai és elképesztően díszes „babahordozók” kerültek elő. Ezeket a táskákat, amelyek díszítéséhez több száz kutya- és farkasfog...