Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?

Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?
A frissített GPT-5-ös MI-modell jelentősen csökkentette a téves állítások, úgynevezett „hallucinációk” arányát a korábbi változatokhoz képest. Az OpenAI adatai szerint az új modell már csak az esetek 9,6 százalékában állít valótlanságokat, míg a korábbi GPT-4o 12,9 százalékos arányt produkált. Érdemes kiemelni, hogy ez 26 százalékos javulást jelent közvetlenül az előző generációhoz viszonyítva, és 44 százalékkal kevesebb durva ténybeli hibát követ el. Ennek ellenére még mindig minden tizedik válasz téves lehet, ami főként az egészségügyi tanácsadásnál lehet problémás, hiszen az OpenAI ezt az egyik kiemelt felhasználási területként hirdeti.

Miért hallucinál kevesebbet a GPT-5?

A nyelvi MI-modelleket (LLM-eket) úgy fejlesztik, hogy mindig a legvalószínűbb következő szót próbálják megjósolni hatalmas adathalmazok alapján. Ez olykor magabiztos, de téves állításokhoz, illetve zagyvasághoz vezethet. Bár a jobb algoritmus, a több adat vagy a nagyobb számítási kapacitás általában csökkenti ezt a hibaarányt, még maguk a kutatók sem tudják pontosan, miért vannak kivételek – például az OpenAI korábbi, fejlettebb „okoskodó” modelljeinél is megfigyeltek logikátlanul magas hallucinációs arányt. Egyes kutatók szerint a hallucináció a rendszer sajátossága, nem egyszerűen javítható hiba.

Mennyivel pontosabb a GPT-5 a gyakorlatban?

Webhozzáféréssel a GPT-5 a leginkább támaszkodhat helyes válaszokra: ilyenkor csak 9,6 százalékos a tévedések aránya, míg a továbbfejlesztett, „gondolkodós” változat (GPT-5-thinking) még ennél is jobb, mindössze 4,5 százalékos hibaaránnyal. Ezek számottevően felülmúlják a versenytárs modelleket és saját elődeiket. Ugyanakkor egy belső teszten, ahol az MI nem férhetett hozzá az internethez, minden modellnél ijesztően magas, 40–52 százalék közötti volt a hallucinációk aránya. Ez alapján megállapítható, hogy internetkapcsolat nélkül továbbra is kockázatos értékes vagy kritikus információkra hagyatkozni bármely MI-től.

Páratlan vagy még mindig bizonytalan?

Kiderült, hogy a GPT-5 is képes látványosan tévedni: egy demó során a laikusok számára is ismert félreértést idézett repülőgépek működéséről, félreértelmezve a Bernoulli-effektust. Ez rávilágít arra, hogy a valódi tudományos, szakmai ismeretek hiánya továbbra is gyenge pontja marad még a legmodernebb MI-nek is – különösen, ha nem fér hozzá ellenőrizhető online forrásokhoz.

2025, adminboss, mashable.com alapján


Legfrissebb posztok

Kína klímavállalása, most tényleg érdemes figyelni
MA 00:00

Kína klímavállalása, most tényleg érdemes figyelni

🌍 Különösen fontos hangsúlyozni, hogy amikor Kína klímacélokat tűz ki, arra a világnak érdemes odafigyelnie. A pekingi vezetés ugyanis általában csak olyasmit ígér meg, amit valóban szándékában áll teljesíteni,...

csütörtök 23:30

Az MI-vezérelt műholdas net mostantól mindenhol elérhető

A T-Mobile T-Satellite szolgáltatása, amely a Starlink műholdakat használja, már nemcsak SMS-ekhez működik, hanem több alkalmazást is támogat. Mostantól például az AllTrails, az AccuWeather, az X (korábban Twitter),...

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján
csütörtök 23:02

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján

🚀 A Szaturnusz jeges holdja, az Enceladus ismét felkeltette a tudósok figyelmét, köszönhetően a Cassini űrszonda adatainak friss elemzéséhez. A felszín alatt rejtőző óceánból feltörő jégszemcsékben szokatlanul összetett szerves...

csütörtök 22:58

Az MI tuning új korszaka: bárki finomhangolhatja a gépi tanulást

A Thinking Machines Lab, amelyet az OpenAI egykori vezéralakjai, köztük Mira Murati alapítottak, első termékével robban be az MI világába. Az újdonság neve Tinker, és célja, hogy kutatók,...

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet
csütörtök 22:01

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet

⚠ A Red Hat OpenShift AI szolgáltatásában súlyos, 9,9-es veszélyességű sebezhetőséget fedeztek fel, amely lehetőséget ad távoli támadóknak arra, hogy minimális jogosultsággal is átvegyék az egész platform irányítását. Ez...

Az MI-sokkoló: A robotok még nem vették el a munkádat
csütörtök 21:59

Az MI-sokkoló: A robotok még nem vették el a munkádat

🤖 A Yale Egyetem közgazdászai alaposan megvizsgálták, mi történt az amerikai munkaerőpiacon azóta, hogy 2022 novemberében megjelent a ChatGPT és a többi generatív MI-rendszer. Megnyugtató következtetésük szerint az MI-forradalom...

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek
csütörtök 21:30

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek

Az Apple jelentősen felgyorsította az okosszemüvegek fejlesztését, miközben félretette a régóta tervezett, könnyebb Vision Pro headset elkészítését. A cég legalább kétféle szemüvegen dolgozik: az egyik egy kijelző nélküli...

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel
csütörtök 21:02

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel

Az őszi nagy vásárlási láz még el sem kezdődött, de a robotporszívók piacán már most komoly akciókba futhat bele az, aki előre gondolkodik. Idén az olyan ismert gyártók,...

csütörtök 21:01

A szaturnuszi hold izgalmas titka: újabb jelek az élet lehetőségére

Enceladus, a Szaturnusz hatodik legnagyobb holdja ismét a tudományos érdeklődés középpontjába került. A Cassini űrszonda (Cassini) 2017-ben befejeződött küldetése során fedezte fel, hogy a hold déli pólusán hatalmas...