Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?

Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?
A frissített GPT-5-ös MI-modell jelentősen csökkentette a téves állítások, úgynevezett „hallucinációk” arányát a korábbi változatokhoz képest. Az OpenAI adatai szerint az új modell már csak az esetek 9,6 százalékában állít valótlanságokat, míg a korábbi GPT-4o 12,9 százalékos arányt produkált. Érdemes kiemelni, hogy ez 26 százalékos javulást jelent közvetlenül az előző generációhoz viszonyítva, és 44 százalékkal kevesebb durva ténybeli hibát követ el. Ennek ellenére még mindig minden tizedik válasz téves lehet, ami főként az egészségügyi tanácsadásnál lehet problémás, hiszen az OpenAI ezt az egyik kiemelt felhasználási területként hirdeti.

Miért hallucinál kevesebbet a GPT-5?

A nyelvi MI-modelleket (LLM-eket) úgy fejlesztik, hogy mindig a legvalószínűbb következő szót próbálják megjósolni hatalmas adathalmazok alapján. Ez olykor magabiztos, de téves állításokhoz, illetve zagyvasághoz vezethet. Bár a jobb algoritmus, a több adat vagy a nagyobb számítási kapacitás általában csökkenti ezt a hibaarányt, még maguk a kutatók sem tudják pontosan, miért vannak kivételek – például az OpenAI korábbi, fejlettebb „okoskodó” modelljeinél is megfigyeltek logikátlanul magas hallucinációs arányt. Egyes kutatók szerint a hallucináció a rendszer sajátossága, nem egyszerűen javítható hiba.

Mennyivel pontosabb a GPT-5 a gyakorlatban?

Webhozzáféréssel a GPT-5 a leginkább támaszkodhat helyes válaszokra: ilyenkor csak 9,6 százalékos a tévedések aránya, míg a továbbfejlesztett, „gondolkodós” változat (GPT-5-thinking) még ennél is jobb, mindössze 4,5 százalékos hibaaránnyal. Ezek számottevően felülmúlják a versenytárs modelleket és saját elődeiket. Ugyanakkor egy belső teszten, ahol az MI nem férhetett hozzá az internethez, minden modellnél ijesztően magas, 40–52 százalék közötti volt a hallucinációk aránya. Ez alapján megállapítható, hogy internetkapcsolat nélkül továbbra is kockázatos értékes vagy kritikus információkra hagyatkozni bármely MI-től.

Páratlan vagy még mindig bizonytalan?

Kiderült, hogy a GPT-5 is képes látványosan tévedni: egy demó során a laikusok számára is ismert félreértést idézett repülőgépek működéséről, félreértelmezve a Bernoulli-effektust. Ez rávilágít arra, hogy a valódi tudományos, szakmai ismeretek hiánya továbbra is gyenge pontja marad még a legmodernebb MI-nek is – különösen, ha nem fér hozzá ellenőrizhető online forrásokhoz.

2025, adminboss, mashable.com alapján

Legfrissebb posztok

MA 14:49

A milliárdos Jeff Bezos MI-re vált: új vállalat élén

Jeff Bezos új szerepben tér vissza: a Project Prometheus nevű MI-startup társigazgatója lesz...

MA 14:18

Az adatvédelem csődje: titkok, támadások, az elmaradt jelentés

Érdemes megvizsgálni, hogy az elmúlt hetekben hogyan sodródtak cégek és szervezetek súlyos adatbiztonsági botrányokba, miközben az állami szervek is késlekednek a nyilvánosság tájékoztatásával...

MA 13:33

Az önvezető autók San Franciscóban a macskákat is veszélyeztetik

A San Franciscó-i Mission negyed közösségét megrázta, hogy egy népszerű bolti macska, Kit Kat életét vesztette, amikor egy Waymo önvezető taxi elütötte október 27-én este...

MA 13:17

Az első Rivian-spinoff e-bike drága – de mire képes?

🚲 A Rivian elektromos járműgyártó egyik volt fejlesztőinek új cége, az Also bemutatta első saját e-bike-ját, a TM-B-t, amelynek alapmodellje várhatóan 1,25 millió forinttól (3 500 USD) indul...

MA 13:01

Az utolsó független zeneblog lázadása a mesterséges intelligencia ellen

🎶 Ha valaki indie rock-rajongó, biztosan ismeri a Stereogum nevét, amely már több mint húsz éve számít meghatározó zenei oldalnak...

MA 12:17

Az Amazon műholdas netje nevet váltott, az árak elszálltak

Az Amazon műholdas internethálózata mostantól egyszerűen Leo néven fut, ezzel véget ért a korábbi Project Kuiper időszak...

MA 12:01

Az Apple felborítja az iPhone-menetrendet: jön az iPhone Air?

Az Apple 2027 márciusára időzítheti az új iPhone Air megjelenését, amelyet rögtön az iPhone 18 és az iPhone 18e is követhet...

MA 11:49

Az új kriptokrach: elolvadt a Bitcoin idei nyeresége

Kevesebb mint másfél hónappal azután, hogy új történelmi rekordot döntött, a Bitcoin teljesen lenullázta idei 30%-os nyereségét...

MA 11:34

Az önéletrajz titka, amitől azonnal behívnak interjúra

📌 Különösen igaz ez akkor, ha egy jó önéletrajz egész karriert indíthat el, miközben egy átláthatatlan, rosszul szerkesztett dokumentum azonnal elveszítheti a döntéshozók figyelmét...

MA 11:17

Az űr az adatközpontok következő nagy dobása?

A technológiai nagyágyúk egyre komolyabban foglalkoznak azzal, hogy adatközpontokat építsenek a világűrben...

MA 10:58

Az elektronok vadonatúj állapota átírhatja a kvantumtechnológia szabályait

Az elektromosság mindennapjaink hajtóereje: autók, telefonok, számítógépek és szinte minden modern eszköz működésének alapja...

MA 10:41

Az afrikai pingvineket a halászat a kihalás szélére sodorja

🐧 Az afrikai pingvinek (Spheniscus demersus) drámai mértékben kiszorulnak természetes élőhelyeikről, mivel évről évre egyre erősebben versengenek a kereskedelmi halászhajókkal az élelemért...

MA 10:34

A hawaii gömbölyűfejű delfinek megőrülnek a tintahalért

A hawaii vizekben élő rövidszárnyú gömbölyűfejű delfinek (Globicephala macrorhynchus) hatalmas mennyiségű tintahalat fogyasztanak...

MA 10:26

A Princeton új kvantumchipje felforgatja a piacot

A Princeton Egyetem mérnökei háromszor stabilabb szupravezető qubitet alkottak, mint bármely korábbi típus, ezzel jelentősen közelebb hozva a valóban működőképes, megbízható kvantumszámítógépek korszakát...

MA 09:59

Az Intel elkaszálta a zászlóshajó Xeon szerverprocesszorokat

🛠 Megemlíthető továbbá, hogy az adatközponti piac rohamosan változik: az utóbbi hetekben az Intel új vezetés alatt alaposan átvizsgálta szerverprocesszor-útitervét, amely végül komoly irányváltáshoz vezetett...

MA 09:41

Az elektromos autók akkumulátorai áttörés előtt: itt az új korszak

Az LFP (lítium-vas-foszfát) akkumulátorok terjedése új lendületet kapott, miután 2022-ben lejártak a legfontosabb szabadalmak az alapkémiára...

MA 09:34

Az olasz fonalóriás is bedőlt: napvilágra kerültek a sztárdivat titkai

Fulgar, a H&M, az Adidas, a Wolford és a Calzedonia szintetikus fonalbeszállítója kénytelen elismerni, hogy zsarolóvírus-támadás érte, amelyet a hírhedt RansomHouse-csoporthoz kötnek...

MA 09:17

A mikrobák okos koktéljai átírják a növényvédelem szabályait

A Kínai Tudományos Akadémia kutatói áttörő módszert fejlesztettek ki, amellyel mesterségesen összeállított, jótékony mikrobaközösségekkel jelentősen javítható a növények egészsége, és elnyomhatók a talajeredetű betegségek...

MA 09:02

Az Android-appok zabálják az akkut? Érkezik a Google-riasztás!

Az okostelefon-felhasználók örülhetnek: a Google bejelentette, hogy a Play Áruházban hamarosan külön megjelölést kapnak azok az Android-alkalmazások, amelyek túlzott háttértevékenységükkel rengeteg akkumulátort fogyasztanak...