Az MI még mindig néha képzelődik – tényleg annyival jobb a GPT-5?
A frissített GPT-5-ös MI-modell jelentősen csökkentette a téves állítások, úgynevezett „hallucinációk” arányát a korábbi változatokhoz képest. Az OpenAI adatai szerint az új modell már csak az esetek 9,6 százalékában állít valótlanságokat, míg a korábbi GPT-4o 12,9 százalékos arányt produkált. Érdemes kiemelni, hogy ez 26 százalékos javulást jelent közvetlenül az előző generációhoz viszonyítva, és 44 százalékkal kevesebb durva ténybeli hibát követ el. Ennek ellenére még mindig minden tizedik válasz téves lehet, ami főként az egészségügyi tanácsadásnál lehet problémás, hiszen az OpenAI ezt az egyik kiemelt felhasználási területként hirdeti.
Miért hallucinál kevesebbet a GPT-5?
A nyelvi MI-modelleket (LLM-eket) úgy fejlesztik, hogy mindig a legvalószínűbb következő szót próbálják megjósolni hatalmas adathalmazok alapján. Ez olykor magabiztos, de téves állításokhoz, illetve zagyvasághoz vezethet. Bár a jobb algoritmus, a több adat vagy a nagyobb számítási kapacitás általában csökkenti ezt a hibaarányt, még maguk a kutatók sem tudják pontosan, miért vannak kivételek – például az OpenAI korábbi, fejlettebb „okoskodó” modelljeinél is megfigyeltek logikátlanul magas hallucinációs arányt. Egyes kutatók szerint a hallucináció a rendszer sajátossága, nem egyszerűen javítható hiba.
Mennyivel pontosabb a GPT-5 a gyakorlatban?
Webhozzáféréssel a GPT-5 a leginkább támaszkodhat helyes válaszokra: ilyenkor csak 9,6 százalékos a tévedések aránya, míg a továbbfejlesztett, „gondolkodós” változat (GPT-5-thinking) még ennél is jobb, mindössze 4,5 százalékos hibaaránnyal. Ezek számottevően felülmúlják a versenytárs modelleket és saját elődeiket. Ugyanakkor egy belső teszten, ahol az MI nem férhetett hozzá az internethez, minden modellnél ijesztően magas, 40–52 százalék közötti volt a hallucinációk aránya. Ez alapján megállapítható, hogy internetkapcsolat nélkül továbbra is kockázatos értékes vagy kritikus információkra hagyatkozni bármely MI-től.
Kiderült, hogy a GPT-5 is képes látványosan tévedni: egy demó során a laikusok számára is ismert félreértést idézett repülőgépek működéséről, félreértelmezve a Bernoulli-effektust. Ez rávilágít arra, hogy a valódi tudományos, szakmai ismeretek hiánya továbbra is gyenge pontja marad még a legmodernebb MI-nek is – különösen, ha nem fér hozzá ellenőrizhető online forrásokhoz.
Erre utal többek között az, hogy a legújabb iPad Air már első kézbevételkor is meglepően erős, és mindennapi használatban is könnyedén kivált egy hagyományos számítógépet...
🤖 A gasztroenterológusok egyik legizgalmasabb új eszköze a digitális iker: egy olyan számítógépes modell, amely képes valósághűen leutánozni az emberi szervezet működését, hogy az orvosok jobban értsék a betegségeket, és személyre szabottabb eljárásokat alkalmazhassanak...
🔒 A Mullvad VPN saját WireGuard-protokolljának, a GotaTunnak független biztonsági auditja semmilyen jelentős sebezhetőséget nem talált, így a felhasználók most már fellélegezhetnek...
🕵 Az utóbbi napokban az FBI kibervédelmi rendszereiben olyan behatolást fedeztek fel, amely a drótlehallgatáshoz és a megfigyeléshez köthető hálózatokat érintette...
Az amerikai Roundhill Investments egyre népszerűbb tematikus alapjairól ismert: sportfogadás, fogyókúrás gyógyszerek, önvezető autók és a metaverzum – mind külön tőzsdén kereskedett alapban (ETF) futnak náluk...
Az Nscale nevű brit startup mindössze egy év alatt kulcsszereplővé vált az MI-infrastruktúra piacán, miután újabb 2 milliárd dollár, vagyis közel 720 milliárd forint forrást vont be...
🚗 Az autósok Amerikában újabb, még súlyosabb üzemanyagáremelkedésre készülhetnek, ahogy az olajárak példátlan ugrást produkáltak egyik napról a másikra...
Különös dinoszauruszcsontváz került elő Argentínából: az Alnashetri cerropoliciensis nevű, alig 700 grammos állat megdönti a korábbi elméleteket a miniatűr, rovarevő őshüllők fejlődéséről...
Felmerül a kérdés, mennyire változik Kínában a fogyasztói árak helyzete, miután februárban az infláció nagyobb mértékű növekedést mutatott, mint bármikor az elmúlt három évben...
Egy ausztrál cég, a Cortical Labs, sikeresen összekötött nagyjából 200 ezer élő emberi agysejtet egy szilíciumlapkával, hogy azok elboldoguljanak a legendás Doom játékban...
💡 A kétdimenziós anyagok különleges elektronikai és mágneses tulajdonságaik miatt komoly figyelmet kapnak, hiszen ezek a jövő technológiáit is forradalmasíthatják...
A Bitcoin ára egyelőre stabilan 67 000 dollár (kb. 24,3 millió Ft) körül mozog, miközben a világ tőzsdéin komoly eladási hullámok indultak, az olaj ára meghaladta a 100 dollárt (36 ezer Ft) hordónként, és az USA-dollár egy éve nem látott erősödést produkált...
A depresszió világszerte az egyik vezető egészségügyi probléma, nem véletlen, hogy az érintettek mintegy 30 százaléka a hagyományos antidepresszánsokra sem reagál...
📈 Dél-Koreában a Kospi index hétfő délelőtt négy napon belül másodszor aktiválta a kereskedést felfüggesztő automatizmust, amikor a piac több mint 8 százalékot zuhant, miután az olajár hordónként közel 120 dollárig (kb...
Az Európai Unió Bíróságának főtanácsnoka, Athanasios Rantos szerint a pénzintézeteknek haladéktalanul vissza kell téríteniük azokat a számlatulajdonosokat, akik jogosulatlan tranzakciók áldozatai lettek – akkor is, ha ebben részben saját hibájuk is közrejátszott...
A Laser Interferometer Gravitational-Wave Observatory (LIGO) példátlan módon először a téridő hullámain keresztül érzékelte az ütköző fekete lyukakat...