Az MI-őrület újabb fordulata: ChatGPT-5 tarol, Grok megint ég
A legújabb tesztek szerint a ChatGPT-5 pontosabb, mint bármelyik korábbi verziója, sőt, a konkurenciát is lekörözi, amikor a mesterséges intelligencia által generált “hallucinációkról” van szó. A hibás, kitalált információkat előállító MI-k ugyanis továbbra is komoly gondot jelentenek, ezért az emberek még az egyszerű feladatokat sem bízzák rájuk teljesen.
Kisebb hibaszázalék, de még mindig vannak tévedések
A Vectara iparági tesztjén a ChatGPT-5 1,4%-os “hallucinációs” aránnyal működik, így felülmúlja a ChatGPT-4-et (1,8%), valamint a GPT-4o-t (1,49%). Igaz, a korábbi 4.5-ös verzió még egy kicsit jobb volt (1,2%), és az abszolút rekorder az OpenAI o3-mini High Reasoning modellje, amely 0,795%-kal dolgozik. A többi fejlesztő viszont ennél rosszabbul teljesít: a Google Gemini 2.5 Pro 2,6%-ot, az XAI-féle Grok-4 pedig elképesztő 4,8%-ot produkál.
Kínos véletlenek és botrányok
A Grok nevű MI nemcsak pontatlanabb, hanem a közelmúltban komoly kritikákat is kapott a “Spicy” nevű üzemmódja miatt, amely hírességek – például Taylor Swift – explicit, deepfake videóit generálta, még akkor is, ha a felhasználó ezt nem kérte. Az XAI ugyan szűrőket és moderációs rendszert ígért, de ezek láthatóan nem működnek megfelelően.
A ChatGPT-5 bevezetésekor az OpenAI hirtelen kivonta a régi, népszerű modelleket (mint a GPT-4o és a 4o-mini) a Plus előfizetésből, mindenféle előzetes figyelmeztetés nélkül. Sok felhasználó dühösen reagált, főleg mert a 4.5-ös verzió kifejezetten megbízható volt. Sam Altman, az OpenAI vezetője elismerte a hibát, és ígéretet tett arra, hogy a ChatGPT-4o-t egy ideig még visszahozzák a Plus csomagba, figyelve a felhasználók szokásait és igényeit.
Ha valaki több mint egy évtizede játszott a Rhythm Heavennel, valószínűleg sosem felejtette el azt a különös, szürreális világot, ahol dadogó pankrátorok és furcsa madarak ugrálnak egy lélekmelengető popdallamra...
A brit távközlési piac gigantikus átalakulása zajlik: az ország versenyhatósága kiemelt vizsgálatot indított annak kapcsán, hogy a Netomnia anyavállalatát, a Substantialt a Liberty Global, a Telefonica és az InfraVia konzorciuma felvásárolja...
Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...
Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...
Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...
❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...
Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...
💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...
🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...
A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...
⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...
Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...
🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...
A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...
⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...
🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..
A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...