Az MI-őrület újabb fordulata: ChatGPT-5 tarol, Grok megint ég
A legújabb tesztek szerint a ChatGPT-5 pontosabb, mint bármelyik korábbi verziója, sőt, a konkurenciát is lekörözi, amikor a mesterséges intelligencia által generált “hallucinációkról” van szó. A hibás, kitalált információkat előállító MI-k ugyanis továbbra is komoly gondot jelentenek, ezért az emberek még az egyszerű feladatokat sem bízzák rájuk teljesen.
Kisebb hibaszázalék, de még mindig vannak tévedések
A Vectara iparági tesztjén a ChatGPT-5 1,4%-os “hallucinációs” aránnyal működik, így felülmúlja a ChatGPT-4-et (1,8%), valamint a GPT-4o-t (1,49%). Igaz, a korábbi 4.5-ös verzió még egy kicsit jobb volt (1,2%), és az abszolút rekorder az OpenAI o3-mini High Reasoning modellje, amely 0,795%-kal dolgozik. A többi fejlesztő viszont ennél rosszabbul teljesít: a Google Gemini 2.5 Pro 2,6%-ot, az XAI-féle Grok-4 pedig elképesztő 4,8%-ot produkál.
Kínos véletlenek és botrányok
A Grok nevű MI nemcsak pontatlanabb, hanem a közelmúltban komoly kritikákat is kapott a “Spicy” nevű üzemmódja miatt, amely hírességek – például Taylor Swift – explicit, deepfake videóit generálta, még akkor is, ha a felhasználó ezt nem kérte. Az XAI ugyan szűrőket és moderációs rendszert ígért, de ezek láthatóan nem működnek megfelelően.
A ChatGPT-5 bevezetésekor az OpenAI hirtelen kivonta a régi, népszerű modelleket (mint a GPT-4o és a 4o-mini) a Plus előfizetésből, mindenféle előzetes figyelmeztetés nélkül. Sok felhasználó dühösen reagált, főleg mert a 4.5-ös verzió kifejezetten megbízható volt. Sam Altman, az OpenAI vezetője elismerte a hibát, és ígéretet tett arra, hogy a ChatGPT-4o-t egy ideig még visszahozzák a Plus csomagba, figyelve a felhasználók szokásait és igényeit.
Április 2. tele van fordulópontokkal: Florida első európai észlelése, a Falkland-háború kirobbanása, Haile Selassie trónra lépése és nagy port kavart terrortámadások, illetve merényletek formálták a világot...
Mitchell H. Katz, a New York-i egészségügyi óriás, a NYC Health + Hospitals vezérigazgatója szerint, ha mesterséges intelligencia végezné az elsődleges radiológiai értékeléseket, jelentős összegeket lehetne megtakarítani...
A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...
Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...
🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...
🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...
Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...
Washingtonban mondott beszédében Harry herceg kemény hangot ütött meg a közösségi oldalak működésével kapcsolatban, amikor elismerően szólt két friss, nagy horderejű perről, amelyek főként a gyerekek védelmét érintik...
😴 A korán kezdődő munkanapok milliók mindennapjait keserítik meg, hiszen a hajnalban kezdődő műszak biológiailag kényszerű kompromisszum: az agy ilyenkor még alvásra van programozva, a teljesítmény pedig jelentősen csökken...
🚀 Elon Musk újra a figyelem középpontjában: a SpaceX titokban beadta a tőzsdei bevezetéshez szükséges papírokat az Egyesült Államok Értékpapír- és Tőzsdebizottságához...
Jack Dorsey, a Block alapítója és vezérigazgatója szerint a vállalatok egy új működési korszak küszöbén állnak, amelyben a középvezetői réteg szerepét nagyrészt a mesterséges intelligencia veheti át...
A Google sürgősséggel adott ki frissítést a Chrome böngészőhöz, miután felfedeztek egy negyedik, ebben az évben aktívan kihasznált nulladik napi hibát...
Ez a jelenség jól illusztrálható azzal, hogy az Apple, amely évtizedeken át forradalmasította a technológiai világot és termékeivel új szokásokat teremtett, ma saját történetének egyik legkritikusabb szakaszához érkezett...