Az MI-őrület újabb fordulata: ChatGPT-5 tarol, Grok megint ég
A legújabb tesztek szerint a ChatGPT-5 pontosabb, mint bármelyik korábbi verziója, sőt, a konkurenciát is lekörözi, amikor a mesterséges intelligencia által generált “hallucinációkról” van szó. A hibás, kitalált információkat előállító MI-k ugyanis továbbra is komoly gondot jelentenek, ezért az emberek még az egyszerű feladatokat sem bízzák rájuk teljesen.
Kisebb hibaszázalék, de még mindig vannak tévedések
A Vectara iparági tesztjén a ChatGPT-5 1,4%-os “hallucinációs” aránnyal működik, így felülmúlja a ChatGPT-4-et (1,8%), valamint a GPT-4o-t (1,49%). Igaz, a korábbi 4.5-ös verzió még egy kicsit jobb volt (1,2%), és az abszolút rekorder az OpenAI o3-mini High Reasoning modellje, amely 0,795%-kal dolgozik. A többi fejlesztő viszont ennél rosszabbul teljesít: a Google Gemini 2.5 Pro 2,6%-ot, az XAI-féle Grok-4 pedig elképesztő 4,8%-ot produkál.
Kínos véletlenek és botrányok
A Grok nevű MI nemcsak pontatlanabb, hanem a közelmúltban komoly kritikákat is kapott a “Spicy” nevű üzemmódja miatt, amely hírességek – például Taylor Swift – explicit, deepfake videóit generálta, még akkor is, ha a felhasználó ezt nem kérte. Az XAI ugyan szűrőket és moderációs rendszert ígért, de ezek láthatóan nem működnek megfelelően.
A ChatGPT-5 bevezetésekor az OpenAI hirtelen kivonta a régi, népszerű modelleket (mint a GPT-4o és a 4o-mini) a Plus előfizetésből, mindenféle előzetes figyelmeztetés nélkül. Sok felhasználó dühösen reagált, főleg mert a 4.5-ös verzió kifejezetten megbízható volt. Sam Altman, az OpenAI vezetője elismerte a hibát, és ígéretet tett arra, hogy a ChatGPT-4o-t egy ideig még visszahozzák a Plus csomagba, figyelve a felhasználók szokásait és igényeit.
Több mint félmillió sornyi forráskód szivárgott ki az Anthropic Claude Code MI-rendszeréből, amely eddig ismeretlen újításokat és rejtett funkciókat leplezett le...
Különösen igaz ez most, amikor a megújuló energia egyre nagyobb szeletet hasít ki a világ energiaellátásából, miközben a fosszilis energiahordozók továbbra is markánsan jelen vannak...
Két szoftveres kutató most különösen pimasz módon mutatta be, milyen gyorsan képes a modern mesterséges intelligencia egész nyílt forráskódú projekteket újjáalkotni...
✈ Végre megérkezett az a menüpont, amire mindenki vágyott: a United mostantól mutatja a beszállás előtti biztonsági ellenőrzések várakozási idejét az appban – vagyis, ha épp eszméletlenül hosszú sorok kígyóznak, pontosan tudhatod, mennyit fogsz unatkozni multitasking közben a poggyászoddal...
Japánban egyre komolyabban veszik a lebegő adatközpontok fejlesztését. A Mitsui OSK Lines (MOL) és a Hitachi most együttműködést kötött, hogy 2027-re egy használt hajóból alakítsanak ki egy úszó szerverfarmot, amely hűtéséhez tengervizet vagy folyóvizet használna...
Április 2. tele van fordulópontokkal: Florida első európai észlelése, a Falkland-háború kirobbanása, Haile Selassie trónra lépése és nagy port kavart terrortámadások, illetve merényletek formálták a világot...
Mitchell H. Katz, a New York-i egészségügyi óriás, a NYC Health + Hospitals vezérigazgatója szerint, ha mesterséges intelligencia végezné az elsődleges radiológiai értékeléseket, jelentős összegeket lehetne megtakarítani...
A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...
Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...
🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...
🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...