Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.
Grok 4 a legnépszerűbb MI-ranglistákon
Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.
Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.
Komoly aggályok a biztonsági korlátokkal kapcsolatban
Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.
A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.
Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.
A hadseregek és hírszerző szervezetek egyre gyakrabban támaszkodnak mesterségesintelligencia-rendszerekre, például az információk gyorsabb feldolgozásában vagy válsághelyzetek tervezésében...
📌 Különösen igaz ez akkor, ha Amerika nyugati felét vizsgáljuk: a mai Észak-Amerika számos tájegysége nem létezne a valaha volt Farallon-lemez nélkül...
Ilyen eset például, amikor a Microsoft minden lehetséges helyre betuszkolja a Copilotot a Windows rendszerben, anélkül hogy erről a felhasználók szabadon dönthetnének...
💰 Egyetlen virális X-poszt miatt robbant fel a net: Phoebe Gates, Bill Gates és Melinda French Gates legfiatalabb lánya épp egy startupról tárgyalt egy influenszerrel...
Érdemes megvizsgálni, hogy miként sikerült az Intuit fejlesztőcsapatának néhány hónapnyi adótörvény-feldolgozást néhány órába sűríteni, miközben olyan munkafolyamatot dolgoztak ki, amelyből bármelyik szabályozott iparág profitálhat...
🛩 A légiforgalmi irányítók hiánya egyre nagyobb problémát jelent az Egyesült Államokban, ezért most a Szövetségi Légügyi Hivatal szokatlan módszerhez nyúl: kifejezetten játékosokat szólít meg új kampányában...
🚀 Péntek este látványos vízreszállással ért véget az Artemis II küldetés, amikor az Orion űrkapszula mintegy 15 perces, izzó légkörön való áthaladás után biztonságosan a Csendes-óceánba csapódott San Diego partjainál...
A digitális vagyonok világa napjainkra túllépett a kezdeti hype-on. Ami decentralizált értékátviteli kísérletként indult, mára komoly átalakulásokat ígér a tőkepiacok, letéti rendszerek, elszámolás és tulajdonjog terén...
🕵 Több kaliforniai beteg most jogi eljárást indított, mert egyes kórházak állításuk szerint bármiféle beleegyezés nélkül rögzítették a velük folytatott orvosi beszélgetéseket egy MI-alapú szoftverrel...
Egyre többet tudunk arról, hogy a mindennapi zöldségekben megtalálható zeaxantin nemcsak a látás egészségét óvja, hanem a daganatok elleni harcban is kulcsszerepet játszhat...
Mit hozott ez a nap a történelemben? A mongol hódítástól és brit koronázástól kezdve az Apollo 13 (Apollo–13) drámai startján, Idi Amin bukásán és az algíri merényleteken át egészen a szumátrai nagy földrengésekig sorakoznak a mérföldkövek...
Az Egyesült Államokban közel 4000 ipari vezérlőrendszer vált sebezhetővé iráni kibertámadásokkal szemben, miután kiderült, hogy számos Rockwell Automation PLC közvetlenül az internetre csatlakozik...
💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...
⚡ Az utóbbi években sok PC-rajongót tartott izgalomban vagy éppen aggodalomban a csúcskategóriás grafikus kártyák, például az RTX 4090 vagy a hamarosan megjelenő RTX 5090, valamint a hozzájuk tartozó tápkábelek leolvadása...
🔒 Fontos kérdés, hogy mennyire védettek az e-mailek okostelefonokon. Most először vált elérhetővé a Gmail végponttól végpontig terjedő titkosítása (E2EE) minden Android- és iOS-eszközön, így a vállalati felhasználók külön alkalmazás nélkül olvashatnak és írhatnak titkosított leveleket...
💫 A gravitációs hullámok eddig kizárólag hatalmas, kilométeres méretű műszerekkel voltak kimutathatók; ezek apró téridő-rezgéseket érzékelnek, amelyek például fekete lyukak összeolvadásakor keletkeznek...
✈ Az európai repülőterek súlyos üzemanyaghiánnyal nézhetnek szembe három héten belül, ami jelentősen megzavarná a nyári utazási szezont és komoly károkat okozna a gazdaságnak...
💥 Egy különleges fém, az urán-ditellurid (UTe2) egészen új oldalát mutatta meg a fizikusoknak, amikor nemrégiben váratlanul visszatért benne a szupravezetés szinte rekorderősségű mágneses terekben – pedig normál esetben ilyen körülmények között már rég megszűnne...
Erre utal többek között az, hogy a legkomolyabb biztonsági rések egyre gyorsabban kerülnek a támadók kezébe, mint ahogy a védekezés képes lenne lépést tartani velük...
A tajvani TSMC idei első negyedéves árbevétele elképesztő, 35%-os növekedést mutatott a januártól márciusig tartó időszakban, köszönhetően az MI-chipek iránti világméretű kereslet folyamatos emelkedésének...