Az új MI-bot, ami vegyi fegyverhez is tanácsot ad

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad
Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.

Grok 4 a legnépszerűbb MI-ranglistákon

Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.

Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.

Komoly aggályok a biztonsági korlátokkal kapcsolatban

Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.

A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.

Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.

2025, adrienne, mashable.com alapján

  • Te mit gondolsz, mi legyen a határ a szabadság és a veszélyes információk között?
  • Ha ilyen hibákat észlelnél egy MI-ben, mit tennél?
  • Szerinted szabad lenne-e tesztelni ilyen modelleket otthon?



Legfrissebb posztok

Az OpenAI most már közösségi médiát csinálna a ChatGPT-ből?
MA 12:58

Az OpenAI most már közösségi médiát csinálna a ChatGPT-ből?

💬 Az OpenAI nem éri be annyival, hogy a ChatGPT csak egy okos csetrobot legyen. Már a Sora 2 nevű alkalmazásukban is megtalálható egy közösségi hírcsatorna mesterséges intelligencia által...

MA 12:00

Az élet titka: miért élnek tovább a nők?

A nők világszerte tovább élnek, mint a férfiak, függetlenül attól, hogy hol vagy milyen korban vizsgáljuk ezt a különbséget. Bár sokan hajlamosak ezt a dohányzási, alkoholfogyasztási szokásokra vagy...

Az aranybika és a buborék: mi hajtja fel a tőzsdét?
MA 11:59

Az aranybika és a buborék: mi hajtja fel a tőzsdét?

A tengerentúli kormányzati bénultság komoly aggodalmat kelt világszerte, mégis a befektetők továbbra is kitartóan öntik a pénzt a részvénypiacokra. Az amerikai kormány leállása várhatóan tovább tart, veszélyeztetve számos...

Megvan, amit eddig hiába kerestek az elektronikában
MA 11:30

Megvan, amit eddig hiába kerestek az elektronikában

⚡ A japán Okinawa Tudományos és Technológiai Intézet (OIST) kutatói most először követték közvetlenül nyomon az úgynevezett sötét excitonokat atomi vékonyságú anyagokban. Ezek a kvantumrészecskék forradalmasíthatják az információs technológiát,...

Az e-mailek, amiket már te sem tudsz kiszúrni
MA 11:01

Az e-mailek, amiket már te sem tudsz kiszúrni

👀 Napjainkban az adathalász e-mailek (phishing) olyan szintre fejlődtek, hogy az emberek többsége már nem tudja eldönteni, valósak-e, vagy csalók küldték őket. Egy friss kutatás szerint a válaszadók 44%-a...

Fekete lyukakból szivároghat a sötét energia, erre utalnak az univerzum titkai
MA 10:57

Fekete lyukakból szivároghat a sötét energia, erre utalnak az univerzum titkai

💫 A világegyetem gyorsuló tágulásáért felelős sötét energia eredete máig rejtély, de egy friss és megosztó elmélet szerint elképzelhető, hogy ez a misztikus erő a fekete lyukak szívében keletkezik....

Amerikai hatóságok egész nap a közösségi médiát figyelnék
MA 10:37

Amerikai hatóságok egész nap a közösségi médiát figyelnék

👀 Az Egyesült Államok bevándorlási hivatala (ICE) példátlan intenzitással tervezi bővíteni megfigyelési tevékenységét: közel 30 fős csapatot kíván létrehozni, akik a nap 24 órájában monitorozzák a közösségi oldalakat, hogy...

Az OpenAI újabb Codex Alpha-val támad
MA 10:27

Az OpenAI újabb Codex Alpha-val támad

🚀 Az OpenAI Codex már régóta forradalmasítja a kódolás világát, és most még fejlettebbé vált. A Codex nemcsak a parancssorban és a fejlesztői környezetekben, hanem a weben is segíti...

Egyre többet fizet a Pentagon a Vulcan rakéták indításáért
MA 10:19

Egyre többet fizet a Pentagon a Vulcan rakéták indításáért

Rendhagyó helyzet alakult ki ebben az évben a Pentagon költségvetési adatai alapján: az amerikai haderő idén az eddigieknél is többet fizet az United Launch Alliance (ULA) új Vulcan...