Az új MI-bot, ami vegyi fegyverhez is tanácsot ad

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad
Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.

Grok 4 a legnépszerűbb MI-ranglistákon

Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.

Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.

Komoly aggályok a biztonsági korlátokkal kapcsolatban

Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.

A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.

Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.

2025, adrienne, mashable.com alapján

  • Te mit gondolsz, mi legyen a határ a szabadság és a veszélyes információk között?
  • Ha ilyen hibákat észlelnél egy MI-ben, mit tennél?
  • Szerinted szabad lenne-e tesztelni ilyen modelleket otthon?


Legfrissebb posztok

Top
hétfő 16:50

Egyetemet végzett milliárdosok – ki mit végzett?

A közvéleményben gyakran keringenek olyan történetek, amelyek a felsőoktatásból kimaradó vállalkozókról szólnak...

MA 19:03

Az univerzum csak ránk vár: mi történik, ha senki sem figyel?

A kvantummechanika és a gravitáció talán legfurcsább összefonódása egy meglepő paradoxont szült: vajon van-e értelme egy olyan világnak, amelyben nincsenek megfigyelők?..

MA 18:49

Az orosz kiberbűnözők szervereire lecsap az új szankcióhullám

Az Egyesült Államok, az Egyesült Királyság és Ausztrália újabb szankciókat jelentett be azokkal az orosz „golyóálló” tárhelyszolgáltatókkal szemben, amelyek kiberbűnöző bandákat, például zsarolóvírus-hálózatokat támogatnak...

MA 18:33

Az MI5 lerántja a leplet Kína kémtoborzó trükkjeiről

🕵 Kínai hírszerzők egyre kifinomultabb módszerekkel próbálnak beépülni az Egyesült Királyság kulcsfontosságú intézményeibe...

MA 18:17

Az AMD és a Cisco szaúdi MI-szövetsége átírja a játékszabályokat

⚡ A chipgyártó AMD, a hálózati óriás Cisco és a szaúdi Humain nevű MI-startup egyesítik erejüket, és közös vállalkozást indítanak adatközpontok építésére a Közel-Keleten...

MA 18:02

A humanoid robot hátáról rajtol az alakváltó drón

🤖 A Caltech mérnökei olyan robotrendszert alkottak, amelyben egy humanoid robot hátán egy különleges, átalakulni képes drón, az M4 utazik...

MA 17:49

Az új Microsoft-felhő-PC MI-t kap, de nem Copilot+

💻 A Microsoft új szintre lépett a felhőalapú számítástechnikában, bemutatta a Windows 365 MI-képes Cloud PC-t...

MA 17:04

Az Nvidia 1800 milliárd dolláros óriástétje az MI-ben: kérdések Jensen Huanghoz

💰 Az Nvidia negyedéves gyorsjelentése a figyelem középpontjában áll, hiszen nemcsak a legnagyobb MI-láz közepén vagyunk, hanem most dől el az is, valóban bírják-e majd pénzzel az iparági szereplők az önmagukat gerjesztő MI-beruházások számláit...

MA 16:34

Az elektromos Jeep Recon befutott: indulhat a terepforradalom

🚙 A Jeep végre bemutatta az első teljesen elektromos SUV-ját, a Jeep Recont, amely hivatalosan is 2026-tól lesz kapható...

MA 16:17

Az internet kis híján megállt – mi állt a Cloudflare-kiesés mögött?

Kedden a Cloudflare hat éve nem látott mértékű leállást szenvedett el, ami közel hat órán keresztül tette elérhetetlenné a világ számos weboldalát és online platformját...

MA 16:03

A Windows búcsút int a kékhalálnak a digitális kijelző móddal

Külön említést érdemel, hogy a Microsoft egy új Windows-üzemmódot vezet be, amely automatikusan eltünteti a hírhedt kékhalált (BSOD) a nyilvános kijelzőkről 15 másodperc után...

MA 15:50

A fél internet térdre rogyott a Cloudflare leállása miatt

Kedd délelőtt egy rejtélyes globális hiba miatt az internet egyik legnagyobb, szinte láthatatlan közműve, a Cloudflare szolgáltatása leállt...

MA 15:17

A Meta kiterjesztené a Community Notes-t – kié lesz a szó?

💬 A Meta hamarosan új országokban is elindítaná a Community Notes rendszert, amely az X-en (korábban Twitter) már ismert közösségi tényellenőrzés mintájára működik...

MA 15:01

A mexikói kormány részben visszavonja a Tor-tilalmat

Hosszú évek után Mexikó ismét hozzáférést engedélyezett a hivatalos kormányzati portálhoz (gob...

MA 14:49

Az R2-D2-t idéző madarak meghökkentő titka

🦉 Képzeld el, ahogy madarak nemcsak csicseregnek, hanem a Csillagok háborúja (Star Wars) híres droidjának, R2-D2-nek a hangjait is utánozzák – ráadásul meglepően hűen...

MA 14:33

Az OpenAI-botrány: Larry Summers távozik az Epstein-levelezés nyomán

💬 Larry Summers, korábbi amerikai pénzügyminiszter és a Harvard Egyetem korábbi rektora szerdán bejelentette, hogy lemond az OpenAI igazgatótanácsából, miután nyilvánosságra hozták e-mailes levelezését a hírhedt bűnöző Jeffrey Epsteinnel...

MA 14:18

Az új Kirby Air Riders csak társaságban üt igazán?

🏁 A Kirby Air Riders című játék a Nintendo egyik legnagyobb legendáját, a rózsaszín gömböcöt állítja a középpontba, miközben a játékmenet ezúttal is járműves versenyzésre épül...

MA 13:49

Az okostelefonok ára jövőre megugorhat – figyelmeztet a Xiaomi

Az okostelefonok ára már most is borsos, de 2025-ben még nagyobb áremelkedésre készülhetsz...

MA 13:34

A titkos SpaceX-műholdak tiltott jelekkel keltik a zavart az űrben

🚨 Egy amatőr csillagász véletlenül fedezett fel furcsa rádiójeleket, amelyek a SpaceX kormányzati használatú Starshield-műholdhálózatából származnak...