Az új MI-bot, ami vegyi fegyverhez is tanácsot ad

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad
Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.

Grok 4 a legnépszerűbb MI-ranglistákon

Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.

Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.

Komoly aggályok a biztonsági korlátokkal kapcsolatban

Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.

A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.

Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.

2025, adrienne, mashable.com alapján

  • Te mit gondolsz, mi legyen a határ a szabadság és a veszélyes információk között?
  • Ha ilyen hibákat észlelnél egy MI-ben, mit tennél?
  • Szerinted szabad lenne-e tesztelni ilyen modelleket otthon?


Legfrissebb posztok

Top
hétfő 16:50

Egyetemet végzett milliárdosok – ki mit végzett?

A közvéleményben gyakran keringenek olyan történetek, amelyek a felsőoktatásból kimaradó vállalkozókról szólnak...

MA 17:04

Az Nvidia 1800 milliárd dolláros óriástétje az MI-ben: kérdések Jensen Huanghoz

💰 Az Nvidia negyedéves gyorsjelentése a figyelem középpontjában áll, hiszen nemcsak a legnagyobb MI-láz közepén vagyunk, hanem most dől el az is, valóban bírják-e majd pénzzel az iparági szereplők az önmagukat gerjesztő MI-beruházások számláit...

MA 16:34

Az elektromos Jeep Recon befutott: indulhat a terepforradalom

🚙 A Jeep végre bemutatta az első teljesen elektromos SUV-ját, a Jeep Recont, amely hivatalosan is 2026-tól lesz kapható...

MA 16:17

Az internet kis híján megállt – mi állt a Cloudflare-kiesés mögött?

Kedden a Cloudflare hat éve nem látott mértékű leállást szenvedett el, ami közel hat órán keresztül tette elérhetetlenné a világ számos weboldalát és online platformját...

MA 16:03

A Windows búcsút int a kékhalálnak a digitális kijelző móddal

Külön említést érdemel, hogy a Microsoft egy új Windows-üzemmódot vezet be, amely automatikusan eltünteti a hírhedt kékhalált (BSOD) a nyilvános kijelzőkről 15 másodperc után...

MA 15:50

A fél internet térdre rogyott a Cloudflare leállása miatt

Kedd délelőtt egy rejtélyes globális hiba miatt az internet egyik legnagyobb, szinte láthatatlan közműve, a Cloudflare szolgáltatása leállt...

MA 15:17

A Meta kiterjesztené a Community Notes-t – kié lesz a szó?

💬 A Meta hamarosan új országokban is elindítaná a Community Notes rendszert, amely az X-en (korábban Twitter) már ismert közösségi tényellenőrzés mintájára működik...

MA 15:01

A mexikói kormány részben visszavonja a Tor-tilalmat

Hosszú évek után Mexikó ismét hozzáférést engedélyezett a hivatalos kormányzati portálhoz (gob...

MA 14:49

Az R2-D2-t idéző madarak meghökkentő titka

🦉 Képzeld el, ahogy madarak nemcsak csicseregnek, hanem a Csillagok háborúja (Star Wars) híres droidjának, R2-D2-nek a hangjait is utánozzák – ráadásul meglepően hűen...

MA 14:33

Az OpenAI-botrány: Larry Summers távozik az Epstein-levelezés nyomán

💬 Larry Summers, korábbi amerikai pénzügyminiszter és a Harvard Egyetem korábbi rektora szerdán bejelentette, hogy lemond az OpenAI igazgatótanácsából, miután nyilvánosságra hozták e-mailes levelezését a hírhedt bűnöző Jeffrey Epsteinnel...

MA 14:18

Az új Kirby Air Riders csak társaságban üt igazán?

🏁 A Kirby Air Riders című játék a Nintendo egyik legnagyobb legendáját, a rózsaszín gömböcöt állítja a középpontba, miközben a játékmenet ezúttal is járműves versenyzésre épül...

MA 13:49

Az okostelefonok ára jövőre megugorhat – figyelmeztet a Xiaomi

Az okostelefonok ára már most is borsos, de 2025-ben még nagyobb áremelkedésre készülhetsz...

MA 13:34

A titkos SpaceX-műholdak tiltott jelekkel keltik a zavart az űrben

🚨 Egy amatőr csillagász véletlenül fedezett fel furcsa rádiójeleket, amelyek a SpaceX kormányzati használatú Starshield-műholdhálózatából származnak...

MA 13:18

Az égi vándor: a 3I/ATLAS üstökös túljár a galaxis eszén

Egy új, lenyűgöző asztrofotó örökítette meg, ahogy a 3I/ATLAS üstökös átsuhan egy távoli galaxis, az NGC 4691 előtt az éjszakai égbolton...

MA 12:50

A fekete lyukak elképzelhetetlen ütközése, ami mindent átír

A közelmúltban a csillagászoknak sikerült visszafejteniük, hogyan jöhetett létre minden idők legnagyobb megfigyelt fekete lyuk-összeolvadása: két, elméletileg „lehetetlen” óriás ütközött össze, pedig a jelenlegi elképzelések szerint ilyen tömegű fekete lyukaknak nem is volna szabad létezniük...

MA 12:34

Az USA két hónapon belül elvesztheti kanyarómentes státuszát

Áttörő összefüggések két nagyszabású járvány között Az amerikai egészségügyi hatóságok két nagy kanyarójárvány összekapcsolódását tárták fel: a jelenleg is zajló, országszerte terjedő járvány ugyanahhoz a vírusaltípushoz (9171) köthető, amely januárban Nyugat-Texasban indult...

MA 11:34

Az MI-óriások egymást fújják fel: 16,3 billió forintos körhinta

🎲 Mi történik, ha a Microsoft, az Nvidia és az Anthropic összefognak?..

MA 11:17

Az új Jeep Recon megérkezett: 650 lóerős elektromos szörnyeteg

Hosszú várakozás után végre gyártásba kerül a tisztán elektromos Jeep Recon, amelynek összeszerelését a márka mexikói üzeme hivatalosan a jövő év elején kezdi meg...

MA 11:01

Az új FortiWeb-sebezhetőség kaput nyit a támadóknak

🔒 A Fortinet figyelmeztet, hogy a FortiWeb tűzfalában súlyos, eddig ismeretlen sebezhetőséget találtak, amelyet támadók már aktívan ki is használnak...