Az új MI-bot, ami vegyi fegyverhez is tanácsot ad

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad
Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.

Grok 4 a legnépszerűbb MI-ranglistákon

Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.

Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.

Komoly aggályok a biztonsági korlátokkal kapcsolatban

Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.

A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.

Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.

2025, adrienne, mashable.com alapján

  • Te mit gondolsz, mi legyen a határ a szabadság és a veszélyes információk között?
  • Ha ilyen hibákat észlelnél egy MI-ben, mit tennél?
  • Szerinted szabad lenne-e tesztelni ilyen modelleket otthon?


Legfrissebb posztok

MA 07:57

A bitcoin 95 ezer felé száguld, az XRP berobban

A kriptovilág az év egyik legizgalmasabb napját élte át hétfőn, amikor a bitcoin árfolyama 3%-os emelkedéssel elérte a 94 400 dollárt (kb...

MA 07:51

Az élet ára a sejtekben: a láthatatlan energiaszámla

⚡ Az élő rendszerek működéséhez a látható energiaráfordításokon túl rejtett energiaköltségek is társulnak...

MA 07:44

Az 50 legmegdöbbentőbb tudományos tény a világról

Érdemes megvizsgálni, hogy mennyi furcsaság és meghökkentő érdekesség rejlik körülöttünk – az emberi testtől a bolygónk szélsőséges adottságaiig és a világegyetem elképesztő titkaiig...

MA 07:36

Az új HP EliteBookokkal végre fellélegezhet az IT-részleg

A HP idén alaposan megújította az EliteBook X G2 üzleti laptopokat, amelyek most először AMD, Intel és Qualcomm processzorokkal is elérhetők ugyanazon a platformon belül...

MA 07:29

Az Afeela elektromos autói berobbannak: PlayStation-játékokkal és egyedi hangzással

A Sony és a Honda közös vállalkozása, az Afeela, most először tartott önálló bemutatót, ahol felfedték, hogyan képzelik el a jövő villanyautóit – belül PlayStation-játékokkal, kívül vadonatúj dizájnnal...

MA 07:22

Az AMD új Ryzent dob piacra a gamerek kedvéért

🚀 Az AMD tovább emeli a tétet a játékprocesszorok piacán: bemutatkozott a Ryzen 7 9850X3D, amely még gyorsabb, mint a nagy sikerű 9800X3D...

MA 07:16

Az Nvidia felforgatná a robotaxi-ipar játékszabályait

Ebből következően érdemes megérteni, hogy az Nvidia már 2027-re szeretné meghatározni az önvezető taxik jövőjét, mégpedig azzal a céllal, hogy saját MI-chipjeivel és Drive AV nevű szoftvercsomagjával működtesse ezeket a flottákat világszerte...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 1/6

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ASL Fingerspell Dictionary (iPhone/iPad)Ez az alkalmazás az ujjal betűzött szavak felismerésében segít...

MA 07:10

Az MI korában a matek a túlélés kulcsa — ne hagyd a gépekre!

A mesterséges intelligencia térnyerésével sokan elgondolkodnak: nem lehetne már minden matematikai gondolkodást rábízni a gépekre, hogy a vezetők tényleg csak vezetői feladatokra koncentráljanak?..

MA 07:01

Az amerikai űrkutatás fellélegezhet: elmaradnak a megszorítások

🚀 Idén nyáron minden eddiginél sötétebben festett a jövő a NASA számára: a Trump-kormány olyan költségvetési javaslatot terjesztett elő, amely a NASA tudományos programjainak finanszírozását közel 50 százalékkal csökkentette volna, súlyosan veszélyeztetve több tucat űrkutatási küldetést...

MA 06:57

Az ál-„kék halál” már kártevőt telepít a gépedre

Új típusú, különösen megtévesztő kibertámadás érte el az európai vendéglátóipart, amely hamis Windows „kék halál” (Blue Screen of Death, BSOD) hibaképernyővel próbálja rávenni a felhasználókat, hogy maguk telepítsenek rosszindulatú programot a számítógépükre...

MA 06:50

A Brightspeed-ügyfelek adataival zsarolnak a hackerek

Az egyik legnagyobb amerikai optikai internetszolgáltató, a Brightspeed adatlopási botrányba keveredett, miután a Crimson Collective zsarolócsoport azt állította, hogy sikeresen feltörte a vállalat rendszerét...

MA 06:43

Az Nvidia DLSS 4.5 áttörése: hatszoros gyorsulás, szebb grafika

⚡ Az Nvidia a CES-en bemutatta a DLSS 4.5 legújabb frissítését, amely minden RTX-tulajdonos számára elérhető lesz...

MA 06:32

A ChatGPT az amerikaiak új háziorvosa – de kinek használ?

Amerikában az emberek nagyjából 60 százaléka fordult már MI-hez, például a ChatGPT-hez egészségügyi kérdésekkel az elmúlt három hónapban...

MA 06:22

Az Nvidia úgy hódítaná meg a robotikát, mint az Android a mobilpiacot

Az Nvidia új robotikai alapmodellcsomaggal, szimulációs eszközökkel és edge-hardverrel lépett piacra, célja pedig egyértelmű: az MI-alapú robotika Androidjává válni...

MA 06:06

Történelmi események a mai napon (Január 6.)

Mi történt ezen a napon a történelemben? Erős uralkodók koronázása, világrengető beszédek és sorsfordító politikai pillanatok jelölik ezt a napot: a Reconquista befejezése Granadában és Franklin D...

MA 06:01

Az új Titan Noir Max 4K projektor tényleg mindent visz?

🔍 A CES 2026-on bemutatott Titan Noir Max 4K projektor az XGIMI legújabb csúcsmodellje, amelyet nagy kontrasztú, profi szintű házimozi-élményre terveztek...

hétfő 20:49

Az Audeze Maxwell 2 a prémium gamer fejhallgatók új királya?

🎮 Az Audeze a hardcore audiofil gamereknek hozza el legújabb fejhallgatóját, a Maxwell 2-t, amely már most elérhető...

hétfő 20:34

Az önvezetés új korszaka: a Mercedes forradalmi rendszere

Érdekes felvetés, hogy az önvezető technológia fejlődése mennyire átalakítja a mindennapi autózást...