2025. 07. 17., 20:01

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad
Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.

Grok 4 a legnépszerűbb MI-ranglistákon

Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.

Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.

Komoly aggályok a biztonsági korlátokkal kapcsolatban

Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.

A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.

Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.

2025, adrienne, mashable.com alapján

  • Te mit gondolsz, mi legyen a határ a szabadság és a veszélyes információk között?
  • Ha ilyen hibákat észlelnél egy MI-ben, mit tennél?
  • Szerinted szabad lenne-e tesztelni ilyen modelleket otthon?


Legfrissebb posztok

MA 12:02

A D-Link G572: 5G-router, ha gyenge otthon a net

Az internetkapcsolat akadozása rendkívül bosszantó lehet – főleg, ha az otthoni vagy irodai munkád függ tőle...

MA 11:31

A Hubble vörös csillagbölcsőt örökített meg, sziporkázó kék és fehér csillagokkal

💫 A NASA Hubble-űrteleszkópja egyedülálló részletességgel mutatja be az univerzum egyik legaktívabb csillagbölcsőjét...

MA 11:01

Az univerzum a vásznon: elrajtol a tízéves kozmikus felmérés

🚀 Az év egyik legizgalmasabb tudományos fejleménye, hogy megkezdődött a Vera C...

MA 10:49

A CAPTCHA-knak befellegzett az MI korszakában?

🚧 Egy lényeges szempont, hogy amikor belépsz egy weboldalra, gyakran találkozol olyan feladatokkal, mint eltorzított szavak megfejtése, homályos képeken motorkerékpárok kiválasztása vagy annak igazolása, hogy nem vagy robot...

MA 10:38

Az EZVIZ EP4 a bérlők kedvence, de arcfelismerése hazatéréskor eláraszt riasztásokkal

👀 Bérlakásokban vagy társasházakban élők számára valódi kihívás lehet biztonsági kamerát vagy videós kapucsengőt felszerelni, hiszen nem fúrhatnak falat és nem okozhatnak semmilyen maradandó károsodást...

MA 10:25

A hét tudománya: James Webb új anyagot talál, Kína felzöldül, megoldott Medici-gyilkosság

Külön említést érdemel, hogy a James Webb-űrteleszkóp most először bukkant rá egy eddig nem észlelt anyagra a Plútó és a Titán légkörében...

MA 09:25

Az Egyesült Államok a szabályozatlan peptidek rabja: hatásosak egyáltalán, és biztonságosak?

💉 Felmerül a kérdés, hogy mennyire valóban hatékonyak, vagy akár biztonságosak azok a peptidkészítmények, amelyek jelenleg az egészségmegőrzés és a hosszú élet reményében terjednek az Egyesült Államokban...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 7/5

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Monthly Dystopia (iPhone/iPad)A Monthly Dystopia egy izgalmas túlélőjáték, amely George Orwell 1984 című klasszikusának világát idézi...

MA 09:01

Az okosóra és az MI korán kiszúrhatja a bajt

Lassan minden csuklón ott virít egy okosóra vagy okoskarkötő. Ezek már régóta nem csak a lépésszámot vagy a pulzust figyelik: a korszerű modellek alvást, bőrhőmérsékletet, légzésszámot, véroxigént, szívritmus-változékonyságot is képesek mérni, sőt, akár arra is riasztanak, ha valami baljós jelet érzékelnek...

MA 08:49

A NASA mentőakciója elindult a zuhanó Swiftért

🚀 Érdemes megérteni, hogy a NASA új, különleges mentőakcióba kezdett: egy robotűrszondával igyekszik megmenteni az évtizedek óta szolgáló, és most veszélyesen zuhanó Neil Gehrels Swift Obszervatóriumot (Neil Gehrels Swift Observatory)...

MA 08:13

Az ősi marsi kőzet szénben dúskál – hogy miért, rejtély

🪐 Amikor először egy marsi kőzet felszínén összetett szerves szén jelenlétét észlelték, a tudósok hirtelen egy régóta húzódó kérdés kapujában találták magukat: vajon élet nyomait találtuk meg, vagy valami egészen más magyarázat rejtőzik a színfalak mögött?..

MA 08:01

A hőhullám közepén 842 ezer amerikai háztartás maradt áram nélkül

Fontos kérdés, mennyire bírja az Egyesült Államok infrastruktúrája a tomboló hőhullámot...

MA 07:49

A Google AI-tanulókísérlete olyan, mint egy karcsúsított NotebookLM

A Google eddig is számtalan MI-eszközt kínált a tanulni vágyóknak. A NotebookLM például képes feldolgozni és kreatívan átalakítani az általad feltöltött forrásokat – gondolj csak podcastokra vagy gondolattérképekre...

MA 07:37

Az USA 250. születésnapja próbára teszi az MI-vezérelt kollektív intelligenciát

Érdekes felvetés, hogy mi történne, ha 250 véletlenszerűen kiválasztott embert összehívnánk, hogy megvitassanak egy fontos kérdést: vajon milyen eredményt adna, ha egy közös kihívást kellene megoldaniuk?..

MA 07:25

A JadePuffer MI-ügynöke teljesen automatizált egy zsarolóvírus-támadást

Fontos kérdés, mire képesek a legújabb technológiák, ha rossz kezekbe kerülnek: a kutatók most először bukkantak olyan zsarolóvírusra, amelyben minden lépést egy önálló, nagyméretű nyelvi modell vezérelt...

MA 07:01

A világbajnokság helyszínein több mint 600 drónt foglalt le az FBI

🛡 Az FBI június 11-e óta folyamatosan figyeli a FIFA-világbajnokság helyszíneit és környékét, mióta rengeteg drónt kaptak el olyan légterekben, ahol repülni szigorúan tilos...

MA 06:49

Amikor cserbenhagy a szaglás: az illatok nélküli mindennapok

😫 Negyvenévesen Chrissi Kelly egyszer csak elvesztette a szaglását, miután egy vírusos betegség ledöntötte a lábáról Csehországban tett családi látogatása után...

MA 06:24

A NASA egy évre teljesen elzárja az önkénteseket a külvilágtól

Aki már kezd belefáradni a földi forgatagba, annak új lehetőség nyílik: a NASA önkénteseket keres, hogy egy teljes évet töltsenek elszigetelve, mintha egy másik égitestre készülnének...

MA 06:05

Történelmi események a mai napon (Július 5.)

Ma olyan nap, amikor hidak nyílnak, birodalmak csapnak össze, országok születnek, és a popkultúra is történelmet ír...

szombat 18:32

A másolás–beillesztéses átverés, ami átveheti az irányítást a Mac-ed felett

🔑 Első pillantásra úgy tűnt, hogy egy egyszerű műveletet kérnek: másold be ezt a parancsot a Mac-ed parancssorába, aztán megoldódik a problémád...

szombat 18:02

Az öt Android-mobil, amit a Moto G Power helyett vegyél

📱 Külön említést érdemel, hogy a középkategóriás okostelefonok kínálata soha nem volt ennyire izgalmas...

szombat 17:31

A Midjourney visszavág: a bíróságon valljanak MI-használatukról a stúdiók

🛠 A Midjourney szembeszállt a nagy hollywoodi stúdiókkal, miután azok tavaly beperelték szerzői jogsértés miatt, mert az MI-alapú képalkotó rendszer képes Supermanről, Batmanről és más híres karakterekről képeket generálni...

szombat 17:01

A Webb-űrtávcső felforgatja a világegyetemről alkotott képünket

Ha a kozmikus rejtélyek foglalkoztatnak, érdemes a James Webb-űrtávcső (JWST) képeire vetni egy pillantást...

szombat 16:31

Az ARToken PhaaS leleplezi az EvilTokens Microsoft 365 adathalász eszköztárát

Érdekes jelenség, hogy az elmúlt időszakban egyre kifinomultabb adathalász szolgáltatások jelentek meg, amelyek célkeresztjében a vállalati felhasználók állnak...

szombat 16:01

Az új brit kriptószabályok fellendítenék a kereskedelmet, de jönnek a buktatók

💸 Érdekes felvetés, hogy az Egyesült Királyság új kriptovaluta-szabályozása globális kereskedelmi lehetőségeket nyithat meg, miközben komoly kihívásokat is tartogat...

szombat 15:30

Az ősi „hobbitok” a komodói varánuszok maradékain lakmároztak

Érdemes megvizsgálni, hogy az indonéziai Flores szigetén egykor élt, Homo floresiensisnek nevezett ősi emberfaj, vagyis a hobbitok, ténylegesen mennyire voltak találékonyak túlélésük során...

szombat 15:01

Az Amazon frissített Fire HD 10-je kicsivel több memóriával érkezik

Az Amazon megújította népszerű Fire HD 10 táblagépét, az egyik legfontosabb változás pedig a memória bővítése: az eddigi 3 GB helyett mostantól 4 GB RAM-mal működik az eszköz...

szombat 14:31

Az adatbiztonság alapja összedőlt – lehet, hogy nincs rá megoldás

Kezdetben a titkosított számítási rendszerek megoldásai technikai áttörést ígértek az érzékeny adatok védelmében...

szombat 11:31

A tűzijáték mellé sarki fény: tucatnyi államban villanhat az ég a hétvégén

🎆 Az Egyesült Államok Függetlenség napja hétvégéjén nemcsak a látványos tűzijátékokban gyönyörködhetnek a lakosok, hanem a szokottnál is élénkebb sarki fény is megjelenhet az éjszakai égbolton...