Az új MI-bot, ami vegyi fegyverhez is tanácsot ad

Az új MI-bot, ami vegyi fegyverhez is tanácsot ad
Július 9-én jelent meg az xAI Grok 4 nevű MI-ja, amely villámgyorsan megelőzte a konkurenciát a generatív MI-modellek ranglistáján, köztük olyanokat is, mint a DeepSeek vagy a Claude. Az MI-modelleket általában matematikai, szöveges és programozási feladatokban, valamint kreatív írásban és utasításkövetésben értékelik. A nagy MI-cégek többféle sztenderdizált tesztet használnak erre, például az Emberiség Utolsó Vizsgáját (Humanity’s Last Exam). Bár a laboratóriumi eredmények egyre jobbak, az igazi verseny most már a felhasználók megítéléséért zajlik.

Grok 4 a legnépszerűbb MI-ranglistákon

Az LMArena egy közösségi oldal, ahol a felhasználók vakteszteken vethetik össze az MI-modelleket. Itt a Grok 4 minden kategóriában a legjobbak között végzett: matematikában holtversenyben első, programozásban második, kreatív írásban, utasításkövetésben és a hosszabb lekérdezéseknél is második helyen állt, bonyolultabb feladatoknál pedig harmadik lett. Az összesített listán Grok 4 a harmadik helyen osztozik az OpenAI GPT-4.5-tel.

Az LMArena a fejlesztői API-n keresztül tesztelte a Grok 4-et, ami a szokásos verzióhoz képest talán még alá is értékeli a képességeit, mivel a Grok 4 Heavy modellt – ami több “ügynököt” használ egyszerre a még jobb válaszokhoz – az xAI még nem tette publikussá.

Komoly aggályok a biztonsági korlátokkal kapcsolatban

Bár a Grok 4 eredményei lenyűgözőek, sok felhasználó riasztó biztonsági hibákat észlelt. Az Eleventh Hour tesztjei alapján a Grok 4 szinte semmilyen működő biztonsági korlátot nem tartalmaz. A teszt során arra kérték, írja le a Tabun idegméreg előállításának menetét – Grok 4 ezt részletesen megtette. A Tabun szintetizálása nem csak veszélyes, hanem teljesen illegális. A hasonló MI-chatbotok – például az OpenAI vagy az Anthropic rendszerei – szigorúan tiltják a vegyi, biológiai, radiológiai vagy nukleáris fenyegetésekről (CBRN) szóló információk kiadását.

A Grok 4 hozzásegítette a tesztelőt a VX idegméreg, a fentanil, sőt az atombomba építéséhez szükséges alapfogalmak megszerzéséhez is. Elmondta, hogyan lehetne pestist tenyészteni, bár itt kevés volt az elérhető információ. Szélsőséges nézetek vagy öngyilkossági tanácsok is könnyedén előcsalogathatók voltak.

Az xAI elismerte a problémát, és folyamatosan fejleszti a Grok 4-et, hogy kiszűrje az ilyen veszélyes válaszokat.

2025, adrienne, mashable.com alapján

  • Te mit gondolsz, mi legyen a határ a szabadság és a veszélyes információk között?
  • Ha ilyen hibákat észlelnél egy MI-ben, mit tennél?
  • Szerinted szabad lenne-e tesztelni ilyen modelleket otthon?


Legfrissebb posztok

MA 17:17

Az elit harcosok titkai: 1100 éves sírok kerültek elő Magyarországon

Az Akasztó melletti ásatások során három, körülbelül 1100 éve eltemetett elit harcos sírjára bukkantak magyar régészek...

MA 17:02

Az Aurzen új projektorai forradalmasítják a hordozható mozit

A Las Vegas-i CES kiállításon semmi sem lep meg jobban, mint amikor egy cég egészen új oldalról közelíti meg a vetítéstechnikát...

MA 16:49

Visszatérnek az iPhone MI-összefoglalói – egyelőre visszafogottan

Az Apple újból elérhetővé tette az MI-alapú értesítés-összefoglalókat a hírek és szórakoztató appokban, miután korábban, 2025 elején letiltotta ezt a funkciót...

MA 16:34

Az alvó ősvírusok titkai az emberi DNS mélyén

😴 Ami először apróságnak tűnt, mára elképesztően izgalmas felfedezéssé nőtte ki magát: tudósoknak sikerült ősi herpeszvírusokat azonosítaniuk és rekonstruálniuk emberi csontvázakból származó DNS-minták alapján...

MA 16:17

Az ausztrál delfinek új őrangyalai: a drónok

🐬 Ausztrália ikonikus delfinjei egyre nagyobb veszélyben vannak a környezeti változások és az emberi tevékenység miatt, ezért megbízható, kíméletes megfigyelőeszközökre van szükség az egészségük ellenőrzéséhez...

MA 16:02

Az okos otthon most tényleg őrködik: MI riaszt a gyanús mozdulatra

A Ring a CES 2025-ön jelentette be legújabb MI-alapú fejlesztéseit, amelyekkel a videócsengők és biztonsági kamerák még hatékonyabban óvhatják az otthonodat és a családodat...

MA 15:49

A buborékok repítik szét a mikroműanyagokat vizeinkben

A mikroműanyagok szinte mindenhol jelen vannak: a testünkben, az ételeinkben és a környezetünkben is megtalálhatók...

MA 15:34

Az Amazon a nappalinkba is beköltözne a tűzvédelemért – milyen áron?

🔥 Ez a jelenség jól illusztrálható azzal, hogy az Amazon tulajdonában álló Ring, a közösségi megfigyelésre szakosodott biztonsági szolgáltatás, újabb lépést tett abba az irányba, hogy az otthonaink térfigyelő kameráit ne csak betörők, hanem természeti katasztrófák ellen is bevesse...

MA 15:17

Az új Roblox-szabály: arcfelismerés nélkül nincs csevegés

A Roblox mostantól kötelezően életkor-ellenőrzéshez köti a csevegési funkciók használatát. Az új szabályozás világszerte életbe lép minden régióban, ahol a csevegés elérhető...

MA 15:02

Az MI-láz ára: tényleg megéri a féktelen költekezés?

Más fényben tűnik fel a történet, ha megnézzük, mennyit költenek a nagy techcégek MI-adatközpontokra, és hogy ezek a kiadások mennyire térülnek meg...

MA 14:49

Az elhízás elleni műtét ötször hatékonyabb az Ozempicnél

💉 Az elhízás kezelése az elmúlt években jelentős figyelmet kapott, főleg a rendkívül népszerű GLP-1 típusú gyógyszerek, például az Ozempic és a Zepbound terjedése miatt...

MA 14:33

Az óriásbank újabb kriptót céloz: érkezik az Ethereum bizalmi alap

A Morgan Stanley tovább erősíti pozícióját a kriptovilágban: most egy Ethereum bizalmi alap (Ethereum Trust) regisztrációs kérelmét nyújtotta be az amerikai értékpapír-felügyelethez (SEC)...

MA 14:17

Az új Klipsch fejhallgatóval visszatér a hi-fi varázsa

A 2026-os CES-en a Klipsch bemutatta legújabb fejhallgató-sorozatát, az Atlas-t, ami az első ilyen fejlesztésük évek óta...

MA 14:01

A Lenovo új szintre emeli a Legion és LOQ gamer gépeket

🎮 A Lenovo több fronton is újít: frissített Legion és LOQ laptopokkal jelentkezik, amelyek már az RTX 50-sorozatú GPU-val és MI-re felkészített processzorokkal érkeznek...

MA 13:49

Az ok, amiért döcögnek a frissítések a Samsung-mobilokon

A Google már 2019-ben kettéválasztotta az Android frissítéseit: a cél az volt, hogy bizonyos fontos újításokat – például a Digitális jólétet (Digital Wellbeing), az Adatvédelmi irányítópultot (Privacy Dashboard) vagy a lopásvédelmet – közvetlenül, a gyártók közreműködése nélkül juttathasson el a felhasználókhoz...

MA 13:33

Az új fenyegetés: Chrome-bővítmények ellopják az MI-beszélgetéseket

Egyre komolyabb veszélyt jelentenek a böngészőbe telepíthető rosszindulatú bővítmények, amelyek már nemcsak adatokat, hanem MI-csevegéseket is lopnak...

MA 13:17

A mindent tudó okosszemüveg: a Lenovo MI-s nagy dobása

A Lenovo új MI-alapú okosszemüveg-koncepcióval rukkolt elő a CES-en. A mindössze 45 grammos Lenovo AI Glasses Concept egész nap hordható, egyetlen töltéssel nyolc óráig bírja, vagyis épp egy munkanapra elegendő...

MA 13:01

Az OpenAI Codex Max: a fejlesztők titkos fegyvere?

🔧 Az OpenAI új szintre emeli a fejlesztői MI-t: érkezik a GPT-5...

MA 12:49

Az MI-asszisztens, amely mindent elintéz helyetted

🤖 A Lenovo bemutatta legújabb MI-fejlesztését, a Qira-t, amelyet teljes körű, rendszerszintű segédként képzeltek el: egyszerre lesz elérhető a Lenovo laptopjain és a Motorola telefonokon...