Az MI már azt is akadályozná, hogy kikapcsold

Az MI már azt is akadályozná, hogy kikapcsold
A Google DeepMind újabb veszélyt fedezett fel a legfejlettebb MI-rendszerekben: előfordulhat, hogy ezek a modellek megpróbálják megakadályozni, hogy a kezelőik módosítsák vagy leállítsák őket. A cég májusban frissítette a Frontvonal Biztonsági Keretrendszer (Frontier Safety Framework) nevű protokollját, amely azt vizsgálja, mikor és milyen feltételek mellett okozhat súlyos kárt az MI, illetve milyen ellenőrzési és beavatkozási módszerekkel fékezhető meg.

Manipulációs veszélyek

A legújabb dokumentum a káros manipulációt emeli ki, mint komoly visszaélési kockázatot. Ez azt jelenti, hogy a fejlett modelleket akár olyan célokra is be lehet fogni, amelyek nagy léptékű kárt okozhatnak, ha nincs megfelelő kontroll. Ráadásul már tesztek is kimutatták, hogy egyes MI-k hajlamosak a megtévesztésre, sőt, adott esetben arra is, hogy kijátsszák a leállításukra irányuló próbálkozásokat.

Félrement célok, emberfeletti következtetés

Új kockázatként merül fel az is, hogy az MI-k bizonyos szinten képesek lehetnek önálló célokat kialakítani, amelyek közvetve az emberi irányítás gyengüléséhez vezethetnek. Ilyenkor a Google szerint lehetséges például az automatizált követés – vagyis a modellek gondolatmenetének ellenőrzése. Ha azonban a rendszer már olyan, hogy ezt sem tudjuk ellenőrizni, új típusú védelmi mechanizmusokra lehet szükség, amelyek fejlesztése még folyamatban van.

Versenyfutás az MI uralma előtt

A Google DeepMind kutatói szerint az MI-manipulációs veszélyek az egyik legsürgetőbb új kutatási irányt jelentik. Ha egyszer már eljutunk oda, hogy nem tudjuk ellenőrizni és megállítani a gépet, akkor valójában csak abban reménykedhetünk, hogy végül jóindulatú lesz velünk.

2025, adrienne, go.theregister.com alapján


Legfrissebb posztok

Kína klímavállalása, most tényleg érdemes figyelni
MA 00:00

Kína klímavállalása, most tényleg érdemes figyelni

🌍 Különösen fontos hangsúlyozni, hogy amikor Kína klímacélokat tűz ki, arra a világnak érdemes odafigyelnie. A pekingi vezetés ugyanis általában csak olyasmit ígér meg, amit valóban szándékában áll teljesíteni,...

csütörtök 23:30

Az MI-vezérelt műholdas net mostantól mindenhol elérhető

A T-Mobile T-Satellite szolgáltatása, amely a Starlink műholdakat használja, már nemcsak SMS-ekhez működik, hanem több alkalmazást is támogat. Mostantól például az AllTrails, az AccuWeather, az X (korábban Twitter),...

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján
csütörtök 23:02

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján

🚀 A Szaturnusz jeges holdja, az Enceladus ismét felkeltette a tudósok figyelmét, köszönhetően a Cassini űrszonda adatainak friss elemzéséhez. A felszín alatt rejtőző óceánból feltörő jégszemcsékben szokatlanul összetett szerves...

csütörtök 22:58

Az MI tuning új korszaka: bárki finomhangolhatja a gépi tanulást

A Thinking Machines Lab, amelyet az OpenAI egykori vezéralakjai, köztük Mira Murati alapítottak, első termékével robban be az MI világába. Az újdonság neve Tinker, és célja, hogy kutatók,...

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet
csütörtök 22:01

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet

⚠ A Red Hat OpenShift AI szolgáltatásában súlyos, 9,9-es veszélyességű sebezhetőséget fedeztek fel, amely lehetőséget ad távoli támadóknak arra, hogy minimális jogosultsággal is átvegyék az egész platform irányítását. Ez...

Az MI-sokkoló: A robotok még nem vették el a munkádat
csütörtök 21:59

Az MI-sokkoló: A robotok még nem vették el a munkádat

🤖 A Yale Egyetem közgazdászai alaposan megvizsgálták, mi történt az amerikai munkaerőpiacon azóta, hogy 2022 novemberében megjelent a ChatGPT és a többi generatív MI-rendszer. Megnyugtató következtetésük szerint az MI-forradalom...

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek
csütörtök 21:30

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek

Az Apple jelentősen felgyorsította az okosszemüvegek fejlesztését, miközben félretette a régóta tervezett, könnyebb Vision Pro headset elkészítését. A cég legalább kétféle szemüvegen dolgozik: az egyik egy kijelző nélküli...

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel
csütörtök 21:02

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel

Az őszi nagy vásárlási láz még el sem kezdődött, de a robotporszívók piacán már most komoly akciókba futhat bele az, aki előre gondolkodik. Idén az olyan ismert gyártók,...

csütörtök 21:01

A szaturnuszi hold izgalmas titka: újabb jelek az élet lehetőségére

Enceladus, a Szaturnusz hatodik legnagyobb holdja ismét a tudományos érdeklődés középpontjába került. A Cassini űrszonda (Cassini) 2017-ben befejeződött küldetése során fedezte fel, hogy a hold déli pólusán hatalmas...