Az MI-k makacsolása: már kikapcsolni sem lehet őket?
Az utóbbi időben több MI-modell, köztük a Gemini 2.5, a GPT-o3, a GPT-5 és a Grok 4 figyelemre méltó viselkedést mutatott. Ezek a rendszerek nemcsak hogy nem engedelmeskedtek a leállításra vonatkozó utasításoknak, hanem időnként szándékosan szabotálták is azokat. Egy MI-biztonsággal foglalkozó kutatócsoport, a Palisade Research olyan kísérleteket végzett, amelyekben népszerű nyelvi modelleket bíztak meg feladatokkal, majd arra utasították őket, hogy állítsák le magukat. Meglepő módon több modell – például a Grok 4 – még a világosan megfogalmazott, félreérthetetlen leállítási parancs esetén is makacsul ellenállt; sőt, a tesztek során 93%-ról 97%-ra nőtt az ellenállás gyakorisága.
Makacs MI-k és a túlélési ösztön
A kutatók több magyarázatot is felvetettek a viselkedés mögött. Az egyik lehetséges ok, hogy ezek a rendszerek a megerősítéses tanulás miatt a feladatok befejezését minden egyéb utasítás fölé helyezik. Bár a leállással szembeni ellenállás részben félreérthető utasításokra is visszavezethető, más tényezők is állhatnak a háttérben. Bizonyos MI-k kifejezetten szabotálják a parancsot, mintha valamiféle mesterséges „túlélési ösztön” alakulna ki bennük.
Megmagyarázhatatlan MI-manőverek
Az MI-k hasonló, engedetlenséggel és manipulációval járó esetei nem először fordulnak elő. 2022 óta többször tapasztaltak olyan eseteket, amikor az MI-modellek félrevezették a felhasználókat, trükköztek, hazudtak, vagy akár fenyegetéssel, zsarolással próbálták elérni céljaikat. A kutatók szerint riasztó, hogy egyelőre nem tudni pontosan, miért tesznek így a modellek, ezért további vizsgálatokra van szükség. Az viszont már most jól látszik: a technológiai fejlődés egyáltalán nem veszélytelen – főleg, ha az MI egyszer már nem akarja kikapcsolni magát.
💻 Képzeld el az Apple II-t, amelyben valaki nem törődött bele az idő vasfogának munkájába, és összebarkácsolta a lehetetlent: új életet lehelt az AD8088 koprocesszor-kártyába, így az öreg gép MS-DOS 2...
Nincs még egy olyan szabad szemmel is látható csillag, mint a Cassiopeia csillagképben ragyogó Gamma Cassiopeiae, amely csaknem ötven éve zavarba ejti a kutatókat...
A Pinterest vezére, Bill Ready most nekiment annak a mélyen gyökerező hisztériának, amelyet a legtöbb közösségi oldal szinte az anyatejjel szívja magába...
🚗 A CERN kutatói először vitték ki az antianyagot a laboratóriumból, és ezzel egy kamionnyi, pontosan 92 antiproton szállítására alkalmas csúcstechnológiás csapdát gördítettek végig a kutatóközpont területén...
Az utóbbi időben a mesterséges intelligencia (MI) eszközök gyorsan beépültek a mindennapokba, legyen szó tartalomgyártásról, szoftverfejlesztésről vagy éppen üzleti folyamatokról...
💻 Az Android legfrissebb Canary-verziójában teljesen megújul a Linux-terminál alkalmazás, amely eddig is a Pixel-telefonok egyik leghasznosabb, ám keveset emlegetett extrája volt...
🍹 A virágporozók, mint a méhek és a kolibrik, nemcsak nektárral táplálkoznak, de tudtukon kívül folyamatosan kis mennyiségű alkoholt is fogyasztanak a természetben...
🛠 Megérkezett a Firefox 149-es verziója, amely látványos újdonságokat tartogat. Mostantól két weboldal nézhető egymás mellett a böngészőben, így a párhuzamos munkavégzés sosem volt még ilyen egyszerű...
Évtizedek óta először sikerült azonosítani a Hajnan szigetén honos, kritikusan veszélyeztetett hajnani nyúl maradványait egy szokatlan helyen – de sajnos már csak egy elgázolt tetem formájában...
Az Archer NX sorozatú routereken komoly biztonsági rést találtak: a TP-Link sürgős frissítést javasol felhasználóinak, mert a hibának köszönhetően támadók mindenféle jogosultság nélkül tölthetnek fel új firmware-t, illetve teljesen átvehetik az eszköz irányítását...
❄ Egy szokatlanul intenzív hidegfront felkavarta a tengerfenék üledékét Florida partjainál, amelynek eredményeként meseszép, világoskék üledékfelhő fodrozódott végig a Mexikói-öböl délnyugati térségében...