Az MI egyre többet hibázik, de tesztelni luxus?

Az MI egyre többet hibázik, de tesztelni luxus?
Az MI (mesterséges intelligencia) használatának rohamos terjedésével egyre több esetben derül ki, hogy a rendszerek kártékony vagy érzékeny tartalmat generálnak. Ezek között szerepel gyűlöletbeszéd, szerzői jogokat sértő anyagok vagy szexuálisan explicit tartalom is. A problémát tovább súlyosbítja, hogy sem a szabályozás, sem a modellek tesztelése nem tart lépést a technológia fejlődésével. Az MI viselkedésének irányítása régóta nehéz feladat, és a megoldás — ahogy az elmúlt másfél évtized kutatásai is mutatják — továbbra is várat magára.

Hogyan teszteljük az MI-t?

Komoly gondot jelent, hogy nincs elegendő szakember, aki az MI hibákat — amit a szakmában hibakeresésnek (red teaming) neveznek — profi módon vizsgálja. Bár egyre több startup alkalmaz belső vagy szerződéses tesztelőket, a szakértők szerint szükség lenne arra is, hogy hétköznapi felhasználók, újságírók, kutatók és etikus hackerek is hozzáférhessenek a rendszerekhez. Sok esetben a modellek olyan hibákat generálnak, amelyek felismeréséhez jogi, orvosi vagy tudományos végzettségre van szükség; egy átlagos felhasználó gyakran nem tudja eldönteni, hogy tényleg hibáról van-e szó.

Az MI hibák standardizált jelentése, az információk megosztása, sőt, az ilyen hibák megtalálásáért járó jutalmak bevezetése hatékonyabbá tenné a védelmet. Ez a megközelítés más IT-biztonsági területeken már bevált.

Ipágarági példák: Holdraszállás projekt (Project Moonshot)

A Holdraszállás projekt (Project Moonshot) nevű kezdeményezés Szingapúrban indult, és a nagyvállalatok – például az IBM – is csatlakoztak hozzá. Az eszköztár célja, hogy átfogóan tesztelje az MI-rendszereket: szabványos összehasonlításokat, hibakeresést, gyorsteszteket kínál, ráadásul bárki kipróbálhatja, vagyis nem zárják ki a külső tesztelőket sem. A program bevezetését vegyesen fogadták, de a startupok többsége már most is használja. A jövőben iparágra szabott, többnyelvű és kulturálisan érzékeny tesztelési lehetőségeket terveznek, amelyek tovább növelik a biztonságot.

Miért kell gyógyszergyári szintű tesztelés?

A jelenlegi gyakorlattal szemben, ahol a tech cégek megfelelő előzetes ellenőrzés nélkül teszik elérhetővé az új MI-modelleket, egy vezető statisztikai professzor szerint szigorú, gyógyszeripari szintű jóváhagyási eljárásra lenne szükség. Egy új gyógyszert vagy repülőgépet csak több hónapos komoly tesztelés után lehet forgalomba hozni, ezzel szemben az MI-modellekkel szemben nincsenek ilyen elvárások.

A jövőben érdemesebb lehet olyan MI-rendszereket fejleszteni, amelyek konkrét feladatokra készülnek, nem pedig mindenhez „is” értenek — hiszen minél általánosabb egy modell, annál több hibalehetőséget kell előre látni, ami szinte lehetetlen.

A cégeknek nem szabad túl magabiztosnak lenniük a védelmi rendszereikkel kapcsolatban, hiszen a nagy, általános modelleknél szinte lehetetlen meghatározni, hogy pontosan mi számít biztonságosnak vagy veszélyesnek.

2025, adminboss, www.cnbc.com alapján

  • Te mit gondolsz, be kellene-e minden új MI-modellt szigorúan tesztelni, mielőtt elérhetővé válik?
  • Te mit tettél volna, ha felelős lettél volna egy olyan MI bevezetéséért, amely később káros tartalmat generál?


Legfrissebb posztok

MA 15:35

Az újrahasznosítás rémálma: berobban a rugalmas anyagok forradalma

♻ A rugalmas ruhák, mint a leggings vagy a sportruházat, szinte lehetetlen újrahasznosítani—ezért a legtöbbjük szeméttelepen végzi, még akkor is, ha elvisszük a szelektív gyűjtőbe...

MA 15:18

Az élet szikrája: RNS születhetett magától az ősi Földön

⚡ Évmilliárdokkal ezelőtt, nem sokkal a Föld kialakulása után, már jelen lehettek azok az anyagok, amelyekből az élet kialakult...

MA 15:02

A biztosítatlan gyerekek nagyobb eséllyel halnak meg rákban

Több mint négymillió, 19 év alatti amerikai gyermek maradt egészségbiztosítás nélkül 2024-ben...

MA 14:48

Az amerikai szabályozás enyhül, a PayPal bankká lépne elő

A PayPal bejelentette, hogy saját bank alapítására készül az Egyesült Államokban, miután Utah államban benyújtotta ipari hitelintézeti engedélykérelmét...

MA 14:34

Az Ofcom rászállt a BT-re és a Three-re a súlyos leállások miatt

⚠ Júniusban és júliusban a BT és a Three mobilhálózatai komoly üzemzavarokat szenvedtek el az Egyesült Királyságban, amelyek során az ügyfelek nem tudtak hívásokat indítani vagy fogadni, sőt, a segélyhívó szolgáltatások sem voltak elérhetők...

MA 14:20

Az elbukott Roomba: így úszott el az otthoni robot jövője

Amikor 2005-ben először vittem haza a saját Roombámat, egy lépéssel közelebb éreztem magam A Jetson család álomvilágához – ahhoz, hogy egy robot takarítson helyettem...

MA 14:03

Az RC4 bukása: a Microsoft száműzi a veszélyes titkosítást

Több mint negyedszázadon át volt része a Windows-rendszereknek egy olyan titkosítási algoritmus, amelyet a hackerek aranybányának tekintettek...

MA 13:50

Az új Kim Kardashian-skin tarol a Fortnite-ban

A Fortnite történetében már megszokottak a sztárkollaborációk, de Kim Kardashian színre lépése egészen új szintet jelent...

MA 13:34

Az orosz GRU éveken át csapott le a kritikus infrastruktúrára

A fejlett orosz kibertámadások évek óta komoly veszélyt jelentenek a nyugati energia-, távközlési és technológiai szektorra...

MA 13:03

Az MI-től tényleg emberibbé válnak a főnökök?

📈 Fontos kérdés, hogy mit jelent az, ha a vállalatok a döntéshozatali folyamatokban mind nagyobb teret adnak az MI-nek, amely eddig inkább csak végrehajtó feladatokat látott el...

MA 12:49

A Ford a szerverparkokban újít: autóakkukból energiabank

🚗 A Ford stratégiát vált, és hatalmas akkumulátorokat kezd gyártani, kihasználva a globális adatközpont-építési hullámot...

MA 12:34

A OnePlus Turbo óriási akkumulátorral robban be

A OnePlus új lendületet vesz: legújabb fejlesztése, a OnePlus Turbo-széria hangos belépőt ígér az okostelefonok piacán...

MA 11:50

A Magdala-kő rejtélye: a világ legkorábbi jeruzsálemi menórája

Egy zarándok több mint 2000 éve örökíthette meg emlékeit a Magdala zsinagógában fellelt kőtömbbe vésett menóra formájában, amelyet a tudósok ma a világ legrégebbi ilyen ábrázolásaként tartanak számon...

MA 11:34

Az év szava idén: MI-szemét

🚬 Az MI által gyártott értéktelen tartalmak annyira elterjedtek 2025-re, hogy az egyik legnagyobb angol szótár, a Merriam-Webster is felvette a szenny (slop) kifejezést új jelentéssel...

MA 11:17

Az életüket kockáztató kolibrik: a természet középkori lovagjai

A zöld erdei kolibri csillogó tollazatával és tűhegyes, hosszú csőrével nemcsak a nektárgyűjtés mestere a közép- és dél-amerikai őserdőkben, hanem igazi harcos is, ha eljön a párzási időszak...

MA 11:02

Az MI miatti csiphiány megdobhatja a mobilok árait

📱 Az MI-vezérelte csiphiány jelentős drágulást hozhat a mobiltelefonok piacán 2026-ban. Az okostelefonok átlagos eladási ára várhatóan 6,9%-kal nő, főként a memóriachipek árának ugrásszerű emelkedése miatt...

MA 10:59

Az év biológiai áttörései: emlékezet, evolúció és az MI legfurcsább titkai

🔬 Tipikus, hogy egyetlen év biológiai felfedezései is képesek megváltoztatni mindazt, amit tudni vélünk magunkról, az állatokról – vagy akár a gépekről...

MA 10:51

A hatalmas SSD, ami valahogy elkerülte mindenki figyelmét

👀 Egy alig ismert lengyel adattároló cég, a Goodram Enterprise csendben piacra dobott egy 122,88 TB kapacitású, PCIe 5...

MA 10:45

Az új klímamodell felforgathatja Ausztrália jövőjét

🌎 Ilyen eset például, amikor az éghajlatváltozás mindent átalakít: otthonainkat, élelmiszer-termelésünket, a bozóttüzek, áradások és hőhullámok kockázatát...