2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 20:44

Az alumínium átírja az ipart: jön a ritkafémek utáni korszak?

A King’s College London kutatócsapata egy egészen új alumíniumformára bukkant, amely olcsóbb és fenntarthatóbb alternatívája lehet a jelenleg használt, drága és ritka fémeknek...

MA 20:34

A QR-kódos csalások sosem voltak ilyen veszélyesek

Az utóbbi időszakban drámai mértékben, 146%-kal nőtt a QR-kódos adathalász támadások száma, miközben más, korábban elterjedt módszerek háttérbe szorultak...

MA 20:22

A Pink Floydról elnevezett új pók a házfalakon portyázik

A Dél-Amerikában dolgozó kutatók egy új repedéslakó pókfajt fedeztek fel, amely a Pikelinia floydmuraria nevet kapta – ezzel egyszerre a Pink Floyd zenekar előtt tisztelegnek és a pók jellegzetes lakóhelyére utalnak...

MA 20:12

A Division: Újjászületés mostantól PC-n is ingyen játszható

Jó példa erre, hogy az okostelefonokon már ismert A Division: Újjászületés (The Division Resurgence) mostantól számítógépen is kipróbálható, még a hivatalos augusztusi rajt előtt...

MA 19:56

Az újabb 80 ezres rekord küszöbén billeg a Bitcoin

💰 A Bitcoin árfolyama közel 3%-ot emelkedett az elmúlt 24 órában, elérve a 78 700 dollárt (kb...

MA 19:45

A városi madarak inkább a férfiakat tűrik a közelükben

🐒 A nagyvárosokban élő madarak viselkedése meglepő mintázatot mutat: úgy tűnik, a városi madarak közelebb engedik magukhoz a férfiakat, mint a nőket...

MA 19:22

Az intézményi tőke felpörgeti a bitcoin piacát: 16 billió dollárig nőhet

📈 A bitcoin értéke robbanásszerű növekedés előtt áll a következő években: 2030-ra 16 billió dollárra (mintegy 5760 billió forintra) ugorhat a kriptodeviza piaci kapitalizációja, jósolja az Ark Invest friss jelentése...

MA 19:11

Az izomnöveléshez nem kell meghalni az edzésen

Sokan azt gondolják, csak kemény, fájdalmas edzésekkel lehet erősebbé válni, de egy friss kutatás szerint ez tévhit...

MA 19:01

Az oxfordi fizikusok áttörték a kvantumhatárokat: itt a quad‑squeezing

A kvantumvilág titkai újabb rétege tárult fel az Oxfordi Egyetemen, ahol fizikusok először valósították meg az úgynevezett quadsqueezinget, vagyis a négyrendű „összenyomást”...

MA 18:56

A feltámadt kínai képcsöves tévék titka

📺 Bár sokak számára a katódsugárcsöves (CRT) tévék már csak a retro videojátékok vagy klasszikus sci-fi filmek kellékei, Kínában most meglepően olcsón kínálnak pár frissnek tűnő példányt...

MA 18:45

Végre megérkezett az Xbox-mód Windows 11-re

🎮 Végre valóra vált a PC-s játékosok álma: Windows 11-en, asztali gépeken is elérhetővé vált az Xbox mód...

MA 18:34

Az ősi, csavart állkapocs rejtélye – Tanyka nyomában

🦖 Dél-Amerika mélyén, Brazília Amazonas menti erdeiben, egy kiszáradt folyómeder alatt paleontológusok rendhagyó fosszíliára bukkantak: egy mintegy 275 millió éves állkapocscsontra, amely semelyik ma élő állathoz sem hasonlítható...

MA 18:23

A ROG Ally X MI-varázsa: profi felskálázás csak dokkolva

A hordozható játék-PC-k között a ROG Ally X most új szintre lép: az eddig elérhető AMD FSR felskálázás mellett már a Microsoft új, mesterséges intelligenciával (MI) támogatott Auto SR megoldását is használhatják a felhasználók – igaz, egyelőre kizárólag dokkolt üzemmódban...

MA 16:01

Az Apple figyelmeztet: a memóriaválság megdobhatja a Mac-árakat

💸 Az Apple vezérigazgatója, Tim Cook egyre komolyabb memóriaválságot prognosztizál, amely már idén júniustól jelentősen megdobhatja a vállalat költségeit...

MA 15:56

Az OpenAI-per tétje: Musk szerint az MI végzetes lehet

💥 A bíróság falai között csapott össze a techvilág két nagyágyúja: Elon Musk és Sam Altman között váratlanul heves vita robbant ki arról, hogy valóban létünk végéhez vezethet-e a mesterséges intelligencia fejlődése...

MA 15:34

Az MI igazi áttörései a tudományban: mire számíthatnak a kutatók?

Felmerül a kérdés, hogy vajon létezik-e már olyan MI-eszköz, amelyben valóban megbízhatnak a kutatók, és amely nemcsak gyorsabbá, hanem megbízhatóbbá is teszi a munkájukat...

MA 15:24

Az asztrológia lebukott: mégsem hat a szerelemre?

👁 Az asztrológia már az ókor óta meghatározó szerepet játszik sok civilizációban, és napjainkban is óriási üzletté nőtte ki magát, amelynek értéke 2025-re már elérte a több száz milliárd forintot...

MA 15:12

Az európai Microsoft-csoda nyomában: szuverenitás, adatközpontok, dicsekvés

🌍 A Microsoft Európában komolyan ráfeküdt az adatkezelésre, és nem aprózza el: az elmúlt évben például Portugáliában több mint 3 500 milliárd forintot, Norvégiában 2 170 milliárdot, az Egyesült Királyságban pedig 10 500 milliárd forintot fordított új adatközpontokra...

MA 15:01

Az MI-háború nagy fordulata: Nem ChatGPT vagy Claude a legokosabb?

Az MI-chatbotok között élesedő verseny újabb meglepetést tartogat: habár egyre többen pártolnak át a ChatGPT-től a Claude-hoz, a friss elemzések szerint egyikük sem mondhatja magát a legokosabb ingyenes MI-nek...

MA 14:56

A villámgyors kontroller – GameSir G7 Pro 8K teszt, humorral

⚡ Kezdődhet a kontrollerfesztivál: a GameSir G7 Pro 8K Aimlabs Edition messze nem csak egy szokványos játékszer...

MA 14:46

Az OLED végre tömegeknek szól: berobban az Alienware AW2726DM

💡 Az utóbbi időben az OLED monitorok ára igencsak elrugaszkodott a valóságtól, de most ugrásszerűen megváltozott a helyzet...

MA 14:33

Az SBI Holdings új kriptotőzsdére csapna le Japánban

💰 A Tokióban működő pénzügyi óriás, az SBI Holdings újabb nagy lépésre készül a digitális eszközök világában...

MA 14:23

Az EA új pénzcsapdája: már előrendelhető a Battlefield 6 battle pass

A Battlefield 6 népszerűsége gyorsan felszökött a rajt után, ám a lendület csak rövid ideig tartott...

MA 13:56

Az MI árnyékában: Mit osztanak meg a dolgozók valójában?

A brit cégek kétharmada bevallja, fogalma sincs arról, hogy alkalmazottaik milyen adatokat osztanak meg azokon az MI-platformokon, amelyeket hivatalosan engedélyeztek...

MA 13:45

Az új gyógyszer, ami felére vágja a rossz koleszterint

A magas koleszterinszint hosszú távon komolyan károsítja az artériákat, növeli a szívbetegségek kockázatát, és világszerte rengeteg embert érint...

MA 13:02

Az új Cyber Essentials-szabályok veszélybe sodorhatják a közbeszerzéseket

⚠ Érdemes megvizsgálni, hogy mennyire komoly következmények várhatnak azokra a szervezetekre, amelyek nem tartanak lépést a legújabb kiberbiztonsági előírásokkal...

MA 12:56

A legkisebb idei telihold jön – és vele a kék Hold

Egy lényeges szempont, hogy május első teliholdja, a Virághold pénteken, 13:24-kor válik pontosan teljessé, bár ez Észak-Amerikában nappalra esik...

MA 12:45

Az etikátlan hackerképzés ára: így veszítjük el a jövő védőit

🔒 Néhány éve még elképzelhetetlen lett volna, hogy tinédzserek önéletrajzaival telnek meg a dark web fórumai...

MA 12:34

Az idei május legütősebb kütyüi: megszólalnak, villannak, rabul ejtenek

💡 Okostévétől könyvespolci hangfalig, elképesztő, mennyi mindent lehet mostanában a kezedbe venni – vagy inkább bekapcsolni...