2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 20:55

Az arcod lesz a kulcs a Discordhoz?

Februártól a Discord világszerte bevezeti a kötelező életkor-ellenőrzést, ami azt jelenti, hogy minden fiók automatikusan a tiniknek megfelelő beállításokat kap, kivéve, ha a tulajdonos igazolja nagykorúságát...

MA 20:19

A Galaxy AI kikapcsolása: két mozdulat, és kész

Az új Samsung-telefonok tulajdonosai gyakran elárasztva érzik magukat a sok újdonságtól, különösen az MI-szolgáltatások miatt, amelyekből nem mindenki kér...

MA 20:01

Az online szerencsejáték új csalói lecsapnak: ezrek az áldozatok

Két connecticuti férfit, a 29 éves Amitoj Kapoort és Siddharth Lillaneyt több mint 3 millió dollár (kb...

MA 19:55

Az ősi hajósok láthatatlan hatása az Északi-sarkvidéken

🚢 A távoli grönlandi Kitsissut-szigetek (Carey Islands) és Északkelet-Kanada között több mint 50 kilométeres, veszélyes tengeri út húzódik, amelyet ma is nehéz megtenni...

MA 19:37

A régi nyomtatód is életre kel Windows 11 alatt

Sokan aggódnak amiatt, hogy a régi nyomtatójuk egyik napról a másikra használhatatlanná válik Windows 11 alatt...

MA 19:03

A mesterséges intelligencia újrarajzolja az agy sejtszintű térképét

🧠 Tipikus eset, amikor a tudomány fejlődése egészen új perspektívából világítja meg a régi kérdéseket...

MA 18:57

Az akadálymentes tervezés rejtett versenyelőnye: így lesz piaci siker

A legtöbb vállalat a tömegeket célozza, hiszen ők hozzák a nagy profitot...

MA 18:37

Az Exchange Online megőrült: levelek ezrei ragadnak karanténban

A Microsoft Exchange Online felhasználói napok óta szembesülnek azzal, hogy teljesen ártalmatlan e-mailjeiket a rendszer tévesen adathalásznak jelöli meg, majd automatikusan a karanténba helyezi azokat...

MA 18:21

A Mars kuka, Elon Musk a Holdat veszi célba

🚀 Felmerül a kérdés, hogy mi késztette Elon Muskot, hogy hirtelen a Mars helyett a Holdra összpontosítson...

MA 18:01

A csodaműanyag új korszaka: megszülettek a szupererős kompleximerek

💥 A legtöbb műanyag lassan alakul át üvegszerűből folyékonnyá, és az átmeneti hőmérséklet (az ún...

MA 17:56

A kínai ingatlanválság mélyül: jöhet a következő nagy zuhanás

A kínai ingatlanpiac összeomlása a vártnál is súlyosabb lesz idén – figyelmeztet az S&P Global Ratings friss előrejelzése...

MA 17:39

Az okoseszközök új királya a Wiim Sound: tényleg mindenkit lemos?

Az utóbbi években az okoshangszórók főként azzal próbálták elnyerni a tetszésünket, hogy 360 fokban szórják a hangot, így töltve meg zenével a teljes szobát...

MA 17:19

A Galaxy S25 legújabb frissítése meghozta a Direct Voicemailt

📱 A Samsung elérhetővé tette a negyedik One UI 8.5 bétaverziót a Galaxy S25 készülékekre, amely már a 2026...

MA 17:01

A mobilhack az EU-t is elérte: kiszivárogtak dolgozói adatok

A brüsszeli Európai Bizottság vizsgálatot indított, miután kibertámadás nyomait észlelték azon a rendszeren, amely a bizottsági munkatársak mobiltelefonjait kezeli...

MA 16:55

Az HBO Max végre elrajtol Angliában is

🎥 Hat évvel az amerikai indulás után március 26-án az HBO Max végre elérhetővé válik az Egyesült Királyságban és Írországban is...

MA 16:38

Az újabb bitcoin-zuhanás megrázta a piacot, de érkeznek a vevők

💸 Egy lényeges szempont, hogy a Bitcoin árfolyama az elmúlt 24 órában újabb 2,5%-os visszaesést produkált, miután az előző hetet egy visszapattanással zárta, amely egészen 71 000 dollárig (kb...

MA 16:21

A Föld alvilágának titka: elpusztíthatatlan élet az üledék mélyén?

Mélyen a Föld felszíne alatt egy ismeretlen világ rejtőzik, ahol mikroszkopikus lények, az úgynevezett „intraterrestrialok” akár több millió évig is szunnyadnak...

MA 15:57

Az új Ferrari Luce utastere: Jony Ive varázsa négy keréken

🚗 Ferrari történelmet ír: bemutatkozik az első tisztán elektromos modell, a Luce...

MA 15:37

Az új BeyondTrust-baki: a támadók álma lett a távoli hozzáférés

🔒 A BeyondTrust biztonsági szakértői kritikus sebezhetőséget fedeztek fel a Remote Support (RS) és a Privileged Remote Access (PRA) szoftverekben, amelyek világszerte több mint 11 000 rendszert érintenek...

MA 15:19

Az AI által írt szerelmeslevelek tényleg beválnak Valentin-napon?

💗 A Valentin-nap közeledtével sokaknak gondot okoz, hogyan fejezzék ki érzéseiket szavakkal...

MA 15:01

Az adataid veszélyben: szivárognak a népszerű fotóazonosító appok

Több közkedvelt fotóazonosító alkalmazás súlyos adatvédelmi hibát vétett: mintegy 152 000 felhasználó érzékeny adatai szivárogtak ki egy nyilvánosan elérhető adatbázison keresztül...

MA 14:21

A Google Pixel titkos laborja: így születnek a legendás mobilok

🔬 Titkos laborok, világszintű fejlesztés, saját gyártású robotkarok és horrorisztikus strapatesztek – így születik meg a Google Pixel, amely milliók zsebébe költözik...

MA 13:55

Az AI.com csillagászati áron kelt el, kriptómilliárdosé lett

🚀 A Crypto.com alapítója, Kris Marszalek 70 millió dollárt, vagyis körülbelül 25,5 milliárd forintot fizetett az AI...

MA 13:01

Az első nagy korrekció: beszakadt a bitcoin bányászati nehézsége

Az elmúlt hetekben nagyot zuhant a bitcoin bányászati nehézsége, 11%-os visszaesése pedig a legnagyobb ilyen mértékű csökkenés Kína 2021-es kriptoszabályozási szigorítása óta...

MA 12:55

Az NFL végre megóvná a játékosok fejét?

A Super Bowl lezárultával az NFL új pályázatot hirdet: a fejlesztőket arra ösztönzi, hogy továbbfejlesszék az amerikaifutball-sisakok rácsát, és ezzel csökkentsék az agyrázkódások számát...

MA 12:38

Az északi úttörők: 4500 év a jég birodalmában

Közel 4500 évvel ezelőtt a paleoinuitok merész tengerészekként hódították meg Grönland távoli szigeteit...

MA 12:02

A jövő erdei veszélyben: gyors növekedés, ingatag alapok

🌲 A világ erdői gyors ütemben változnak, ám a fejlődés csalóka: az erdők uniformizálódnak, elveszítik sokszínűségüket és egyre sérülékenyebbé válnak...

MA 11:55

Az olcsó Wegovy-utánzat visszavonása után szárnyal a Novo Nordisk

📈 A Novo Nordisk részvényei hétfő reggel közel 8%-kal emelkedtek, miután a Hims & Hers nevű telemedicina-szolgáltató visszavonta a Wegovy nevű fogyókúrás tabletta másolatának forgalmazását...

MA 11:37

Az iPhone 17 felforgat mindent: új chip és MagSafe érkezik

Az Apple hamarosan bemutathatja az új iPhone 17e-t, amely az iPhone 17 szériából ismert A19 chipet kap, és támogatja a MagSafe vezeték nélküli töltést is...