2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 18:57

A legmenőbb techkütyük 36 ezer forint alatt

A megfelelő ajándék kiválasztása igazi kihívás lehet, különösen, ha az illető már mindennel fel van szerelkezve a technológia világából...

MA 18:39

Az Obsbot Tiny 3: A csúcskategóriás laptopwebkamera, amelynek nem kéne léteznie

Az Obsbot Tiny 3 és a kedvezőbb árú Obsbot Tiny 3 Lite új szintre emelik a webkamerázás élményét, főleg azok számára, akik podcasterként, streamer-műsorvezetőként vagy zenészként dolgoznak, de a mindennapi felhasználó is profitálhat belőlük...

MA 18:20

Az okos műbőr, amely képeket rejt és alakot vált

A Penn State Egyetem kutatói új, „okos”, hidrogélalapú műbőrt fejlesztettek ki, amely képes álcázni vagy feltárni képeket, szövegeket és más információkat, sőt a felülete, megjelenése és formája is parancsra változtatható...

MA 18:02

Az EU rászállt a TikTokra: veszélyesen addiktív

Az Európai Bizottság szerint a TikTok jelenlegi működése túlzottan addiktív, ezért akár a szolgáltatás alapjain is változtatni kellene a jogszabályok betartása érdekében...

MA 17:38

A láthatatlan vegyi eső már bolygónkat is elborítja?

🌧 Egyre nagyobb mennyiségben hullik a Földre egy szinte eltávolíthatatlan szennyező anyag, amelyet eredetileg az ózonréteg védelmére fejlesztett anyagok lebomlása generál...

MA 17:19

Az univerzum legvadabb energiakitörése: tombol Jetty McJetface

💥 Az elmúlt években egy különleges fekete lyuk, amelyet Jetty McJetface-nek becéznek, minden eddiginél erőteljesebb sugárzást bocsát ki – a kutatók szerint jelenleg az univerzum legnagyobb energiájú objektumai közé tartozik...

MA 17:02

Az igazi Starlink-mobil? Musk tagad, de jöhet egy MI-kütyü?

A SpaceX már most is műholdak százait irányítja az űrben, amelyek világszerte internet-hozzáférést biztosítanak...

MA 16:55

Az MI eladási pánikot váltott ki a tech tőzsdén

📈 A hét elején drámai árfolyamesés rázta meg a szoftveripart, miután az Anthropic új, MI-alapú vállalati csomagja, a Claude Cowork fenyegetést jelent a hagyományos szoftvereszközök számára...

MA 16:19

Az OpenAI Codexe már nemcsak programoz: új korszak az MI-ben

🧠 Az OpenAI bemutatta a GPT-5.3-Codexet, amely egy fejlettebb kódoló MI-modell, és mostantól a parancssorban, fejlesztői környezetben, webes felületen, valamint új platformokon is elérhető – API-hozzáférés viszont még nincs hozzá, de hamarosan várható...

MA 16:01

A spanyol kormány egyik minisztériumát kibertámadás bénította meg

🔒 A Spanyol Tudományos Minisztérium részlegesen leállította informatikai rendszereit, miután kibertámadás gyanúja merült fel...

MA 15:19

Az Amazon és a Google vezet az MI-harcban – de milyen áron?

📈 A nagy techcégek versenye egyre inkább arról szól, ki tud többet költeni adatközpontokra, hogy ezzel növelje az MI-fejlesztésekhez szükséges számítási kapacitást...

MA 15:01

A CISA elrendelte az elavult hálózati eszközök lecserélését

🔧 Az Egyesült Államok Kiberbiztonsági és Infrastruktúra-védelmi Ügynöksége (CISA) kötelező irányelvet adott ki, amely szerint a szövetségi ügynökségeknek fel kell kutatniuk és le kell cserélniük minden olyan hálózati eszközt – például útválasztókat, tűzfalakat és kapcsolókat –, amelyek már nem kapnak frissítést a gyártótól...

MA 14:56

A Szilícium-völgyet rettegésben tartják a titokzatos MI-botok

🤖 Egy átlagos hét sincs már az MI világában: friss az xAI-fúzió, a technológiai részvények piacán tombol az MI-hisztéria, és a Moltbook nevű új közösségi hálózat személyes MI-ügynökeivel robbantotta fel az internetet...

MA 14:38

Az MI-őrület: tényleg közeleg az új dotkomlufi?

A befektetői hangulat jelentősen átalakult ezen a héten, miután egyre többen kérdőjelezik meg a vállalati szoftverek és IT-szolgáltatások értékét abban a korszakban, amelyben a mesterséges intelligencia házon belül is elláthat sok feladatot...

MA 14:19

Az első gyerektelefon, amitől a szülők is nyugodtan alhatnak

A Samsung és az AT&T bemutatta a vadonatúj amiGO Jr. Phone-t, amely kifejezetten gyerekeknek készült...

MA 13:55

Az új LEGO-őrület: megjelenés előtt áll, mégis mindenki ezt lesi

🚀 A LEGO idén igazán szokatlan húzással jelentkezik: érkezik a Hail Mary küldetés (Project Hail Mary) építőkészlet, pedig a film maga még mozikba sem került...

MA 13:19

A Samsung berobban az első Ultra robotporszívóval

A robotporszívók ma már szinte nélkülözhetetlenek annak, aki szeretné tisztán tartani otthonát minimális erőfeszítéssel...

MA 13:01

A valaha volt legdurvább kriptotél: miért szakad be minden?

Az októberi csúcs óta a Bitcoin értéke mintegy 44%-kal esett vissza...

MA 12:55

Az új Switch végre feltámasztja a retro klasszikusokat

A Nintendo évekkel ezelőtt eltemette a Virtual Console-t, vagyis azt a lehetőséget, hogy klasszikus játékokat töltsünk le egyenként a Wii-re vagy a Wii U-ra...

MA 12:38

Az MI már önállóan költhet – itt az új korszak?

A programozásban járatlanok ma már képesek saját alkalmazást készíteni, köszönhetően a vibe-coding megoldásoknak, például a Lovable-nek, amelyek hétköznapi nyelvű leírásból működő kódot generálnak...

MA 12:20

Az „oldalszámozás” áttörése új korszakot nyit a DNS-tervezésben

🔎 A mesterséges intelligencia és a fejlett számítástechnika már ma képes olyan genetikai szekvenciákat tervezni, amelyek változatos biológiai alkalmazásokat tesznek lehetővé...

MA 12:06

Végre iPhone-okkal indulhatnak a Holdra az űrhajósok

A NASA új szabályozásának köszönhetően az űrhajósok a közelgő Crew-12 és Artemis II küldetések során már magukkal vihetik iPhone-jaikat, illetve más modern okostelefonokat az űrbe és a Holdra is...

MA 11:55

Az orosz virtuális gépek mögül csapnak le a zsarolóvírusok

A kiberbűnözők új trükkel szálltak be a ransomware-piacra: egy legitim szolgáltató, az ISPsystem virtuális gépein keresztül terjesztik a kártékony programokat...

MA 11:38

Az online toborzás lett a felhő legnagyobb biztonsági rése

A felhőalapú szolgáltatások biztonsága napról napra fontosabbá válik, miközben újabb és újabb támadási módszerek jelennek meg...

MA 11:20

Az új Ubiquiti UniFi switch végre 10G-s PoE-t hoz az asztalodra

🔋 Az Ubiquiti UniFi USW-Pro-XG-8-PoE egyedülálló megoldást kínál azoknak, akik gyors hálózatra és professzionális PoE-ellátásra vágynak...

MA 11:01

Az élet nyomában: Valóban sosem fagytak be teljesen a marsi tavak?

🕵 Évszázados rejtély, hogy miért vannak a Marson víz jelenlétére utaló nyomok, miközben a bolygó sosem volt elég meleg, hogy tartósan folyékony víz maradjon rajta...

MA 10:57

Az OpenAI új MI-je: aranybánya a hekkereknek, rémálom a fejlesztőknek

🔧 Az OpenAI bemutatta legújabb fejlesztését, a GPT-5.3-Codex nevű MI-modellt, amely messze felülmúlja a konkurens rendszereket kódolási teljesítményben és megbízhatóságban...

MA 10:49

Az MI-alapú keresés lehet a Reddit új aranybányája?

Az MI-alapú keresésben látja a Reddit a jövő üzleti lehetőségét. A vállalat szerint az MI által támogatott kereső túlszárnyalhatja a jelenlegi megoldásokat, mert ott is hatékony válaszokat tud adni, ahol hivatalos válasz nem létezik – elvégre a Reddit erőssége mindig is az volt, hogy egy kérdésre rengeteg különböző vélemény érkezhet sok felhasználótól...

MA 10:41

Az új korszak küszöbén: a Toyota ismét vezérigazgatót vált

🚗 Március 1-jétől új vezérigazgató irányítja a Toyotát: Kenta Kon, a korábbi pénzügyi igazgató lett a vállalat elnök-vezérigazgatója...