2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

péntek 21:46

Az agyevő amőba tombol – Jön végre a fordulat?

💀 Forró, déli nyári napon egy nyolcéves fiút szállítanak az intenzív osztályra...

péntek 21:34

Az amerikai kormány soha nem látott tempóban vizsgálja a pszichedelikumok engedélyezését

Az Egyesült Államokban jelentősen felgyorsítják három, mentális betegségek kezelésére szánt pszichedelikus szer engedélyezési eljárását – köztük olyanokét is, amelyek a depresszió nehezen kezelhető formáira kínálnak potenciális megoldást...

péntek 21:23

Jön az orosz VPN-adó: vége a kiskapunak?

Oroszország egy újabb lépésként a VPN-használatot adóztatná meg, de a bevezetés május 1-i határideje könnyen csúszhat – a legnagyobb szolgáltatók szerint egyszerűen lehetetlen időben kiépíteni a rendszert...

péntek 21:12

Az új RIG FPS-headset: stúdióhangzás játék közben, borsos árcédulával.

Mostantól tényleg nem kell kompromisszumot kötni, ha játék közben mennyei hangzásra vágysz!..

péntek 21:02

Az MI-ügynökök már itt vannak – de ki meri bevetni őket?

🤖 Érdekes felvetés, hogy ma már a vállalatok 85 százaléka futtat MI-ügynökökre épülő pilotprojekteket, mégis mindössze 5 százalékuk bízik meg annyira ezekben a rendszerekben, hogy éles környezetben is bevesse őket...

péntek 20:56

Az első valódi kvantumtámadás a Bitcoinra: közeleg a veszély?

⚠️ Egy független kutató, Giancarlo Lelli, történelmet írt: nyilvánosan hozzáférhető kvantumszámítógépen sikerült feltörnie egy elliptikus görbéhez tartozó 15 bites kulcsot...

péntek 20:46

Az adatközponti gázerőművek egyes országoknál is szennyezőbbek lehetnek

⚡ A világ adatközpontjainak energiaszükséglete elképesztő tempóban nő, és a zöld energia helyett egyre több helyen fordulnak a kevésbé fenntartható megoldásokhoz: az Egyesült Államokban például most 11 óriási adatközpont-kampusz energiaellátására terveznek új gázerőműveket...

péntek 20:33

Az Aptos szárnyal, ünnepel a CoinDesk 20

Ez szép, de aztán jön a de: a digitális pénzekkel nem mindig sétakocsikázás a parkban, most viszont kifejezetten napos a kriptó-csillagzat...

péntek 20:23

Az izlandi vulkán, ahol leereszkedhetsz a magma gyomrába

Izlandon, Rejkavíktól alig néhány kilométerre található a Thríhnúkagígur, magyarul „Háromcsúcsú kráter”, amely egyedülálló látványosságot kínál: ez az egyetlen hely a Földön, ahol bárki leereszkedhet egy kiürült magmakamrába...

péntek 20:12

Az arany laskagomba inváziója veszélybe sodorja Florida erdeit

🍄 A figyelemfelkeltő, sárga kalapú arany laskagomba egyre népszerűbb a gasztronómiában és az otthoni gombatermesztésben...

péntek 20:03

A titokban fejlesztett Anthropic MI, amit túl veszélyesnek tartanak

Az Anthropic bemutatta Claude Mythos Preview nevű, minden eddiginél fejlettebb MI-modelljét, amelyet azonban nem engedett szabadjára...

péntek 19:56

Az Ethereum Alapítvány kasszája ismét dagad: a Bitmine óriásvásárlása

A Bitmine Immersion Technologies újabb óriási lépést tett a digitális eszközpiacon: 10 000 ethert (ETH) vásárol az Ethereum Foundationtől, összesen 8,6 milliárd forintért...

péntek 19:45

Az El Niño már májusban fenekestül felforgathatja az időjárást

🌧 A Föld szinte minden részén az átlagosnál melegebb nyárra készülhetünk: a legfrissebb előrejelzés szerint májusban visszatérhet az El Niño...

péntek 19:34

A láthatatlan veszély: mikroműanyagok a levegőben

🌫 A bolygó légkörében keringő mikroműanyagokról már sokat hallhattunk, de most kiderült, hogy a forrásukról eddig teljesen félrevezető kép élt bennünk...

péntek 19:24

Az apró hangszóró, ami lenyomja a nagyokat: Tribit Stormbox Micro 3 teszt

🔊 A Tribit Stormbox Micro 3 alig nagyobb egy szappantartónál, mégis lazán hozza azt a hangélményt, amit sok, jóval drágább és nagyobb Bluetooth-hangszóró sem tud...

péntek 19:12

Az áradások célkeresztjében: New York és New Orleans

Külön említést érdemel, hogy egy új kutatás nyolc amerikai keleti parti várost az extrém áradási károk legmagasabb kockázati zónájába sorol...

péntek 19:03

Az univerzum új robbanása: megszülethetett egy szuperkilonova?

Egy eddig ismeretlen, titokzatos kozmikus robbanás tartja lázban a csillagászokat: lehet, hogy egészen új csillagászati katasztrófát láttak, amely egyszerre egy neutroncsillag-ütközésből, azaz kilonovából, és egy szupernóva-robbanásból tevődik össze...

péntek 18:56

Az antarktiszi ősjégben lapul a klímarejtély megoldása?

🧊 Több millió éves antarktiszi jég vizsgálata soha nem látott részleteket tárt fel a Föld éghajlatának hosszú távú változásairól...

péntek 18:45

Az ötödik erő tényleg rejtőzik a Naprendszerben?

Az Univerzum titkait kutatva a tudomány gyakran szembesül azzal, hogy bolygók, csillagok és galaxisok nagy léptékű viselkedésére nincs mindenre kiterjedő magyarázat...

péntek 18:35

Az Apple új korhatár-ellenőrzése inkább árt, mint használ

🔴 Miközben az online tartalmakhoz egyre szigorúbb életkori ellenőrzések válnak általánossá, az Apple iOS 26...

péntek 18:23

A Terra-botrány fordulata: a Jane Street ellentámad

Az egyik legnagyobb Wall Street-i kereskedőcég, a Jane Street azt kérte az amerikai bíróságtól, utasítsa el a Terraform Labs csődvagyonának keresetét...

péntek 16:13

Az olcsó 8 GB-os kártyák utolérhetik a 16 GB-os csúcsokat?

📈 Megvizsgáltam, mennyire lehet tuningolással felzárkóztatni a középkategóriás, 8 GB memóriás Nvidia- és AMD-videokártyákat a drágább, 16 GB-os változatok teljesítményéhez...

péntek 16:02

Az EA nem csinálja, ezért egy indie nekiáll a Titanfall 3-nak

A Titanfall-sorozat minden idők egyik legkedveltebb FPS-élménye, amely érthetetlen módon a süllyesztőbe került, amikor az EA a Titanfall 2-t két nagy riválissal, a Battlefield 1-gyel és a Call of Duty: Infinite Warfare-rel egy időben dobta piacra...

péntek 15:57

Az indiánok rejtett őse: szenzációs felfedezés az ősi DNS-ben

Az utóbbi évek egyik legjelentősebb genetikai kutatásában sikerült majdnem kétszáz dél- és közép-amerikai őslakos ember genomját feltérképezni, egészen új képet adva Amerika benépesítésének rejtélyes múltjáról...

péntek 15:46

Az amerikaiak titkos gombaláza: depresszió, remény és varázsgombák

Megemlíthető továbbá, hogy az elmúlt években az úgynevezett varázsgombák, vagyis a pszilocibint tartalmazó gombák iránti érdeklődés az Egyesült Államokban minden eddiginél nagyobb lett...

péntek 15:34

Az MI-forradalmat is túléli az iPhone: az Apple aduásza marad

📱 Az utóbbi időben sokan vitatják, hogy vajon képes lesz-e az Apple megőrizni vezető szerepét a mobilpiacon az MI rohamos fejlődése mellett...

péntek 15:23

Az SSD-k drágulnak, elszálltak a processzorárak

Egyre biztosabbnak tűnik, hogy jóval mélyebben kell a pénztárcánkba nyúlni, ha új SSD-t vagy processzort szeretnénk venni...

péntek 15:12

A bitcoin és a dollár most döbbenetesen tükörképei egymásnak

Érdemes megvizsgálni, hogy a bitcoin és az amerikai dollár közötti kapcsolat sosem volt ennyire szélsőséges, mint mostanában...

péntek 15:03

A május égi csodái: felszerelések, tippek, kihagyhatatlan élmények

🌙 Májusban is számos látványosság vár az égbolton mindazokra, akik szeretnék felfedezni a csillagászat rejtelmeit...