2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 07:01

Az árak elszabadultak: Miért kerül ma minden ilyen sokba?

Gyerekkoromban apámmal mindig azt játszottuk a boltban, ki találja el jobban, mennyi lesz a végösszeg...

MA 06:57

Az afrikai drónforradalmat a Terra robbantja be

🚀 Egy nigériai start-up, a Terra Industries páratlanul nagy léptékben gyárt drónokat, hogy megvédje Afrika fontos létesítményeit...

MA 06:50

Az MI-forradalom, ami százszoros energiamegtakarítást ígér

Egy lényeges szempont, hogy a mesterséges intelligencia már most is hatalmas mennyiségű energiát fogyaszt világszerte; az Egyesült Államokban például a teljes áramfogyasztás több mint 10%-át MI-rendszerek és adatközpontok használják el, ami 2024-ben mintegy 415 terawattóra volt...

MA 06:29

Az új FortiClient EMS-ben talált rés pánikhétvégét hoz: jackpot a hackereknek

Elképesztő, hogy még szombat este sem lehet hátradőlni a gép előtt, mert a Fortinet kénytelen volt villámgyorsan kiadni egy javítást a FortiClient Enterprise Management Serverhez tartozó kritikus biztonsági rés miatt...

MA 06:22

Ki viszi el a balhét az MI-ügynökök helyett?

🤔 Az MI-ügynökök betörése a vállalati döntéshozatalba eddig példátlan lehetőségeket ígér, de a felelősség kérdése komolyan fennáll...

MA 06:14

A rádióamatőrök új kora: küldd jeleid egészen a Holdig!

Továbbá a MoonRF nevű nyílt forráskódú kezdeményezés lehetővé teszi bárki számára, hogy a világ bármely pontjáról, akár a Hold segítségével lépjen kapcsolatba másokkal...

MA 06:05

Történelmi események a mai napon (Április 6.)

Viharos fordulók, mérföldkő technológiák és sorsfordító csaták: ezen a napon Julius Caesar döntő győzelmet aratott Thapsusnál, Gandhi elindította a Sómenetet, és Németország megtámadta Jugoszláviát és Görögországot...

vasárnap 21:24

Az Nvidia fénysebességre vált: kulisszák mögött az optikai áttörés

💫 A 2020-as évek közepére rendkívül felgyorsult a mesterséges intelligencia fejlődése, és ehhez az Nvidia óriási teljesítményű GPU-rendszerei adták az alapot...

vasárnap 20:12

Az intézményi tőke tartja felszínen a bitcoint a pánik közepette

A bitcoin ismét a figyelem középpontjába került, hiszen árfolyama 67 100 dollár (kb...

vasárnap 19:33

A bűvös dohánylevél: öt hallucinogén egyetlen növényben

Képzeld el, egy rakás pszichedelikus anyag egyetlen ártatlan dohánylevélben – igen, ezt most tudományosan is megcsinálták!..

vasárnap 19:23

Az adatlopás új hulláma célkeresztbe vett 766 Next.js szervert

Veszélybe kerültek a legnagyobb felhőszolgáltatókra épülő rendszerek, miután hackerek tömegesen támadták meg a Next...

vasárnap 19:13

Az oxigénhiány meglepő titka: védhet a magaslati élet a cukorbetegségtől?

A vörösvértestek nemcsak oxigént szállítanak: most úgy tűnik, komoly szerepük lehet abban, hogy a magaslati lakosok ritkábban válnak cukorbeteggé...

vasárnap 19:01

Az Orion űrkapszula lézerrel élő 4K videót küld a Holdról

📺 Négy űrhajós indult útnak a Hold köré az Artemis II küldetésen, új fejezetet nyitva az űrkommunikációban is...

vasárnap 18:56

Az Artemis II a Holdra megy, vécégondok ide vagy oda

🚀 Már útjuk felénél járnak az űrhajósok, akik történelmi jelentőségű holdkerülő repülésre készülnek az Orion-kapszulában...

vasárnap 18:45

Az USA titkai tényleg egy tanulókártya-appból szivárogtak ki?

Egy Quizlet nevű online tanulási platformon februárban olyan, nyilvánosra állított kártyacsomag bukkant fel, amely valószínűleg rendkívül bizalmas, texasi biztonsági létesítményekhez köthető eljárásokról árult el információkat...

vasárnap 18:33

Az MI felforgat mindent: így lesz a gyerekednek munkája a jövőben

Kisgyerekes szülőként az ember hajlamos túlparázni, hogy merre érdemes vinni a lurkót: magán- vagy állami suliba?..

vasárnap 18:23

Az MI-ügynökök betörnek a kriptópiacra

A kínai Ant Group blokklánc-részlege, az Ant Digital Technologies bemutatta az Anvita platformot, amely lehetővé teszi, hogy önjáró MI-ügynökök minimális emberi beavatkozás mellett vagyont birtokoljanak, kereskedjenek és azonnali fizetéseket bonyolítsanak le...

vasárnap 17:01

Az Artemis II úton, de gond van a holdűrhajósok vécéjével

Az űrutazás következő mérföldkövéhez érkezett a NASA, hiszen az Artemis II küldetés négy asztronautája már néhány napja úton van a Hold felé...

vasárnap 16:56

Az olvadó Antarktisz kincseiért megindul a bányászroham?

🚧 Az Antarktisz felszínét hatalmas arany-, ezüst-, réz- és vaslelőhelyek rejtik – eddig ezek megközelíthetetlenek voltak, de az éghajlatváltozás most mindent felboríthat...

vasárnap 16:45

Az ultravékony fénycsapda áttörést hoz a fény irányításában

💡 Lengyel kutatóknak minden eddiginél vékonyabb rétegben sikerült csapdába ejteniük az infravörös fényt: mindössze 40 nanométer vastagságban, ami ezerszer vékonyabb, mint egy hajszál...

vasárnap 16:12

Az ősi szupernóva feltárul: új rejtélyre bukkant a NASA távcsöve

Közel kétezer évvel ezelőtt kínai csillagászok egy különös, ideiglenes „vendégcsillagot” figyeltek meg az éjszakai égbolton, az Alfa Centauri irányában...

vasárnap 16:01

Az égre tükröt küldenének – jön az álmatlan káosz?

Az elkövetkező években radikálisan megváltozhat a Föld éjszakai égboltja: a Reflect Orbital nevű cég tervezi, hogy hatalmas tükrökkel felszerelt műholdakat állít pályára, melyek képesek lennének 5-6 km széles földi területekre napfényt vetíteni – a telihold fényétől a verőfényes dél ragyogásáig...

vasárnap 15:57

Az Instax Mini 13: a nosztalgia varázsa vagy olcsó retró?

Érdemes megvizsgálni, hogy a digitális korszakban mennyire van helye egy analóg instant fényképezőgépnek, mint a Fujifilm Instax Mini 13...

vasárnap 15:47

A Palantir MI-forradalma, amit senki sem tud lemásolni

🛡 Érdekes felvetés, hogy a legforróbb techmeló, a forward-deployed engineer (FDE), gyökeresen felforgatta a szoftveripart, miközben a legtöbb cég aligha tudja azt valóban megvalósítani...

vasárnap 15:24

Az MI-től rettegünk: az elavulás réme sosem volt erősebb

Az amerikai munkahelyeken új, mindennapokat átszövő félelem uralkodik: a munkavállalók egyre kevésbé attól tartanak, hogy elbocsátják őket, inkább attól, hogy munkájuk jelentéktelenné válik a mesterséges intelligencia előretörése miatt...

vasárnap 15:12

Az MI most tényleg felforgatja az amerikai iskolákat?

Az amerikai oktatás ma éles kanyarban halad. Mesterségesintelligencia-cégek azt ígérik, hogy a munkaerőpiac teljesen átalakul, miközben már senki sem tudja igazán, mit is jelent pályára készen állni...

vasárnap 15:02

A torinói lepel rejtélye: sárgarépa- és korallnyomok?

Kevesen vannak, akik ne hallottak volna a torinói lepelről, arról a titokzatos vászonról, amelyet sokan Jézus testét beborító halotti lepelként tisztelnek...

vasárnap 14:57

A védelmi ipar lehet a gyengélkedő európai autógyárak mentőöve?

🛡 Az európai autóipar kritikus állapotban van. Az elektromos autók iránti kereslet jelentős lassulása, a kínai versenytársakkal szemben elvesztett piaci részesedés, valamint a megemelkedett hitelköltségek olyan tökéletes vihart idéztek elő, amelyből még nem sikerült kilábalni...

vasárnap 14:45

A frankfurti mélyben rejtőző római szentély sötét titkai

Frankfurt északi részén, egy építkezés során egyedülálló római szentély maradványai kerültek elő, amelyek egészen új fényt vethetnek az ókori vallási szokásokra...