2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 11:01

Az iPhone 17 lepipálja a Pixel 10a-t?

A Google február 18-án mutatja be a Pixel 10a-t, ám az Apple sem tétlenkedik: kiszivárgott, hogy hamarosan érkezik egy jóval olcsóbb iPhone, a 17e is, amely komoly riválisa lehet a Pixelnek...

MA 10:57

Az AT&T olcsó gyerekmobilja, amit teljesen te irányítasz

Az okostelefon ma már a legtöbb gyerek életének része, de sok szülő szeretné korlátozni a használatát...

MA 10:49

Az elveszett aranyszövet – visszatér a tengerek legendája

Egy ritka, luxusnak számító aranyszövetet, amelyet kétezer évig csak császárok és pápák viselhettek, sikerült újraalkotni dél-koreai tudósoknak...

MA 10:41

Az új NotebookLM-funkció turbófokozatba kapcsolja a jegyzetelést

A Google legújabb fejlesztése, a Personal Intelligence, hamarosan a NotebookLM-ben is megjelenhet...

MA 10:33

Az AirFish, a tenger felett repülő hajó forradalma

Szingapúrban hamarosan teljesen új élmény vár a nyaralókra: a tenger felett, nem pedig a vízben száguldhatnak céljuk felé...

MA 10:26

Az amerikai makroadatok padlóra küldhetik a Bitcoint

Többek között négy jelentős amerikai gazdasági esemény mozgathatja meg e héten a Bitcoin árfolyamát...

MA 10:04

Az első brit klímamenekültek: végre maguk mögött hagyják otthonaikat és traumáikat

Negyven környékbeli lakó évekig rettegtek a walesi Clydach Terrace utcájában az áradásoktól és a természeti csapásoktól, míg végül a helyi önkormányzat úgy döntött, 2,6 millió fontért (~1,14 milliárd forintért) felvásárolja az ingatlanokat...

MA 09:49

Az aloe vera rejtett hatóanyaga áttörést hozhat az Alzheimer-kór ellen

🌿 Fontos kérdés, hogy lehet-e természetes anyagokkal felvenni a harcot az Alzheimer-kór ellen...

MA 09:41

Az anyag különleges fázisai: szuperfolyadékból szuperszilárd – és vissza

A kutatók először figyelték meg, hogy egy szuperfolyadék visszafordítható módon alakul át szuperszilárddá – ezzel új lehetőségeket nyitva az extrém anyagállapotok vizsgálatában...

MA 09:34

A kamu OpenAI-reklám a Super Bowlon mindenkit megvezetett

Nem, Alexander Skarsgård nem bohóckodott Jony Ive-val és az OpenAI első ChatGPT-kütyüjével – az egész egy jól eltervezett átverés volt...

MA 09:18

A kínai hekkerek tombolnak, az amerikai távközlési óriások némák

🚨 Az elmúlt hónapokban drámai események rázták meg az amerikai távközlési szektort: kínai hekkerek, akiket Salt Typhoon néven azonosítottak, mélyen behatoltak a legnagyobb szolgáltatók – köztük az AT&T és a Verizon – rendszereibe...

MA 09:09

Az új LineageOS szinte Pixel-szintre emeli bármelyik telefont

📱 A LineageOS 23.2 frissítése elhozta a Pixel telefonok két legjobb fejlesztését a testreszabható Android ROM-ok világába...

MA 09:02

Az izlandi mikrobák kisiklatják a nitrogénkört: éheznek a növények

🌋 Izlandon forró vizek, földrengések és gejzírek között kiderült: a talajban élő mikrobák elkezdtek nitrogént felhalmozni maguknak, miközben egyre kevesebbet juttatnak vissza a növényeknek...

MA 08:57

Az auróra hullámainak titkai: így működik az égi fényshow

🌌 Az aurórák, vagyis a sarki fények, elképesztő fénysávokként ragyognak fel az éjszakai égbolton, főként a Föld sarkvidékei körül...

MA 08:49

Az MI áttörést hozhat a lítiumion-akkuk fejlesztésében

⚡ A lítium-ion akkumulátorok fejlesztése évekbe telik, rengeteg pénzbe kerül, és hatalmas mennyiségű áramot igényel, mert az új terveket eddig csak hosszú fizikai teszteléssel lehetett kipróbálni...

MA 08:43

Az agyhálózat, amely átírhatja a Parkinson-kutatás szabályait

A Parkinson-kór világszerte több mint 10 millió embert érint, Magyarországon is komoly kihívást jelent...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/9

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 06:05

Történelmi események a mai napon (Február 9.)

Rázós nap ez a történelemben: Massachusettset lázadásban nyilvánítják, Jefferson Davist ideiglenes elnökké választják a Konföderáció élére, a Beatles berobban az amerikai tévébe, és a Halley-üstökös utoljára feltűnik a belső Naprendszerben...

vasárnap 09:42

Miért eszik meg a gyerekek a saját taknyukat?

🤢 A gyerekek, felnőttek és más főemlősök, például a csimpánzok is ismertek arról, hogy piszkálják az orrukat és megeszik a taknyukat...

vasárnap 09:33

A Hims & Hers lebukott: hamis fogyókúrás tablettákat árult

💊 A Hims & Hers szombaton bejelentette, hogy leállítja a Wegovy másolatának értékesítését, miután a Novo Nordisk és az amerikai Élelmiszer- és Gyógyszerügyi Hatóság (FDA) jogi lépésekkel fenyegette meg a távegészségügyi szolgáltatót...

vasárnap 09:25

Az Anthropic örökre lemondott a reklámokról – de vajon tartható ez az ígéret?

🤔 Az Anthropic csatlakozott azon márkák hosszú listájához, amelyek megfogadták, hogy reklámmentes maradnak...

vasárnap 09:08

A Waymo Fülöp-szigeteki dolgozói csendben irányítják az önvezető autókat

A Waymo szerdán meglepte az amerikai törvényhozókat egy autonóm járművekkel foglalkozó meghallgatáson...

vasárnap 08:56

Az olvasás halála: tévhit vagy valóság?

Valóban szétrombolták a digitális technológiák a figyelmünket, és kiszorították a könyveket a kultúránkból?..

vasárnap 08:50

Az emberiség közös ősére deríthet fényt egy 773 000 éves marokkói lelet

🦴 Egy marokkói barlangból előkerült fosszíliák kivételes pontossággal, körülbelül 773 000 évvel ezelőttre datálhatók, köszönhetően a környező üledékekben rögzült mágneses lenyomatnak...

vasárnap 08:41

A Bitcoin 50%-os zuhanása nem válság, hanem természetes volatilitás

Gary Bode fedezeti alap veterán szerint a Bitcoin közel 50%-os esése a közelmúltbeli csúcsokról nem rendszerszintű válságot jelez, hanem összhangban van a kriptovaluta történelmével, amely során hasonló mértékű, de történelmileg mindig átmeneti zuhanások voltak jellemzőek...

vasárnap 08:24

Az Anthropic mesterséges intelligenciája 500 kritikus biztonsági hibát fedezett fel

Az Anthropic legújabb MI-modellje több mint 500 korábban ismeretlen, súlyos biztonsági hibát tárt fel nyílt forráskódú könyvtárakban, szinte külön utasítás nélkül...

vasárnap 08:01

Mi köze a 6-7-nek, a démonoknak és az Agymenőknek a prímszámokhoz?

Ebből következően érdemes megérteni, hogy a prímszámok a matematika atomjaihoz hasonlóak: olyan oszthatatlan építőelemek, amelyekből minden más szám összeáll...

vasárnap 07:57

A keserű íz azonnal felpörgeti az agyad

🧠 Új kutatás szerint a flavanolokban gazdag ételek keserű, összehúzó íze közvetlenül aktiválhatja az agyat, és pusztán az ízérzékelés által válthat ki a testmozgáshoz hasonló hatásokat...

vasárnap 07:48

Az Anthropic mesterséges intelligenciája 500 kritikus biztonsági rést fedezett fel

Az Anthropic legújabb MI-modellje, a Claude Opus 4.6 több mint 500 korábban ismeretlen, súlyos biztonsági hibát fedezett fel nyílt forráskódú könyvtárakban, minimális utasítással...