2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

szerda 20:55

Az AMD zuhan a tőzsdén, miközben az MI-kereslet rakétázik

A chipgyártó AMD vezérigazgatója, Lisa Su szerint az MI iránti kereslet olyan tempóban gyorsul, amilyenre még ő sem számított...

szerda 20:38

Az MIT ultrahangos áttörése közelebb visz a tudat rejtélyéhez

Az emberi tudat eredetét máig rejtély övezi: a kutatók még mindig nem értik pontosan, miként képes az agy fizikai működése gondolatokat, érzelmeket és öntudatot teremteni...

szerda 20:21

Az MI kiszorította a juniorokat – most fizetjük meg az árát

A 33 éves Isaac négy éve dolgozik középszinten fejlesztőmérnökként egy nagy techcégnél, ahol komoly változásokat érzékelt a belépőszintű munkaerő körül...

szerda 20:01

Az egyiptomi hatóságok betiltják a Robloxot – búcsú a kedvencnek?

Az egyiptomi médiahatóság úgy döntött, hogy teljesen blokkolja az egyik legnépszerűbb, gyermekeknek szánt videojátékot, a Robloxot...

szerda 19:55

A Behemót visszatért: az óriáscsillag mégsem robban fel

Külön említést érdemel, hogy a WOH G64, vagy ahogy sokan hívják, a „behemót csillag”, mégsem haldoklik, ahogy azt korábban gondolták...

szerda 19:38

A Prime-tagoknak most ingyen jár az Amazon Alexa+ MI-asszisztense

💭 Az Alexa+ mostantól minden amerikai felhasználó számára elérhető, a Prime-előfizetők számára pedig teljesen ingyenes...

szerda 19:20

Az MI a trópusok megmentője? A nitrogén újraéleszti az esőerdőket

🌲 Az emberi tevékenység miatt az elmúlt évtizedekben rengeteg trópusi erdő tűnt el, helyüket legelők váltották fel...

szerda 19:01

A mesterséges intelligencia kudarcainak rejtett oka: a szétszabdalt rendszerek átka

⚠ Nehéz elhinni, de az MI körüli kezdeti lelkesedés mára gyakran csalódottságba fordult a vállalatoknál...

szerda 18:55

Az agy rejtett hálózata új megvilágításba helyezi a Parkinson-kórt

Érdemes megérteni, hogy a Parkinson-kórt eddig elsősorban mozgászavarnak tartották, pedig a betegség hátterében jóval összetettebb idegi hálózat rejtőzhet...

szerda 18:20

Az Ozempic és a Wegovy rejtett táplálkozási csapdája

Felmerül a kérdés, hogy mennyire biztonságos valójában a gyors fogyás az új generációs fogyasztószerekkel, mint az Ozempic és a Wegovy...

szerda 17:55

A Jupiter új arca: kisebb, laposabb, meglepőbb, mint hittük

🪐 A Jupiter eddig ismert méretei és alakja a legújabb kutatások szerint finomhangolásra szorulnak...

szerda 17:37

A Samsung titkos aduja lehet a Galaxy S25 FE

🔐 A Samsung hamarosan bemutatja az új Galaxy S26 modelleket, de a szivárgások szerint az elérhető árú verziók főleg csak apróbb fejlesztéseket kapnak...

szerda 15:19

Az Xcode 26.3 elhozza az eszközön futó MI-fejlesztés erejét

💻 Frissült az Xcode, és a 26.3-as verzió már támogatja az ügynökalapú programozást...

szerda 15:02

A Sysmon végre alapfunkció lesz a Windows 11-ben

💡 A Microsoft elindította a beépített Sysmon-támogatás tesztelését a Windows 11 rendszerben, igaz, egyelőre csak a Windows Insider programban részt vevő felhasználók élvezhetik az újdonságot...

szerda 14:56

Az Nvidia és az OpenAI gigaüzlete füstbe ment: 36 billió forint

💸 Lényeges, hogy tavaly szeptemberben az Nvidia és az OpenAI szándéknyilatkozatot írt alá, miszerint az Nvidia akár 36 billió forint (100 milliárd dollár) értékben fektetne be az OpenAI MI-infrastruktúrájába...

szerda 14:37

Az ingyenes MI-kamerák korszaka: így védheted az otthonod

Az okosotthonokba lassan bekúszik az MI, és ma már nem luxus, ha egy kamera felismeri a családtagokat, különbséget tesz egy futár és a saját kutyád között, vagy kiértékeli a nap eseményeit...

szerda 14:20

Az Artemis II startja megint csúszik: hidrogénszivárgás a holdrakétán

🚀 A NASA újabb késést jelentett be az Artemis II misszióban, miután a rakéta főpróbáján ismét hidrogénszivárgást észleltek...

szerda 14:02

Olvad az Antarktisz: összeomolhat a Föld szénelnyelője

🌨 A Nyugat-Antarktiszi jégtakaró olvadása meglepő változásokat idézhet elő abban, ahogyan a Déli-óceán elnyeli a légköri szén-dioxidot...

szerda 13:55

Az óriás Tether meghátrál: milliárdokkal vágja vissza a tőkebevonást

💸 A Tether, a világ egyik legismertebb stabilcoin-kibocsátója drasztikusan visszafogta tőkebevonási terveit, miután a befektetők nem igazán voltak lenyűgözve az akár 180 000 milliárd forintos (500 milliárd USD) álomértékeléstől...

szerda 13:19

A gerinc születésének titka: egy sorsfordító gén nyomában

A gerinces állatok, azaz az emlősök, halak, hüllők és kétéltűek fejlődésének rejtélyeit segíthet megfejteni egy friss genetikai kutatás...

szerda 13:02

Az összehajtható telefonok 2026-ban már tényleg megérik?

📱 Érdemes megvizsgálni, mennyire éri meg összehajtható telefont venni 2026-ban, hiszen egyre több gyártó dob piacra ilyen készüléket, és a felhasználók véleménye is sokat árnyalja a képet...

szerda 12:55

A fehérzajgép tönkreteheti az éjszakai nyugalmadat

Sokan használják a hálószobában a különféle hanggépeket, például pink noise-t (rózsaszín zajt), abban a hitben, hogy ezek elősegítik az egészséges alvást...

szerda 12:36

Az óriás visszavág: a Walmart belép az egybillió dolláros klubba

A Walmart piaci értéke átlépte az 1 billió dolláros, vagyis 370 000 milliárd forintos határt, ezzel az amerikai kiskereskedelmi lánc bejutott a legértékesebb cégek szűk körébe, amelyet eddig főként techóriások uraltak...

szerda 12:19

Az Igazságügyi Minisztérium ismét nekimegy a Google-nek

Az amerikai Igazságügyi Minisztérium (DOJ) újabb fellebbezést nyújtott be a Google ellen indított versenyjogi perben, amely az internetes kereső- és hirdetési piac monopolhelyzetéről szól...

szerda 12:02

A nyers tej miatt halt meg egy újszülött Új-Mexikóban

😷 Egy Új-Mexikó-i újszülött életét vesztette liszteriózis következtében, miután édesanyja terhessége alatt nyers tejet ivott...

szerda 11:56

A Gemini átveszi az irányítást a mobilod felett?

Az MI térhódítása az Android-eszközökön megállíthatatlanul halad előre, és a Gemini hamarosan olyan funkciókat kap, amelyekkel akár teljesen átveheti az irányítást a telefonod felett...

szerda 11:37

Az MI-botok visszatértek: ma leálltak a ChatGPT és a Claude

🤖 Ma délután sokan nem tudták használni a ChatGPT-t, amikor a népszerű MI-csevegőbot részleges leállást szenvedett el...

szerda 10:58

Az árnyék-CDC: ki tölti be a közegészségügyi űrt?

👀 Az amerikai közegészségügy történetének egyik legnagyobb válságát éli. A Centers for Disease Control and Prevention (CDC) évtizedeken át a megbízható, bizonyítékalapú egészségügyi iránymutatás és a járványügyi védelem csúcsintézménye volt...

szerda 10:49

Az új vezér megfordítja a PayPal sorsát?

Hatalmas változás előtt áll a PayPal: Enrique Lores veszi át az irányítást, miután a társaság vezetése elégedetlen volt a korábbi vezérigazgató, Alex Chriss teljesítményével...