2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 18:31

A Flipper Zero firmware-e közösségi erővel száguld tovább

🚀 Újabb változások jönnek a Flipper Zero életében: a népszerű zsebkütyü fejlesztőcsapata bejelentette, hogy kisebb létszámban dolgozik tovább, és nagyobb szerepet kapnak a közösségi hozzájárulások...

MA 18:04

Az amerikaiak újra tovább élnek – miért?

Az Egyesült Államokban történelmi mélypontra süllyedt a halálozási ráta, amit a szakemberek biztató jelnek tartanak a jövőre nézve...

MA 17:32

Az irodai visszarendelés: valóság, vagy még mindig mítosz?

Az amerikai nagyvállalatok vezetői már jó ideje próbálják elhitetni, hogy a home office korszak véget ér...

MA 17:02

Az etikus hackerek 1,1 milliós szerverrel lepleztek 70 milliárd dolláros hibát

Felmerül a kérdés, mennyire biztonságosak a legújabb blokklánc-rendszerek, ha egy mindössze 1,1 millió forintos szerver is képes olyan súlyos hibát szimulálni, amely akár 25 ezermilliárd forint (70 milliárd USD) értékű kriptót sodorhatott volna veszélybe...

MA 16:32

Felejtsd el a Pixel 10a-t: ez az olcsó androidos telefon, ami kell

A mobilpiacon régóta a Google Pixel A-szériája számít alapvetésnek annak, aki kedvező áron szeretne prémium érzetű készüléket...

MA 15:31

Az újabb kamatemelés hidegzuhany: ugranak a lakáshitel-kamatok

Jelentős emelkedést tapasztalhatnak most azok, akik hitelt vennének fel vagy meglévő lakásukat refinanszíroznák...

MA 15:01

Az erkölcs diktálja: legyünk kevesebbet online

Az online jelenlét a mindennapok része, de kevesen tudunk szabadulni attól a tapasztalattól, hogy minél több időt töltünk a közösségi oldalakon, annál rosszabbul érezzük magunkat...

MA 14:31

A szuperintelligens űr-MI lehet a Fermi-paradoxon megoldása?

Ebből következően érdemes megvizsgálni, miért nem találkoztunk még fejlett földönkívüli civilizációkkal, noha éveken át vizsgáltuk az univerzumot...

MA 12:02

A D-Link G572: 5G-router, ha gyenge otthon a net

Az internetkapcsolat akadozása rendkívül bosszantó lehet – főleg, ha az otthoni vagy irodai munkád függ tőle...

MA 11:31

A Hubble vörös csillagbölcsőt örökített meg, sziporkázó kék és fehér csillagokkal

💫 A NASA Hubble-űrteleszkópja egyedülálló részletességgel mutatja be az univerzum egyik legaktívabb csillagbölcsőjét...

MA 11:01

Az univerzum a vásznon: elrajtol a tízéves kozmikus felmérés

🚀 Az év egyik legizgalmasabb tudományos fejleménye, hogy megkezdődött a Vera C...

MA 10:49

A CAPTCHA-knak befellegzett az MI korszakában?

🚧 Egy lényeges szempont, hogy amikor belépsz egy weboldalra, gyakran találkozol olyan feladatokkal, mint eltorzított szavak megfejtése, homályos képeken motorkerékpárok kiválasztása vagy annak igazolása, hogy nem vagy robot...

MA 10:38

Az EZVIZ EP4 a bérlők kedvence, de arcfelismerése hazatéréskor eláraszt riasztásokkal

👀 Bérlakásokban vagy társasházakban élők számára valódi kihívás lehet biztonsági kamerát vagy videós kapucsengőt felszerelni, hiszen nem fúrhatnak falat és nem okozhatnak semmilyen maradandó károsodást...

MA 10:25

A hét tudománya: James Webb új anyagot talál, Kína felzöldül, megoldott Medici-gyilkosság

Külön említést érdemel, hogy a James Webb-űrteleszkóp most először bukkant rá egy eddig nem észlelt anyagra a Plútó és a Titán légkörében...

MA 09:25

Az Egyesült Államok a szabályozatlan peptidek rabja: hatásosak egyáltalán, és biztonságosak?

💉 Felmerül a kérdés, hogy mennyire valóban hatékonyak, vagy akár biztonságosak azok a peptidkészítmények, amelyek jelenleg az egészségmegőrzés és a hosszú élet reményében terjednek az Egyesült Államokban...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 7/5

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Monthly Dystopia (iPhone/iPad)A Monthly Dystopia egy izgalmas túlélőjáték, amely George Orwell 1984 című klasszikusának világát idézi...

MA 09:01

Az okosóra és az MI korán kiszúrhatja a bajt

Lassan minden csuklón ott virít egy okosóra vagy okoskarkötő. Ezek már régóta nem csak a lépésszámot vagy a pulzust figyelik: a korszerű modellek alvást, bőrhőmérsékletet, légzésszámot, véroxigént, szívritmus-változékonyságot is képesek mérni, sőt, akár arra is riasztanak, ha valami baljós jelet érzékelnek...

MA 08:49

A NASA mentőakciója elindult a zuhanó Swiftért

🚀 Érdemes megérteni, hogy a NASA új, különleges mentőakcióba kezdett: egy robotűrszondával igyekszik megmenteni az évtizedek óta szolgáló, és most veszélyesen zuhanó Neil Gehrels Swift Obszervatóriumot (Neil Gehrels Swift Observatory)...

MA 08:13

Az ősi marsi kőzet szénben dúskál – hogy miért, rejtély

🪐 Amikor először egy marsi kőzet felszínén összetett szerves szén jelenlétét észlelték, a tudósok hirtelen egy régóta húzódó kérdés kapujában találták magukat: vajon élet nyomait találtuk meg, vagy valami egészen más magyarázat rejtőzik a színfalak mögött?..

MA 08:01

A hőhullám közepén 842 ezer amerikai háztartás maradt áram nélkül

Fontos kérdés, mennyire bírja az Egyesült Államok infrastruktúrája a tomboló hőhullámot...

MA 07:49

A Google AI-tanulókísérlete olyan, mint egy karcsúsított NotebookLM

A Google eddig is számtalan MI-eszközt kínált a tanulni vágyóknak. A NotebookLM például képes feldolgozni és kreatívan átalakítani az általad feltöltött forrásokat – gondolj csak podcastokra vagy gondolattérképekre...

MA 07:37

Az USA 250. születésnapja próbára teszi az MI-vezérelt kollektív intelligenciát

Érdekes felvetés, hogy mi történne, ha 250 véletlenszerűen kiválasztott embert összehívnánk, hogy megvitassanak egy fontos kérdést: vajon milyen eredményt adna, ha egy közös kihívást kellene megoldaniuk?..

MA 07:25

A JadePuffer MI-ügynöke teljesen automatizált egy zsarolóvírus-támadást

Fontos kérdés, mire képesek a legújabb technológiák, ha rossz kezekbe kerülnek: a kutatók most először bukkantak olyan zsarolóvírusra, amelyben minden lépést egy önálló, nagyméretű nyelvi modell vezérelt...

MA 07:01

A világbajnokság helyszínein több mint 600 drónt foglalt le az FBI

🛡 Az FBI június 11-e óta folyamatosan figyeli a FIFA-világbajnokság helyszíneit és környékét, mióta rengeteg drónt kaptak el olyan légterekben, ahol repülni szigorúan tilos...

MA 06:49

Amikor cserbenhagy a szaglás: az illatok nélküli mindennapok

😫 Negyvenévesen Chrissi Kelly egyszer csak elvesztette a szaglását, miután egy vírusos betegség ledöntötte a lábáról Csehországban tett családi látogatása után...

MA 06:24

A NASA egy évre teljesen elzárja az önkénteseket a külvilágtól

Aki már kezd belefáradni a földi forgatagba, annak új lehetőség nyílik: a NASA önkénteseket keres, hogy egy teljes évet töltsenek elszigetelve, mintha egy másik égitestre készülnének...

MA 06:05

Történelmi események a mai napon (Július 5.)

Ma olyan nap, amikor hidak nyílnak, birodalmak csapnak össze, országok születnek, és a popkultúra is történelmet ír...

szombat 18:32

A másolás–beillesztéses átverés, ami átveheti az irányítást a Mac-ed felett

🔑 Első pillantásra úgy tűnt, hogy egy egyszerű műveletet kérnek: másold be ezt a parancsot a Mac-ed parancssorába, aztán megoldódik a problémád...

szombat 18:02

Az öt Android-mobil, amit a Moto G Power helyett vegyél

📱 Külön említést érdemel, hogy a középkategóriás okostelefonok kínálata soha nem volt ennyire izgalmas...