2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 09:33

Jön az év legvadabb tőzsdei hete a Wall Streeten

A jövő hét sorsfordító lehet a tőzsdén, hiszen egyszerre érkeznek meg a legnagyobb technológiai óriások negyedéves jelentései, és a Federal Reserve is újabb kamatdöntést hoz...

MA 09:25

Az Instapaper hidegzuhanya: fizetős lett a Küldés Kindle-re

💧 Február 19-től az Instapaper egyik legnépszerűbb funkciója, a Send to Kindle csak a fizetős Instapaper Premium-előfizetéssel lesz használható...

MA 09:17

Az Intel chipekért ölre mennek, de üresek a polcok

💸 A kereslet az Intel processzorai iránt továbbra is erős, azonban a gyártó képtelen elegendő darabot előállítani ahhoz, hogy lépést tartson a vásárlói igényekkel...

MA 09:09

Kitört a Waymo-botrány: az önvezető taxik megszegik az iskolabusz-szabályokat

A Waymo önvezető taxijai újabb nagy port kavartak az Egyesült Államokban, miután kiderült: számos alkalommal jogsértően haladtak el megálló iskolabuszok mellett, miközben gyerekeket szállítottak le vagy vettek fel...

MA 09:01

Az új szűrőtechnológia véget vethet az örök vegyszereknek

A Rice Egyetemen fejlesztett forradalmi szűrőtechnológia új szintre emelheti a PFAS, azaz az „örök vegyszerek” eltávolítását a vízből...

MA 08:57

A mesterséges intelligencia lecsap: négy szoftverhiba célkeresztben

Az amerikai kiberbiztonsági hatóság (CISA) négy súlyos hibát azonosított vállalati szoftverekben, amelyeket hackerek már aktívan kihasználnak...

MA 08:50

Az OpenAI titka: így turbózza a PostgreSQL a ChatGPT-t

⚡ Az OpenAI 800 millió felhasználónak szolgáltatja a ChatGPT-t és az API-platformját egyetlen elsődleges PostgreSQL-példányon keresztül...

MA 08:42

Az iPhone szárnyal Indiában, miközben stagnál a piac

📱 Az Apple iPhone történelmi csúcsot döntött Indiában 2025-ben, 14 millió készüléket szállított le, ezzel 9%-os részesedést szerzett a helyi okostelefon-piacon...

MA 08:33

A grönlandi kincsek ára: miért olyan nehéz a bányászat?

Grönland földje rengeteg ígéretes ásványi nyersanyagot rejt, ezek kiaknázásáról azonban sokkal könnyebb álmodozni, mint a valódi kitermelésüket véghez vinni...

MA 08:24

A kutatók merész új trükkje: űrszemétvadászat földrengésszenzorokkal

A földrengésfigyelő hálózatok nemcsak a föld rengéseit, hanem a világűrből lehulló űrszemét útját is képesek követni – olykor pontosabban mint a radar...

MA 08:17

A Harvey tovább hódít: felvásárolta a Hexust

A Harvey, az egyik legfelkapottabb jogi MI-startup, megvette a mindössze két éve alapított Hexust, amely termékbemutató- és oktatóvideók, valamint útmutatók készítésére szolgáló eszközöket fejlesztett...

MA 08:01

Az új OnePlus 15T kamerája leuralja a mezőnyt?

📷 Egy kiszivárgott információ szerint a OnePlus 15T merész újításokat hoz a kamerák terén...

MA 07:59

Az otthoni arcfiatalítás új favoritjai: 2026 legjobb mikroáramos készülékei

Az arcbőr öregedése mindenkit utolér: idővel csökken a feszesség, az állvonal elmosódása és az arcpuffadás egyre láthatóbb...

MA 07:50

Száguld az infláció, a mindennapok mégsem könnyebbek

📈 A brit infláció ismét emelkedni kezdett, miközben a kormány igyekszik az élet megfizethetőségének javítását az első helyre állítani...

MA 07:42

A Colorado-folyó válsága elhúzódik: meddig bírják a nyugati kormányzók?

💧 A Colorado folyó jövője most még bizonytalanabb, mint valaha: hetek óta eredménytelenül húzódnak a hét érintett nyugati állam – Utah, Arizona, Nevada, Wyoming, Kalifornia, Colorado és Új-Mexikó – tárgyalásai arról, hogyan csökkentsék vízfelhasználásukat, mivel az év végén lejárnak a jelenlegi szabályok...

MA 07:33

A hírességek fellázadnak az MI-vel elkövetett lopások ellen

Több száz híres művész, köztük Scarlett Johansson és Cyndi Lauper, közösen emelt szót az ellen, hogy az MI-fejlesztők jogdíj fizetése nélkül használják fel műveiket algoritmusok tanítására...

MA 07:25

Az orosz hekkerek ismét megpróbálták teljesen lekapcsolni Lengyelországot a hálózatról

Egy decemberi próbálkozás, amely Lengyelország energiahálózatát célozta, orosz állami hekkerekhez köthető – jelentette egy kiberbiztonsági kutatócég...

MA 07:17

A kormány BitLocker-kulcsai: tényleg a tiéd marad a titkod?

🔑 A Microsoft BitLocker titkosítása sokak számára a biztonság szinonimája, pedig korántsem jelent teljes védelmet...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 1/24

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     WebFX (iPhone/iPad)Ez a játékos kártyatrükk igazán különleges élményt kínál: a néző a saját telefonján, táblagépén vagy számítógépén nyit meg egy weboldalt, ahol a bűvész egy fényképet emel ki...

MA 07:10

A brutális téli vihar elsöpri Amerikát – és a pénztárcákat is

❄ Első pillantásra úgy tűnt, hogy a hideg önmagában is elég kihívást jelent, ám az Egyesült Államok nagy részére lecsapó súlyos téli vihar a háztartások anyagi helyzetét is alaposan próbára teszi...

MA 07:01

Az idei téli vihar: mi vár ránk a káosz közepén?

Érdemes megvizsgálni, miért lehet ennyire bizonytalan a hétvégi hatalmas téli vihar pontos előrejelzése, amikor 160 millió embert fenyeget hideg, hó, ónos eső és szél az USA mintegy harminc államában...

MA 06:57

Az új Google Photos mindenkit mémmé változtat

A Google bejelentette legújabb mókás fejlesztését, a Me Meme-t, amely generatív MI segítségével bármelyik fotódból azonnal mémeket készít...

MA 06:49

A milliárdos Apple-per: rejtett díjak lapulnak a zsebünkben

Egy brit pénzügyi jogvédő, James Daley, 2 milliárd dollárra – azaz hozzávetőleg 700 milliárd forintra – rúgó kártérítési pert indított az Apple ellen az Egyesült Királyságban...

MA 06:41

Az új TikTok-tulajok átírják, mit látsz a hírfolyamban?

👀 Az amerikai TikTok mostantól teljesen új kezekben van: Larry Ellison, az Oracle vezérigazgatója, valamint több befektetési alap vette át az irányítást a platform felett egy 14 milliárd dolláros (kb...

MA 06:34

Az MI jövőjét formálja az AMI Labs és LeCun

Yann LeCun, az MI egyik vezető kutatója, nagy meglepetést okozott, amikor elhagyta a Metát, hogy elindítsa saját vállalkozását, az AMI Labs nevű céget...

MA 06:25

Az ősi óriáskenguruk nemcsak jártak: ugráltak is

Sokáig úgy vélték, hogy a modern kenguruk ősi óriásai túl nehezek voltak ahhoz, hogy úgy ugráljanak, mint ma élő rokonaik...

MA 06:17

Az Nvidiától távozik Persis Drell, 9,4 milliárd forintos részvénycsomaggal

🚀 Persis Drell, a Stanford professzora egy évtized után távozott az Nvidia igazgatótanácsából...

MA 06:05

Történelmi események a mai napon (Január 24.)

Ezen a napon világraszóló fordulatok történtek: egy chilei földrengés ezrek életét oltotta ki, az Egyesült Államok 20...

péntek 20:58

Gondban az űripar: kínai kudarcok, bajban a Rocket Lab

🚀 Hihetetlen, de mégis igaz, hogy a múlt hét a rakétaiparban felemás eseményeket hozott: komoly előrelépések mellett látványos kudarcokat is tapasztalhattunk...