2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 08:38

Az Nvidia asztali szuperszámítógépe: trilliós paraméterű MI mindenkinek, felhő nélkül

💻 Nvidia új DGX Station gépe egy teljesen új korszakot nyit az asztali számítástechnikában...

MA 07:57

Az Nvidia felturbózza a játékokat: itt a DLSS 5, az AI‑csodaszűrő

Elképesztő, mit tud a DLSS 5: a legújabb Nvidia AI-alapú felskálázási technológia nem egyszerűen élesebb képet ad, hanem teljesen új szintre emeli a látványt — ráadásul úgy, hogy közben minden részlet valósághűbbnek hat...

MA 07:50

Az EU-t elárasztja a robotaxi-láz: Bolt és NVIDIA összefog

🚗 Nem hiszem el, de a Bolt összefogott az NVIDIA-val, hogy Európában is berobbanhasson a robotaxi-biznisz...

MA 07:43

Az xAI-botrány: tizenévesek perelik a Grokot szexuális visszaélésért

🔴 Három tennessee-i tinédzser pert indított Kaliforniában az xAI ellen, mert szerintük a Grok nevű MI a fotóikat felhasználva gyermekbántalmazásnak minősülő képeket készített...

MA 07:36

Az új Sony-csoda: extrém képminőség PS5 Pro-n

Képzeld el, hogy a PS5 Pro mostantól még durvább képminőséget hoz ki a kedvenc játékaidból – és nem kell hozzá 4 millió forintos tévé sem!..

MA 07:23

A Samsung új Privacy Displayje tényleg csökkenti a kijelző fényerejét?

💡 A Samsung Galaxy S26 Ultra egyik legizgalmasabb újdonsága a Privacy Display nevű funkció, amely bizonyos nézési szögekből korlátozza a kijelző láthatóságát...

MA 07:15

Az Nvidia friss dobásai: MI-ügynök, lélegzetelállító grafika és Vera CPU

Az Nvidia ismét új szintre emeli a jövő technológiáját. Egyetlen eseményen mutatták be azt az MI-alapú fejlesztést, amely forradalmasíthatja a játékélményt és a professzionális adatközpontokat, ráadásul bemutatták a Vera CPU-t, ami minden eddiginél nagyobb teljesítményt ígér a mesterséges intelligencia korszakában...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 3/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Juggly Ball (iPhone/iPad)Ez a fizika alapú ügyességi játék próbára teszi a labdazsonglőr tudásodat...

MA 07:08

Az új Boox Go berobban: ultravékony, világítós E Ink tablet Android 15-tel

A legújabb Boox Go 10.3 Lumi tablet jelentősen bővíti az E Ink eszközök lehetőségeit...

MA 07:01

Az Exchange Online újra letérdelt: se e-mail, se naptár

A Microsoft Exchange Online szolgáltatása komoly leállást szenvedett el, ami miatt rengeteg felhasználó nem tudott hozzáférni sem a postafiókjához, sem a naptárjához...

MA 06:58

Az élet nagy dobása: amikor a növények partra szálltak

Földünk mai képe egészen más lenne, ha néhány apró, kitartó élőlény évmilliárdokkal ezelőtt nem vállalta volna az ismeretlen felfedezését...

MA 06:50

Az Nvidia áttörése alapjaiban formálja át az MI-alapú adattárolást

Felmerül a kérdés: miként orvosolható az a probléma, amikor egy MI-ügynök a feladat közben elveszíti a kontextust, mert a hagyományos adattárolás már nem tudja tartani a tempót a gyorsabb következtetésekkel?..

MA 06:43

Az xAI-t beperelték a Grok miatt: újabb botrány Musknál

💥 Három Tennessee állambeli tinédzser beperelte Elon Musk xAI-ját, akik szerint a vállalat mesterséges intelligenciája, a Grok, szexuális jellegű képeket és videókat készített róluk, amikor még kiskorúak voltak...

MA 06:37

Az Nvidia új csodafegyvere: lélegzetelálló grafika, bizarr arcok

Az Nvidia bemutatta legújabb fejlesztését, a DLSS 5-öt, amely a vállalat szerint korszakváltó áttörést jelent a számítógépes grafika világában...

MA 06:30

Az óriáscég 80 ezer gépét törölték: kitört a káosz, kézi rendelés!

Külön említést érdemel, hogy a múlt héten súlyos kibertámadás érte a Stryker orvostechnológiai vállalatot, amelynek során közel 80 ezer eszköz adatait törölték az éjszaka folyamán – mindezt anélkül, hogy bármilyen rosszindulatú programot bevetettek volna...

MA 06:22

Az áttörés: új injekció tünteti el a rákot

💉 Egy új fejlesztésű immunterápiás eljárás, amelyet közvetlenül a daganatba fecskendeznek, lenyűgöző eredményeket adott egy klinikai vizsgálatban...

MA 06:15

Az Egyesült Arab Emírségek megnyitja a légterét, ég a Közel-Kelet

🌍 Nehéz elhinni, de a Dubaji Nemzetközi Repülőtér közelében hatalmas füstfelhő szállt fel, miután egy dróntámadás eltalált egy üzemanyagraktárt, és nagy tüzet okozott...

MA 06:08

A mesterséges intelligencia a Britannica tartalmait is lenyúlta – jön a nagy perpatvar

Na hát ennyit erről – a legendás Britannica enciklopédia (Encyclopaedia Britannica) és a Merriam–Webster szótárkiadó most nagyon berágtak az OpenAI-ra, mert simán lenyúlták a szerzői jogi tartalmaikat a ChatGPT betanításához...

MA 06:05

Történelmi események a mai napon (Március 17.)

Erős nap a történelemben: császárváltás Rómában, elsöprő népszavazás apartheid ügyben, női miniszterelnök Izraelben, és űrtörténeti mérföldkő...

MA 06:01

Az ötmillió brit cég adatai hónapokig szabadon keringtek

🚧 Pénteken napvilágra került egy súlyos biztonsági rés az Egyesült Királyság cégnyilvántartási rendszerében, amely mintegy ötmillió vállalkozás adatait tette hozzáférhetővé illetéktelenek számára...

hétfő 21:56

Az MI-szuperszámítógép lehet a brit fúziós áttörés kulcsa

⚡ Minden eddiginél nagyobb teljesítményű, MI-alapú szuperszámítógép épül nyáron az oxfordshire-i Culham kutatóközpontban, amely a remények szerint lendületet adhat a brit fúziósenergia-fejlesztésnek...

hétfő 21:45

Az iráni háború felforgatja az olajpiacot – Meddig bírják a gazdaságok?

Fontos kérdés, mennyire tud ellenállni a világgazdaság az olajválságnak, amelyet az iráni háború indított el...

hétfő 21:34

Az amerikai partoknál már pörögnek az új szélerőművek

Az Egyesült Államok keleti partvidékén két új offshore szélfarm is elindult, amelyek jelentősen növelik a régió zöldenergia-ellátását...

hétfő 21:23

A Wing FTP kritikus hibája az állami szervereket fenyegeti

⚠ Az Egyesült Államok kormányzati ügynökségeit sürgősen figyelmeztették, hogy a Wing FTP Server szoftverükben lévő veszélyes sérülékenységet mielőbb javítsák, mivel hackerek már aktívan kihasználják...

hétfő 21:12

A techóriások összefognak: végre együtt csapnak le az online csalókra

A Google, a Microsoft, a LinkedIn, a Meta, az Amazon, az OpenAI, az Adobe és a Match Group most közös frontot alkotnak az online átverők ellen...

hétfő 21:02

Az áttörés: szívgyógyító injekció egereknél és sertéseknél

Egyetlen speciális injekció heteken át képes beindítani a szívizom öngyógyítását – legalábbis egerekben és disznókban...

hétfő 20:56

Az új AirPods Max 2: még jobb zajszűrés, okosabb extrák

🎧 A kaliforniai Apple bemutatta az AirPods Max 2-t, amely jól ismert, fület körülölelő formáját most még jobb aktív zajszűréssel, magasabb hangminőséggel és intelligens újításokkal ötvözi...

hétfő 20:45

Az új Google TV-frissítés véget vet a reklámmentes élménynek?

📺 A Google TV újabb frissítése kisebb fennforgást okozott azok körében, akik szeretik testreszabni az okostévéjük felületét...

hétfő 20:34

Az MI áttörése: Itt a bizonyítások automatizálásának kora?

A matematika világa épp most forradalmasodik: ahogy a mesterséges intelligencia egyre gyorsabban fejlődik, a matematikusok is egyre nehezebben látják előre, milyen szerepük marad a jövőben...