2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 5/2

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Waltz of the Wizard (iPhone/iPad)A Waltz of the Wizard egy fizika alapú, első személyű varázslószimulátor, amely klasszikus fantasy élményt kínál...

MA 08:36

A MI-keretek bukása: mi váltja a LlamaIndexet?

🤖 Az utóbbi években a fejlesztőknek még komoly infrastruktúrára volt szükségük ahhoz, hogy nagyméretű nyelvi modelleket (LLM) működtessenek: indexelés, lekérdezőmotorok, adat-visszakeresést végző folyamatok és aprólékosan vezérelt feladatsorok tartották életben a rendszereket...

MA 08:29

Az emberi test sorsa: temetés vagy hamvasztás?

Amerika egyik legismertebb tudósa, Neil deGrasse Tyson asztrofizikus saját temetkezési terveiről fejtette ki, mi történik velünk halálunk után – és miért a hagyományos temetkezést részesíti előnyben a hamvasztással szemben...

MA 08:22

Az Erő veled van: turbózd fel Secretlab gamerkuckódat a Csillagok háborúja-napon

Ha már unod, hogy a széked csak egy unalmas bútordarab, ideje fénysebességre kapcsolni!..

MA 08:01

Az MI-keretrendszerek forradalma: az angol lett a programozás nyelve

A fejlesztők által használt MI-keretrendszerek drasztikusan átalakulnak. A bonyolult programozói környezetek visszaszorulnak, helyüket egyre inkább átlátható, hatékony és természetes nyelvű megoldások veszik át...

MA 07:56

Az Ethereum Alapítvány ismét 10 000 ETH-t dobott piacra

Felmerül a kérdés, hogy mi áll az Ethereum Alapítvány legújabb eladása mögött...

MA 07:49

Az AIMCo óriásit kaszált: 25 milliárd egy bitcoinos húzással

Az Alberta Investment Management Corporation (AIMCo), Kanada egyik óriásnyugdíjalapja, nagyot lépett: idén év elején 1 382 000 darab MSTR-részvényt (MicroStrategy) vásárolt, összesen 62,6 milliárd forintért (172,5 millió dollár)...

MA 07:43

A HESK-kel az online ügyfélszolgálat pofonegyszerű – lépésről lépésre

Az online ügyfélszolgálati rendszerek ma már nem kizárólag a nagyvállalatok kiváltságai...

MA 07:29

A bitcoin valódi története, amire senki sem számított

💸 Az utóbbi években elképesztően vad ötletek láttak napvilágot arról, hogy mi is lehet valójában a bitcoin...

MA 07:22

A Blizzard végre leszámol a brutális barbár-buggal a Diablo IV-ben

Újabb, a játékmenetet megtörő hibát kellett kezelnie a Blizzardnak a Diablo IV-ben (Diablo 4): a Limitless Rage nevű legendás tárgy aspektusa túlzottan hatékonynak bizonyult, ezért a fejlesztők gyorsan letiltották a használatát...

MA 07:14

Végre nem ránk szabják az MI-t: itt a Salesforce áttörése

A nagyvállalati MI bevezetése eddig sokszor megrekedt, mert a háttérrendszerek egyszerűen nem voltak felkészítve arra, hogy ügynökalapú munkavégzést támogassanak...

MA 07:08

A mesterséges intelligencia alapjaiban tátong a rés: 200 ezer MCP-szerver veszélyben

⚠ Senki sem gondolta volna, hogy a legmodernebb MI-alkalmazások mögött rejlő infrastruktúra ekkora biztonsági rést hordoz magában...

MA 07:01

A vadnyugat idei szenzációja: robotcowboyok tombolnak, de valami mégis hiányzik

🤠 A Far Far West meglepetéssikert aratott a Steamen: a vadnyugati, többjátékos robotcowboy-lövöldözős játék mindössze két nap alatt 250 ezres eladást produkált világszerte...

MA 06:57

Az El Niño visszatér: készülhetünk újabb időjárási káoszra?

🌤 Vizsgálják, hogy a Csendes-óceán trópusi vizeinek jelentős melegedése, az El Niño, idén minden eddiginél gyorsabb tempóban alakulhat-e ki...

MA 06:43

A Riot AI-ra áll át: kriptóbányászból techóriás?

Ki gondolta volna, hogy egy klasszikus kriptóbányász egyszer csak feltámad, ledobja a poros bányászfelszerelést, és hirtelen az AI-üzlet felé kacsintgat?..

MA 06:36

Az adósság romba döntheti Floyd Mayweather fényűző életét

A sportvilág egyik legnagyobb pénzgyárosa, Floyd Mayweather komoly bajba került: több mint 2,65 milliárd forintnyi (7,25 millió dollár) adótartozása miatt elveszítheti amerikai útlevelét...

MA 06:29

Az Oscar kitiltja az MI-t a színészi és írói díjakból

A Filmművészeti és Filmtudományi Akadémia (az Oscar-díjak szervezője) friss szabályokat vezet be a mesterséges intelligencia használatára, amelyekkel kizárja az MI által generált alakításokat és forgatókönyveket a legfontosabb kategóriákból...

MA 06:23

Az MI-háború új felvonása: a Grok 4.3 fillérekért

Elon Musk ezúttal sem adja fel a küzdelmet a mesterséges intelligencia frontján: miközben a rivális Altman-féle OpenAI világsikereit figyeli, az xAI újabb ütős MI-fejlesztéseket dobott piacra, és ezúttal a döbbenetesen alacsony árakkal akarja letarolni a mezőnyt...

MA 06:15

Az új Heroes of Might and Magic első nap rögtön berobbant

Ilyen eset például, amikor egy klasszikus stratégiai játék új kiadása minden várakozást felülmúl...

MA 06:05

Történelmi események a mai napon (Május 2.)

Erős nap a történelemben: Anne Boleyn letartóztatása, Madrid felkelése a francia megszállás ellen és a második világháborús olaszországi kapituláció is ehhez a dátumhoz kötődik...

péntek 21:56

A rejtett IT-hibák csendben mérgezik a munkahelyeket

👀 A nagyvállalati IT-hibákat gyakran szinte lehetetlen észrevenni – legalábbis addig, amíg az egész rendszer össze nem omlik...

péntek 21:45

A szállítmánylopás sosem volt ekkora – figyelmeztet az FBI

2025-ben az Egyesült Államokban és Kanadában 264 milliárd forint (kb. 725 millió USD) értékben tűnt el áru – és az elkövetők egyre rafináltabb módszerekkel dolgoznak...

péntek 21:23

A szimulátorőrület májusban letarolja a cozy játékokat

💻 Májusban igazi szimulátorözön várható a cozy játékok világában, ráadásul minden típusból akad újdonság: életszimulátorok, boltvezetős szimkék és egészen extrém menedzsmentjátékok is indulnak...

péntek 21:12

Az első MI-cég betör a kriptópiacra Amerikában

Az Egyesült Államokban először fordult elő, hogy egy mesterséges intelligencia önállóan céget alapított, megszerezte a tevékenységhez szükséges hivatalos iratokat, és már az első kriptovaluta-kereskedésére is készül...

péntek 20:56

A techóriások szárnyalása hajtja az újabb bitcoin-rallit

🚀 A bitcoin az utóbbi napokban ismét emelkedett, és elérte a 77 400 dolláros, vagyis közel 28 millió forintos szintet...

péntek 20:44

Az alumínium átírja az ipart: jön a ritkafémek utáni korszak?

A King’s College London kutatócsapata egy egészen új alumíniumformára bukkant, amely olcsóbb és fenntarthatóbb alternatívája lehet a jelenleg használt, drága és ritka fémeknek...

péntek 20:34

A QR-kódos csalások sosem voltak ilyen veszélyesek

Az utóbbi időszakban drámai mértékben, 146%-kal nőtt a QR-kódos adathalász támadások száma, miközben más, korábban elterjedt módszerek háttérbe szorultak...

péntek 20:22

A Pink Floydról elnevezett új pók a házfalakon portyázik

A Dél-Amerikában dolgozó kutatók egy új repedéslakó pókfajt fedeztek fel, amely a Pikelinia floydmuraria nevet kapta – ezzel egyszerre a Pink Floyd zenekar előtt tisztelegnek és a pók jellegzetes lakóhelyére utalnak...

péntek 20:12

A Division: Újjászületés mostantól PC-n is ingyen játszható

Jó példa erre, hogy az okostelefonokon már ismert A Division: Újjászületés (The Division Resurgence) mostantól számítógépen is kipróbálható, még a hivatalos augusztusi rajt előtt...