2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 08:43

Az AI új csapdája: úgy ránt be, mint az adathalászat

🖰 Az AI-k világában már nem csak emberek lehetnek átverés áldozatai: a mesterséges intelligenciák is csúnyán pofára eshetnek, ha valaki elég ügyesen csavarja a kérdéseket...

MA 08:29

Az egyedüllét nem okoz demenciát, de kikezdi a memóriát

💡 Az egyedüllét érzése mindannyiunkkal megesik, és ugyan természetes emberi érzelem, mégis képes alattomosan befolyásolni gondolkodásunkat, memóriánkat...

MA 08:03

A legnagyobb DeFi-hack: milliárdok tűntek el pillanatok alatt

💸 A decentralizált pénzügyi szektorban (DeFi) komoly felfordulást okozott az év eddigi legnagyobb hackje, amely során közel 108 milliárd forintnak megfelelő értékű kriptovalutát tulajdonítottak el...

MA 07:57

Az új Vercel-botrány: hackerek pénzzé teszik a lopott adatokat

Érdemes megérteni, hogy a népszerű felhőalapú fejlesztői platformot, a Vercelt jelentős biztonsági incidens érte, melynek során egyes ügyfelek adatai veszélybe kerültek...

MA 07:50

Az utolsó kilométerek: a Voyager–1 az ereje végén jár

Tipikus eset, amikor egy világraszóló felfedezőút lassan lezárul. A Voyager 1, amely 49 éve szeli az űrt, mostanra elérte élettartama határát: energiaforrása, a plutóniumalapú termoelektromos generátor évről évre körülbelül 4 wattal kevesebb teljesítményt ad le, és már nincs napelem, sem újratölthető akkumulátor, amely segítene...

MA 07:36

A Blue Origin beégett: az első újrahasznosított rakéta műholdat veszít

A Blue Origin legújabb, harmadszor repülő New Glenn rakétája megint nagyot szólt, de valahogy mégiscsak a partvonalról nézheti a diadalt: a második fokozat műszaki hibája miatt a fedélzeten lévő BlueBird 7 műhold menthetetlen pályán rekedt, vagyis el is búcsúzhatunk tőle – a biztosító viszont fizetni fog, ami azért enyhíti a csapást...

MA 07:24

Az elemek korszaka véget érhet a talajból nyert árammal?

A Northwestern Egyetem kutatói áttörést értek el a fenntartható energiaellátásban: olyan tüzelőanyagcellát fejlesztettek ki, amelynek működését a talajban élő mikroorganizmusok biztosítják...

MA 07:15

Az Apple-értesítésekkel támadnak a csalók: új adathalász trükk

🚨 Az elmúlt napokban többen kaptak olyan e-maileket, amelyek Apple-fiók módosításáról szóló hivatalos értesítésnek tűnnek, valójában azonban adathalász csalási kísérletek...

MA 07:01

Az Apple-rajongók türelmét próbára teszi a csúszó Mac Studio és MacBook Pro

Akik már tűkön ülnek az új Mac Studio vagy MacBook Pro kiadására várva, kénytelenek még pár hónapot várni...

MA 06:50

A OnePlus új mobilja tényleg kézikonzollá válik

Érdemes megvizsgálni, hogy a OnePlus hamarosan bemutatkozó Ace 6 Ultra készüléke nem egyszerűen egy csúcsmobil lesz, hanem kifejezetten játékosoknak tervezett kézi játékkonzollá is alakítható...

MA 06:43

A csodafegyverét, a Mythost már beveti az NSA – mindenki csak néz

👀 Érdekes fordulat, hogy az amerikai Nemzetbiztonsági Ügynökség (NSA) pillanatok alatt rácsapott az Anthropic új mesterségesintelligencia-modelljére, a Mythos Preview-ra, annak ellenére, hogy nem is olyan régen még nyílt háború dúlt a cég és a Pentagon között...

MA 06:38

Az igazságos osztozás: a reneszánsz játék, amely forradalmasította a kockázatkezelést

🧡 Tipikus eset, amikor két barát, mindketten 25 000 forintot tesznek be egy kalapba, majd elkezdenek érmét dobni...

MA 06:22

Az emberi lelemény újrarajzolja a Föld arculatát

🚀 Az emberi társadalmak évszázadok óta nemcsak alkalmazkodnak a természethez, hanem képesek is azt gyökeresen átalakítani...

MA 06:15

Az új Dragon Ball Xenoverse végre itt van

Több mint tíz év várakozás után jövőre érkezik a Dragon Ball Xenoverse 3...

MA 06:05

Történelmi események a mai napon (Április 20.)

Április 20-án a történelem sorsfordító pillanatai és különös epizódjai váltották egymást: haditengerészeti áttörés Konstantinápoly ostroma előtt, forradalmak és háborúk küszöbei, tudományos áttörések és űrsikerek...

vasárnap 21:23

Az újrahasználható rakéták csatája: beszáll a Blue Origin

A Blue Origin történelmi sikert ért el, amikor a Never Tell Me the Odds nevű rakétája a New Glenn NG-3 küldetés során sikeresen leszállt az Atlanti-óceánon lebegő Jacklyn drónhajó fedélzetére...

vasárnap 21:01

Az új opioid kevésbé okozhat függőséget, mint a morfium

💊 A kutatók azt vizsgálták, hogy a laboratóriumban most először tesztelt új, szintetikus opioid milyen eséllyel válthatja le a morfiumot és a fentanilt, amelyek erős fájdalomcsillapítók, egyben komoly függőségi problémák forrásai is...

vasárnap 20:45

Az áttörés küszöbén: forradalmi kezelés az agydaganat ellen

A Telix Pharmaceuticals most tényleg történelmet ír: új, kifejezetten agresszív agytumor, vagyis glioblasztóma kezelésére fejlesztett radiofarmakonja már a kulcsfontosságú, III...

vasárnap 20:24

A betonbiztos otthoni Wi-Fi: így zárod le a hálózatod

Megemlíthető, hogy a stabil és biztonságos otthoni internet ma már alapvető követelmény, de kevesen fordítanak elég figyelmet a hálózatuk védelmére...

vasárnap 20:12

Az őrült peremhajtás: rakétával pörgetett propeller a sugárhajtóműben

Különleges meghajtási koncepcióval állt elő egy feltaláló, amikor a hagyományos propeller–motor rendszert teljesen átértelmezte: itt nem középre került a motor, hanem egy üreges szerkezetet alkotott, amelynek belső oldalára erősítette fel a lapátokat...

vasárnap 20:02

A munkahelyi kiégés közelebb van, mint hinnéd – így védd magad

🔥 Ha már mindennap kimerülten kelsz fel, fásult vagy, esetleg azt érzed, hogy semmi értelme sincs a munkádnak, akkor könnyen lehet, hogy éppen a kiégés fenyeget...

vasárnap 19:55

A HP lekapcsolja a távoli asztali szolgáltatásait – búcsú, Anyware!

A legendás Teradici PCoIP-ból lett HP Anyware távoli asztali megoldás a végéhez közeledik...

vasárnap 19:45

A fejlesztők rémálma: a Vercelt is elérte a biztonsági blama

😱 Hiába reménykedtünk, hogy a Vercel szolgáltatásai megingathatatlan biztonságot nyújtanak, mégis betörték az ajtót...

vasárnap 19:34

A mesterséges intelligencia tényleg tudja, mit csinál? Gondoljuk újra!

Az emberi gondolkodás működését leíró szavak a hétköznapokban természetesek. Gondolkodni, érteni, tudni, emlékezni – mindennapi kifejezéseink...

vasárnap 19:25

A jövő elektronikája: mágnes nélküli vezérlés forradalmasíthatja a számítástechnikát

⚡ A számítástechnika jövője új irányt vesz: kutatók most először tették lehetővé az elektronok vezérlését mágnesek nélkül, egy olyan tulajdonság kihasználásával, amellyel eddig senki sem foglalkozott...

vasárnap 19:12

Az önvezető Tesla-taxik már Dallasban és Houstonban is hódítanak

🚗 A texasi forróságban bukkannak fel az új robotaxi-modellek, amelyek most először gördülnek ki Dallas és Houston bizonyos kerületeiben...

vasárnap 18:45

Az egyetlen békés forradalom: trónváltás a csupasz turkálók birodalmában

🐍 A föld alatti járatokban élő csupasz turkálók társadalmában az élet általában nem szelíd...

vasárnap 18:37

Az oklevél ára: belépő a hitelek világába a pályakezdőknek

Idén tavasszal egy teljesen átalakult rendszer várja azokat, akik most szereznek diplomát az Egyesült Államokban...

vasárnap 18:23

A valaha készült legnagyobb 3D-s univerzumtérkép: 47 millió galaxis egy képen

👀 Az eddigi legnagyobb 3D-s univerzumtérkép minden korábbinál részletesebben mutatja meg a világegyetem szerkezetét...