2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 17:02

Az új PamStealer nem a szokványos macOS-kártevő

🔒 A PamStealer nevű, most felfedezett macOS-kártevő alaposan feladja a leckét az Apple gépeket használóknak...

MA 16:31

Az első antarktiszi dinoszaurusz a valaha élt óriások közé tartozott

Több mint negyven évvel ezelőtt egy hatalmas állat gerincdarabját emelték ki az antarktiszi jég fogságából...

MA 16:02

Az MI-t bevezető cégek idővel még több embert vesznek fel

Tipikus eset, amikor mindenki attól tart, hogy az MI elterjedése elveszi a munkahelyeket, de a számok mást mutatnak: az MI-re nagyban támaszkodó vállalatok valójában bővítik a munkatársi létszámot...

MA 15:32

Az űripar nagy rablása: a SpaceX tőzsdére lépésének csavarja

🚀 Majdnem elképzelhetetlen, hogy ne hallottunk volna arról, mekkora sikert aratott a SpaceX a tőzsdére lépésével...

MA 14:31

A Webb-űrtávcső sosem látott, rejtélyes anyagot találhatott Plútón és Titánon

A James Webb űrteleszkóp legújabb megfigyelései szerint egy rejtélyes hullámhossz hiányzik a törpebolygó, a Plútó és a Szaturnusz legnagyobb holdja, a Titán felszínéről visszaverődő fény spektrumából...

MA 12:01

Az óceánok júniusi hőrekordja: erősödő El Niño fűti a vizeket

A Föld óceánjai idén júniusban történelmi hőmérsékleti rekordot döntöttek, ráadásul éppen akkor, amikor az El Niño hatása is felerősödik a Csendes-óceánon...

MA 11:31

A csendes szuperszonikus utasszállítók hamarosan átrepülhetnek amerikai városok felett?

A több mint öt évtizede érvényben lévő tiltás, amely megakadályozta a szuperszonikus utasszállítók áthaladását az Egyesült Államok városai felett, hamarosan a múlté lehet...

MA 11:01

A brutális hőség az amerikai áramhálózatokat és a július 4-i utazást fenyegeti

🔥 Amerikát rendkívüli hőhullám sújtja, amely a középső és keleti régiókban éri el csúcspontját, és várhatóan egészen a függetlenség napjáig kitart...

MA 10:49

A villámtrükk, amivel 3 másodperc alatt ellopják a Microsoft 365-fiókod

Elég csak egy ártatlannak tűnő linket behúzni a böngészőbe, és három másodperccel később már jogosulatlanul hozzáférhet valaki a Microsoft 365-fiókodhoz, miközben semmilyen szokványos biztonsági jelzés nem figyelmeztet előre a veszélyre...

MA 10:37

A denevérrel ébredt, 11 éves kanadai fiú belehalt a veszettségbe

🦇 Egy 11 éves ontariói fiú tragikus körülmények között veszettségben vesztette életét, miután egy denevér éjszaka az arcán leszállt...

MA 09:49

A Fehér Ház mindent bedob: új UAP-tanácsadó testület alakul

Az Egyesült Államok kormánya új szintre emeli a földönkívüli élet utáni kutatást: külön tudományos tanácsadó testület segíti az ország vezetőit az azonosítatlan légköri észlelések, vagyis az UAP-ok vizsgálatában...

MA 09:24

A Meta előfizetéshez köti az okosszemüvegek extra funkcióit

A Meta új előfizetési rendszert vezet be az okosszemüvegeihez, amely érinti mind a Ray-Ban- és Oakley‑modelleket, mind a saját márkás eszközöket...

MA 09:14

A mesterséges intelligencia igazi ára: spórolás helyett súlyos mellékhatások?

💸 Egy lényeges szempont, hogy az amerikai kormány jelenlegi hiánya soha nem látott magasságokba emelkedett, miközben egyre élénkebb vita övezi a költségvetési reformok szükségességét...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 7/3

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     FormatX: Video Audio Converter (iPhone/iPad)A FormatX egy sokoldalú, minden az egyben formátum átalakító eszköz, amely egyszerűen és gyorsan alakít át videó-, hang- és képformátumokat...

MA 09:02

Az új ZCode kihívja a Copilotot, a Cursort és a Claude-ot

Egyre látványosabb átrendeződés zajlik a fejlesztői eszközök piacán: Pekingből érkezik egy új szereplő, amely odacsap a veterán nyugati óriások asztalára...

MA 08:49

A Google beszünteti a legendás Nest okoszár árusítását

🔒 A Nest x Yale Lock hosszú időn át az egyik legismertebb okoszár volt a piacon, de most végleg eltűnt a Google Store kínálatából...

MA 08:03

Az MI-szabályozás káosza és a küszöbön álló technológiai forradalom

Az elmúlt hét legnagyobb MI-híre Amerikában az volt, hogy visszavonták az Anthropic Mythos és Fable modelljeire két hete bevezetett exportkorlátozásokat...

MA 07:49

A láthatatlan szálak: így irányítja a világot a Goldman Sachs

💎 Közel 46 ezer alkalmazott dolgozik a világ egyik legnagyobb pénzügyi intézményénél, ahol évente több mint egymillióan pályáznak állásra...

MA 07:37

A Hubble lehetetlen fényt észlelt egy láthatatlan galaxisból

Egy rejtélyes, ősi galaxis, az MXDFz4.4 fényét sikerült észlelni a világegyetem legkorábbi időszakából, ami eddig lehetetlennek tűnt...

MA 07:13

Az űrverseny óriásai: Mikor startol végre a New Glenn?

🚀 Senki sem várta volna, hogy a holdraszállásról álmodó NASA egyik legkomolyabb akadályát saját beszállítói okozzák, mégpedig a Blue Origin csúszásai miatt...

MA 07:01

A Securitize NYSE-debütál: 295 millió dolláros tokenizált részvény Solanán és Avalanche-en

🔥 A digitális vagyonkezelés újabb mérföldkőhöz érkezett: a BlackRock és az ARK Invest által is támogatott Securitize egyszerre lépett be a New York-i tőzsdére, és tokenizálta saját részvényeit...

MA 06:49

Az évszázad legerősebb rengése Venezuelában: 2595 halott, súlyos károk

A Venezuelát múlt héten sújtó földrengések következtében a halálos áldozatok száma 2 595-re nőtt, miközben a mentőalakulatok továbbra is versenyt futnak az idővel a túlélők felkutatásáért...

MA 06:26

Véget ért a hajón kitört hantavírus-járvány – közölte a WHO

🚦 A luxushajón tavasszal felbukkanó hantavírus-járvány végre hivatalosan is lezárult. A fertőzés korábban három ember halálát okozta, és komoly félelmeket keltett a további terjedésével kapcsolatban...

MA 06:06

Történelmi események a mai napon (Július 3.)

Viharos ütközetek, trónra lépések és technikatörténeti mérföldkövek jelölik ezt a napot: a gettysburgi csata tetőpontja, Hugh Capet francia királlyá koronázása és a Mallard gőzmozdony világrekordja egyszerre rajzolják át a történelem térképét...

MA 06:01

A CISA szerint már aktívan támadják a Microsoft SharePoint RCE-hibát

A Microsoft SharePoint-rendszerei újabb komoly biztonsági kockázattal néznek szembe: a legújabb, távoli kódfuttatást lehetővé tévő sérülékenységet már aktívan kihasználják a támadók...

csütörtök 18:31

A pályaközepi kiégés: amikor munka, gyereknevelés és idősgondozás ütközik

Egy hétfő reggel Sarah Davies, egy nagy brit élelmiszergyártó pénzügyi vezetője, szokása szerint felhívta idős édesapját...

csütörtök 18:01

A világ végére tartó út: úszó labor az északi jég fogságában

Jövő hónapban tizenkét fős csapat indul Norvégia sarkköri kisvárosába, Kirkenesbe, hogy megkezdje elképesztő utazását a Föld egyik legkietlenebb, legzordabb vidékére...

csütörtök 17:01

Az amerikai álom újra szárnyal: SpaceX, részvényláz, történelem

🚀 Az Egyesült Államok 250. születésnapját a világ valaha volt legnagyobb tőzsdei kibocsátásával ünnepli...

csütörtök 16:01

Az Nvidia új húzása: számítási kapacitást ad bevételrészesedésért cserébe

💻 Az Nvidia friss partnerségi programja forradalmasítja a startupok és a csipgyártó kapcsolatát: a gyorsan bővülő MI-cégekkel mostantól olyan megállapodásokat köt, amelyekben jövőbeli bevételük egy részéért cserébe számítási kapacitást biztosít...