2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 12:01

Az új Tenways városi e-bike tényleg megkönnyíti a közös tekerést

🚲 Néha rájössz, hogy egy jó elektromos bringa többet ér, mint egy akármilyen együtt töltött vasárnap...

MA 11:58

A Windows 11 frissítés, ami végre megszelídíti a batch fájlokat

A legutóbbi Windows 11 Insider Preview frissítések most komoly lendületet adnak a batch fájlok és CMD-szkriptek futtatásának biztonságában és sebességében...

MA 11:40

Az első napfoltmentes napok: nyugalom, vagy csak vihar előtti csend?

Több évnyi aktív naptevékenység után február 22-én először fordult elő, hogy egyetlen napfolt sem volt látható a Föld felé néző napkorongon...

MA 11:21

Az utolsó nagy próba: Jön az MI történelmi fordulópontja?

Érdemes megvizsgálni, hol húzzuk meg a határt az emberi tudás és a modern MI-modellek képességei között...

MA 11:01

Az Egyesült Államokban újra tombol a kanyaró

🦠 Érdekesség, hogy 2026 első két hónapjában az Egyesült Államokban már 1 136 kanyarós megbetegedést regisztráltak, ami a tavalyihoz képest jóval gyorsabb terjedést jelez...

MA 10:55

A hadseregből száműzi az MI-t Trump: Palantir marad, Anthropic bukik

Az amerikai védelmi minisztérium egyre keményebb tempóban keresi a legerősebb MI-technológiákat: a verseny a csúcsra pörgött, a tét óriási...

MA 10:47

Az MI elhozza a nagy leépítést: Jack Dorsey szerint vége a munkáknak

Jack Dorsey, a Block (korábban Square) alapítója nem kertelt: szerinte eljött az az idő, amikor a mesterséges intelligencia már valóban az emberek munkáját veszi át...

MA 10:37

Az eltűnt hold átírhatta a Szaturnusz múltját

A Titan, a Szaturnusz legnagyobb holdja, eredetileg két ősi hold gigantikus ütközéséből születhetett, amely nemcsak a teljes holdrendszert formálta át, hanem közvetve a Szaturnusz ikonikus gyűrűinek születésére is hatással lehetett...

MA 10:28

Az űrben lebeg egy agy? Nézd meg, mit fotózott a JWST!

Elképesztő fotók érkeztek a James Webb-űrtávcsőtől: a Vela csillagképben, tőlünk nagyjából 2 300 000 000 000 000 000 km-re (azaz 5 000 fényévre) a PMR 1 nevű köd úgy néz ki, mintha egy átlátszó koponyában villámok járnák át az agytekervényeket...

MA 10:20

A Google 100 órás akkumulátora forradalmasítja az energiatárolást

Érdemes megvizsgálni, milyen új korszakot nyithat meg a Google legújabb beruházása Minnesota államban, ahol egy adatközpontot épít, amelyet szinte kizárólag tiszta energiával látnak el...

MA 10:02

Az unalmas, drága PC-k és mobilok kora 2026-ban kezdődik

Az okostelefonok és számítógépek világa komoly átalakulás előtt áll: a várakozások szerint a készülékek kevesebb memóriával, szerényebb képességekkel, mégis jóval magasabb áron érkeznek majd 2026-ban...

MA 09:56

Az OpenAI beszáll a hadügybe: MI-rendszerek a Pentagonban

Az MI fejlesztésében az utóbbi időben egyre élesebb a verseny, de most újabb fordulóponthoz érkeztünk: az OpenAI megállapodott az amerikai védelmi minisztériummal, hogy saját MI-modelleit az ügynökség rendszereibe telepítik...

MA 09:46

Az életed tíz képpel jobb lehet: a Gemini turbóra kapcsolja a megosztást

📷 Mostantól fájdalommentes a képek és videók importja: a Gemini alkalmazás legújabb, 1...

MA 09:29

A RESURGE, az Ivanti eszközök láthatatlan kártevője – mire képes?

Ilyen eset például, amikor egy szervezet hálózatát észrevétlenül fertőzi meg egy rendkívül fejlett kártevő...

MA 09:19

Az égbolt ritka csodája: hat bolygó egyszerre sorakozik fel

Különleges látvány várja a csillagászat rajongóit a hétvégén, amikor hat bolygó, mint gyöngyszemek, egymás után sorakoznak fel az esti égbolton...

MA 09:11

Az OpenAI és az Amazon új korszakot nyit a vállalati MI-ben

Az MI világában új nagyhatalmi játszma bontakozik ki: a SoftBank 8 500 milliárd, az Nvidia 8 500 milliárd, az Amazon pedig 14 100 milliárd forintot fektet az OpenAI-ba...

MA 09:02

Az Europol lecsapott Európa legrettegettebb tinédzser hackereire

🕵 Egy nagyszabású, egy évig tartó nyomozás végén harminc embert letartóztattak, 179 gyanúsítottat pedig összefüggésbe hoztak a The Com nevű online bűnözői csoporttal, amely gyerekek és tinédzserek ellen irányuló zsarolásban, erőszakos cselekményekben és gyermekpornográfia előállításában vett részt...

MA 08:55

Az MI új sztárja: ezt tudja a Nano Banana 2

A képgenerálás terén új szintre lépett a Google legfrissebb modellje, a Nano Banana 2...

MA 08:47

A Google hadat üzen a kvantumtámadásoknak: jönnek az új tanúsítványok

A Google új, a Chrome böngészőbe épülő védelmi megoldása meglepő egyszerűséggel foglalja össze a kvantumszámítógépes támadásokkal szemben ellenálló HTTPS-tanúsítványokat, miközben a felhasználók számára észrevétlen marad a rendszerfrissítés...

MA 08:37

Az állati fehérje mellőzése tényleg fogyást hoz edzés nélkül?

🥩 Egy friss kutatás szerint egészen új megközelítéssel lehet serkenteni a szervezet zsírégető folyamatait – ráadásul edzés és erőfeszítés nélkül...

MA 08:28

Az észak-koreai hackerek már vezeték nélkül is fertőznek

📶 Egy észak-koreai eredetű hackercsoport új, kifejezetten hálózattól elszigetelt (air-gapped) rendszerek feltörésére készült kártevőkkel folytat kibertámadásokat...

MA 08:19

Az óriás kábeltársaságok összeolvadnak: jön az új korszak?

📶 Az Egyesült Államokban a Cox és a Charter Communications egyesülését engedélyezte a Szövetségi Kommunikációs Bizottság (FCC)...

MA 08:01

Az arany Trump-telefon titka: hová tűnt a HTC-logó?

Ki hinné, hogy a nagy csinnadrattával beharangozott Trump-telefon kísértetiesen hasonlít a vadonatúj HTC U24 Pro-ra?..

MA 07:56

A láthatatlan fenyegetés: a harmadik féltől származó szoftverek valódi veszélyei

Érdemes megvizsgálni, hogy a vállalati informatikai biztonság mennyire fókuszál a szem előtt lévő rendszerekre: szerverekre, hálózatokra, felhasználói fiókokra, VPN-ekre vagy a felhőszolgáltatásokra...

MA 07:46

Az újabb csúszás: a NASA holdraszállása messzebb, mint valaha

Ja, mert hogy nyilván mindeközben a NASA megint belengette, hogy csak ne ácsingózzunk az új holdraszállásra, ugyanis az egész Artemis-program időrendje szétesett...

MA 07:39

A repedések ereje: így alakulnak a szövetek és szervek

Az élő sejtek világa nemcsak a folyamatos növekedésről, hanem néha a tudatos törésről is szól...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 2/28

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Castle Zombiestein – 3D FPS (iPhone/iPad)A Zombiestein egy pörgős akciójáték, amelyben a játékos Yuri Agron, azaz “Tarzan” bőrébe bújik, aki egy elit orosz Spetsnaz kommandós...

MA 07:10

Az első influenza–COVID–19 kombinált oltást jóváhagyták Európában, Amerika még vár.

🤒 Európában zöld utat kapott a Moderna új, kettős védelmet nyújtó oltóanyaga, amely egyszerre óv az influenzától és a COVID-19-től...

MA 07:01

Az MI-cégek szembeszállnak a Pentagon nyomásával

Jellemző példa erre, hogy több száz Google- és OpenAI-dolgozó aláírta azt a nyílt levelet, amelyben arra kérik cégeiket, hogy vállaljanak közös állásfoglalást az Anthropic mellett...