2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 16:12

Az első Bloodlines 2 DLC végre helyreteszi a harcrendszert

🔴 A várva várt Vampire: The Masquerade – Bloodlines 2 tavalyi megjelenése után sokan érezhették úgy, hogy valami hiányzik a játékból...

MA 16:01

Az Oppo Find X9 Ultra tarol: 2000 fotón át bizonyított

Az okostelefonos fotózás új szintre lépett az Oppo Find X9 Ultrával...

MA 15:56

Az MI forradalmasítja az állami megfigyelést – riadót fújnak a képviselők

A technológia fejlődése alapjaiban változtatja meg, hogyan figyeli meg az állam polgárait...

MA 15:34

A Hubble 30 év után újra célba veszi a Trifid-ködöt

🛰 Ötvenezer fényévnyi távolságból ismét elképesztő fotót készített a Hubble űrtávcső a Trifid-ködről, amely a Nyilas csillagképben található, és a csillagkeletkezés egyik ikonikus helyszíne az univerzumban...

MA 15:23

A mindent tudó kriptobróker: a Coinbase újraosztja a lapokat

A Coinbase egy olyan mérföldkőhöz érkezett, amelyet a Wall Street is azonnal felismer: mostantól teljes körű prime brókerként működik a kriptopiacon...

MA 15:12

Az LG C6 OLED: Lélegzetelállító fényerő, de akadnak árnyoldalak

Az LG C-sorozatos OLED tévéi évről évre a kategória legnépszerűbbjei közé tartoznak...

MA 15:01

A nagy rejtély: miért rázza a fejét a macska és a kutya?

A macskáknál gyakran előfordul, hogy evés, ivás vagy alapos simogatás után villámgyorsan megrázzák a fejüket...

MA 14:57

A gigászi adatközpont rekordszintű áraméhséggel fenyeget Utahban

Különleges beruházás készül Box Elder megyében, ahol Kevin O’Leary, a híres „Mr...

MA 14:45

Az Enter the Gungeon tízéves: Tényleg véget ér a roguelike aranykora?

Tíz év telt el azóta, hogy megjelent az Enter the Gungeon, amely több mint 14 millió példányban kelt el, és jelentős hatást gyakorolt a modern akció-roguelike műfajra...

MA 14:34

Az FA-kupa elődöntő: megingott a Chelsea, éhes a Leeds

⚽ Nem a bajnoki tabella alapján ítélhető meg, melyik csapat az esélyesebb a Chelsea–Leeds FA-kupa-elődöntőben...

MA 14:23

A T. rex megőrződött vérerei átírják a dinoszaurusz-kutatást

A tudósok hosszú évtizedeken át próbáltak dinoszaurusz-DNS-t találni, eredménytelenül. Ma már a paleontológia főleg a fosszíliákban maradt eredeti szerves anyagok nyomait kutatja, de a több mint 66 millió év során a DNS teljesen elpusztult...

MA 13:56

Tűz az amerikai bombázók brit bázisán – csak egy üres épület égett

Hajnalban hatalmas tűz ütött ki a Gloucestershire melletti RAF Fairford katonai repülőtéren, ahol jelenleg is amerikai egységek állomásoznak...

MA 13:23

Az utolsó nagy csata: Coventry City–Wrexham, itt dől el minden

A Coventry City és a Wrexham vasárnapi rangadója rengeteget jelent a Championship idei szezonjában, ahol már csak néhány kérdés maradt nyitva a playoff-helyek sorsáról...

MA 13:11

Az újabb Litecoin-botrány: egy támadás miatt 13 blokkot visszaforgattak

Érdemes megérteni, hogy a népszerű Litecoin kriptohálózatot hétvégén súlyos támadás érte, amely során a támadók egy korábban javított, addig kihasználatlan sérülékenységet céloztak meg...

MA 09:15

Az Ultramarine-ok közé tényleg keveredett egy Halo-elit?

😱 Egy igazi rajongó, Skykillerr nevű művész szétmodolta a Warhammer 40,000: Space Marine 2-t: konkrétan játszhatóvá tette benne a Halo-sorozatból ismert félelmetes fehér Elite-et (Ultra, Halo: Reach), és erről egy menő videót is feltöltött...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     RPG Knights of Grayfang (iPhone/iPad)Eldraad egy varázslatos, fantáziadús világ, ahol ember és szörny évszázados háborút vív egymással...

MA 09:08

Az afrikai kontinens kettészakadása gyorsabb, mint hittük

A kelet-afrikai Turkana-árok kétségtelenül híres az emberiség egyik leggazdagabb fosszíliálelet-anyagáról, miközben állandó vulkáni aktivitás jellemzi a területet...

MA 09:01

Az amerikai bitcoin-ETF-ek uralmuk alá hajtják a kriptopiacot

Pénteken áttörés történt az amerikai bitcoin-derivatívák piacán: a BlackRock által menedzselt bitcoin-tőzsdén kereskedett alap (ETF), az IBIT opcióinak piaci mérete elérte, sőt meghaladta a külföldi Deribit opciós piacáét...

MA 08:56

Az agresszív gyíkok felfalják a természet színeit

Tipikus eset, amikor az evolúció szépen, egyensúlyban működik évmilliókig – aztán hirtelen minden felborul...

MA 08:50

Az új Strands: egy vita, ami mindenkit beszippant

🤔 A vasárnapi Strands rejtvény elsőre tréfásan könnyű témát ígért: „Merülj bele” (Get into it)...

MA 08:43

A legújabb kutatás szerint a halolaj árthat az agyadnak

🐞 Az utóbbi években egyre többek kezében tűnik fel valamilyen halolaj-kiegészítő, főleg azok körében, akik szeretnének vigyázni agyuk egészségére...

MA 08:35

Az alaszkai lazac vesztét hozhatják az invazív csukák

Alaszka folyóinak felmelegedése újabb problémát hozott magával: az invazív északi csuka egyre falánkabbá válik...

MA 08:29

Az NYT Connections legújabb trükkjei: így győzd le a rejtvényt

📚 Érdemes látni, mennyire képes meglepni a Connections, a New York Times egyre népszerűbb szójátéka...

MA 08:22

Az életmentő grafén: baktériumölő csoda, emberre nézve veszélytelen

💡 A mindennapi életben számos olyan tárgy vesz körül minket – ruhák, maszkok, fogkefék –, amelyek közvetlenül érintkeznek a testünkkel, így kiemelten fontos a higiénia...

MA 08:01

Az univerzum titkos kohói: gravitációs hullámokból születhetett a sötét anyag

Az Ősrobbanás utáni kaotikus pillanatokban a téridő fodrozódásai többet jelenthettek, mint puszta hullámok: lehet, hogy ezeknek köszönhetjük a galaxisokat összetartó titokzatos sötét anyagot is...

MA 07:57

Az új Michael Jackson-film: táncra perdül a nézőtér, vagy égés?

A moziban ülők most nemcsak pattogatott kukoricáért ugranak fel, hanem a Michael (Michael) című életrajzi film alatt tényleg táncra is perdülnek!..

MA 07:50

Az MI-ügynökök letarolják a kriptót: az ember háttérbe szorul

A modern pénzügyi rendszer mindig is az emberi élet igényeihez igazodott: országhatárokhoz, papírmunkához, banki nyitvatartáshoz...

MA 07:29

Az MI új támadáshullámot szabadított a kriptovilágra

A decentralizált pénzügyi világban (DeFi) évekig a figyelem középpontjában az okosszerződés-hibák álltak...

MA 07:22

Az Assassin’s Creed: Fekete Zászló adaptációja nem spórol a vérrel

🏴 Az Assassin’s Creed: Fekete Zászló (Black Flag) Resynced bejelentése után sok rajongó felkapta a fejét: eltűnt a jól ismert vér, helyette színes szikrák jelentek meg a harcokban...