Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 20:34

Az indiai Nagy Testvér mindent lát: nyilvántartanak minden okostelefont

👀 Megvizsgáljuk, hogyan tervezi India feltérképezni és nyilvántartani az ország összes okostelefonját, legyen szó új vagy használt készülékről...

MA 20:16

Jön a szigor: felezik az ingyenes tanúsítványok érvényességét

A Let’s Encrypt bejelentette, hogy 2028-ig felére, azaz 90 napról 45 napra rövidíti a kibocsátott tanúsítványainak érvényességi idejét...

MA 20:03

Az Amazon 36 millióért engedi személyre szabni a saját MI-modelleket

💰 Különösen említést érdemel, hogy az Amazon Web Services (AWS) mostantól lehetővé teszi a felhőalapú ügyfelek számára, hogy már a betanítási folyamat közben is testre szabják az MI-modelleket, saját adataikat beépítve...

MA 19:34

A MI jövőjének kulcsa az igazság, a szépség és a kíváncsiság?

Elon Musk ismét figyelmeztetett az MI jelentette veszélyekre, kiemelve, hogy a technológia gyors fejlődése miatt a jövő nem feltétlenül lesz pozitív...

MA 19:17

A Microsoft Defender összeomlása megbénította a fenyegetésvadászatot

🙁 Az elmúlt 10 órában részleges leállás bénította a Microsoft Defender XDR portált, több felhasználó számára elérhetetlenné téve a fenyegetésvadászatot és egyéb funkciókat...

MA 19:01

A város minden épülete 3D-ben – itt az új térkép!

A Müncheni Műszaki Egyetem kutatói a GlobalBuildingAtlas nevű projektben először készítették el a Föld összes épületéről készült, nagyfelbontású 3D-térképét...

MA 18:50

A menstruáció űrbeli forradalma: új megoldások hosszú küldetéseken

Az űrutazás emberi kihívásai túlmutatnak a technológián: az alapvető testi folyamatokat is újra kell gondolni a Földtől távol, legyen szó étkezésről, alvásról, vagy éppen a menstruációról...

MA 18:34

Az új Steam Machine megtöri a Valve hardverátkát?

Első pillantásra úgy tűnt, hogy a Steam Machine 2015-ös bevezetésével a Valve végre megoldja a PC-s játékok legnagyobb gondjait...

MA 18:17

Az év végi aduász: jön a Mortal Kombat 1 Game Passra

Decemberben a Game Pass kínálata igazi csemegéket tartogat. A legnagyobb durranás kétségtelenül a Mortal Kombat 1, amely december 10-től érhető el az Ultimate és Premium előfizetők számára...

MA 18:01

A halott csillagok rejtélye: feltámadnak a fehér törpék?

💫 Az univerzum egyik legérdekesebb jelensége a fehér törpék világa: ezek a csillagmaradványok akkor születnek, amikor egy csillag már nem termel energiát magfúzió útján...

MA 17:02

Az Antigravity bakija: eltűnt egy felhasználó teljes meghajtója

Külön említést érdemel, hogy egy újabb súlyos hiba miatt a Google Antigravity nevű MI-fejlesztőeszköze egy felhasználó teljes D: meghajtóját törölte, helyreállítási lehetőség nélkül...

MA 16:50

A YouTube új deepfake-rendőre: áldás vagy átok?

A YouTube új arcfelismerő eszköze, amely a feltöltők biometrikus adatait használja fel az MI-alapú deepfake videók azonosítására, komoly aggodalmakat váltott ki szakértők és tartalomgyártók körében...

MA 16:33

Az a merész jóslat, amely fél évszázadra formálta a chipeket

1964. december 2-án a San Francisco-öböl térségében egy szerény, szakmai találkozón Gordon Moore számítástechnikus letette a félvezetőipar alapjait: megszületett a ma már legendás Moore-törvény...

MA 16:18

A Luma AI meghódítja Londont

Az amerikai Luma AI, amelynek értéke már meghaladja az 1 470 milliárd forintot, nagyszabású londoni terjeszkedést jelentett be...

MA 16:01

Titkok a középkori angol seregről: 290 ezer sors online

Néhány éve még elképzelhetetlen volt, hogy bárki böngészhessen középkori angol katonák sorsaik között...

MA 15:50

Az Oracle-hack után újabb adatlopás rázza meg a Pennsylvaniai Egyetemet

A Pennsylvaniai Egyetem nemrég jelentette be, hogy támadók érzékeny személyes adatokat loptak el az Oracle E-Business Suite szervereiről...

MA 15:33

Az újabb csapás: Michael Burry szerint túlárazott a Tesla

Michael Burry, a híres befektető, aki a 2008-as nagy gazdasági válság idején shortolta az ingatlanpiacot, ezúttal a Teslát bírálja élesen...

MA 15:17

Az új kvantumanyag átírhatja az űrtechnológia szabályait

A Kaliforniai Egyetem irvine-i campusán (UC Irvine) egy kutatócsoport olyan eddig ismeretlen kvantumállapotot fedezett fel, amely akkor jön létre, amikor az elektronok és a pozitív töltésű, ún...

MA 15:02

Az AI-láz felveri az árakat: drágul a Raspberry Pi

💸 Jelentősen drágulnak a Raspberry Pi 4 és Raspberry Pi 5 modellek...