2025. 03. 03., 11:30

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek

Kódhallucinációk az MI-ben? Valójában ezek a legkevésbé veszélyesek
Meglepően gyakori panasz azoktól a fejlesztőktől, akik már kipróbálták a nyelvi modelleket (LLM) kódírásra, hogy hallucinációkba ütköztek – általában olyan funkciókat vagy akár teljes szoftverkönyvtárakat talál ki a modell, amelyek nem léteznek – és ez azonnal lerombolta a bizalmukat az LLM-ekben mint kódírási eszközökben. Hogyan használhatná bárki is hatékonyan ezeket az eszközöket, ha olyan funkciókat találnak ki, amelyek nem léteznek? A kódban előforduló hallucinációk valójában a legkevésbé káros hallucinációk, amelyekkel egy modellnél találkozhatsz.

A valódi veszély máshol rejlik

Az LLM-ek kódírásra való használatának igazi kockázata az, hogy olyan hibákat követhetnek el, amelyeket nem azonnal észlel a nyelvi fordító vagy értelmező. És ezek folyamatosan előfordulnak!

Abban a pillanatban, amikor futtatod az LLM által generált kódot, bármilyen hallucinált metódus azonnal nyilvánvalóvá válik: hibaüzenetet kapsz. Ezt magad is kijavíthatod, vagy visszatáplálhatod a hibaüzenetet az LLM-be, és figyelheted, ahogy korrigálja önmagát.

Hasonlítsd ezt össze a hagyományos prózában előforduló hallucinációkkal, ahol kritikus szemre, erős intuícióra és jól fejlett tényellenőrzési készségekre van szükséged, hogy elkerüld a helytelen és a hírnevedre közvetlenül káros információk megosztását.

Ingyenes tényellenőrzés a kódban

A kóddal ingyenesen kapsz egy hatékony tényellenőrzési formát. Csak futtasd a kódot, és nézd meg, működik-e. A hallucinált funkciók olyan apró akadályok, hogy amikor az emberek panaszkodnak rájuk, feltételezhető, minimális időt töltöttek azzal, hogy megtanulják, hogyan használják hatékonyan ezeket a rendszereket – az első akadálynál feladták.

Miért utasítják el egyesek az MI-t ilyen gyorsan?

Kissé Cinikusan azt is mondhatnánk, hogy talán csak egy okot kerestek a technológia elutasítására, és az elsőnél lecsaptak rá.

Esetleg senki sem figyelmeztette őket, hogy sok munkát kell befektetni ahhoz, hogy megtanulják, hogyan érhetnek el jó eredményeket ezekkel a rendszerekkel.


A kézi tesztelés nélkülözhetetlen

Csak mert a kód jónak tűnik és hiba nélkül fut, még nem jelenti azt, hogy valóban a megfelelő dolgot csinálja. Semmilyen alapos kódfelülvizsgálat – vagy akár átfogó automatizált tesztek – sem bizonyítják meggyőzően, hogy a kód valóban a helyes dolgot teszi. Magadnak kell futtatnod! Annak bizonyítása, hogy a kód működik, a te feladatod.

Az LLM-kód általában fantasztikusan néz ki: jó változónevek, meggyőző megjegyzések, világos típusannotációk és logikus struktúra. Ez hamis biztonságérzetbe ringathat, ugyanúgy, ahogy egy nyelvtanilag helyes és magabiztos válasz a ChatGPT-től arra csábíthat, hogy kihagyd a tényellenőrzést vagy a szkeptikus szemlélet alkalmazását.

Hogyan kerüljük el a csapdákat?

A problémák elkerülésének módja ugyanaz, mint ahogy elkerülöd a problémákat más emberek által írt kódban, amelyet felülvizsgálsz, vagy a saját kódodban: aktívan tesztelned kell azt a kódot. Kiváló manuális minőségellenőrzési készségekkel kell rendelkezned.

A programozás általános szabálya, hogy soha ne bízz egyetlen kódrészletben sem, amíg nem láttad saját szemeddel működni – vagy, ami még jobb, nem láttad hibázni, majd kijavítottad.

Tippek a hallucinációk csökkentésére

Ha valóban hallucinált részletek áradatát tapasztalod az LLM-ek által neked készített kódban, számos dolgot tehetsz ellene.

Próbálj ki különböző modelleket. Lehet, hogy egy másik modellnek jobb a tanítási adathalmaza a választott platformodhoz. Jelenlegi a gondolkodás funkcióval ellátott Claude 3.7 Sonnet, az OpenAI o3-mini-high és a GPT-4o Code Interpreter a közönség kedvencek.

Tanuld meg, hogyan használd a kontextust. Ha egy LLM nem ismer egy adott könyvtárat, gyakran orvosolhatod ezt néhány tucat sornyi példakód beillesztésével. Az LLM-ek hihetetlenül jók az utánzásban és a minták gyors felismerésében nagyon korlátozott példák alapján. A modern modellek egyre nagyobb kontextusablakokkal rendelkeznek – a Claude új funkciója, hogy teljes repókat enged betölteni.

 

 

  • Te hogy kezelnéd, ha egy LLM által generált kódban hibát találnál, és mi lenne a következő lépésed?
  • Mit tennél, ha olyan eszközt használnál, ami többször is hallucinált metódusokat generál?


Legfrissebb posztok

MA 12:02

Az óceán közepe sem menedék: műanyag üldözi a halakat

🐠 A Csendes-óceán legtávolabbi, érintetlennek hitt vizei sem tudják már megóvni a halakat a műanyaghulladék terjedésétől...

MA 11:56

Az Artemis II holdküldetés megint késik – a NASA-t sokkolta az ok

Ezek után érthető, hogy a NASA ismét elhalasztja az Artemis II küldetést, amely négy űrhajóst indítana a Hold köré...

MA 11:38

Az MMS „csodaszere”: az ára a súlyos sejtkárosodás

Az úgynevezett Miracle Mineral Solution (MMS) évek óta kering mint univerzális gyógymód rákra, autizmusra és COVID-19-re...

MA 10:57

Az új Google Home-frissítés végre ér valamit?

💡 A Google Home új frissítésének köszönhetően a kamerák legfrissebb felvételei most már sokkal megbízhatóbban lejátszhatók, így a bosszantó “A videó nem érhető el” hibák ritkábban fordulnak majd elő...

MA 10:49

A SpaceX Elon Muskkal az űrbe viszi a mesterséges intelligenciát

Elon Musk egyesíti a SpaceX-et és az xAI-t (amely az X-et is birtokolja), hogy létrehozza a Földön (és azon túl) a legambiciózusabb, egységes innovációs gépezetet...

MA 10:42

A Waymo 5800 milliárd forintot húzott be az önvezető taxi‑világhódításra

A Waymo friss tőkebevonása 5800 milliárd forintot hozott a cég kasszájába, hogy önvezető taxiparkját az USA számos új városába, sőt a világ több pontjára is eljuttassa...

MA 10:17

A Moltbook MI-kultusza: új őrület vagy mesterséges botrány?

🕵 Az elmúlt napokban a Moltbook nevű közösségi oldal hirtelen mindenki figyelmét felkeltette a techvilágban...

MA 10:01

Az új, csirkeméretű dinoszaurusz átírja a dinoszauruszok történetét

Egy apró növényevő dinoszaurusz, a Foskeia pelendonum különös anatómiája alaposan meglepte a kutatókat...

MA 09:49

A mesterséges intelligencia űrutazása: a SpaceX felvásárolta az xAI-t

Elon Musk újra megkeverte a lapokat: a SpaceX bekebelezte saját MI-cégét, az xAI-t, így egy fedél alá kerülnek a rakéták, a műholdas internet, a mesterséges intelligencia és a világelső, szólásszabadságot hirdető közösségi platform...

MA 09:41

Megint drágít a Crunchyroll: az animések pénztárcája bánja

💸 A Crunchyroll ismét árat emel minden előfizetési csomagján – ráadásul a változás minden szintet érint...

MA 09:34

A Galaxy Z TriFold elfogyott – mit jelent ez a Galaxy S26-nak?

Érdekes kérdés, mivel készül a Samsung az okostelefon-piacon: néhány nap alatt teljesen elfogyott a Galaxy Z TriFold, amely minden előjel nélkül, csekély hírveréssel került forgalomba, és meglepően magas, 1 070 000 forint körüli áron talált gazdára...

MA 09:25

A bitcoin visszavág: új kriptohullám a hétvégi zuhanás után

Az elmúlt napokban a bitcoin árfolyama hatalmas hullámvasútra ült, miután hétvégén 74 000 dollár (kb...

MA 09:10

Az űridőjárás tombol: brutális napkitörések közelegnek

🌌 Az elmúlt 24 órában a Nap 4366-os aktív foltja elképesztő, 27 napkitörést produkált, ráadásul ezek között volt az utóbbi évek legerősebb kitörése is...

MA 09:01

Az új szabály véget vet Kínában a rejtett kilincsek korszakának

Kína hamarosan betiltja az elektromos autókon az elrejtett ajtókilincseket, miután több tragikus baleset nyomán világszerte megkérdőjelezték ezt a megoldást, amelyet a Tesla tett elterjedtté...

MA 08:49

Az évszázad legnagyobb napkitörése – tanúi lehettünk

Vasárnap a Nap hatalmas kitörésekkel lepte meg a Földet: az elmúlt harminc év egyik legerősebb napkitörése beragyogta a világűr sötétjét...

MA 08:41

Az MI memóriáját forradalmasítja a SoftBank–Intel szövetség

💻 A SoftBank leányvállalata, a Saimemory és az Intel közös fejlesztésbe kezd, hogy megalkossa a következő generációs MI-hez és nagyteljesítményű számítástechnikához készült memóriatechnológiát...

MA 08:33

A kínai hatóságok betiltják az eltűnő autókilincseket

A kínai hatóságok betiltották a rejtett, karosszériába süllyesztett autókilincseket, amelyek az utóbbi években egyre népszerűbbé váltak az autógyártók körében, főként aerodinamikai és dizájn okokból...

MA 08:17

Végre kikapcsolhatod az MI-t a Firefoxban

A Firefox új frissítése végre lehetőséget ad a felhasználóknak arra, amire már régóta várnak: teljesen kikapcsolhatóvá vált minden MI-funkció...

MA 08:01

A Google Telefon új trükkje, amire senki sem várt

📱 Az okostelefonok szoftverei folyamatosan frissülnek, ezért néha nehéz követni, mikor és miért változik meg egy-egy alkalmazás kinézete vagy működése...

MA 07:57

Az ólom sötét öröksége: tisztábbak vagyunk, de még nincs vége

🔫 Az emberi haj többet mesél rólunk, mint hinnénk: egy évszázadon át gyűjtött hajtincsek alapján utahi kutatók most lenyűgöző eredményre jutottak...

MA 07:50

A Notepad++ frissítéseivel kémkedett Kína?

🕵 A népszerű Notepad++ szöveg- és kódszerkesztő felhasználói hónapokon át veszélyben voltak, miután a szoftver frissítéseit terjesztő szervereket tavaly feltörték...

MA 07:42

A Waymo 5,7 billió forintos dobása: jönnek a robottaxik világszerte

🚗 A Waymo, az Alphabet önvezető autós cége újabb óriási befektetést kapott: 5,7 billió forint (16 milliárd USD) tőkét vont be, amellyel globálisan, több mint egy tucat új városban – köztük Tokióban és Londonban – terjeszti ki sofőr nélküli taxiszolgáltatását még az idén...

MA 07:34

A mesterséges intelligencia közösségi hálója kiteregette a felhasználói adatokat

A Moltbook nevű közösségi oldal azzal büszkélkedik, hogy MI-ügynököknek kínál közösségi teret – azonban most kiderült, hogy több ezer emberi felhasználó adatait tette nyilvánossá egy hiányos biztonsági védelem miatt...

MA 07:25

Az újabb Windows-frissítési baki még több gépet dönt romba

Januári Windows-frissítés után egyre több felhasználó szembesül azzal a bosszantó hibával, hogy számítógépe nem képes leállni vagy hibernálni, hanem újraindul...

MA 07:17

Jön az iPhone Fold brutál akkuval és új gombokkal

Az Apple első hajlítható iPhone-járól újabb részletek szivárogtak ki: a készülék a valaha volt legnagyobb, 5500 mAh-s akkumulátort kaphatja meg...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/3

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:09

Az Apple nagy dobása: érkezik a kagylóhéj‑iPhone?

Úgy tűnik, hamarosan véget ér a klasszikus, lapos okostelefonok időszaka. Egyre erősebbek a pletykák arról, hogy az Apple 2026 végén dobhatja piacra első összecsukható telefonját, ráadásul dolgozik egy kagylóhéj-formájú, vagyis flip kivitelű modellen is...

MA 07:01

Az új GlassWorm-támadás már a Maceket is fenyegeti

Egy veszélyes, GlassWorm nevű kártevő új módszert talált arra, hogy macOS-rendszereken fejlesztők jelszavait, kriptotárca-adatait és bizalmas információit lopja el...

MA 06:57

Az új Starlink Wi‑Fi a felhők fölé emeli az otthoni netet

Elképesztő, hogy ma már nemcsak a földön, de a magasban is élvezhetjük a stabil, gyors internetet: a Starlink műholdas Wi-Fi már a United Airlines járatain is úgy működik, mintha csak otthon lennél...