Az MI egyre többet képzelődik – és ez baj?

Az MI egyre többet képzelődik – és ez baj?
Az MI fejlődésével egyre gyakrabban fordul elő, hogy hamis vagy hibás információkat közöl. Az OpenAI legújabb, legerősebb modelljei, az o3 és az o4-mini a PersonQA-teszten 33%-ban, illetve 48%-ban hallucináltak – ez több mint kétszerese a korábbi o1 típus hibaarányának. Az új generáció valóban jobb válaszokat tud adni, de ezzel párhuzamosan nőtt a tévedések száma is. Ennek következtében egyre nagyobb kérdés, hogy mennyire bízhatunk meg a nagy nyelvi MI-chatbotokban, alkalmazásokban és az általuk szolgáltatott tartalmakban. Ha egy rendszer ugyanolyan meggyőzően ad elő kitalációkat, hamis tényeket, idézeteket vagy eseményeket, mint a valódi adatokat, könnyen félrevezetheti a felhasználókat. Ez különösen akkor probléma, ha ellenőrzés nélkül hagyatkozunk ezekre az információkra.

Az MI-nek muszáj kreatívnak lennie

A fejlett MI-modellek lényege, hogy bonyolult feladatokat is képesek megoldani: szétbontják azokat kisebb részekre, majd ezekre kidolgoznak megoldásokat. Nem csupán valószínűségi alapon megtanult válaszokat adnak vissza, hanem saját stratégiákat dolgoznak ki, hasonlóan az emberi gondolkodáshoz.

Egy igazán kreatív, új ötlet vagy megoldás azonban elképzeli, vagyis lényegében „hallucinálja” is a válaszokat – e nélkül az MI csak a betanult adatbázis szigorú határain belül mozogna. Egy MI-kutató úgy fogalmazza meg: minden egyes LLM által generált válasz hallucináció, a különbség csupán annyi, hogy némelyik eltalálja a valóságot.

Ha csak azt tudná visszaadni, ami már volt, soha nem írna például dalszöveget egy olyan konceptalbumhoz, amely az MI-szingularitásról szól Snoop Dogg és Bob Dylan stílusában. Az imagináció, az ötletelés „emberi módja” így alapfeltétele az MI kreativitásának is.

Amikor már nem elég jó a fantázia

A gond akkor kezdődik, amikor a kitalált, téves információkat is ugyanolyan magabiztosan közli az MI, mint a valós adatokat, és a felhasználók ezt ellenőrzés nélkül elfogadják. Ez főleg olyan területeken életveszélyes, ahol a pontosság kulcsfontosságú, például az orvostudományban, a jogban vagy a pénzügyekben. Ezeknél a modelleknél nemcsak kevésbé nyilvánvaló hibákkal, hanem sokkal rafináltabb, nehezebben felismerhető tévedésekkel is találkozunk. Az MI egyre inkább beépíti a hibás információkat logikusnak tűnő érvelésekbe és történetekbe, így azok szinte „észrevétlenül” válnak meggyőzővé.

Ráadásul egyelőre azt sem tudjuk pontosan, hogyan születnek ezek a válaszok a modellekben – az MI működése továbbra is rejtély, akárcsak az emberi agy logikája. Például, amikor egy MI pénzügyi dokumentumot foglal össze, valójában fogalmunk sincs, miért dönt egyik vagy másik szó vagy információ mellett – vagy hogy miért hibázik.

Nem csoda, hogy a cégek ügyfélszolgálati chatbotjai rendszeresen találnak ki sosem létezett szabályzatokat, vagy hivatkoznak fiktív forrásokra.

Lehet egyáltalán kevesebb „álomvilágot” elérni?

A legtöbb szakértő szerint ezek a fantáziálások teljesen soha nem szoríthatók ki az MI-ből, de mérsékelni lehet őket. Az egyik leghatékonyabb módszer az úgynevezett „retrieval-augmented generation”, amikor a modell válaszait ellenőrzött, külső adatbázisokhoz kötjük. Így az MI a válaszadás előtt utánanéz a valós tényeknek.

Emellett segít, ha a modelleket önellenőrzésre ösztönözzük: például arra kérjük, hogy hasonlítsa össze több nézőpontot, vagy lépésről lépésre vezesse le a válaszát. Az emberi vagy MI-értékelők visszacsatolása, a „bízd a szakértőre” szemlélet, valamint az önbizalom szintjének jelzése (például, ha nem tud valamit, inkább ne válaszoljon biztosan) mind csökkentik a hibaarányt.

Mivel azonban a kreativitás és a hallucináció kéz a kézben járnak, örökre csak mérsékelni tudjuk majd az MI félrevezető válaszait. Ezeket a válaszokat továbbra is ugyanolyan szkepszissel kell kezelnünk, ahogyan egy ismeretlen ember állításait is – ebben hasonlít egymásra a kétféle gondolkodás.

2025, adminboss, www.livescience.com alapján

  • Te mit éreznél, ha egy MI által adott válasz tényleg félrevezetne valakit?
  • Te hogyan ellenőriznéd az MI által generált információkat?
  • Te szerinted meddig lehet engedni, hogy egy MI kreatív legyen, ha az néha tévedésekkel jár?



Legfrissebb posztok

A Cisco tűzfalnyi bajban: kritikus sérülékenységre figyelmeztet

MA 16:01

A Cisco tűzfalnyi bajban: kritikus sérülékenységre figyelmeztet

⚠ A Cisco komoly, legmagasabb súlyosságú sebezhetőséget azonosított a Secure Firewall Management Center (FMC) szoftverük RADIUS alrendszerében, amely számos nagyvállalatnál és az állami szférában is elterjedt a hálózati eszközök...

Az Everest szemetét is elintézik a drónok

MA 15:51

Az Everest szemetét is elintézik a drónok

Idén tavasszal egy nepáli, mesterséges intelligencia-technológiával dolgozó csapat is érkezett hegymászókkal az Everest alaptáborába: két erős, DJI FC 30 típusú drónnal takarították a világ legmagasabb szemétlerakójává vált hegyet....

Az Apple újabb titoklopási botrányba keveredett: most az Oppo a főszereplő

MA 15:26

Az Apple újabb titoklopási botrányba keveredett: most az Oppo a főszereplő

Egy volt Apple-alkalmazott, Chen Shi, aki 2020 januárjától 2025 júniusáig dolgozott a cég Apple Watch csapatában szenzorrendszer-építészként, azzal gyanúsítható, hogy üzleti titkokat lopott el és adott tovább az...

Egy egyszerű módszer, amivel később lesz szükség térdprotézisre

MA 15:02

Egy egyszerű módszer, amivel később lesz szükség térdprotézisre

Külön figyelmet érdemel, hogy egy friss kutatás szerint már egy apró változtatás a járásunkban jelentősen csökkentheti a térdízületi porckopás okozta fájdalmat, ráadásul gyógyszerek mellékhatásai nélkül. Egyszerűen a talpunk...

Az MI-nek semmi keresnivalója a naplóírásban

MA 14:26

Az MI-nek semmi keresnivalója a naplóírásban

📝 A naplóírás varázsa éppen abban rejlik, hogy a fehér lap előtt ülve őszintén találkozol önmagaddal. A digitális naplóalkalmazások fejlődésével azonban egyre több MI-alapú megoldás próbálja megkönnyíteni ezt a...

Meglepően stabil marad az agy testtérképe amputáció után is

MA 14:01

Meglepően stabil marad az agy testtérképe amputáció után is

💪 Nem hagyható figyelmen kívül, hogy új kutatások szerint az agy testtérképe, amely a tapintás és más érzékelések feldolgozásáért felelős elsődleges szomatoszenzoros kéregben található, jóval stabilabb, mint eddig gondoltuk....

Az űrrakéta, amit a SpaceX sem képes megépíteni

MA 13:53

Az űrrakéta, amit a SpaceX sem képes megépíteni

A SpaceX texasi Starbase gyára elképesztő méreteivel és fejlett technológiájával minden eddigi rakétaépítő üzem fölé magasodik. A cél: évente 365 Starship űrhajót gyártani, amivel a vállalat gyakorlatilag naponta...

Tényleg az adatainkra vadászik a mesterséges intelligencia, vagy csak unatkozik?

MA 13:27

Tényleg az adatainkra vadászik a mesterséges intelligencia, vagy csak unatkozik?

🕵 A kvantumszámítógépek fejlődése korszakváltást hoz az adatbiztonságban, amely ellen a jelenlegi titkosítási technológiák egyre kevésbé nyújtanak védelmet. Nem hagyható figyelmen kívül, hogy az új eszközök elképesztő számítási képességeikkel...

A kicsi méhek agya segíthet okosabbá tenni a mesterséges intelligenciát

MA 13:01

A kicsi méhek agya segíthet okosabbá tenni a mesterséges intelligenciát

A kutatók egy digitális méhagy-modell segítségével olyan felfedezést tettek, amely átírhatja, ahogyan a jövő mesterséges intelligenciáját (MI) fejlesztjük. Kiderült, hogy a méhek repülés közbeni mozdulatai nemcsak a látott...