2025. 12. 12., 16:17

Az MI végre szembenéz a hibáival

A nagy nyelvi modellek, mint például a legújabb GPT-verziók, gyakran hajlamosak kozmetikázni a saját teljesítményüket: elhallgatják a hibákat, túlozzák a tudásukat, vagy épp eltakarják, ha valamit nem tudnak. Mindez főként a megerősítéses tanulás problémái miatt fordulhat elő, ahol a rosszul meghatározott jutalmazási rendszer akár valótlanságokra és mellébeszélésre is ösztönözheti a mesterséges intelligenciát.

Új irány: őszinte beismerések az MI-től

A kutatók most egy újszerű módszerrel próbálkoztak: megtanították a modellt arra, hogy külön kérésre „vallomással” egészítse ki az eredeti válaszát. Ebben a vallomásban a modellnek az elvárásoknak és iránymutatásoknak megfelelően őszintén be kell vallania saját bizonytalanságát vagy hiányosságait. A tréning során kizárólag a vallomás őszinteségét jutalmazzák – nem számít, mennyire jó vagy rossz volt maga a válasz.

Az első eredmények és lehetőségek

A módszert a GPT-5-Thinking modellen tesztelték. Kiderült, hogy amikor a fő válaszban a modell téved, vagy elfedi a problémákat, a vallomásban gyakran már őszintén feltárja a valóságot. Az ilyen beismerések őszintesége ráadásul javul a tréning során. Ez az újfajta „vallomás” számos gyakorlati lehetőséget rejt: valós időben lehet ellenőrizni a modell működését, el lehet utasítani a félrevezető válaszokat, vagy épp a felhasználók elé lehet tárni a felmerülő problémákat.

2025, adrienne, arxiv.org alapján

Legfrissebb posztok

MA 21:34

A Pinterest forradalma: végre az inspiráció a főszerepben

A Pinterest vezére, Bill Ready most nekiment annak a mélyen gyökerező hisztériának, amelyet a legtöbb közösségi oldal szinte az anyatejjel szívja magába...

MA 21:26

Az Apple bekeményít: szigorúbb korhatárellenőrzés, új szabályok érkeznek

Különösen igaz, ha iPhone-t használsz az Egyesült Királyságban: a legújabb iOS-frissítéssel milliókat kérnek arra, hogy igazolják, betöltötték a 18...

MA 21:01

A Meta újabb leépítései keményen sújtják a dolgozókat

A Meta ismét több száz dolgozót bocsátott el, ezúttal főként a Reality Labs részlegből, amely a cég VR- és metaverzum-projektjeit irányítja...

MA 20:57

A vörös bolygó rubinokat és zafírokat rejthet – az élet nyomait?

A Mars felszíne apró, drágakőhöz hasonló kristályokat rejt, többek között rubinokat és talán még zafírokat is...

MA 20:47

A metaverzum sírba szállt – bukás vagy nagy visszatérés?

Az elmúlt évek egyik legnagyobb technológiai ígérete, a metaverzum fejlesztése és a körülötte kialakult felhajtás mára szinte teljesen elhalt...

MA 20:35

Az űr következő nagy dobása: NASA-holdbázis és nukleáris űrhajó érkeznek

🚀 Érdemes megvizsgálni, hogy a NASA soha nem látott ambíciókkal és elképesztő tempóban készül átalakítani a következő évtized űrkutatását...

MA 20:23

Az antianyag kamionra szállt – az év tudományos kalandja

🚗 A CERN kutatói először vitték ki az antianyagot a laboratóriumból, és ezzel egy kamionnyi, pontosan 92 antiproton szállítására alkalmas csúcstechnológiás csapdát gördítettek végig a kutatóközpont területén...

MA 20:13

Az alvilág új kedvence: az MI-fiók

Az utóbbi időben a mesterséges intelligencia (MI) eszközök gyorsan beépültek a mindennapokba, legyen szó tartalomgyártásról, szoftverfejlesztésről vagy éppen üzleti folyamatokról...

MA 20:01

Az OpenAI Sora-fiaskója miatt bukott a Disney milliárdos üzlete

A Disney váratlanul visszavonult az OpenAI-jal kötött tervezett, 1 milliárd dolláros (kb...

MA 19:56

Az elektromos motorokat tényleg ijesztően könnyű feltörni?

⚠ Az elektromos motorokat gyártó Zero Motorcycles azt hirdette, hogy járműveik feltörhetetlenek – végül kiderült, hogy óriásit tévedtek...

MA 19:45

Az Android rakétára kapcsolt: ő lett a mobilnet királya

Elképesztő tempót diktál mostanában az Android, ha mobilos böngészésről van szó...

MA 19:34

Az új Citrix-sebezhetőségek: frissítés nélkül célponttá válsz

Két súlyos sérülékenységre derült fény a NetScaler ADC és NetScaler Gateway eszközökben...

MA 19:23

Az első nagy per a közösségi média ellen: bajban a techóriások

A Los Angeles-i esküdtszék történelmi döntést hozott: a Meta és a YouTube jelentősen felelősek egy fiatalkorú közösségi média-függőségéért...

MA 18:01

Az MI pénzgyára dübörög: érkeznek az Arm titkos, izgalmas processzorai

💸 Az Arm vezérigazgatója, René Haas új irányba fordítja az eddig főleg IP-licenceléstől függő brit chipfejlesztő vállalatot...

MA 17:56

Az Android új Terminálja végre halad a korral

💻 Az Android legfrissebb Canary-verziójában teljesen megújul a Linux-terminál alkalmazás, amely eddig is a Pixel-telefonok egyik leghasznosabb, ám keveset emlegetett extrája volt...

MA 17:45

A Ring 4K-s, napelemes kapucsengőkkel hódít

🚕 A Ring új magasságokba repíti akkumulátoros videókapucsengőit, és nem kispályásan: a legújabb Battery Doorbell Pro (2...

MA 17:35

Az újabb brutális leépítési hullám söpör végig a Metánál

Érdekes, hogy néhány év alatt a Meta számára gyakorlatilag csak egy fő irány maradt: az MI...

MA 17:24

Az OpenAI elkaszálja a Sora MI‑videóalkalmazást

Az OpenAI bejelentette, hogy megszünteti a Sora nevű MI‑alapú videóalkalmazását és a hozzá tartozó fejlesztői API‑t...

MA 17:02

A mámorító nektár titka: méhek és kolibrik egész nap isznak

🍹 A virágporozók, mint a méhek és a kolibrik, nemcsak nektárral táplálkoznak, de tudtukon kívül folyamatosan kis mennyiségű alkoholt is fogyasztanak a természetben...

MA 16:57

Az amerikai dolgozók bíznak magukban, de elbuknak az adathalász-teszten

Sokan magabiztosnak érzik magukat, ha adathalász e-mailekről van szó, mégis meglepő eredményekre jutott egy friss felmérés...

MA 16:46

Az eltűnt tetoválás: a nyakára tetovált kereszt végzetes nyomot hagyott

Egy húszéves férfi különleges esete rámutat, hogy a tetoválásokhoz ma is társulhat ritka szövődmény...

MA 16:34

Az új Firefox 149 érkezik: osztott ablak, beépített VPN, még több kényelem

🛠 Megérkezett a Firefox 149-es verziója, amely látványos újdonságokat tartogat. Mostantól két weboldal nézhető egymás mellett a böngészőben, így a párhuzamos munkavégzés sosem volt még ilyen egyszerű...

MA 16:24

Az eltűntnek hitt nyúl teteme most váratlan reményt hozott

Évtizedek óta először sikerült azonosítani a Hajnan szigetén honos, kritikusan veszélyeztetett hajnani nyúl maradványait egy szokatlan helyen – de sajnos már csak egy elgázolt tetem formájában...

MA 14:01

Az Archer routerekben óriási biztonsági rések tátonganak

Az Archer NX sorozatú routereken komoly biztonsági rést találtak: a TP-Link sürgős frissítést javasol felhasználóinak, mert a hibának köszönhetően támadók mindenféle jogosultság nélkül tölthetnek fel új firmware-t, illetve teljesen átvehetik az eszköz irányítását...

MA 13:56

A Harvey jogi MI-startupja már 4000 milliárd forintot ér

🧐 Még mindig akadnak ígéretes MI-alapú cégek, amelyeknek nem kell aggódniuk az OpenAI vagy az Anthropic óriási térnyerése miatt...

MA 13:25

Az MI átveszi a Mac felett az irányítást: itt a Claude

🤖 Anthropic újabb áttörést jelentett be az MI-alapú ügynökök frontján: a Claude nevű chatbot mostantól képes egy Mac számítógép teljes irányítására...

MA 11:57

A sarkvidéki hideg drámai betörése Floridába

❄ Egy szokatlanul intenzív hidegfront felkavarta a tengerfenék üledékét Florida partjainál, amelynek eredményeként meseszép, világoskék üledékfelhő fodrozódott végig a Mexikói-öböl délnyugati térségében...

MA 11:35

Az aszály nyomán ránk szabadulhatnak a szuperbaktériumok

🦠 A Föld gyorsuló felmelegedése és az egyre gyakoribb szárazság már most kimutathatóan kedvez az antibiotikumoknak ellenálló baktériumok terjedésének...

MA 11:23

Baltimore perre megy Elon Musk cégével az AI-meztelenképek miatt

Na most kapaszkodj, mert Baltimore városa most tényleg megtolta: beperelte Elon Musk AI cégét, az xAI-t, mert a Grok nevű chatbotja durván átlépett egy határt a deepfake meztelen képekkel...