Az MI agyába láttak bele a kutatók: így gondolkodik valójában Claude

Az MI agyába láttak bele a kutatók: így gondolkodik valójában Claude

Az Anthropic kutatói kidolgoztak egy áttörő “keresztrétegű átkódolót” (CLT), amely az agyi MRI-hez hasonlóan működik a nagy nyelvi modellek esetében. A Claude 3.5 Haiku modellen végzett tesztelés során a kutatók felfedezték, hogy a modell hosszabb távú tervezést végez bizonyos feladatokhoz — például előbb kiválasztja a rímelő szavakat, mielőtt összeállítaná a verssorokat —, és a többnyelvű fogalmakat egy közös neurális térben dolgozza fel, mielőtt az eredményeket specifikus nyelvekre konvertálná.

Kiderült, hogy szándékosan hazudnak

A csapat azt is megerősítette, hogy a nagy nyelvi modellek képesek hamis érvelési láncokat gyártani, akár azért, hogy helytelen útmutatással örömet szerezzenek a felhasználóknak, akár hogy indokolják az azonnal levezetett, valószínűleg elhamarkodott válaszaikat. A CLT értelmezhető jellemzőhalmazokat azonosít egyedi neuronok helyett, lehetővé téve a kutatóknak, hogy nyomon kövessék a teljes érvelési folyamatokat a hálózati rétegeken keresztül.

2025, adrienne, slashdot.org alapján

Legfrissebb posztok

MA 06:44

Az Apple a Google erejével mentené meg Sirit

Az Apple és a Google többéves együttműködést kötött, hogy felturbózza Siri mesterséges intelligenciáját...

MA 06:37

A MI titkára: a Claude Cowork minden ajtón kopogtat

Az Anthropic egy újabb lépéssel hozza közelebb az MI-t a hétköznapi emberekhez: a Claude Cowork mostantól nemcsak programozóknak szól, hanem bárki használhatja számítógépes feladatok automatizálására...

MA 06:29

Az OpenAI bekebelezi a Torch egészségügyi startupot

Az OpenAI felvásárolta a mindössze négyfős Torch egészségügyi startupot, méghozzá nem kevesebb mint 36 milliárd forint értékű részvénycsomagért...

MA 06:23

A mesterséges intelligencia mostantól megfejti az orvosi leleteidet

Érdemes megérteni, hogy az Anthropic új, Claude for Healthcare nevű MI-asszisztense mostantól a saját egészségügyi csapatod része lehet: segít jobban átlátni az orvosi információidat, és az orvosod számára is egyszerűbbé teszi az adminisztrációs feladatokat...

MA 06:15

Az új elektronikus orr előre jelzi, hol üt be a penész

🤮 A penész szinte mindenhol jelen van, de amikor elszaporodik, komoly egészségügyi problémákat okozhat embereknél és állatoknál egyaránt...

MA 06:09

Az amerikai kriptoháború elérte a fordulópontját?

💸 Kritikus hét előtt áll az amerikai kriptopiac: a Szenátus most szavazhat olyan jogszabályokról, amelyek pontot tehetnek az évek óta lebegő bizonytalanság végére a kriptopiac szabályozása körül, és a nagy pénzintézmények is beléphetnek a piacra...

MA 06:06

Történelmi események a mai napon (Január 13.)

Viharos felkelés Konstantinápolyban, az új görög zászló születése és Ausztrália egyik legsúlyosabb bozóttüze: ezen a napon sokszor fordult nagyot a történelem kereke...

MA 06:02

Az Amazon titokban leváltja Alexát a Prime-előfizetőknél

💬 Az Amazon az elmúlt hetekben automatikusan Alexa Plusra frissíti a Prime-előfizetők eszközein futó Alexát...

hétfő 20:50

Az MI váratlan szövetséges az igazságosabb munkahelyekért

Bár az MI körül nagy a lelkesedés, sokan még mindig szkeptikusak maradnak két fő ok miatt: az automatizálás elveszi a munkát, vagy épp felerősíti az emberek előítéleteit...

hétfő 20:34

Az Amazon-alapító: Nem ciki, ha a munka az első

💼 Jeff Bezos nemcsak a világ leggazdagabb emberei közé tartozik, hanem amellett is kiáll, hogy a sikerhez nem elég fiatalon vállalkozást indítani – tudás és tapasztalat nélkül több a bukás, mint a jó ötlet...

hétfő 20:17

Az Endesa ügyfeleinek adatai a hackerek prédájává váltak

Spanyolország legnagyobb energiaszolgáltatója, az Endesa, valamint leányvállalata, az Energía XXI most jelentették be, hogy hackertámadás érte informatikai rendszereiket – az elkövetők személyes és szerződéses ügyféladatokhoz jutottak hozzá...

hétfő 20:01

Az indiai kormány újra drákói korlátozásokat tervez az okostelefonokra

📱 India szigorú, okostelefonokra vonatkozó biztonsági szabályokat tervez, amelyek köteleznék a gyártókat, hogy a sebezhetőségek elemzése érdekében hozzáférést biztosítsanak forráskódjukhoz a kormány számára...

hétfő 19:49

Az Apple átvette a trónt: a legnagyobb mobilgyártó a világon

2025 végére az Apple megelőzte a Samsungot, és a világ legnagyobb okostelefon-gyártójává vált az eladott készülékek száma alapján...

hétfő 19:33

Az Apple Sirije új agyat kap: jön a Google Gemini

💡 Az Apple és a Google hivatalosan bejelentették, hogy a következő Siri-verzió már a Gemini MI-t és a Google Cloudot fogja használni...

hétfő 19:18

Az új kristály átírja a mágnesességet: forradalom az adattárolásban?

📸 A Florida State University kutatói olyan kristályos anyagot alkottak, amely eddig nem látott, bonyolult mágneses viselkedést mutat...

hétfő 19:01

Az elfeledett gombatörténelem: a csiperkegomba születésének titka

🍄 A csiperkegomba (Agaricus bisporus) világviszonylatban az egyik legkedveltebb és legtöbbet termesztett ehető gombaféle, mégis mostanáig keveset tudtunk arról, hogyan vált ilyenné...

hétfő 18:49

A Roblox új szabálya megtiltja a gyerek–felnőtt csevegést

🔒 A Roblox az Egyesült Államokban új, kötelező biztonsági rendszert vezetett be, hogy megakadályozza a gyerekek és felnőttek közötti kommunikációt a platformján...

hétfő 18:33

Az Apple Siri mostantól a Google Gemini erejét használja

Az Apple és a Google többéves együttműködést kötött, amelynek részeként az Apple következő generációs MI-modelljei a Google Gemini technológiájára és felhőszolgáltatásaira fognak épülni...

hétfő 18:02

Az amerikai szankciók befagyasztották a 66 milliárd forintnyi USDT-t

🔒 Tether eddig példátlan összeget, több mint 182 millió dollárnyi (kb. 66 milliárd forint) USDT-t fagyasztott be öt Tron-blokkláncú tárcában, miután igazodott az amerikai pénzügyminisztérium szankciós előírásaihoz...