MA 08:08

Az MI rengeteg tudományos bakit ejt – több mint hinnéd

Az MI rengeteg tudományos bakit ejt – több mint hinnéd
Érdemes megvizsgálni, mennyire megbízható valójában egy olyan népszerű MI, mint a ChatGPT, ha tudományos állításokról van szó. Mesut Cicek, a Washingtoni Állami Egyetem professzora 700 tudományos hipotézissel tesztelte az MI-t, amelyek mind aktuális kutatásokból származtak. A kutatás során tízszer tették fel ugyanazt a kérdést, hogy felmérjék a válaszok következetességét.

Válaszok pontossága és az MI korlátai

2024-ben a ChatGPT válaszainak pontossága 76,5% volt, egy évvel később ez 80%-ra nőtt. Ugyanakkor, amikor kizárták a véletlenszerű tippelés lehetőségét, a tényleges teljesítmény lényegesen szerényebb lett: az MI csak mintegy 60%-kal szerepelt jobban, mint a puszta találgatás, ami egy gyenge közepesnek felel meg. Az MI leginkább a hamis állítások felismerésével küzdött, mindössze az esetek 16,4%-ában tudta helyesen jelezni, ha egy hipotézis nem volt igaz. Külön probléma volt a következetlenség: tízszeri ismétlésnél is csak az esetek 73%-ában adott egyező választ az MI.

A meggyőző megfogalmazás félrevezet

A tesztek világossá tették, hogy az MI könnyen kelt megbízhatósági látszatot, ám valójában gyakran spekulatív vagy pontatlan válaszokat ad bonyolult, árnyalt tudományos kérdésekre. A háttérben az áll, hogy ezek a rendszerek nem értik a világot, csak nagy mennyiségű adatból generálnak valószerűnek tűnő válaszokat. A kutatók hangsúlyozták, hogy az MI jelenlegi formájában távol áll az emberi gondolkodástól.

A kutatás módszertana

A kísérlet során 719, üzleti tudományos folyóiratokból válogatott hipotézist használtak fel, amelyek sokszor összetett gondolkodást igényelnek. A csapat 2024-ben a ChatGPT-3.5 ingyenes verzióját, 2025-ben pedig a ChatGPT-5 Minit vetette be, de a teljesítmény hasonlóan hullámzó maradt. Még fejlettebb modellekkel is csak minimális javulást tapasztaltak, így egyre nyilvánvalóbb, hogy ezek az MI-rendszerek nem tudnak megbízható módon érvelni bonyolult kérdésekben.


Miért fontos az óvatosság?

A kutatók szerint érdemes minden MI által adott tudományos vagy üzleti információt kétszer ellenőrizni és egészséges kétkedéssel kezelni. Kiemelten fontos, hogy a felhasználók értsék az MI-rendszerek képességeit és korlátait: a jól hangzó, meggyőző mondatok mögött sokszor nincs valódi értelem. Korábbi kutatásokból is látszik, hogy az erőltetett MI-használat inkább bizalmatlanságot kelt a fogyasztókban, ezért különösen nagy a felelősség, ha valaki ezekre a rendszerekre akar építeni.

2026, adminboss, www.sciencedaily.com alapján

Legfrissebb posztok

MA 10:10

Az iráni háború miatt rekordon a benzinárak Amerikában

Miközben az iráni háború felbolygatta a globális olajpiacot, az üzemanyagárak soha nem látott magasságokba emelkedtek Amerikában...

MA 09:57

Az Apple lopakodva telepíti a biztonsági frissítéseket a készülékeidre

🔒 Az Apple beindította a háttérben letöltődő biztonsági javításokat, amelyek olyan észrevétlenül érkeznek, hogy talán észre sem veszed őket – de a telefonod vagy a géped nagyon hálás lesz érte...

MA 09:51

Az iráni blokád a Hormuzi-szoros lezárásával fenyeget

Az elmúlt hetek eseményei szinte megbénították a Hormuzi-szoros forgalmát: ahol korábban naponta több mint 100 tanker haladt át, most viszont február vége óta alig 21 tette meg az utat...

MA 09:44

Az amerikai tőzsde igazi mélypontja még odébb van?

📈 A látszólagos tőzsdei robbanás ellenére a befektetők már hónapok óta gyakorlatilag medvepiacban mozognak...

MA 09:29

Az albérletpiac most neked dolgozik – érkeznek a durva kedvezmények

Szóval végre valami, aminek most tényleg lehet örülni bérlőként: az albérletpiacon közel 12 éve nem látott szintre emelkedtek az extra kedvezmények...

MA 09:23

A Meta leteszi az asztalodra a Manus MI-ügynököt

A Meta frissen felvásárolt MI-startupja, a Manus most egy asztali alkalmazással hozza el saját mesterségesintelligencia-ügynökét közvetlenül a felhasználók számítógépeire...

MA 09:16

Az utolsó tánc: újabb frissítés az FBC: Firebreakhez – de minek?

🔥 Mielőtt bárki eltemetné az FBC: Firebreak-et, fontos tudni, hogy a Remedy kiadta hozzá az utolsó tartalmi frissítést—de cseppet se aggódj, a szerverek még évekig bírni fogják a strapát...

MA 09:11

A Mistral Forge letaszítja trónjukról az MI-szuperszámítógépeket

👑 A francia Mistral AI bemutatta a Forge nevű platformját, amellyel cégek és állami intézmények saját MI-modelleket építhetnek, továbbfejleszthetnek és folyamatosan igazíthatnak a saját adataikhoz szabva – mindezt teljes körű adatvédelem mellett...

MA 09:01

Az XRP-n 5,5 milliárd forint a tét: háború a tőzsdén

💸 Fontos kérdés, hogy mi történik az XRP árfolyamával a következő napokban...

MA 08:57

A nagy Pikachu-leleplezés: Pizzafutár lett a Pokémon GO-ból?

👑 A Pokémon GO valaha csak játék volt, ma már viszont sokkal több: szinte észrevétlenül a városi robotok navigációs segédeszközévé vált...

MA 08:38

Az Nvidia MI-ügynökplatformja tényleg biztonságos?

🔒 Kezdetben az MI-fejlesztések fő fókuszában a képességek és a funkcionalitás állt, de most először jelent meg egy átfogó biztonsági rendszer már a kiadás pillanatában...

MA 08:30

Az MI-engedélyezés könnyen vállalati káoszhoz vezethet

Az MI-alapú ügynökök egyre több vállalatnál végzik el helyettünk az érzékeny feladatokat: CRM-rendszerekbe lépnek be, adatbázisokat olvasnak, e-maileket küldenek...

MA 08:23

A pofonegyszerű trükk, amivel túljárhatsz a ChatGPT eszén

A ChatGPT szinte mindig magabiztos válaszokat ad, bármiről kérdezed is. Olyan határozottsággal érvel, hogy első ránézésre meggyőző lehet – ugyanakkor könnyen elfeledteti, hogy az általa közvetített válasz csupán egy nézőpont, nem pedig az egyetlen érvényes megoldás...

MA 07:57

Az MI szerinte csak nevetséges fenyegetés a Grand Theft Auto VI-ra

A videojáték-ipar épp az MI robbanását éli, sokan attól tartanak, hogy a generatív modellek elveszik majd az emberek munkáját a legnagyobb franchise-okban is...

MA 07:50

Az MI-ügynököknek végre van bizonyítható személyiségük?

Érdemes megvizsgálni, miként lehet az online térben biztosan megkülönböztetni az MI-ügynököket működtető embereket a tömeges, névtelen botoktól...

MA 07:43

Az online csalók rémálma: összefog a Google, a Meta és az Amazon

A netes csalók manapság vérprofi szélhámosokká váltak: ügyesen ugrálnak a közösségi oldalak, üzenetküldő appok, e-mailek és piacterek között, hogy lecsapjanak a legóvatosabb áldozatokra is...

MA 07:36

A Samsung Galaxy Z TriFold pályafutása villámgyorsan véget ért

⚠ Három hónap után eltűnik a boltokból a Samsung úttörő, hárompaneles, hajlítható mobilja, a Galaxy Z TriFold...

MA 07:22

Mostantól a Fitbit az orvosi leleteidet is figyeli

A Google újítása, a Coach funkció 2025 októberében indult az amerikai Fitbit Premium felhasználók számára Androidon, és a vállalat nemrég bejelentette, hogy bővülnek a lehetőségek: most már Kanadában, az Egyesült Királyságban, Ausztráliában, Új-Zélandon és Szingapúrban is elérhetővé vált...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 3/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Learn Hindi (iPhone/iPad)Ez a tananyag lehetővé teszi, hogy hindi nyelven több mint 400 hasznos szót és kifejezést sajátíts el, különféle utazási helyzetekhez igazítva...

MA 07:08

Az aszteroida, amely felrázta Ohiót: tűzgömb hasított az égen

🚀 A kedd reggeli égbolton látványos tűzgömb húzott át az amerikai Közép-Nyugat fölött, és végül Ohio és az Erie-tó környékén csapódott be, helyi idő szerint reggel kilenckor...

MA 07:01

A halak érzik, ha nézed őket – az akvárium sztárjai

🐠 Ki ne érezte volna már azt a bizsergető érzést, amikor valaki árgus szemekkel figyeli?..

MA 06:57

Az Alzheimer elleni új fegyver: most kiderült, hogyan működik valójában

🧠 A világon több mint 55 millió embert sújt az Alzheimer-kór, amelyben az agyban lerakódó mérgező fehérjecsomók, úgynevezett amiloidplakkok pusztítják az idegsejteket, idővel teljes szellemi leépüléshez vezetve...

MA 06:50

Az új MI-hullám leépítési lavinát hozhat a nagy tech cégeknél

Mark Zuckerberg most hatalmas jelentőségű döntés előtt áll, amely alapjaiban változtathatja meg a technológiai ipar működését...

MA 06:43

A Horizon Worlds búcsút int a headseteknek – új korszak jön

👋 A Meta végre leállítja a VR-headsetes Horizon Worldst – 2026. június 15...

MA 06:36

A titokzatos kénbolygó furcsább mindennél, amit eddig láttunk

🌍 Egy új típusú exobolygóra bukkantak csillagászok, amely alapjaiban kérdőjelezi meg, miként osztályozzuk azokat a világokat, amelyek Naprendszerünkön kívül találhatók...

MA 06:22

Az emberarcú cápa: meghökkentő barátságok a tenger mélyén

Első pillantásra úgy tűnt, hogy a bikacápák magányosan róják a tengerek mélyét, de egy friss kutatás átírja ezt a képet...

MA 06:06

Történelmi események a mai napon (Március 18.)

Ma olyan mérföldkövek elevenednek meg, mint az első űrséta 🚀, a berlini márciusi forradalom és a keletnémetek első szabad választása 🗳️...

MA 06:04

Az Nvidia új MI-ügynökei: védőháló vagy időzített bomba?

⚠ Fontos kérdés, hogy a mesterségesintelligencia-fejlesztések hogyan férhetnek bele a vállalati működésbe komoly biztonsági kockázatok nélkül...

kedd 21:57

Az élet építőkövei a Ryugu aszteroidán megbújtak

🚀 Például az emberi örökítőanyag, a DNS és az RNS alkotóelemei nélkülük nem létezhetnének...