Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni
A tudományos újságírás egyik legnagyobb kihívása, hogy a bonyolult kutatási eredményeket közérthetően, mégis pontosan adja át a nagyközönség számára. Bár az utóbbi évek MI-fejlesztései, például a ChatGPT, ígéretes lehetőségeket kínálnak az ilyen összefoglalók készítésében, a valóságban ezek a rendszerek még messze elmaradnak az elvárható szinttől. Az Amerikai Tudományos Fejlesztési Szövetség (AAAS) ezért egy éven át vizsgálta, hogyan teljesít a ChatGPT a Science magazinban gyakran megjelenő tömörített hírszemlék írásában.
Emberi minőség kontra MI-megoldás
A kísérlet során 2023 decembere és 2024 decembere között hetente legfeljebb két, kifejezetten nehéz tudományos közleményt választottak ki, hogy azokat három, különböző részletességű MI-prompt segítségével foglaltassák össze a ChatGPT-vel. Ezek között voltak úttörő felfedezések, vitatott témák, technikai zsargonnal teli írások és embereken végzett kutatások is. A kivonatokat a szokásos, tapasztalt SciPak szerzők értékelték — kvantitatív és kvalitatív módszerekkel is.
Fontos szempont, hogy a mérések szerint az MI-vel készült összefoglalók gyakran feláldozták a pontosságot az egyszerűségért, és számos ténybeli hibát, valamint téves következtetést tartalmaztak. Bár a stílus néha hasonlított a szerkesztőségi írásokéhoz, a tartalom megbízhatósága messze elmaradt a kívánalmaktól. Ezzel szemben az emberi szerzők összefoglalói jóval kiegyensúlyozottabbak és alaposabbak voltak.
Az MI hiányosságai
A kísérlet során összesen 64 szakcikk rövid összefoglalóját hasonlították össze a szerkesztők. A leggyakoribb hibák közé tartozott, hogy a ChatGPT gyakran összekeverte az ok-okozati összefüggéseket a véletlenszerű egybeesésekkel, nem adott elég kontextust, vagy túlértékelte az eredmények jelentőségét — például túl gyakran nevezett valamit világviszonylatban újnak vagy áttörőnek. Ráadásul a tényszerű pontatlanságok javítása ugyanannyi, ha nem több emberi munkát igényelt, mint egy teljesen új összefoglaló megírása.
A pontszámok sem voltak meggyőzőek: átlagosan 2,26-ot és 2,14-et kaptak az 5 pontos skálán, ahol az 1 jelentette a teljesen alkalmatlant, míg az 5 a tökéletességet. Mindössze egy összefoglaló kapott maximális értékelést; ezzel szemben harmincszor is a legutolsó helyre sorolták az MI munkáit.
Összességében kijelenthető, hogy a ChatGPT jelenlegi változatai nem érik el azt a szakmai színvonalat, amelyet akár egy szerkesztett SciPak hírszemlétől elvárnánk. Bár ígéretes segédeszközök lehetnek egyszerűbb feladatokhoz vagy vázlatíráshoz, tényleges szerkesztett tartalom létrehozásához a súlyos tényellenőrzési igény miatt továbbra is nélkülözhetetlen az emberi szakértelem. Az AAAS szakértői szerint csak akkor érdemes újra próbálkozni ezzel, ha a ChatGPT egy jelentős, minőségi frissítésen esik át.
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Terminal Madness – Revelations (iPhone/iPad)A *Terminal Madness: Revelations* egy fizetős sci-fi kalandjáték, amelyben izgalmas történet és komplex logikai feladványok várnak...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben egy kisvárosban élő mutánsok mindennapjaiba nyerhetsz betekintést...
Viharos nap a történelemben: a Holland Kelet-indiai Társaság megszületésétől 🧭 a napóleoni Száz Nap kezdetéig, Einstein relativitáselméletétől 🧠 a modern háborúk fordulópontjaiig...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben a vidéki kisváros hétköznapi pletykái és a természetfeletti események keverednek...
Mi történt ma a történelemben? A Mongol Birodalom győzelmével véget ér a Szung-dinasztia Kínában 🇨🇳, az angol alsóház eltörli a Lordok Házát 🏛️, a náci csapatok megszállják Magyarországot 🇭🇺, és a Tuskegee Airmen egységet hivatalosan aktiválják ✈️...
📦 Az IKEA új, mindenki számára elérhető okos kütyüi végre megérkeztek! A gondolat izgalmas: menő, okos izzók, kapcsolók, dugaljak, mind kezdőáron, már 2400 forinttól...
🛡 Egy új, böngészőkben alkalmazható trükk lehetővé teszi, hogy rosszindulatú parancsokat rejtsenek el közvetlenül a weboldalakon anélkül, hogy azt az MI‑asszisztensek észrevennék...
A Google újraírta a szabályokat: mostantól a Geminiben mindenki számára ingyenesen elérhető az a funkció, amellyel valóban személyre szabott válaszokat adhat...
Jellemző példa erre, hogy napjaink egyik legagresszívebb ellátásilánc-támadása, a GlassWorm ismét lecsapott: több mint 400 fejlesztői csomag, forráskódtár és bővítmény vált fertőzötté olyan platformokon, mint a GitHub, az npm, a Visual Studio Code és az OpenVSX...
🎧 A Spotify most végre bevezette az Exkluzív módot (Exclusive Mode) Windowsra – innentől a szoftver ráteszi a kezét a hangkártyádra, és kiküszöböli, hogy a géped belemotyogjon a zenédbe...
🔒 Az Apple először élesítette a Háttérbiztonsági fejlesztések nevű rendszerét, amellyel anélkül javíthattak egy kritikus WebKit-sebezhetőséget, hogy a teljes operációs rendszert frissíteni kellett volna...
🔒 Az Apple beindította a háttérben letöltődő biztonsági javításokat, amelyek olyan észrevétlenül érkeznek, hogy talán észre sem veszed őket – de a telefonod vagy a géped nagyon hálás lesz érte...
Az elmúlt hetek eseményei szinte megbénították a Hormuzi-szoros forgalmát: ahol korábban naponta több mint 100 tanker haladt át, most viszont február vége óta alig 21 tette meg az utat...
A Meta frissen felvásárolt MI-startupja, a Manus most egy asztali alkalmazással hozza el saját mesterségesintelligencia-ügynökét közvetlenül a felhasználók számítógépeire...
🔥 Mielőtt bárki eltemetné az FBC: Firebreak-et, fontos tudni, hogy a Remedy kiadta hozzá az utolsó tartalmi frissítést—de cseppet se aggódj, a szerverek még évekig bírni fogják a strapát...
👑 A francia Mistral AI bemutatta a Forge nevű platformját, amellyel cégek és állami intézmények saját MI-modelleket építhetnek, továbbfejleszthetnek és folyamatosan igazíthatnak a saját adataikhoz szabva – mindezt teljes körű adatvédelem mellett...
🔒 Kezdetben az MI-fejlesztések fő fókuszában a képességek és a funkcionalitás állt, de most először jelent meg egy átfogó biztonsági rendszer már a kiadás pillanatában...
Az MI-alapú ügynökök egyre több vállalatnál végzik el helyettünk az érzékeny feladatokat: CRM-rendszerekbe lépnek be, adatbázisokat olvasnak, e-maileket küldenek...