2025. 12. 21., 08:15

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?
Az elmúlt hat évben az MI-k képességei exponenciálisan nőttek: ma már olyan feladatok nagy részét is képesek megoldani, amelyek egy embernek napokat vagy heteket igényelnek. Ez a növekedés nemcsak a pontszerzésben vagy kvízekben jelentkezik, hanem abban is, hogy az MI mennyi ideig önállóan képes összetett munkafolyamatokat végigvinni. A kutatók szerint, ha ez az ütem fennmarad, kevesebb mint tíz éven belül eljutunk oda, hogy önállóan dolgozó MI-k a jelenlegi szakértői munka jelentős részét kiválthatják.

Meddig bírja az MI önállóan?

A jelenlegi MI-k, mint a Claude 3.7 Sonnet, már messze lepipálják az embereket szövegkiegészítésben vagy tesztfeladatokon: a szakértői költség töredékébe kerülnek, miközben hasonló színvonalat hoznak. Alkalmazkodva egy-egy speciális feladathoz, praktikus eszközzé válnak rengeteg területen. Ugyanakkor, ha összetett projektekről, például többnapos munkákról van szó, még mindig akadoznak. A legjobbak sem képesek megbízhatóan elvégezni olyan adminisztratív, számítógép előtt végzett rutinfeladatokat, mint például egy távmunkás asszisztens napi programjának kezelése. Különösen fontos kiemelni, hogy az MI látszólagos szuperképességei mögött gyakran épp az húzódik meg, hogy a hosszabb, több lépésből álló munkákat nem tudja még összefűzni. A szakértők ezért azt mérik, az MI-modellek mekkora időtartamú feladatokat tudnak sikeresen befejezni – ezzel pedig jól jellemezhető képességeik valódi határa.

Az időtáv a kulcs

A teszteken azt vizsgálták, hogy mennyi idő alatt végeznek emberek a különböző – többlépcsős, szoftveres – feladatokkal, majd ugyanazokat elvégeztették MI-kkel. Az eredmények azt mutatják, hogy a jelenlegi modellek szinte 100%-os pontossággal oldják meg azokat a feladatokat, amelyekkel egy ember legfeljebb 4 perc alatt végez. Ugyanakkor, ha az emberi munkaidő meghaladja a 4 órát, az MI már csak kevesebb mint 10%-ban ér célba. Ez alapján logaritmikus görbével jól becsülhető, milyen hosszú feladatot képes egy adott rendszer fele ekkora eséllyel sikeresen megoldani.

Mindez magyarázza, miért nem érezzük azt, hogy az MI-k már most kiválthatnának bonyolultabb napi munkafolyamatokat. Bár képesek órákat igénylő, szakértői szintű lépéseket is elvégezni, megbízhatóan még főként csak percekbe férő időkeretben működnek.

A növekedés exponenciális

Az elmúlt hat évben a legfejlettebb MI-k által sikeresen befejezett feladatok hossza (50%-os sikerarány mellett) elképesztően megnőtt. Ha féllogaritmikus skálán ábrázoljuk ezt, kiderül, hogy a növekedés jól illeszkedik egy exponenciális görbére, amelynek duplázódási ideje 7 hónap körül van. Ha ugyanez az ütem még legalább két évig folytatódik, az MI-k akár egy egész hétig tartó projekteket is el tudnak majd végezni önállóan. Ha a számítás hibája akár tízszeres is, az csak körülbelül két évet tolna az áttörés időpontján.

Különösen fontos kiemelni, hogy a trend minden megvizsgált részadathalmazon megmaradt (legyen szó extrém rövid, hosszú, vagy akár kaotikusabb, életszerűbb szoftverfeladatokról), sőt, egy alternatív adatmintán még gyorsabb, akár 3 hónapos duplázódás is látszik.

Persze jelentős modellezési hibalehetőség is benne van a képletben: például az MI fejlődésének üteme 2024-től gyorsult – ezt figyelembe véve az, hogy a hónapokig tartó feladatoknál elérik az 50%-os sikerességet, akár 2,5 évvel hamarabb is bekövetkezhet.


Mit jelent mindez nekünk?

Összességében elmondható, hogy a kutatások alapján a legfontosabb mérőszám az MI számára a feladat hossza, ameddig még képes önállóan, hiba nélkül dolgozni. A trend szerint 6 évenként 1–4-szeres előrelépés várható, és ha minden így folytatódik, az évtized végére az önjáró MI-k már hónapokig tartó projekteket is lebonyolíthatnak – ami óriási következményekkel jár, pozitívumokat és kockázatokat egyaránt tartogatva. A történések mögött komoly erők munkálnak, és az előttünk álló időszakban tovább fog gyorsulni az MI valódi hatása a hétköznapokra.

2025, adminboss, metr.org alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     FormatX: Video Audio Converter (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) War Mongrels (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia...

APP
csütörtök 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...