A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?
Az elmúlt hat évben az MI-k képességei exponenciálisan nőttek: ma már olyan feladatok nagy részét is képesek megoldani, amelyek egy embernek napokat vagy heteket igényelnek. Ez a növekedés nemcsak a pontszerzésben vagy kvízekben jelentkezik, hanem abban is, hogy az MI mennyi ideig önállóan képes összetett munkafolyamatokat végigvinni. A kutatók szerint, ha ez az ütem fennmarad, kevesebb mint tíz éven belül eljutunk oda, hogy önállóan dolgozó MI-k a jelenlegi szakértői munka jelentős részét kiválthatják.

Meddig bírja az MI önállóan?

A jelenlegi MI-k, mint a Claude 3.7 Sonnet, már messze lepipálják az embereket szövegkiegészítésben vagy tesztfeladatokon: a szakértői költség töredékébe kerülnek, miközben hasonló színvonalat hoznak. Alkalmazkodva egy-egy speciális feladathoz, praktikus eszközzé válnak rengeteg területen. Ugyanakkor, ha összetett projektekről, például többnapos munkákról van szó, még mindig akadoznak. A legjobbak sem képesek megbízhatóan elvégezni olyan adminisztratív, számítógép előtt végzett rutinfeladatokat, mint például egy távmunkás asszisztens napi programjának kezelése. Különösen fontos kiemelni, hogy az MI látszólagos szuperképességei mögött gyakran épp az húzódik meg, hogy a hosszabb, több lépésből álló munkákat nem tudja még összefűzni. A szakértők ezért azt mérik, az MI-modellek mekkora időtartamú feladatokat tudnak sikeresen befejezni – ezzel pedig jól jellemezhető képességeik valódi határa.

Az időtáv a kulcs

A teszteken azt vizsgálták, hogy mennyi idő alatt végeznek emberek a különböző – többlépcsős, szoftveres – feladatokkal, majd ugyanazokat elvégeztették MI-kkel. Az eredmények azt mutatják, hogy a jelenlegi modellek szinte 100%-os pontossággal oldják meg azokat a feladatokat, amelyekkel egy ember legfeljebb 4 perc alatt végez. Ugyanakkor, ha az emberi munkaidő meghaladja a 4 órát, az MI már csak kevesebb mint 10%-ban ér célba. Ez alapján logaritmikus görbével jól becsülhető, milyen hosszú feladatot képes egy adott rendszer fele ekkora eséllyel sikeresen megoldani.

Mindez magyarázza, miért nem érezzük azt, hogy az MI-k már most kiválthatnának bonyolultabb napi munkafolyamatokat. Bár képesek órákat igénylő, szakértői szintű lépéseket is elvégezni, megbízhatóan még főként csak percekbe férő időkeretben működnek.

A növekedés exponenciális

Az elmúlt hat évben a legfejlettebb MI-k által sikeresen befejezett feladatok hossza (50%-os sikerarány mellett) elképesztően megnőtt. Ha féllogaritmikus skálán ábrázoljuk ezt, kiderül, hogy a növekedés jól illeszkedik egy exponenciális görbére, amelynek duplázódási ideje 7 hónap körül van. Ha ugyanez az ütem még legalább két évig folytatódik, az MI-k akár egy egész hétig tartó projekteket is el tudnak majd végezni önállóan. Ha a számítás hibája akár tízszeres is, az csak körülbelül két évet tolna az áttörés időpontján.

Különösen fontos kiemelni, hogy a trend minden megvizsgált részadathalmazon megmaradt (legyen szó extrém rövid, hosszú, vagy akár kaotikusabb, életszerűbb szoftverfeladatokról), sőt, egy alternatív adatmintán még gyorsabb, akár 3 hónapos duplázódás is látszik.

Persze jelentős modellezési hibalehetőség is benne van a képletben: például az MI fejlődésének üteme 2024-től gyorsult – ezt figyelembe véve az, hogy a hónapokig tartó feladatoknál elérik az 50%-os sikerességet, akár 2,5 évvel hamarabb is bekövetkezhet.


Mit jelent mindez nekünk?

Összességében elmondható, hogy a kutatások alapján a legfontosabb mérőszám az MI számára a feladat hossza, ameddig még képes önállóan, hiba nélkül dolgozni. A trend szerint 6 évenként 1–4-szeres előrelépés várható, és ha minden így folytatódik, az évtized végére az önjáró MI-k már hónapokig tartó projekteket is lebonyolíthatnak – ami óriási következményekkel jár, pozitívumokat és kockázatokat egyaránt tartogatva. A történések mögött komoly erők munkálnak, és az előttünk álló időszakban tovább fog gyorsulni az MI valódi hatása a hétköznapokra.

2025, adminboss, metr.org alapján

Legfrissebb posztok

MA 11:02

Az amerikai alap kiszáll a Sportradarból: miért most?

🏆 A kaliforniai székhelyű Global IMC jelentősen csökkentette részesedését a Sportradar Group AG-ben, több mint 7 millió dollár (kb...

MA 10:57

Végleg vége az olcsó Steam Deck korszakának

💸 A Steam Deck-rajongók számára rossz hír, hogy a Valve beszüntette az utolsó megfizethető, LCD-s modellt is...

MA 10:39

Az év rejtett gyöngyszemei: játékok, amikről lemaradtál

💎 2025-ben a videojáték-ipar elképesztő mennyiségű címet ontott magából, de szinte lehetetlen mindenre odafigyelni...

MA 10:32

Az inka kőcsodák titkai: így emelték fel a birodalmat

Az inka civilizáció építőművészetét évszázadok óta rejtély övezi. A mai Peru, Ecuador, Bolívia, Chile és Argentína területén elterülő, több mint tízmillió lakosú inka birodalom hivatalosan az 1500-as években bekövetkezett spanyol hódításig uralta a térséget...

MA 10:17

A 2025-ös társasjátékrobbanás legizgalmasabb újdonságai

🎲 A társasjáték-rajongók számára 2025 a nehézségek ellenére is kiemelkedő év lett – a vámok alaposan felforgatták a piacot, de így is rengeteg kiváló cím jelent meg...

MA 09:43

A Switch 2 olcsóbb kazettáinak titka kiszivárgott?

🔑 A Nintendo következő konzolja, a Switch 2 várhatóan olcsóbb fizikai játékkazettákat kaphat, legalábbis erre utalt egy korai, idő előtt törölt bejegyzés egy retro játékokkal foglalkozó kiadótól, az ININ Games-től...

MA 09:37

Az új Dogpile: Tetris, Balatro és kiskutyák őrült találkája

A Dogpile egy meglepően friss játék, amely ötvözi a pakliépítős stratégiát, a match-3 mechanikát, a roguelike hangulatot és persze rengeteg aranyos kutyát...

MA 09:22

Az okos kosár titka: így lesz egészséges a bevásárlás

Az egészséges táplálkozás egyik kulcsa, hogy tudatosan vásárolj az élelmiszerboltban. Egyre többen esküsznek arra a bevált módszerre, hogy elsősorban a bolt peremén keresd az alapanyagokat...

MA 09:16

Az Apple nyit, de vasmarokkal fogja az iPhone-okat Japánban

Az Apple jelentős módosításokat jelentett be a japán iOS-rendszerben, hogy megfeleljen a Mobil Szoftver Versenytörvénynek (MSCA)...

MA 09:08

A mesterséges intelligenciás autók elárasztották San Franciscót – káosz a sötétben

🚗 San Franciscót december 20-án hatalmas áramszünet bénította meg, aminek következtében a Waymo önvezető autói egyszerűen leálltak az utakon...

MA 09:02

Az Ozempic-láz kincsvadászata: a turkálás új aranykora

💎 Tíz éven át vadásztam arra a kabátra, amilyet Winona Ryder visel a Furcsa dolgok (Stranger Things) első évadában...

MA 08:59

Az igazi távcsőpárbaj: melyik Celestron 10×42 a nyerő?

A hobbifelfedezők és természetjárók szinte mind találkoztak már a 10×42-es távcsövekkel...

MA 08:36

A RansomHouse új titkosító trükkökkel riogatja az áldozatokat

Az ismert RansomHouse zsarolóvírus-csoport nemrég komoly fejlesztéseken esett át: eddigi egyszerű titkosítási eljárása helyett most egy összetettebb, többrétegű titkosítási módszert alkalmaz...

MA 08:29

A műanyagválság elharapózik – ideje lépniük a kormányoknak!

A műanyagszennyezés világszerte egyre csak nő, miközben a globális műanyag-egyezményről szóló tárgyalások évek óta elakadtak...

MA 07:50

A NASA az űrből kapta lencsevégre a különleges üstököst

🚀 Felmerül a kérdés, hogy mi történik, ha egy rejtélyes vándorüstökös a Naprendszer közelébe sodródik, és csak űrszondával lehet megfigyelni...

MA 07:36

Az olcsó 2,5 GbE switch: aranybánya vagy zsákutca?

A Tenda SE105 egy 5 portos, ventilátor nélküli 2,5 GbE switch, amely erősen hasonlít a BrosTrend S2-re...

MA 07:29

A Sony–Honda első villanyautójában már távolról is fut a PS5

Sony és Honda közös vállalata, a Sony Honda Mobility bemutatta első közös elektromos autóját, az Afeelát, amely egy különleges extrát kap: az utazók távolról játszhatnak PlayStation 5 (PS5) és PlayStation 4 (PS4) játékokat az autó beépített kijelzőjén keresztül...

MA 07:23

A csoda, ami megmentette Christmas Valleyt a lángoktól

✨ 2021 augusztusában hihetetlen szerencsével menekült meg a Christmas Valley és Meyers közössége a hatalmas Caldor-tűz elől a Lake Tahoe-medencében...

MA 07:15

Az MI-kamerák áldás vagy átok: hol a határ?

Érdemes megvizsgálni, milyen mértékben segíthetik a mesterséges intelligenciával támogatott kamerák a rendőrségi munkát, miközben komoly adatvédelmi aggályokat is felvetnek...