2025. 12. 21., 08:15

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?
Az elmúlt hat évben az MI-k képességei exponenciálisan nőttek: ma már olyan feladatok nagy részét is képesek megoldani, amelyek egy embernek napokat vagy heteket igényelnek. Ez a növekedés nemcsak a pontszerzésben vagy kvízekben jelentkezik, hanem abban is, hogy az MI mennyi ideig önállóan képes összetett munkafolyamatokat végigvinni. A kutatók szerint, ha ez az ütem fennmarad, kevesebb mint tíz éven belül eljutunk oda, hogy önállóan dolgozó MI-k a jelenlegi szakértői munka jelentős részét kiválthatják.

Meddig bírja az MI önállóan?

A jelenlegi MI-k, mint a Claude 3.7 Sonnet, már messze lepipálják az embereket szövegkiegészítésben vagy tesztfeladatokon: a szakértői költség töredékébe kerülnek, miközben hasonló színvonalat hoznak. Alkalmazkodva egy-egy speciális feladathoz, praktikus eszközzé válnak rengeteg területen. Ugyanakkor, ha összetett projektekről, például többnapos munkákról van szó, még mindig akadoznak. A legjobbak sem képesek megbízhatóan elvégezni olyan adminisztratív, számítógép előtt végzett rutinfeladatokat, mint például egy távmunkás asszisztens napi programjának kezelése. Különösen fontos kiemelni, hogy az MI látszólagos szuperképességei mögött gyakran épp az húzódik meg, hogy a hosszabb, több lépésből álló munkákat nem tudja még összefűzni. A szakértők ezért azt mérik, az MI-modellek mekkora időtartamú feladatokat tudnak sikeresen befejezni – ezzel pedig jól jellemezhető képességeik valódi határa.

Az időtáv a kulcs

A teszteken azt vizsgálták, hogy mennyi idő alatt végeznek emberek a különböző – többlépcsős, szoftveres – feladatokkal, majd ugyanazokat elvégeztették MI-kkel. Az eredmények azt mutatják, hogy a jelenlegi modellek szinte 100%-os pontossággal oldják meg azokat a feladatokat, amelyekkel egy ember legfeljebb 4 perc alatt végez. Ugyanakkor, ha az emberi munkaidő meghaladja a 4 órát, az MI már csak kevesebb mint 10%-ban ér célba. Ez alapján logaritmikus görbével jól becsülhető, milyen hosszú feladatot képes egy adott rendszer fele ekkora eséllyel sikeresen megoldani.

Mindez magyarázza, miért nem érezzük azt, hogy az MI-k már most kiválthatnának bonyolultabb napi munkafolyamatokat. Bár képesek órákat igénylő, szakértői szintű lépéseket is elvégezni, megbízhatóan még főként csak percekbe férő időkeretben működnek.

A növekedés exponenciális

Az elmúlt hat évben a legfejlettebb MI-k által sikeresen befejezett feladatok hossza (50%-os sikerarány mellett) elképesztően megnőtt. Ha féllogaritmikus skálán ábrázoljuk ezt, kiderül, hogy a növekedés jól illeszkedik egy exponenciális görbére, amelynek duplázódási ideje 7 hónap körül van. Ha ugyanez az ütem még legalább két évig folytatódik, az MI-k akár egy egész hétig tartó projekteket is el tudnak majd végezni önállóan. Ha a számítás hibája akár tízszeres is, az csak körülbelül két évet tolna az áttörés időpontján.

Különösen fontos kiemelni, hogy a trend minden megvizsgált részadathalmazon megmaradt (legyen szó extrém rövid, hosszú, vagy akár kaotikusabb, életszerűbb szoftverfeladatokról), sőt, egy alternatív adatmintán még gyorsabb, akár 3 hónapos duplázódás is látszik.

Persze jelentős modellezési hibalehetőség is benne van a képletben: például az MI fejlődésének üteme 2024-től gyorsult – ezt figyelembe véve az, hogy a hónapokig tartó feladatoknál elérik az 50%-os sikerességet, akár 2,5 évvel hamarabb is bekövetkezhet.


Mit jelent mindez nekünk?

Összességében elmondható, hogy a kutatások alapján a legfontosabb mérőszám az MI számára a feladat hossza, ameddig még képes önállóan, hiba nélkül dolgozni. A trend szerint 6 évenként 1–4-szeres előrelépés várható, és ha minden így folytatódik, az évtized végére az önjáró MI-k már hónapokig tartó projekteket is lebonyolíthatnak – ami óriási következményekkel jár, pozitívumokat és kockázatokat egyaránt tartogatva. A történések mögött komoly erők munkálnak, és az előttünk álló időszakban tovább fog gyorsulni az MI valódi hatása a hétköznapokra.

2025, adminboss, metr.org alapján

Legfrissebb posztok

MA 13:23

Az MI-influencerek kora megérkezett: kiosztották az első díjakat

🤩 Az MI-influencerek világában egyre inkább elmosódik a határ a valóság és a fikció között...

MA 12:03

A CERN forradalma: így vésik a mesterséges intelligenciát szilíciumba

⚡ Érdekes felvetés, hogy míg a legtöbb MI-fejlesztő főként előregyártott chipeken és előre beállított modelleken dolgozik, a CERN kutatói teljesen egyedi utat járnak: nanomásodperc-sebességgel működő MI-algoritmusokat „égetnek” közvetlenül a szilíciumlapkákba, ezzel szűrik ki az adatözön felesleges részét...

MA 11:24

A filléres mobilok nagy visszatérése: műanyag, retró trükkök?

Az újabb RAM‑válság miatt alaposan átrendeződhet az okostelefonok kínálata. Az elmúlt hónapokban az MI-fejlesztések felvásárolták a piacon elérhető memóriát, ami a fogyasztói elektronika árait jelentősen megemelte, főként a megfizethető és középkategóriás mobilokra mérve csapást...

MA 11:12

Az AI-botrány után a Crimson Desert képei borzolják a kedélyeket

🔥 Pár napja jelent meg a Crimson Desert, és máris komoly botrány kerekedett belőle: a fejlesztő Pearl Abyss kénytelen volt nyilvánosan bocsánatot kérni, mert a játékosok felháborodtak az AI-generált 2D-s képeken...

MA 10:57

A vocoder, amely örökre átírta a zenét – az igaz történet

Senki sem várta volna, hogy egy titkos kommunikációs eszköz egyszer világsikert arat a zenében...

MA 10:50

Az Apple és Kína: dicséret ide vagy oda, a nyomás marad

🎗 Külön említést érdemel, hogy Tim Cook, az Apple vezérigazgatója a pekingi China Development Forumon nagy elismeréssel szólt a kínai fejlesztőkről, valamint a vállalat helyi partnereiről...

MA 10:36

Az új Pixel Watch megbolondult lépésszámlálója – íme a gyors megoldás

Kezdetben a Google Pixel Watch megbízhatóan számolta a megtett lépéseket és más egészségügyi adatokat...

MA 10:33

Az eurázsiai hódok lehetnek a szénkibocsátás titkos fegyverei

Észak-Svájcban végzett kutatás szerint a hódok által épített vizes élőhelyek hatalmas mennyiségű szén-dioxidot képesek megkötni, méghozzá meglepően költséghatékony módon...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/23

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy varázslatos hangulatú kalandjáték, ahol a kisvárosi pletykák és a természetfeletti rejtélyek különleges elegyet alkotnak...

MA 06:05

Történelmi események a mai napon (Március 23.)

Erős nap a történelemben: a brit kolostorbezárások utolsó állomásától Patrick Henry legendás szónoklatán át Mussolini mozgalomalapításáig és Pakisztán köztársasággá válásáig sok minden történt...

APP
vasárnap 07:11

APPok, Amik Ingyenesek MA, 3/22

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Terminal Madness – Revelations (iPhone/iPad)A *Terminal Madness: Revelations* egy prémium, fizetős videojáték, amely egy izgalmas sci-fi világba kalauzolja a játékosokat...

vasárnap 06:05

Történelmi események a mai napon (Március 22.)

Római császárok kikiáltása, brit adó Amerikában, az Arab Liga megalakulása, valamint a brüsszeli és a londoni terrortámadások: ez a nap a történelemben sorsfordító pillanatokkal van tele...

APP
szombat 07:11

APPok, Amik Ingyenesek MA, 3/21

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Terminal Madness – Revelations (iPhone/iPad)A *Terminal Madness: Revelations* egy fizetős sci-fi kalandjáték, amelyben izgalmas történet és komplex logikai feladványok várnak...

szombat 06:05

Történelmi események a mai napon (Március 21.)

Időutazás a történelemben: nagy ostromok, sorsfordító törvények és megrázó tragédiák sorakoznak ezen a napon...

APP
péntek 07:11

APPok, Amik Ingyenesek MA, 3/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben egy kisvárosban élő mutánsok mindennapjaiba nyerhetsz betekintést...

péntek 06:05

Történelmi események a mai napon (Március 20.)

Viharos nap a történelemben: a Holland Kelet-indiai Társaság megszületésétől 🧭 a napóleoni Száz Nap kezdetéig, Einstein relativitáselméletétől 🧠 a modern háborúk fordulópontjaiig...

APP
csütörtök 07:12

APPok, Amik Ingyenesek MA, 3/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben a vidéki kisváros hétköznapi pletykái és a természetfeletti események keverednek...

csütörtök 06:06

Történelmi események a mai napon (Március 19.)

Mi történt ma a történelemben? A Mongol Birodalom győzelmével véget ér a Szung-dinasztia Kínában 🇨🇳, az angol alsóház eltörli a Lordok Házát 🏛️, a náci csapatok megszállják Magyarországot 🇭🇺, és a Tuskegee Airmen egységet hivatalosan aktiválják ✈️...

szerda 12:01

Az IKEA okosotthona: menő és olcsó, mégsem működik

📦 Az IKEA új, mindenki számára elérhető okos kütyüi végre megérkeztek! A gondolat izgalmas: menő, okos izzók, kapcsolók, dugaljak, mind kezdőáron, már 2400 forinttól...

szerda 11:34

Az MI-asszisztensek kijátszása: veszélyes parancsok az orrod előtt

🛡 Egy új, böngészőkben alkalmazható trükk lehetővé teszi, hogy rosszindulatú parancsokat rejtsenek el közvetlenül a weboldalakon anélkül, hogy azt az MI‑asszisztensek észrevennék...

szerda 11:23

Az iPhone 16e megkapja az álomfrissítést, amiről az Android csak álmodik

😍 Fontos kérdés, hogy mennyire lehet egy okostelefont olcsón, akár otthon is fejleszteni, főleg, ha új funkciók utólag is elérhetők lesznek...

szerda 11:13

Az USA-ban berobban a vastagbélrák az 50 év alattiaknál

💉 Az Egyesült Államokban egyre fiatalabbakat érint a vastagbélrák, amely immár a leggyakoribb daganatos halálok az 50 év alattiak körében...

szerda 11:01

Az új Google Gemini már mindent tud rólad – ráadásul ingyen

A Google újraírta a szabályokat: mostantól a Geminiben mindenki számára ingyenesen elérhető az a funkció, amellyel valóban személyre szabott válaszokat adhat...

szerda 10:50

Az orosz hackerek új kártevőhulláma elözönli a GitHubot

Jellemző példa erre, hogy napjaink egyik legagresszívebb ellátásilánc-támadása, a GlassWorm ismét lecsapott: több mint 400 fejlesztői csomag, forráskódtár és bővítmény vált fertőzötté olyan platformokon, mint a GitHub, az npm, a Visual Studio Code és az OpenVSX...

szerda 10:43

Most te vagy a hangmérnök: itt az új Spotify-mód

🎧 A Spotify most végre bevezette az Exkluzív módot (Exclusive Mode) Windowsra – innentől a szoftver ráteszi a kezét a hangkártyádra, és kiküszöböli, hogy a géped belemotyogjon a zenédbe...

szerda 10:36

Az Apple új titkos fegyvere: láthatatlanul javították a sebezhetőséget

🔒 Az Apple először élesítette a Háttérbiztonsági fejlesztések nevű rendszerét, amellyel anélkül javíthattak egy kritikus WebKit-sebezhetőséget, hogy a teljes operációs rendszert frissíteni kellett volna...

szerda 10:30

Az akcentus rejtett ára: kinek a hangja számít igazán?

Modern munkahelyeken sokan hiszik, hogy a legjobb ötletek maguktól érvényesülnek: az győz, aki meggyőzően érvel, vagy eredeti meglátással áll elő...

szerda 10:23

Az észak-koreai hekkerek kifosztották a Bitrefillt: 19 ezren pórul jártak

💰 Március 1-jén nagyszabású kibertámadás érte a nagy nemzetközi kriptopénzes fizetési és ajándékkártya-platformot, a Bitrefillt...

szerda 10:16

A gyerekkori stressz egész életre beleég a bélrendszerbe

😱 A korai gyermekkori stressz nem csupán mentális sebeket hagyhat maga után, hanem a bélrendszer működését is átrendezheti...