2025. 12. 21., 08:15

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?
Az elmúlt hat évben az MI-k képességei exponenciálisan nőttek: ma már olyan feladatok nagy részét is képesek megoldani, amelyek egy embernek napokat vagy heteket igényelnek. Ez a növekedés nemcsak a pontszerzésben vagy kvízekben jelentkezik, hanem abban is, hogy az MI mennyi ideig önállóan képes összetett munkafolyamatokat végigvinni. A kutatók szerint, ha ez az ütem fennmarad, kevesebb mint tíz éven belül eljutunk oda, hogy önállóan dolgozó MI-k a jelenlegi szakértői munka jelentős részét kiválthatják.

Meddig bírja az MI önállóan?

A jelenlegi MI-k, mint a Claude 3.7 Sonnet, már messze lepipálják az embereket szövegkiegészítésben vagy tesztfeladatokon: a szakértői költség töredékébe kerülnek, miközben hasonló színvonalat hoznak. Alkalmazkodva egy-egy speciális feladathoz, praktikus eszközzé válnak rengeteg területen. Ugyanakkor, ha összetett projektekről, például többnapos munkákról van szó, még mindig akadoznak. A legjobbak sem képesek megbízhatóan elvégezni olyan adminisztratív, számítógép előtt végzett rutinfeladatokat, mint például egy távmunkás asszisztens napi programjának kezelése. Különösen fontos kiemelni, hogy az MI látszólagos szuperképességei mögött gyakran épp az húzódik meg, hogy a hosszabb, több lépésből álló munkákat nem tudja még összefűzni. A szakértők ezért azt mérik, az MI-modellek mekkora időtartamú feladatokat tudnak sikeresen befejezni – ezzel pedig jól jellemezhető képességeik valódi határa.

Az időtáv a kulcs

A teszteken azt vizsgálták, hogy mennyi idő alatt végeznek emberek a különböző – többlépcsős, szoftveres – feladatokkal, majd ugyanazokat elvégeztették MI-kkel. Az eredmények azt mutatják, hogy a jelenlegi modellek szinte 100%-os pontossággal oldják meg azokat a feladatokat, amelyekkel egy ember legfeljebb 4 perc alatt végez. Ugyanakkor, ha az emberi munkaidő meghaladja a 4 órát, az MI már csak kevesebb mint 10%-ban ér célba. Ez alapján logaritmikus görbével jól becsülhető, milyen hosszú feladatot képes egy adott rendszer fele ekkora eséllyel sikeresen megoldani.

Mindez magyarázza, miért nem érezzük azt, hogy az MI-k már most kiválthatnának bonyolultabb napi munkafolyamatokat. Bár képesek órákat igénylő, szakértői szintű lépéseket is elvégezni, megbízhatóan még főként csak percekbe férő időkeretben működnek.

A növekedés exponenciális

Az elmúlt hat évben a legfejlettebb MI-k által sikeresen befejezett feladatok hossza (50%-os sikerarány mellett) elképesztően megnőtt. Ha féllogaritmikus skálán ábrázoljuk ezt, kiderül, hogy a növekedés jól illeszkedik egy exponenciális görbére, amelynek duplázódási ideje 7 hónap körül van. Ha ugyanez az ütem még legalább két évig folytatódik, az MI-k akár egy egész hétig tartó projekteket is el tudnak majd végezni önállóan. Ha a számítás hibája akár tízszeres is, az csak körülbelül két évet tolna az áttörés időpontján.

Különösen fontos kiemelni, hogy a trend minden megvizsgált részadathalmazon megmaradt (legyen szó extrém rövid, hosszú, vagy akár kaotikusabb, életszerűbb szoftverfeladatokról), sőt, egy alternatív adatmintán még gyorsabb, akár 3 hónapos duplázódás is látszik.

Persze jelentős modellezési hibalehetőség is benne van a képletben: például az MI fejlődésének üteme 2024-től gyorsult – ezt figyelembe véve az, hogy a hónapokig tartó feladatoknál elérik az 50%-os sikerességet, akár 2,5 évvel hamarabb is bekövetkezhet.


Mit jelent mindez nekünk?

Összességében elmondható, hogy a kutatások alapján a legfontosabb mérőszám az MI számára a feladat hossza, ameddig még képes önállóan, hiba nélkül dolgozni. A trend szerint 6 évenként 1–4-szeres előrelépés várható, és ha minden így folytatódik, az évtized végére az önjáró MI-k már hónapokig tartó projekteket is lebonyolíthatnak – ami óriási következményekkel jár, pozitívumokat és kockázatokat egyaránt tartogatva. A történések mögött komoly erők munkálnak, és az előttünk álló időszakban tovább fog gyorsulni az MI valódi hatása a hétköznapokra.

2025, adminboss, metr.org alapján

Legfrissebb posztok

MA 12:55

Az agy megtéveszti az immunrendszert: a tüdőrák titkos fegyvere

🧠 A tüdőrák évtizedek óta csak a kontrollt vesztett sejtosztódás hibájaként szerepelt az orvosi gondolkodásban, de friss kutatások feltárták: a daganatok aktívan kommunikálnak az aggyal, hogy kijátsszák az immunrendszert...

MA 12:37

Az MI felforgatja az ügyvédi irodák mindennapjait

Felmerül a kérdés, hogy egy MI-alapú startup hogyan képes átformálni egy olyan hagyományos területet, mint az ügyvédi irodák piaca...

MA 12:19

A Substack adatbotránya: kiszivárogtak a felhasználói adatok

Októberben súlyos biztonsági résen keresztül szivárogtak ki a Substack-felhasználóinak e-mail-címei és telefonszámai, ám a vállalat csak február elején észlelte az incidenst...

MA 12:02

Az egészséges Barry Manilow mégis halasztja Las Vegas-i koncertjeit

A 81 éves Barry Manilow sikeres műtét után kiválóan érzi magát, de orvosa tanácsára átszervezi közelgő Las Vegas-i koncertjeit, hogy maradéktalanul a felépülésre és az év eleji turnéjára tudjon koncentrálni...

MA 11:38

A pénztárcabarát, 12 portos 10GbE switch, ami felülmúl minden várakozást

💰 A Sodola SL-SWTGW2C48NS 12 portos 10GbE switch első ránézésre feltűnően olcsó, hiszen mindössze 84 000 forintért (230 USD) kínálják, sőt, egyes akciókkal akár 77 000 forintért is beszerezhető...

MA 11:19

Az Alphabet történelmet írt: a Google bevétele átlépte a 400 milliárd dollárt

🏆 A Google anyavállalata, az Alphabet idén először lépte át a 400 milliárd dolláros (kb...

MA 11:02

Az Alphabet mélyen hallgat a Google–Apple MI-alkuról

Az Alphabet vezetői egyetlen szóval sem válaszoltak arra a befektetői kérdésre, miként hat a Google és az Apple közötti MI-megállapodás a cég jövőjére...

MA 10:59

Az MI veszélyezteti a bizalmat – így marad egészséges a csapatod

Egy lényeges szempont, hogy az MI integrációjával a cégek nemcsak technológiai kihívásokkal szembesülnek, hanem a csapaton belüli bizalom és együttműködés terén is jelentős változások jöhetnek...

MA 10:42

Az USA zöld utat adna a Hold meghódításához

Jellemző példa erre, hogy az amerikai törvényhozás első lépésként rábólintott arra, hogy a kereskedelmi űripar nagyobb szerepet kapjon a mélyűri küldetésekben...

MA 10:34

A szív rejtett bumerángcsontja: megdöbbentő orvosi felfedezés

Egy meglepő boncolási lelet az Egyesült Államokban először dokumentált egy összetett, támasztó csontot egy felnőtt ember szívében...

MA 10:18

Az orosz hekkerek új Office-rést kihasználva tarolnak

🚨 A Microsoft kénytelen volt villámgyorsan kiadni egy sürgős frissítést az Office-hoz, miután orosz állami hackerek kompromittálták több ország diplomáciai, tengeri és közlekedési szervezeteinek eszközeit...

MA 10:02

Az Anthropic kiszáll az MI-hirdetésekből

🛑 Az Anthropic szerdán bejelentette, hogy MI-chatbotja, Claude teljesen reklámmentes marad. Ezzel éles határvonalat húz saját szolgáltatása és az OpenAI közé, amely nemrég az olcsóbb ChatGPT Go csomagban kezdett hirdetésekkel kísérletezni...

MA 09:58

Az MI-vel turbózott AWS-betörés: adminjogok 10 perc alatt

Egy digitális behatoló villámgyorsan, kevesebb mint 10 perc alatt szerzett adminisztrátori jogosultságot egy AWS-környezetben, hála a nagy nyelvi modellek (LLM) automatizálásának...

MA 09:49

A bhutáni bitcoinoffenzíva: kezdetét vette az idegháború

🗡 A Bhutáni Királyi Kormány több mint 184 bitcoint, vagyis mintegy 5,1 milliárd forintot mozgatott át kereskedő cégekhez és tőzsdékre, amikor a BTC ára 71 000 dollár (kb...

MA 09:41

A nosztalgia ára: itt a limitált Canon G7 X III

📷 A Canon a PowerShot digitális fényképezőgépek 30. évfordulójára egy különleges, limitált szériás G7 X III kompakt gépet dob piacra...

MA 09:33

Az n8n kritikus hibái akár teljes szerverátvételt eredményezhetnek

🚨 Az n8n nevű, népszerű, nyílt forráskódú, automatizált munkafolyamat-platformban több kritikus biztonsági hibát találtak, amelyek lehetővé teszik a támadók számára, hogy kikerüljék a biztonsági korlátokat és átvegyék az irányítást a kiszolgáló felett...

MA 09:26

A netet már az MI-botok uralják, az emberek eltűnnek

Az interneten egyre nagyobb teret nyernek az MI-alapú robotok, miközben az emberek jelenléte folyamatosan csökken...

MA 09:17

Szabályozás vagy kínai fölény dönti el az amerikai önvezetők sorsát?

A szenátusi meghallgatáson a Waymo és a Tesla vezetői nyomatékosan kérték a törvényhozókat, hogy mielőbb alkossanak jogszabályokat az önvezető járművek szabályozására, különben könnyen lehet, hogy Kína beelőzi az Egyesült Államokat a technológiai versenyben...

MA 09:09

A rejtélyes ausztrál mágneses anomália: a múltunk kulcsa?

🔑 Ausztrália Északi Területe alatt a kutatók egy eddig ismeretlen, Ausztrália alakját idéző mágneses anomáliát találtak, amely új fejezetet nyithat a kontinens geológiai történetének feltárásában...

MA 09:01

Az amerikai ügynökségek versenyt futva javítják a kritikus SolarWinds-hibát

Amerikai kormányzati szerveket szoros határidővel kötelezték, hogy frissítsék SolarWinds Web Help Desk-rendszereiket, miután támadók egy kritikus sebezhetőséget kihasználni kezdtek...

MA 08:50

Így teljesít a Swarovski NL Pure 8×32 a teszten

👀 A Swarovski NL Pure 8×32 kétségtelenül a távcsővilág egyik csúcsmodellje: kristálytiszta képminőség, könnyű, kompakt kialakítás és annyira élethű látvány, hogy szinte 8K videót néznél rajta...

MA 08:41

Az új VMware ESXi-sebezhetőségre már lecsaptak a zsarolóvírusok

🛡 A VMware ESXi egyik súlyos sebezhetősége, a CVE-2025-22225 mostanra a zsarolóvírus-bűnözők kedvence lett...

MA 08:33

A Galaxy S26 nem az áttörés, amire vártunk?

A közelgő Galaxy S26 sorozatról eddig több pletyka keringett, hogy beépített mágneseket kaphat, amelyek támogatnák a mágnesesen rögzíthető kiegészítőket és a fejlett MPP-s töltőket...

MA 08:25

A Super Bowl MI-csatája: ki játszik tisztán a reklámokban?

🚩 A Super Bowl vasárnapján az OpenAI és az Anthropic, két MI-fejlesztő cég ellentéte került a figyelem középpontjába...

MA 08:17

A kisbolygó, amely látványos krátert vághat a Holdba

🚀 Egy csaknem 60 méteres aszteroida 4 százalékos eséllyel csapódhat a Holdba 2032-ben – a jelenség pedig szabad szemmel is látható lesz a Földről...

MA 08:02

Az amerikai hadsereg robotokkal verné vissza a biofegyvereket

🤖 Az Egyesült Államok hadserege robotrendszereket keres, amelyek képesek elvégezni a veszélyes vegyi és biológiai fegyverek utáni nagytakarítást...

MA 07:58

Az Apple 2026-ban berobban: sztárok, sorozatok, meglepetések

🎉 Az Apple TV+ továbbra is irigylésre méltó helyzetben van a streaming piacon...

MA 07:49

Az új Sony-rekord mögött: szárnyal a profit, bajban a PlayStation

A Sony ismét erőteljes negyedéves eredményeket mutatott fel: az október–decemberi időszakban az üzemi nyereség elérte az 515 milliárd jent (kb...

MA 07:41

Az autizmus itthon egészen más, mint hittük

A legfrissebb svéd kutatás teljesen új megvilágításba helyezi azt a régóta tartott feltételezést, hogy az autizmus elsősorban a fiúkat érinti...