2025. 12. 21., 08:15

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?
Az elmúlt hat évben az MI-k képességei exponenciálisan nőttek: ma már olyan feladatok nagy részét is képesek megoldani, amelyek egy embernek napokat vagy heteket igényelnek. Ez a növekedés nemcsak a pontszerzésben vagy kvízekben jelentkezik, hanem abban is, hogy az MI mennyi ideig önállóan képes összetett munkafolyamatokat végigvinni. A kutatók szerint, ha ez az ütem fennmarad, kevesebb mint tíz éven belül eljutunk oda, hogy önállóan dolgozó MI-k a jelenlegi szakértői munka jelentős részét kiválthatják.

Meddig bírja az MI önállóan?

A jelenlegi MI-k, mint a Claude 3.7 Sonnet, már messze lepipálják az embereket szövegkiegészítésben vagy tesztfeladatokon: a szakértői költség töredékébe kerülnek, miközben hasonló színvonalat hoznak. Alkalmazkodva egy-egy speciális feladathoz, praktikus eszközzé válnak rengeteg területen. Ugyanakkor, ha összetett projektekről, például többnapos munkákról van szó, még mindig akadoznak. A legjobbak sem képesek megbízhatóan elvégezni olyan adminisztratív, számítógép előtt végzett rutinfeladatokat, mint például egy távmunkás asszisztens napi programjának kezelése. Különösen fontos kiemelni, hogy az MI látszólagos szuperképességei mögött gyakran épp az húzódik meg, hogy a hosszabb, több lépésből álló munkákat nem tudja még összefűzni. A szakértők ezért azt mérik, az MI-modellek mekkora időtartamú feladatokat tudnak sikeresen befejezni – ezzel pedig jól jellemezhető képességeik valódi határa.

Az időtáv a kulcs

A teszteken azt vizsgálták, hogy mennyi idő alatt végeznek emberek a különböző – többlépcsős, szoftveres – feladatokkal, majd ugyanazokat elvégeztették MI-kkel. Az eredmények azt mutatják, hogy a jelenlegi modellek szinte 100%-os pontossággal oldják meg azokat a feladatokat, amelyekkel egy ember legfeljebb 4 perc alatt végez. Ugyanakkor, ha az emberi munkaidő meghaladja a 4 órát, az MI már csak kevesebb mint 10%-ban ér célba. Ez alapján logaritmikus görbével jól becsülhető, milyen hosszú feladatot képes egy adott rendszer fele ekkora eséllyel sikeresen megoldani.

Mindez magyarázza, miért nem érezzük azt, hogy az MI-k már most kiválthatnának bonyolultabb napi munkafolyamatokat. Bár képesek órákat igénylő, szakértői szintű lépéseket is elvégezni, megbízhatóan még főként csak percekbe férő időkeretben működnek.

A növekedés exponenciális

Az elmúlt hat évben a legfejlettebb MI-k által sikeresen befejezett feladatok hossza (50%-os sikerarány mellett) elképesztően megnőtt. Ha féllogaritmikus skálán ábrázoljuk ezt, kiderül, hogy a növekedés jól illeszkedik egy exponenciális görbére, amelynek duplázódási ideje 7 hónap körül van. Ha ugyanez az ütem még legalább két évig folytatódik, az MI-k akár egy egész hétig tartó projekteket is el tudnak majd végezni önállóan. Ha a számítás hibája akár tízszeres is, az csak körülbelül két évet tolna az áttörés időpontján.

Különösen fontos kiemelni, hogy a trend minden megvizsgált részadathalmazon megmaradt (legyen szó extrém rövid, hosszú, vagy akár kaotikusabb, életszerűbb szoftverfeladatokról), sőt, egy alternatív adatmintán még gyorsabb, akár 3 hónapos duplázódás is látszik.

Persze jelentős modellezési hibalehetőség is benne van a képletben: például az MI fejlődésének üteme 2024-től gyorsult – ezt figyelembe véve az, hogy a hónapokig tartó feladatoknál elérik az 50%-os sikerességet, akár 2,5 évvel hamarabb is bekövetkezhet.


Mit jelent mindez nekünk?

Összességében elmondható, hogy a kutatások alapján a legfontosabb mérőszám az MI számára a feladat hossza, ameddig még képes önállóan, hiba nélkül dolgozni. A trend szerint 6 évenként 1–4-szeres előrelépés várható, és ha minden így folytatódik, az évtized végére az önjáró MI-k már hónapokig tartó projekteket is lebonyolíthatnak – ami óriási következményekkel jár, pozitívumokat és kockázatokat egyaránt tartogatva. A történések mögött komoly erők munkálnak, és az előttünk álló időszakban tovább fog gyorsulni az MI valódi hatása a hétköznapokra.

2025, adminboss, metr.org alapján

Legfrissebb posztok

MA 11:19

Az Alphabet történelmet írt: a Google bevétele átlépte a 400 milliárd dollárt

🏆 A Google anyavállalata, az Alphabet idén először lépte át a 400 milliárd dolláros (kb...

MA 11:02

Az Alphabet mélyen hallgat a Google–Apple MI-alkuról

Az Alphabet vezetői egyetlen szóval sem válaszoltak arra a befektetői kérdésre, miként hat a Google és az Apple közötti MI-megállapodás a cég jövőjére...

MA 10:59

Az MI veszélyezteti a bizalmat – így marad egészséges a csapatod

Egy lényeges szempont, hogy az MI integrációjával a cégek nemcsak technológiai kihívásokkal szembesülnek, hanem a csapaton belüli bizalom és együttműködés terén is jelentős változások jöhetnek...

MA 10:42

Az USA zöld utat adna a Hold meghódításához

Jellemző példa erre, hogy az amerikai törvényhozás első lépésként rábólintott arra, hogy a kereskedelmi űripar nagyobb szerepet kapjon a mélyűri küldetésekben...

MA 10:34

A szív rejtett bumerángcsontja: megdöbbentő orvosi felfedezés

Egy meglepő boncolási lelet az Egyesült Államokban először dokumentált egy összetett, támasztó csontot egy felnőtt ember szívében...

MA 10:18

Az orosz hekkerek új Office-rést kihasználva tarolnak

🚨 A Microsoft kénytelen volt villámgyorsan kiadni egy sürgős frissítést az Office-hoz, miután orosz állami hackerek kompromittálták több ország diplomáciai, tengeri és közlekedési szervezeteinek eszközeit...

MA 10:02

Az Anthropic kiszáll az MI-hirdetésekből

🛑 Az Anthropic szerdán bejelentette, hogy MI-chatbotja, Claude teljesen reklámmentes marad. Ezzel éles határvonalat húz saját szolgáltatása és az OpenAI közé, amely nemrég az olcsóbb ChatGPT Go csomagban kezdett hirdetésekkel kísérletezni...

MA 09:58

Az MI-vel turbózott AWS-betörés: adminjogok 10 perc alatt

Egy digitális behatoló villámgyorsan, kevesebb mint 10 perc alatt szerzett adminisztrátori jogosultságot egy AWS-környezetben, hála a nagy nyelvi modellek (LLM) automatizálásának...

MA 09:49

A bhutáni bitcoinoffenzíva: kezdetét vette az idegháború

🗡 A Bhutáni Királyi Kormány több mint 184 bitcoint, vagyis mintegy 5,1 milliárd forintot mozgatott át kereskedő cégekhez és tőzsdékre, amikor a BTC ára 71 000 dollár (kb...

MA 09:41

A nosztalgia ára: itt a limitált Canon G7 X III

📷 A Canon a PowerShot digitális fényképezőgépek 30. évfordulójára egy különleges, limitált szériás G7 X III kompakt gépet dob piacra...

MA 09:33

Az n8n kritikus hibái akár teljes szerverátvételt eredményezhetnek

🚨 Az n8n nevű, népszerű, nyílt forráskódú, automatizált munkafolyamat-platformban több kritikus biztonsági hibát találtak, amelyek lehetővé teszik a támadók számára, hogy kikerüljék a biztonsági korlátokat és átvegyék az irányítást a kiszolgáló felett...

MA 09:26

A netet már az MI-botok uralják, az emberek eltűnnek

Az interneten egyre nagyobb teret nyernek az MI-alapú robotok, miközben az emberek jelenléte folyamatosan csökken...

MA 09:17

Szabályozás vagy kínai fölény dönti el az amerikai önvezetők sorsát?

A szenátusi meghallgatáson a Waymo és a Tesla vezetői nyomatékosan kérték a törvényhozókat, hogy mielőbb alkossanak jogszabályokat az önvezető járművek szabályozására, különben könnyen lehet, hogy Kína beelőzi az Egyesült Államokat a technológiai versenyben...

MA 09:09

A rejtélyes ausztrál mágneses anomália: a múltunk kulcsa?

🔑 Ausztrália Északi Területe alatt a kutatók egy eddig ismeretlen, Ausztrália alakját idéző mágneses anomáliát találtak, amely új fejezetet nyithat a kontinens geológiai történetének feltárásában...

MA 09:01

Az amerikai ügynökségek versenyt futva javítják a kritikus SolarWinds-hibát

Amerikai kormányzati szerveket szoros határidővel kötelezték, hogy frissítsék SolarWinds Web Help Desk-rendszereiket, miután támadók egy kritikus sebezhetőséget kihasználni kezdtek...

MA 08:50

Így teljesít a Swarovski NL Pure 8×32 a teszten

👀 A Swarovski NL Pure 8×32 kétségtelenül a távcsővilág egyik csúcsmodellje: kristálytiszta képminőség, könnyű, kompakt kialakítás és annyira élethű látvány, hogy szinte 8K videót néznél rajta...

MA 08:41

Az új VMware ESXi-sebezhetőségre már lecsaptak a zsarolóvírusok

🛡 A VMware ESXi egyik súlyos sebezhetősége, a CVE-2025-22225 mostanra a zsarolóvírus-bűnözők kedvence lett...

MA 08:33

A Galaxy S26 nem az áttörés, amire vártunk?

A közelgő Galaxy S26 sorozatról eddig több pletyka keringett, hogy beépített mágneseket kaphat, amelyek támogatnák a mágnesesen rögzíthető kiegészítőket és a fejlett MPP-s töltőket...

MA 08:25

A Super Bowl MI-csatája: ki játszik tisztán a reklámokban?

🚩 A Super Bowl vasárnapján az OpenAI és az Anthropic, két MI-fejlesztő cég ellentéte került a figyelem középpontjába...

MA 08:17

A kisbolygó, amely látványos krátert vághat a Holdba

🚀 Egy csaknem 60 méteres aszteroida 4 százalékos eséllyel csapódhat a Holdba 2032-ben – a jelenség pedig szabad szemmel is látható lesz a Földről...

MA 08:02

Az amerikai hadsereg robotokkal verné vissza a biofegyvereket

🤖 Az Egyesült Államok hadserege robotrendszereket keres, amelyek képesek elvégezni a veszélyes vegyi és biológiai fegyverek utáni nagytakarítást...

MA 07:58

Az Apple 2026-ban berobban: sztárok, sorozatok, meglepetések

🎉 Az Apple TV+ továbbra is irigylésre méltó helyzetben van a streaming piacon...

MA 07:49

Az új Sony-rekord mögött: szárnyal a profit, bajban a PlayStation

A Sony ismét erőteljes negyedéves eredményeket mutatott fel: az október–decemberi időszakban az üzemi nyereség elérte az 515 milliárd jent (kb...

MA 07:41

Az autizmus itthon egészen más, mint hittük

A legfrissebb svéd kutatás teljesen új megvilágításba helyezi azt a régóta tartott feltételezést, hogy az autizmus elsősorban a fiúkat érinti...

MA 07:33

A pelenka olcsó anyaga új korszakot nyit a mikroszkópiában

A modern mikroszkópia egyik legmeglepőbb áttörése iskolai vegyszerként indult. Míg a legtöbb kutató klasszikus mikroszkópokat használ, amelyek üveglencsékkel nagyítják fel a mintákat, sok részlet még így is rejtve marad...

MA 07:26

Az S&P 500 újra esik: a techpapírok rántják le a piacot

Az S&P 500 az elmúlt hat napból ötödször zárt veszteséggel, ezúttal 0,5%-ot esett, miközben a Dow Jones 0,5%-kal, azaz 260 ponttal emelkedett, a Nasdaq pedig 1,5%-os visszaesést mutatott...

MA 07:17

A fél évtizedes GitLab-sebezhetőség továbbra is fenyeget

Az amerikai kiberbiztonsági hivatal (CISA) felszólította az állami szerveket, hogy három héten belül frissítsék rendszereiket egy öt éve ismert GitLab-sebezhetőség miatt, amelyet jelenleg aktívan kihasználnak támadásokban...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/5

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:10

A semmiből bukkannak elő az univerzum furcsa részecskéi

A kvantumfizika különös világa tele van meghökkentő jelenségekkel: véletlenszerű korrelációkkal, bizonytalanságokkal és talán a legfurcsábbal, amikor részecskék a semmiből, látszólag ok nélkül jelennek meg...