Saját MI-utódunkat tanítjuk be minden egyes billentyűleütéssel?

Saját MI-utódunkat tanítjuk be minden egyes billentyűleütéssel?
  Hősünk 2025 februárjában elgondolkodott azon, hogy mennyi idő múlva fogják a munkáltatók mesterséges intelligenciával helyettesíteni alkalmazottaikat, hiszen minden szükséges adattal rendelkeznek ehhez.

Egy év távmunka a Google-nél

2020 és 2021 között hősünk teljes munkaidőben dolgozott a Google-nél, teljesen távmunkában. Soha nem járt a Google székhelyén, minden hozzájárulása digitális volt: billentyűleütések, érintőpad-mozgások és egérkattintások sorozata a hivatalos Google laptopjáról. Videótalálkozókon keresztül adott hang- és videóbemeneteket, de soha senki nem látta személyesen.

Csak nemrég merült fel a gondolat, hogy ezeket a cselekedeteket valószínűleg rögzítették. Természetesen bizonyos dolgokról már ismert volt, hogy rögzítve vannak: például a Google monorepo-ba beküldött kódsorok feltehetően még mindig ott vannak. A levelek is tárolva vannak valahol, ahogy a Google Docs-on keresztül írt jegyzetek is. De mi a helyzet a vállalati számítógépen végzett többi tevékenységgel?

Nagyonis lehetséges, hogy az egész napi munkafolyamatot dokumentálták. Elméletileg a munkáltatónak joga volt minden olyan bemenetet gyűjteni, amit a vállalati számítógépen adtak meg: minden egérkattintást, minden billentyűleütést. És ezeket mind visszaküldhették volna valamilyen adattárházba. Ez sokkal gazdagabb adattípus, mint egyszerűen a kimeneti kódsorok: ezek olyan *viselkedési nyomok*, amelyek meghatározzák, hogyan oldódnak meg problémák az elejétől a végéig.

Távmunka automatizálása felügyelt tanulással

A viselkedési nyomok a munkakimenet automatizálásának fogalmát a mesterséges intelligencia jól definiált tanulási problémájává egyszerűsítik. A modell bemenetei lennének mindazok a bemenetek, amelyeket a számítógép szolgáltat: képernyőn megjelenő pixelek, esetleg hang. A kimenetek pedig azok a “műveletek”, amelyeket a számítógépen végeztek: billentyűleütések, egérmozgások, kattintások.

Nagy léptékben teljesen megvalósíthatónak tűnik olyan nagy modell betanítása, amely képes megjósolni a műveleteket a számítógépes bemenetekből. Ez a jelenlegi technológiával is megoldható: felügyelt tanulással, amely lehetővé teszi a műveletek előrejelzését számítógépes bemenetekből, és transzformerek segítségével, amely neuronhálózat-típus kiválóan alkalmas nagy mennyiségű adatból való tanulásra.

A vállalat szempontjából a folyamat egyszerű lenne. A munkáltató rögzíti a munkavállaló tevékenységét bizonyos ideig; betanít egy modellt, hogy reprodukálja a kimenetét a legmonotonabb és legunalmasabb feladatokhoz. Vagy talán a vállalat az összes rendelkezésre álló adatot felhasználja, és egy modellt tanít be az összes alkalmazott kimenetének összességére. Ez közelebb állna ahhoz, amit más területeken, például a képfelismerésben és a nyelvfeldolgozásban láttunk sikeresen működni, ahol a több adaton való tanítás általában a helyes válasz.

Tökéletlen modelljeink képesek-e javítani termelékenységünket?

A cégek tehát betaníthatnak egy modellt az alkalmazottak cselekedeteinek utánzására. De hogyan használhatók ezek a modellek? Ha a létrejött mesterséges intelligenciára gondolunk, az nem lenne az alkalmazott közvetlen helyettesítője, hanem egy valószínűségi modell, amely megmondja egy adott művelet valószínűségét egy adott bemenet alapján.

A neurális hálózatokat könnyen megtéveszthetik a megtévesztő bemenetek, és általában nem teljesítenek jól, ha a bemenetek túlságosan eltérnek a megszokottól. Ezek az emberekkel ellentétben problémát jelentenek.

Magasabb bizonytalanságú helyzetekben a modell kevésbé hasznos eloszlást adna a potenciális műveletekről. Ilyenkor a mohó művelet-mintavételezés “kitettségi torzításhoz” vezethet, ahol a modell valami furcsát csinál, olyan helyzetbe kerül, amelyet még soha nem látott, és elkerülhetetlenül kisiklik.

A legvalószínűbb megoldás hasonló lesz ahhoz, ami az önvezető autók esetében bevált: a számítógép magától “vezethet”, amíg nem találkozik valami teljesen váratlannal, amikor egy ember beavatkozik. Miután az újszerű forgatókönyv megoldódott, és a feladat ismét hasonlít valamire, amit a számítógép már tud kezelni, a modell folytathatja a működést.

Kétféle alapvető felhasználói felület képzelhető el: “gyorsítás” stílus és “művezető” stílus.

A gyorsítási beállításban az asszisztens nagyon gyorsan elvégezne bizonyos feladatokat, míg a felhasználó várakozik. Ha a bemeneti késleltetés nem korlátozó tényező, a számítógép egy szempillantás alatt elvégezhetné a feladatokat.

A művezető módban egy ember felügyelne *sok* párhuzamosan dolgozó MI-t. Ez csak akkor lehetséges, ha a modellek beavatkozás nélkül tudják végezni munkájuk nagy részét. Ebben a beállításban egy személy lenne felelős több MI asszisztens sikeréért, és akkor segítene nekik, amikor a feladat elér egy bizonyos bizonytalansági szintet.


Mit jelent ez a mi számunkra?

A fejlődés növeli a digitális munka átlagos entrópiáját. Ennek az elvnek semmi köze a neurális hálózatokhoz. Ahogy jobb eszközöket fejlesztünk ki, gyorsabban tudjuk elvégezni az ismétlődő feladatokat. A jobb absztrakciók csökkentik a bemenet mennyiségét, amellyel ugyanannyi kimenetet tudunk generálni.

Minden távmunkás munkája időnként ismétlődő jellegű. Az érték abból származik, ahogyan a legkevésbé ismétlődő dolgokat kezelik: reagálnak az új helyzetekre, alkalmazkodnak a változásokhoz. Az új eszközök csökkenteni fogják a munkában lévő ismétlődések mennyiségét. A mindennapi munka kevésbé lesz kiszámítható, mivel a legvilágosabb és legmonotonabb feladatokat modellezik.

Mindezek alapján hogyan teheti magát nélkülözhetetlenné az ember? A válasz az entrópia elleni harccal. Ha a leghatékonyabb vállalat az, ahol az alkalmazottak mindig a legkevésbé ismétlődő dolgot csinálják, akkor a legproduktívabb alkalmazott az, aki a legkevésbé modellezhető. A hangsúly azokon a dolgokon van, amelyekhez nehéz tréningadatokat gyűjteni.

A “legbiztosságosabb” vagy legnehezebben MI-esíthető munkák azok, amelyek sok váratlan helyzetet tartalmaznak, kreativitáson vagy más emberi sajátosságon alapulnak.

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 20:50

Az MI új trükkjei: védekezés a hálózat mélyén

Érdekes felvetés, hogy a kiberfenyegetések napjainkra új szintre léptek: a támadók egyre gyakrabban támaszkodnak mesterséges intelligenciára, amivel a védekezés is komplexebbé és a sebességét tekintve is nagyobb kihívássá válik...

MA 20:33

A Mullvad kizárja az OpenVPN-t: csak a WireGuard marad

A Mullvad VPN merész lépésre szánta el magát: végleg száműzi az OpenVPN-támogatást az asztali alkalmazásokból, és minden felhasználót WireGuardra terel át...

MA 20:17

Az új főbűnös a rejtélyes halálos kórokban: a hiányzó fehérje

Egy új felfedezés szerint egy eddig rejtve maradt fehérje, az RPA, kulcsfontosságú lehet számos, akár halálos betegség kialakulásában...

MA 20:02

Az árzuhanás megkezdődött az ingatlanpiacon – nem mindenkinek jó hír

Több mint két év után először országos szinten csökkennek a házárak az Egyesült Államokban...

MA 19:49

Az alakváltó molekulák forradalma már itt van

🚀 A Jyväskyläi Egyetem kutatói áttörő módszert fejlesztettek, amellyel a szintetikus molekulák egyszerűen programozhatók: így most már képesek spirális szerkezetekbe rendeződni, sőt akár formát is váltani...

MA 19:34

Újabb biztonsági rés: 700 Gogs-szervert törtek fel világszerte

Egy foltozatlan, eddig nem nyilvánosságra hozott biztonsági rés a Gogsban, a népszerű, önállóan üzemeltethető Git-szolgáltatásban lehetővé tette, hogy támadók távoli kódfuttatást hajtsanak végre, és így több száz szervert kompromittáljanak világszerte...

MA 19:17

Az Xsight Labs parányi chipje tarol a Starlinknél

Az Xsight Labs, amely mögött olyan nagyágyúk állnak, mint az AMD, az Intel Capital és a Marvell, most komoly győzelmet aratott: az ő X2 kapcsolóchipjük került be a SpaceX új, Starlink V3 műholdjaiba...

MA 19:03

Visszatér-e a Twitter? Bluebird szemben Elon Muskkal, a „márkagyilkos megváltóval”

Fontos kérdés, hogy vajon feltámasztható-e az egykor legendás Twitter, amelyet Elon Musk minden eddiginél radikálisabban változtatott meg, és most már X néven fut...

MA 18:49

A Disney-varázs elszabadult: MI-vel bárki sztárt gyárthat

🎞 A Disney 360 milliárd forintot (1 milliárd dollárt) fektet az OpenAI-ba, hogy legendás karakterei életre kelhessenek a legújabb MI-alkalmazás, a Sora segítségével...

MA 18:34

Az MI nagy dobása: Disney-hősök kelnek életre Sora-videókban

📺 A Disney óriási, 370 milliárd forintos (1 milliárd dollár) befektetést jelentett be az OpenAI-ba, amellyel példátlan együttműködést indít el a generatív MI világában...

MA 18:17

A Windowsban végre vége a fehér villanásoknak

A Microsoft végre orvosolta azt a bosszantó hibát, amely miatt a Windows 11 Sötét módban futó Fájlkezelő használatakor hirtelen vakító fehér villanások jelentek meg...

MA 18:02

A tél kapuja: mit hoz a téli napforduló?

Decemberben a legrövidebbek a nappalok, de a tél kezdete nem is olyan egyértelmű, mint hinnéd...

MA 17:50

A fogyókúra új csodaszere: dán gyógyszergyár szorongatja a nagyokat

Ez a jelenség jól illusztrálható azzal, hogy a dán Zealand Pharma merész, 2030-ig tartó stratégiát hirdetett, amellyel új lendületet hozna a fogyást segítő gyógyszerek piacára...

MA 17:33

Az idei nyolcadik Chrome-botrány: újabb kritikus hibát foltozott a Google

⚠ A Google újabb, a gyakorlatban is kihasznált, úgynevezett nulladik napi sebezhetőséget javított a Chrome böngészőben – ez már a nyolcadik ilyen javítás 2025-ben...

MA 17:18

Az aranyos társasjáték, amely brutális agytornát kíván

Érdekes felvetés, hogy egy tündéri, állatkákkal illusztrált társasjáték valójában igazi, többrétegű stratégiai kihívást rejthet...

MA 17:02

Az új Pixel Camera-frissítés totális káoszt okoz?

📷 A Pixel telefonokat sokan főleg kiváló fotózási képességeik miatt választják, és a gyári Pixel Camera alkalmazás most a 10...

MA 16:50

A szmogtengerben fuldoklik Hanoi

Egy hete vastag, mérgező szmog borítja Hanoi utcáit, amely elhomályosítja a város látképét, és nehézlégzést okoz a kilencmilliós lakosság körében...

MA 16:33

A 4000 milliárdos gigadeal: az IBM viszi a Confluentet

💰 A technológiai világ ismét felforrósodott: az IBM bejelentette, hogy 11 milliárd dollárért (kb...