2026. 05. 13., 09:50

A Perceptron Mk1 olcsón tarol a videóelemző MI-piacon

Többek között a vállalatok régóta keresik azt a technológiát, amely képes valós időben értelmezni és feldolgozni a videókat. Egy ilyen eszköz túlmutat a hagyományos biztonsági rendszereken: képes automatikusan kiemelni a marketingvideók legizgalmasabb pillanatait, felismeri a hibákat vagy zavarokat, és figyelmeztet a jelenlétükre, sőt, viselkedéselemzésre is alkalmas különböző tudományos vagy munkaerő-felvételi helyzetekben.

Perceptron Mk1: Alternatíva a gigászok árnyékában

Az amerikai Perceptron Inc. újítása, a Perceptron Mk1 modell, alapjaiban rengeti meg a piacot. Az MI videóelemzője mindössze 22 Ft (0,15 USD) egymillió bemeneti tokenenként és 220 Ft (1,50 USD) egymillió kimeneti tokenenként dolgozik, ami 80–90%-kal olcsóbb, mint a hasonló képességű MI-platformok, például az Anthropic-féle Claude Sonnet 4.5, az OpenAI GPT-5 vagy a Google Gemini 3.1 Pro. A cég vezérigazgatója, Armen Aghajanyan korábban a Meta FAIR-nél és a Microsoftnál dolgozott, és csapatával 16 hónapon át egy teljesen új, multimodális algoritmus fejlesztésén munkálkodott, hogy az MI a valódi, fizikai világban is releváns tudással rendelkezzen.

Tarol a legkeményebb teszteken

Különösen fontos kiemelni, hogy a Perceptron Mk1 eredményei meghaladják a nagy nevek eredményeit is a szektorban. Térbeli logikai feladatokban (ER Benchmarks) 85,1 pontot ért el az EmbSpatialBench teszten, maga mögé utasítva a Google Robotics-ER 1.5 (78,4) és az Alibaba Q3.5-27B (kb. 84,5) modelleket is. A különösen nehéz RefSpatialBench teszten 72,4 ponttal messze felülmúlta az OpenAI GPT-5m (9,0) és a Sonnet 4.5 (2,2) eredményeit.

Videóalapú kihívásokban is kimagasló: az EgoSchema Hard Subset esetében – ahol nem elég pusztán az első és az utolsó képkockát vizsgálni – 41,4 pontot szerzett, míg a Google Gemini 3.1 Flash-Lite csak 25,0 pontot ért el. A VSI-Bench teszten 88,5 pontjával minden vetélytársat lekörözött.

Hatékonyság új szintje és piacformáló árazás

A Perceptron célzottan az úgynevezett „Efficiency Frontier”-re lőtt, vagyis a teljesítmény és költséghatékonyság egyensúlyára. Míg a GPT-5 átlagos ára közel 290 Ft (2 USD) egymillió tokenenként, a Gemini 3.1 Pro pedig hozzávetőleg 440 Ft (3 USD) egymillió tokenenként, addig az Mk1 blended (átlagolt) költsége mindössze 44 Ft (0,30 USD) ugyanerre az adatmennyiségre, miközben a logikai teszteken jobb eredményeket produkál.

A megközelítés lényege, hogy a fizikai világ MI-alapú értelmezése ne csak elit laborok és kutatások számára legyen elérhető, hanem nagyipari, kereskedelmi szereplők is beépíthessék mindennapi folyamataikba.

Egyedi felépítés és valós időben értelmezett videófolyam

A Perceptron Mk1 egyszerre képes natív videofelvételeket 2 képkocka/másodperc sebességgel, akár 32 ezer tokenes ablakban értelmezni. Több szempontból is eltér a hagyományos kép- és szövegalapú MI-ktől: nem egy-egy képkockát elemez önálló képként, hanem folyamatos, összefüggő cselekményként látja a videót, és képes felismerni a tárgyakat akkor is, ha azok időlegesen kitakarásba kerülnek.

A fejlesztők tetszőleges pillanatokra kérdezhetnek rá, amelyekre a rendszer strukturált időbélyegekkel válaszol, jelentősen egyszerűsítve például a fontos események automatikus kivágását vagy pontos beazonosítását.

Fizika az MI-ben – valódi térbeli-logikai tudás

A Perceptron Mk1 döntő előnye az úgynevezett fizikai logika és térbeli tudás. Képes valós időben következtetni tárgyak dinamikájára, interakcióira, sőt akár leolvasni analóg órákat vagy mérőműszereket, amelyek eddig kihívást jelentettek a digitális rendszereknek. Például egy kosármeccsen pontosan meg tudja mondani, hogy a kosárdobás a sípszó előtt vagy után történt – ez a labda pályájának és a kijelző állásának egyidejű értelmezését igényli.

Felhasználói tapasztalatok is ezt igazolják: a rendszer akár több száz objektumot is összeszámol zsúfolt jelenetekben, bonyolult, régi felvételeken is gyorsan és pontosan felismeri a részleteket, az időpontokat is helyesen azonosítja.

Fejlesztői platform és nyílt modelllicenc – mindkét világ legjava

A modell megjelenése mellett a Perceptron kibővített fejlesztői platformot is kínál: a Python-alapú SDK révén már kevés kóddal is hasznosítható a gépi érzékelés. Olyan speciális funkciókat ad, mint a Fókusz (adott területek automatikus kijelölése), a Számlálás (tömeges felismerés és megszámlálás például gyümölcsnél vagy kiskutyáknál), illetve a példatanulás (in-context learning), amellyel pár példából rá lehet tanítani az MI-t új felismerési kategóriákra.

A vállalat kétirányú licencstratégiát alkalmaz: a csúcsváltozat (Mk1) zárt, csak API-n keresztül érhető el, azonban az Isaac-sorozat nyílt forráskódú alternatíva marad egészen 2 milliárd paraméteres méretig, gyors, 0,2 másodpercen belüli válaszidővel.

Mögöttes csapat és jövőkép

A Perceptron AI történetét két, a Metánál (Facebook AI Research) kutatóként dolgozó alapító, Armen Aghajanyan és Akshat Shrivastava indította. 2024 végén döntöttek úgy, hogy a digitális MI helyett olyan rendszereket építenek, amelyek a fizikai világot is képesek értelmezni. Korábbi közös kutatásuk az új generációs, vegyes szekvenciákat (képet és szöveget) feldolgozó modellek fejlesztése volt, az ezekből leszűrt tapasztalatokat vitték tovább a Perceptron megoldásaiba.

Valós terep – már alkalmazzák élesben

A rendszer képességeit már most hasznosítják különféle partnerek: sportközvetítésekben automatikusan kiemelik a legfontosabb jeleneteket, robotikai alkalmazásokban a tanuláshoz használt adatok automatikus címkézése és tisztítása zajlik, gyártósorokon multimodális minőségellenőrzést végeznek, okosszemüvegeken segítő, kontextusérzékeny információkat szolgáltatnak a felhasználóknak.

A Perceptron célja, hogy a fizikai világ MI-megértése éppoly magától értetődővé váljon, mint a digitálisé, új korszakot hozva az ipar, biztonság, robotika és tartalommoderáció terén.

2026, adminboss, venturebeat.com alapján

filózó

Te mennyire bíznál egy ilyen MI-alapú videóelemző rendszerben?
Te hogyan ellenőriznéd, hogy a rendszer valóban pontosan működik?

Legfrissebb posztok

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

Tudomány

MA 09:49

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

💨 A Microsoft károsanyag-kibocsátása tavaly 25%-kal nőtt, ami főleg az adatközpontok gyors terjeszkedésének köszönhető...

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

MI Hírek

MA 09:37

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

📱 A Google ismét újat mutat a Pixel okostelefonok világában – mostantól az eszközökön futó mesterséges intelligencia még erősebbé teszi a mobilokat, úgy, hogy közben védi a felhasználók adatait...

APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/15

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás egyszerű és gyors megoldást kínál két dátum közötti napok kiszámítására...

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Színes

MA 09:01

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Az Észak-Minnesotában pusztító erdőtüzek füstje hamarosan elérheti az Egyesült Államok északkeleti nagyvárosait, többek között Detroitot, Milwaukee-t, Clevelandet, Philadelphiát és New Yorkot...

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

Tudomány

MA 08:49

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

A Minnesotai Egyetem laboratóriumában újszerű biológiai eredmény született: egy aprócska SpudCell nevű képződmény képes táplálkozni, növekedni, versengeni, osztódni és lemásolni önmagát – vagyis szinte mindent tud, amit egy élő sejt is...

MI Hírek

MA 08:36

Az új Google Képek Pinterest-szerű, felfedezésre kihegyezett átalakítást kapott

A Google Képek (Google Images) megújult külsőt kapott: mostantól személyre szabott galériákat kínál a felhasználóknak, így még könnyebben fedezhetik fel az őket érdeklő képeket...

MI Hírek

MA 08:12

A Google DeepMind az USA-t tenné az MI-szabványok élére

A Google DeepMind vezére, Demis Hassabis szerint az új generációs mesterséges intelligencia egyre komolyabb veszélyeket rejt magában, például a kiberbiztonság és a biológiai fenyegetések terén...

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

Tudomány

MA 08:01

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

💊 Fontos kérdés, hogy meg lehet-e állítani vagy lassítani az Alzheimer-kór lefolyását, hiszen a demencia legfőbb oka, az Alzheimer-kór, világszerte rengeteg embert érint...

Tudomány

MA 07:49

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

🚀 Sikeresen megérkezett kedden a Nemzetközi Űrállomásra egy amerikai–orosz személyzet, miután a kazahsztáni Bajkonurból indultak a Roszkoszmosz által üzemeltetett Szojuz MS-29 fedélzetén...

Tudomány

MA 07:37

A Microsoft Secure Bootja tíz éve lyukas, észre sem vették

🔒 Az informatika egyik legfontosabb biztonsági eleme, a Secure Boot, már csaknem tíz éve lényegében védtelenné vált – és ezt eddig senki sem vette észre...

Tudomány

MA 07:24

A csípős paprika növelheti egy halálos rák kockázatát?

Bár a csípős paprika számos kultúra elválaszthatatlan része, és egyes laboratóriumi kísérletek a bennük található vegyületeket, például a kapszaicint gyulladáscsökkentőnek vagy akár daganatellenesnek mutatják, az utóbbi évek humán kutatásai nem ennyire egyértelműek...

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Tudomány

MA 07:02

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Április 6-án négy űrhajós indult el az Artemis II misszió keretében az Orion űrhajóval, és körülbelül 40 percig teljesen eltűntek a Föld látóteréből...

Színes

MA 06:38

A Microsoft rekordméretű javításözöne: 570 hiba és 3 zero-day

🔧 Szinte példátlanul nagy frissítési csomagot adott ki a Microsoft a 2026...

MI Hírek

MA 06:25

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

💼 Májusban a Meta megvált dolgozóinak 10 százalékától, közel 8 000 alkalmazottat küldött el, ami jelentős átszervezéssel járt a vállalat MI-re és adatközpontokra irányuló fejlesztései miatt...

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 15.)

Időutazás egyetlen napon: Jeruzsálem falainak áttörésétől 🏰 a Rosetta-kő 🗿 megtalálásán és Napoleon 🚢 megadásán át a Grunwaldnál vívott döntő ütközetig ⚔️, sőt a modern korszakban a törökországi puccskísérletig 🇹🇷 és a Mozilla alapításáig 🦊...

Tudomány

kedd 18:31

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tipikus eset, amikor egy ismert gyógyszer egészen váratlan előnyöket kínál. A GLP-1 típusú szerek, mint az Ozempic, a Wegovy vagy a Rybelsus, eredetileg a fogyás, a jobb vércukorszint-szabályozás és a szívbetegségek kockázatának csökkentése miatt váltak népszerűvé...

Tudomány

kedd 17:30

Az indiai tudósok megalkották az emberi agytörzs eddigi legrészletesebb 3D-atlaszát

Indiai kutatók a világ eddigi legrészletesebb, háromdimenziós agytörzs-atlaszát hozták létre, amelyben MRI-felvételeket több mint 500 mikroszkópos szövetrészlettel kapcsoltak össze...

Tudomány

kedd 17:01

A Tejútrendszer mélyén cukrot találtak a kutatók

Többek között különleges eredményre jutottak a kutatók: a Tejútrendszer középpontjához közel egy óriási gázfelhőben felfedeztek egy ritka cukorfélét, az eritrózt, amely nemcsak málnában, hanem barnító krémekben is megtalálható...

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Kriptó

kedd 16:01

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Ami kezdetben ártalmatlannak tűnt, végül az IBM történetének egyik legsötétebb napjához vezetett a tőzsdén...

A NASA Perseverance-je célba ért: megvan a marsi maraton

Tudomány

kedd 15:01

A NASA Perseverance-je célba ért: megvan a marsi maraton

🚀 Történelmi teljesítmény született a Marson: a Perseverance marsjáró öt év és négy hónap után elérte a 42,195 kilométeres maratoni távot...

Színes

kedd 12:01

A régi T‑Mobile-csomagoknak vége: kényszerváltás már ezen a héten

Ami kezdetben ártalmatlannak tűnt, most minden régi T-Mobile-előfizető számára valódi változás: a társaság e héttől kezdve automatikusan átsorolja a 10–15 éves tarifákat – például a Simple Choice, T-Mobile One, One Plus, a Magenta családhoz tartozó, valamint a Sprintből áthozott régi csomagokat – modernebb tarifákra...

Kriptó

kedd 11:31

Az inflációs adat előtt megroggyan a Bitcoin

A legnagyobb kriptovaluták teljesítménye az elmúlt 24 órában jelentősen visszaesett, miután egyre többen valószínűsítik, hogy az amerikai jegybank akár már júliusban kamatemelés mellett dönt...

Színes

kedd 11:02

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Az elmúlt pár évben váratlan fordulat történt a fotózás világában: a fiatal generáció újra felfedezte a filmes fényképezőgépeket...

MI Hírek

kedd 10:49

A Turing-mítosz vége: lehet, hogy tévedett a mesterséges intelligenciáról?

🤔 A mesterséges intelligencia kutatása 75 éve követi Alan Turing útmutatását, aki két alapvető feltételezést tett: az intelligencia létrehozható szoftverből, függetlenül a testtől, és hogy egy gép intelligensnek számít, ha sikerrel utánozni tudja az embert, például egy beszélgetés során...

MI Hírek

kedd 10:37

Az MI átírja a marketinget: a régi szabályoknak befellegzett

💡 A Fortune 500 cégek vezető marketingesei kénytelenek szembenézni azzal a ténnyel, hogy a korábbi, jól bevált módszerek egyszerűen elavultak...

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

Színes

kedd 10:25

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

🚀 A legújabb Google System-frissítés idén nyáron ismét ráncfelvarrást hoz az Android-felhasználóknak...

Színes

kedd 10:01

Végre itt a hideg vízzel elkészíthető Cup Noodles!

🍹 Lényeges szempont, hogy az instant tészták villámgyors megoldást kínálnak, legyen szó egyetemista vacsoráról vagy gyors munkahelyi ebédről...

Színes

kedd 09:48

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

A Google a Pixel telefonokon jelentősen megkönnyíti a csengőhangok, az ébresztők és az értesítések hangerejének szabályozását...

Színes

kedd 09:37

A legnagyobb japán taxitársaság leállította rendszereit kibertámadás után

Felmerül a kérdés, hogy mi történik egy nagyvállalattal, ha leáll a teljes informatikai rendszere?..