
Az MI, ami helyetted nézi végig a kamerákat
Nem hagyható figyelmen kívül, hogy a jelenlegi MI-rendszerek – a Google, az OpenAI vagy akár a Meta modelljei – gyakran csak egy-két órás videót tudnak összefüggéseiben értelmezni. A Memories.ai társalapítói, Dr. Shawn Shen és Enmin (Ben) Zhou, éppen ezen szeretnének változtatni; Shen például korábban a Meta valóságlaborjában kutatott MI-modelleket. Elképzelésük szerint az MI képes legyen a felhasználó vizuális emlékezetéhez hasonlóan hosszabb időszakokon át „gondolkodni”, mintákat keresni, és következtetéseket levonni a látottakból.
Erre utal többek között, hogy a fejlesztők saját technológiát használnak: előbb megtisztítják a felvételeket a zajtól, majd egy tömörítési rétegben csak a lényeges információkat tárolják, ezt pedig kulcsszavakkal és címkékkel kereshetővé, szegmentálttá és összesíthetővé teszik. Így nemcsak egy adott esemény kereshető vissza egyszerűen, de trendeket, tipikus cselekvéseket is fel lehet térképezni, amiket az MI észlel a videók adathalmazában.
Pénz, növekedés, jövő
A startup 8 millió dollárnyi (mintegy 2,8 milliárd forint) magvető befektetést kapott, többek között a Samsung Nexttől. Bár eredetileg 4 millió dollár volt a cél, az óriási érdeklődés miatt végül a duplája gyűlt össze. A különböző befektetők más-más lehetőséget látnak a technológiában: a Samsungot például az a képesség győzte meg, hogy a rendszer akár helyben, felhő használata nélkül is futtatható – ez adatvédelmi szempontból különösen fontos, főleg otthoni biztonsági kameráknál.
Jelenleg a Memories.ai marketingcégeknek segít a közösségimédia-trendek azonosításában és a legmegfelelőbb tartalmak előállításában, míg a biztonsági vállalkozások számára mintázatokat, kockázatos magatartásokat képes felismerni és megjelölni.
A jövő az MI-segítőkben rejlik
Ennek megfelelően nem csupán elemzőeszközt fejlesztenek: a cél egy olyan MI-asszisztens, amely akár a felhasználó képeiből, akár okosszemüvegen keresztül képes összefüggéseket felismerni, memóriát építeni, és támogatni a döntéseket. Ide tartozhat például önvezető autók útvonalmemóriája vagy humanoid robotok tanítása is.
A konkurencia sem tétlenkedik: a TwelveLabs vagy a Google is ezen a problémán dolgozik, de ők jelenleg kevésbé sokoldalúak, és főként rövidebb videók feldolgozására képesek. Shen hisz abban, hogy az ő rendszerük horizontálisan alkalmazható, bármilyen videómodellel szemben.
A startup jelenleg 15 főt foglalkoztat, a mostani támogatásból pedig a csapat bővítését és a keresési funkciók fejlesztését tervezik finanszírozni.