
Eltűnt adatok: elveszett korszakok
Az adatvesztés egyre gyakoribbá válik, ahogy a projektek befejeződnek vagy tulajdonost váltanak. Jim Cowie, akit sokan az internet-infrastruktúra történetének lelkes krónikásaként tartanak számon, első kézből szenvedte meg ezt a folyamatot. Saját vállalkozása, a Renesys évekig gyűjtött részletes hálózati adatokat, ám a felvásárlások után (előbb a Dyn, majd az Oracle szerezte meg) több értékes állomány is elveszett. Cowie szerint az információ lassan elszivárog, ha nem gondoskodnak a megőrzéséről.
Indul az Internet History Initiative
Az adatszemét felett érzett elkeseredettség indította el Cowie új projektjét, az Internet History Initiative-et (IHI). Az IHI célja, hogy ne csupán archiválja ezeket a logfájlokat, hanem megteremtse annak feltételeit, hogy a jövő kutatói hitelesen feltárhassák az internet társadalmi hatásait. Cowie szerint erre csak úgy van esély, ha könyvtárosok, archívumok, technikusok és jogászok összefognak, és biztosítják a sokszorosított, offline mentéseken alapuló megőrzési stratégiát (Lots of Copies Keep Stuff Safe – „sok másolat megőrzi az anyagot” elv).
A tervek szerint a több intézményből álló együttes nemcsak biztonságosan, akár száz évre elmenti az adatokat, de „meleg tárakban” (warm storage) elérhetővé is teszi őket elemzők és kutatók számára.
Helyi sikerek és együttműködések
A projekt számára biztató, hogy több szervezet, például a RIPE NCC vagy az Oregoni Egyetem RouteViews csoportja már évtizedek óta gyűjti és rendszerezi a hasonló hálózati forgalmi adatokat, a határon átnyúló BGP-forgalomtól kezdve az útválasztási eseményekig. Ezek együttműködése révén az IHI-nek nem a nulláról kell indulnia: már sikerült is visszaszerezni néhány kulcsfontosságú adatállományt, köztük a SLAC PingER mérési anyagait, és több szervezet jelezte segítő szándékát.
Az eltűnt adatok utáni hajszában
Mindezek dacára továbbra is számos olyan adatgyűjtemény létezik, amely talán örökre elveszett. Cowie például megemlített egy akadémiai projektet, amely minden, az USÁ-ból Nagy-Britanniába tartó adatcsomagot rögzített két órán át – a tanulmány még megtalálható, de maga az alapadat már nem. Az IHI abban bízik, hogy magánszemélyek vagy intézmények révén további, elveszettnek hitt gyűjtemények is előkerülhetnek; akár régi mágnesszalagokon vagy elfeledett szervereken.
Ugyanis a nagy hálózati gyártóknál, mint például a Cisco, elképzelhetetlen mennyiségű, évtizedek alatt felhalmozott felhasználói adat vár arra, hogy egy ilyen archívum hasznosítsa őket.
Lehetőség a múltunk megmentésére
Ennek alapján megállapítható, hogy az Internet History Initiative fontos lépést jelenthet a digitális emlékezet megőrzésében – de csak közös összefogással, támogatással és megfelelő anyagi háttérrel valósulhat meg. Az elveszett és megmentett adatállományok sorsa végül azt határozza meg, mennyit érthetünk meg az internet korának társadalmi változásaiból.
