krono.inaplo.hu

  • A betűméret növelése
  • Alapértelmezett betűméret
  • A betűméret csökkentése
iNapló / iNter / Hálózati jelenségek / Az internet archívumai

Az internet archívumai

Tags: archiválás | archive team | geocities | jason scott

Alexander Stille, amerikai újságíró az információs kor egyik nagy iróniájának nevezte, hogy – bár soha azelőtt nem rögzítettek olyan mennyiségű adatot, mint a 20. század végén – ugyanakkor szinte biztosra vehető az is, hogy a rögzített információk jóval nagyobb hányada pusztult el, mint korábban bármelyik történelmi korszakban. Napjaink adathordozói sokkal kevésbé bizonyulnak tartósnak, mint a jól bevált papír, esetleg a pergamen – így például a 70-es évek közepétől a 90-es évekig elterjedt hajlékonylemezeken tárolt adatok ma már gyakran olvashatatlanok. Egy korábbi kutatás szerint az 1998-ban még elérhető honlapok 44 százaléka tűnt el nyomtalanul, alig egy év leforgása alatt – a honlapok átlagos élettartama 44 és 75 nap közé tehető. Szerencsére egyre többen tesznek azért, hogy az állandóan és egyre nagyobb mennyiségben előállított digitális tartalmak ne tűnjenek el rövid idő után örökre. 
 
Felépül a GeoCities

A 2009 óta aktív Archive Team is a digitális örökség megőrzését tűzte ki céljául. A Jason Scott számítástechnika-történész koordinálta csoport írók, programozók és önjelölt archivisták összefogása, első komoly akciójuk a GeoCities megmentése volt. A hosszú ideig a legnépszerűbb tárhelyszolgáltatók között szereplő GeoCities-t David Bohnett és John Reznor indította útjára 1994 végén, ekkor még Beverly Hills Internet néven. 1995-re alakult ki a virtuális városokon (innen a GeoCities név) és régiókon alapuló koncepció, a felhasználói weblapok besorolását tematikusan képzelték el, így a filmekkel kapcsolatos tartalmak Hollywoodhoz, a pénzügyi oldalak a WallStreethez tartoztak volna. Július 5-én 14-re bővült a virtuális negyedek száma, így például SiliconValley is választhatóvá vált. Az URL címekben is megjelent a negyedek neve egy – az egyedi azonosításra használatos – számsor előtt. Ugyanakkor a szolgáltató a továbbiakban nem próbálta meg a felhasználókkal (akiket egyébként “telepeseknek” neveztek) szigorúan betartatni a tematikus elvet, mindenki szabadon építhette saját honlapját és egyre többen éltek is a lehetőséggel. Decemberben már naponta több ezer új regisztráció érkezett, a GeoCities pedig havonta több mint 6 millió oldalletöltéssel büszkélkedhetett. A növekedés töretlen volt, annak ellenére, hogy az 1997 májusában az oldalakon megjelenített hirdetések számos negatív reakciót váltottak ki a felhasználók tömegeiből, év végére a GeoCities már az öt legnépszerűbb weblap közé került, az 1999-es látogatottsági adatok szerint pedig csak az AOL és a Yahoo! előzte meg.

Városok romjain

Jerry Yang és David Filo 1994-ben alapították meg a Yahoo! elődjét, Jerry és David World Wide Web kalauza néven (David and Jerry's Guide to the World Wide Web), ez kezdetben nem volt több  egy egyszerű, hierarchiába rendezett internetes címjegyzéknél. A kalauzt 1995 januárjában keresztelték át Yahoo!-ra, az új név mozaikszó, melynek feloldása: Yet Another Hierarchical Officious Oracle, utalva arra, hogy célközönségüket ekkor a munkahelyükön internetező irodai munkásokban látták. Az oldal egyre sikeresebb lett, a 90-es évek végére számos új szolgáltatást ajánló portállá nőtte ki magát. A növekedéssel párhuzamosan a vállalat elkezdett felvásárolni és beolvasztani más szolgáltatókat, így 1999 januárjában, 3,57 milliárd dollárért a GeoCities is az ő tulajdonukba került. Az átállás nem volt zökkenőmentes, a felhasználási feltételek megváltozása miatt – amely szerint a feltöltött tartalmak joga a céghez került – sokan megnehezteltek és tüntetőleg odahagyták oldalaikkal együtt a szolgáltatót is. A Yahoo! a nagy tiltakozás következtében végül enyhítette a feltételeket, nem sokkal később azonban – a prémium-fizetős csomagok bevezetésével párhuzamosan – korlátozta az ingyenes kontók adatforgalmát (a havi 3 GB mellett óránkénti 4.2 MB korlátozást vezettek be). Mivel a GeoCities még így sem hozott számottevő hasznot a vállalatnak, ezért már 2001-ben felütötte a fejét egy körlevelekben terjedő pletyka a szolgáltatás megszüntetéséről, igaz, egy olyan, a New York Times-ban megjelent cikkre hivatkozva, amely ennek épp az ellenkezőjét állította. 

A szó elszáll, a szervereket lekapcsolják

A Yahoo! végül 8 évvel később, 2009 áprilisában jelentette be, hogy október 28-án bezárja  a GeoCities amerikai ágát (a japán máig üzemel), arra figyelmeztetve a felhasználókat, hogy attól a naptól kezdve a szervereken tárolt fájlok örökre elérhetetlenné válnak. A bejelentést követően regisztrációkat már nem fogadtak, a leendő és régi tagoknak saját fizetős tárhelyszolgáltatásukat ajánlották helyette. A korabeli híradások közt számos ironikus hangvételű búcsút találunk, a PC World például „Viszlát, GeoCities: már el is felejtettük, hogy léteztél” címmel közölte kvázi nekrológját, az írást jegyző JR Raphael a közösségi oldalak személyes honlapokkal szembeni térnyerésében látta az elmúlás egyik feltételezhető okát. Az Ars Technica újságírója Jacqui Cheng esztétikai szempontból közelítette meg a kérdést, a felhasználók által kreált honlapokat művészien szörnyűnek nevezve, illetve utalást tett arra is, hogy a GeoCities valamikori célközönsége már a sokkal menőbbnek számító MySpace-t részesíti előnyben. Rupert Goodwins egy korszak lezárásaként értékelte a Yahoo! döntését, amelynek egyik fontos tanulsága, hogy nem elég birtokolni egy népszerű szolgáltatást, azt az interneten nem lehet feltétlenül pénzre váltani – a kor igényei már sokkal többet követelnek az ingyenes tárhelynél, a GeoCities az internet hajnalának magával ragadó kísérlete, amely fölött már eljárt az idő.

Menteni a menthetőt

Mások azonban többre tartották egy érdekes kísérletnél, így a Yahoo! bejelentése után a nonprofit digitális könyvtárként működő Internet Archive közleményében az önkifejezés fontos webes csatornájaként jelölte meg és nekiláttak minél nagyobb teljességre törekedve lementeni a veszélyeztetett tartalmakat. Hasonlóképpen cselekedett számos önszerveződő csoport, így a már korábban említett Archive Team is, akik a szerverek tényleges lekapcsolása után egy évvel jelentették meg a 650 GB adatot tartalmazó torrent fájlt (majd 2011 áprilisában még megtoldották egy kiegészítéssel), amely ugyan valószínűleg nem tartalmazz minden egyes GeoCities honlapot, de átfogó képet ad az internet 1994-től 2009-ig terjedő időszakáról. A csoport vezetője, Jason Scott a világtörténelem legnagyobb népművészeti gyűjteményének nevezte a GeoCities-t, amely felhasználók millióinak jelentette az első tényleges találkozást az internettel, annak működésével és a benne rejlő lehetőségekkel. A Yahoo! – véleménye szerint – megtalálta a módját annak, hogy a lehető legrövidebb idő alatt a lehető legtöbb történelmet pusztítsa el, visszafordíthatatlanul. 2009-ben, az [origo]-nak adott interjúban arról is beszélt, hogy az archiválás során nagyon fontos a gyorsaság (ezért nem számíthatnak hivatalos szervek támogatására, mivel azok rendkívül lassan dolgoznak), illetve az, hogy válogatás és ítélkezés nélkül próbáljanak meg mindent megmenteni az utókornak, hogy a következő generáció saját döntéseket hozhasson a fennmaradt anyagról. Valójában a GeoCities csak egy a szolgáltatások hosszú sorában, amely valamikori meghatározó szerepe után kis híján nyomtalanul tűnt el a süllyesztőben. Az Archive Team oldalán található veszélyeztetett és halódó honlapok listája jól mutatja, hogy adataink ma sincsenek biztonságban. A jelenleg sérthetetlennek tűnő nagyok, amilyen a Google és a Facebook, jövője sem biztosított, elég csak a pár éve még szintén megállíthatatlannak tűnő Myspace eljelentéktelendésére, hosszúra nyúló hattyúdalára gondolni. 

Jason Scott és a gyűjtőszenvedély

Jason Scott már jóval az Archive Team indulása előtt szenvedélyesen gyűjtötte a digitális kor elfeledett emlékeit: 1998-ban indult textfiles.com című oldala, amely az 1980-as években rendkívül nagy népszerűségnek örvendő, a mai fórumok és szociális hálók előképének tekinthető BBS-ekre (bulletin board system) feltöltött szöveges dokumentumok archívuma. A telefonvonalon – modem és terminálprogram segítségével – elérhető BBS-ek már az internet széleskörű elterjedése előtt lehetővé tették a felhasználók számára a közvetlen üzenetváltást, írásaik megosztását, programok le- és feltöltését. A 90-es évek közepére a BBS-ek aranykora lezárult (igaz, még ma is találni aktív közösségeket) helyüket kényelmesebb megoldások vették át, a több mint egy évtized alatt keletkezett szövegek közül csaknem 60 ezer érhető el jelenleg a honlapon, ezek tartalmilag és stílusukban is meglehetősen sokfélék. A fájlok különböző kategóriákba rendezve böngészhetők, a teljesen hétköznapi kérdések (napi politika, receptek) mellett nagy számban képviseltetik magukat a 80-as években népszerű geek-témák (szerepjáték, számítógépek, phreaking – utóbbi a telefonvonalak manipulálására használt kifejezés), de találhatunk a földönkívüli élettel kapcsolatos fejtegetéseket és természetesen a szex sem hiányozhat. Scott fontosnak tartotta kiemelni, hogy cenzúra és előzetes szűrés nélkül tették elérhetővé a szövegeket, nem töröltek semmit csak azért, mert nem értettek egyet vele, vagy mert időközben egy technikai kérdésben meghaladottá váltak a leírtak. A gyűjtemény célja nem a naprakészség, egy adott korszakról (elsősorban az 1980-1989 közötti évekről) szeretne minél teljesebb képet festeni: mi foglalkoztatta ekkor az embereket, hogyan osztották meg a gondolataiakat, érzéseiket egy újfajta technológia segítségével, hogyan küzdötték le annak korlátait. Utóbbira jó példa az oldal ASCII Artwork szekciója, ahol olyan képeket gyűjtöttek össze, amelyek kizárólag az ASCII karakterkészletének felhasználásával készültek. Scott a szöveges dokumentumok után az interneten fellelhető hangfájlokat is gyűjteni kezdte, már a 2000-es évek elején, majd az évtized közepén bekövetkezett podcast-robbanást követően is folytatta tevékenységét, a Wired 2005-ös cikke szerint ekkor mintegy 1500 csatornát követve, egy szkript segítségével automatizálva a letöltés folyamatát. Továbbra is a minél szélesebb körű és előzetes szelekciót nélkülöző gyűjtésre törekedett, így a látszólag kevésbé érdekfeszítő adásokat és rövid életű projekteket is archiválta. Egy átlagos podcast történeti értékét az amerikai polgárháborúban harcoló katona feleségéhez írott leveléhez hasonlította, amelynek a kutatók szempontjából nem is feltétlenül a tartalma a lényeg, hanem a szóhasználat, esetleg a papíron található vízjel. Az így megőrzött hangfájlok felderítése a jövő kutatóira vár, akik már feltehetőleg értékelni fogják a ma még érdektelennek ítélt anyagokat is.  

Filmes számítógéptörténet
 
A digitális emlékek archiválása mellett Scott szükségét érezte, hogy a számítástechnika történetének egyes szakaszait dokumentumfilmek formájában is feldolgozza, így készült el 2005-ben a BBS: The Documentary 8 fejezetből álló sorozata, amelyhez 4 éven át 200 interjút készített. 2006 és 2008 között forgatta, majd 2010-ben jelent meg Get Lamp címmel a számítógépen játszható szöveges kalandjátékokról szóló anyag. A 70-es évek közepétől virágzó műfajt interaktív fikcióként is emlegetik, mivel a játékos a történetet olvasva és a számítógépnek szöveges parancsokat adva (ilyen parancsra utal a film címe is) haladhat előre, a mai játékokban dolgozó grafikus motor helyett a képzeletére támaszkodva. Annak ellenére, hogy mára teljesen kiszorultak a piacról, hatásuk mégis gyakran érezhető, így a videójátékok fejlődéstörténetének megértéséhez ismeretük elengedhetetlen. A két sikeres projektet hamarosan újabbak követik, hiszen Scott a Kickstarter segítségével elég támogatást gyűjtött össze, hogy párhuzamosan három dokumentumfilmet kezdjen el forgatni – legkésőbb 2015-ig szeretné is elkészíteni őket. The 6502 címmel a Chuck Peddle és Bill Mensch által tervezett MOS 6502-es 8 bites mikroprocesszorról (amely elérhető ára miatt fontos szerepet játszott a házi számítógépek 80-as évekbeli elterjedésében) és az Assembly programozási nyelvről szól majd. Az archiváláshoz legközelebb a különböző szalagos adathordozókkal foglalkozó Tape-pel kerül, amely említett médiumok történetét és hanyatlásának okait tárja fel a tervek szerint. Végül a videójátékok világához is visszakanyarodik, a harmadik, Arcade című filmmel. Mindezek mellett 2011-től, immár az Internet Archive munkatársaként folytatja archiváló tevékenységét, december elején blogján felsorolta az aktuálisan feltöltött anyagokat, amelyek közt találunk több száz számítógépes magazint a 80-as évekből, nagyszámú shareware cd anyagát a legkülönfélébb programokkal és multimédiás tartalmakkal, illetve a San Franciscóban található DNA Lounge nevű klubban elhangzott előadások és koncertek felvételeit 2002-től 2011-ig (kb. 10 ezer órát venne igénybe mindet végighallgatni). A sort még hosszan lehetne folytatni, és ahogy a blogbejegyzés címe utal rá, Scott nem is tervez leállást – hatásvadász, de kétségkívül szórakoztató előadásmódjával különböző konferenciák gyakori vendége, tolmácsolásában egyre szélesebb közönséghez juthat el a jövőben a digitális emlékezet megőrzésének fontos ügye.