Archiveren in tijden van capacitaire overvloed
Door Lieven Van Speybroeck, op Thu Jan 20 2022 23:00:00 GMT+0000We lijden aan verzamelwoede. Hoe we elektronische documenten beheren, is niet bepaald zorgzaam te noemen. We maken, kopiëren, bewaren, vergaren, verzenden en ontvangen kilo-, mega- en terrabytes dat het een lieve lust is, niet zelden onbewust. Daarbij verliezen we onvermijdelijk het overzicht, in de berusting dat iets opslaan schijnbaar betekent dat het voor de eeuwigheid in onveranderlijke staat kan worden geparkeerd. Eerst uit de weg, daarna uit het zicht en uiteindelijk uit het hoofd. Maar altijd en overal beschikbaar, als het moet. Hoewel.
Als digitale eindgebruiker krijg je er willens nillens een dagtaak als archivaris bij. Een gecomprimeerde bundeling bestanden op een Macintosh krijgt niet voor niks de standaardbenaming 'Archief.zip' mee. De hoeveelheid data die we dagelijks te verwerken krijgen, via een arsenaal aan toestellen met microchips, is exuberant. Denk daarbij niet alleen aan lokale digitale huishouding, maar ook aan het 'user-generated archive' dat via globale netwerkstructuren wordt gevoed en alleen al via onze elektronische briefwisseling met de seconde exponentieel groeit. Dat dit digitale vrachtverkeer gelijktijdig en overal via verschillende media verloopt, zorgt ervoor dat verbrokkeling, duplicatie en verbastering onvermijdelijk zijn. Daar is zelfs het grootste organisatorische talent niet tegen opgewassen.
Die tendens van exponentiële informatiegroei werd reeds ingezet tijdens de industriële revolutie. De grootschalige sociaal-economische veranderingen zorgden toen voor een geleidelijke transformatie van gegevensbeheer en informatieverkeer. De echte administratieve explosie kwam er echter aan het begin van de twintigste eeuw met de Eerste Wereldoorlog. De wereldwijde accumulatie van gegevens in lijsten, dossiers, collecties en archieven was zo plots en zo omvangrijk dat er letterlijk geen houden aan was. Voor het eerst werden archivarissen geconfronteerd met een acuut capaciteitsprobleem: in een sneltempo raakten lades, kasten, kelders en hele gebouwen vol. Naast het gegeven van een ontoereikende opslaginfrastructuur zorgden ook de ingrijpende bureaucratische hervormingen doorheen de twintigste eeuw voor de nodige inhoudelijke en organisatorische uitdagingen.
In de twintigste eeuw werd duidelijk dat archiveren er niet langer in bestond te conserveren, maar vooral ook te liquideren. Wat was wel en niet waardevol genoeg om te bewaren?
Door die aanhoudende groei en geleidelijke statusverandering van informatie werd duidelijk dat archiveren er niet langer in bestond te conserveren, maar vooral ook te liquideren. Dat ging gepaard met de nodige ethische, politieke en culturele vraagstukken over wat niet en wat wel waardevol genoeg was om te bewaren en zo niet of wel in aanmerking kwam voor een plek in de geschiedenis. Voor die eerste categorie werden zogenaamde 'verwijderingsprotocollen' ontwikkeld die in de lijn lagen van het bredere rationaliserings- en professionaliseringsproces dat (overheids)instituten tijdens de moderniteit doormaakten. Deze handleidingen waren enerzijds nodig om een houvast te bieden bij het selectieproces, maar anderzijds ook een manier om zich te wapenen tegen de weerstand die ontstaat bij het uitdunnen van collecties met een historisch karakter. Het had iets weg van barbarij, een noodzakelijk kwaad dat inging tegen de natuur van alles wat collectiebeheer tot dan toe was geweest, en legde meer dan ooit de affectieve band tussen archivaris en archiefmateriaal bloot.
Er is iets misgegaan
Elektronische opslagmedia hebben verandering gebracht in die verhouding tot en omgang met het materiaal dat we preserveren en elimineren. Een uit pixels opgetrokken prullenmand wekt een ander gevoel van finaliteit op dan een papierversnipperaar, toch wanneer het om documenten gaat waar geen dubbels van bestaan. Daar zit meteen al het eerste en misschien wel grootste verschil: de bedenking dat iets nooit écht weg is wanneer je die prullenmand leegt, ongeacht wat er in de waarschuwing te lezen valt (als die al niet is uitgeschakeld). Die bedenking is ook deels terecht. Om vandaag iets digitaal definitief de vergetelheid in te sturen moet je ofwel fysiek met het opslagmedium aan de slag (een hamer zal niet volstaan), ofwel met software die van nulletjes eentjes maakt en omgekeerd en dat proces tientallen keren herhaalt totdat de binaire volgorde van het origineel zo vermangeld is dat deze simpelweg niet meer te lezen valt. In dat geval staan zelfs bedrijven die gespecialiseerd zijn in dataherstel machteloos, terwijl zij doorgaans toch in staat zijn om pure wanhoop nog om te buigen – het mag kosten wat het kost – in euforie.
Digitalisering is een eenrichtingsstraat geworden. Eenmaal ingeslagen, moet je met heel je hebben en houden meescheuren aan de steeds hogere snelheid die je door een permanent evoluerende industrie wordt opgelegd.
Die gedachte dat je een destructieve handeling dus bijna altijd wel kan 'Ongedaan maken' door een 'Stap terug' te zetten, versterkt ook de illusie dat digitaliseren synoniem is met eeuwig leven schenken. Het is de valse belofte waar veel archieven mee kampen vanaf het moment dat ze het voortbestaan van hun collecties willen vrijwaren met behulp van digitale middelen. Doorheen de jaren is gebleken dat samen met specifieke datadragers ook de machinerie om ze te lezen maar beter goed wordt bewaard. En zelfs dat is niet altijd een garantie voor een blijvende werking en toegankelijkheid. Alleen al stof vergaren houdt – letterlijk – een risico in. De snelheid waarmee informatietechnologie wordt ontwikkeld is recht evenredig met de snelheid waarmee ze in onbruik raakt. En vaak blijken de vernieuwingen op vlak van grootschaligere, duurzamere bewaring de tand des tijds minder goed te doorstaan dan initieel werd voorzien of geloofd. Elektromechanische harde schijven worden vroeg of laat onbetrouwbaar, de magnetiseerbare film in floppy disks is kwetsbaar en sterk onderhevig aan degradatie, de lasertechnologie waar CD-ROMs, DVD’s en Blu-ray Discs gebruik van maken is extreem gevoelig en de weggeschreven data kan mettertijd gewoon vervagen, de geheugenchips in Solid State Drives van bijvoorbeeld USB-sticks hebben een variabel en gelimiteerd aantal schrijfcycli met mogelijk dataverlies tot gevolg, en ga zo maar door. Technische beperkingen en onvoorziene effecten op langere termijn zijn uiteraard inherent aan elke vorm van technologische vooruitgang. Dat is op zich niks nieuws. Maar de innovatiefrequentie (en dus ook het verouderingstempo) maakt van digitalisering een radicale eenrichtingsstraat. Eenmaal ingeslagen, moet je met heel je hebben en houden meescheuren aan de steeds hogere snelheid die je door een permanent evoluerende industrie wordt opgelegd. Bij stilstand word je in de vernieling gereden. Digitale omzetting en bewaring is dus geen eenmalige activiteit, het is een voortdurend proces van heromzetten, heropslaan en herverwijderen. De condities van elektronische opslagmedia zijn daardoor dus eerder precair dan solide.
Hoe kleiner, strakker, gladder en gestroomlijnder de omhulsels die onze informatie omsluiten, hoe groter het contrast met wat zich op microniveau aan de binnenkant ervan afspeelt.
Of dat geen verleden tijd is met de doorbraak van Cloud storage services zoals Dropbox, Google Drive, Microsoft OneDrive, iCloud, Amazon Web Services en consoorten? Ja en nee. De (ver)huur van schijfruimte die in theorie vanaf eender welke plek met een internetconnectie bereikbaar is, verlegt inderdaad een groot deel van de compatibiliteitsrace, en de investeringen en complicaties die daarmee gepaard gaan, van de eindgebruiker naar de providers. Dat 'de cloud' per definitie een veilige haven is, is dan weer geen zekerheid. Achter het enigszins efemere, onzichtbare concept van de cloud schuilt een gigantische materiële infrastructuur. Soms verborgen op de bodem van de oceaan, maar vaker nog in de vorm van reusachtige industrieparken. Eerder dit jaar ging in het Franse Strasbourg een van de grootste datacenters van heel Europa gedeeltelijk in vlammen op. Een aantal cloudproviders die gebruik maakten van deze infrastructuur hadden geen zogenoemd 'recovery plan', waardoor grote hoeveelheden data simpelweg verloren gingen. Spitstechnologie blijkt soms dus even kwetsbaar of zelfs kwetsbaarder dan papier, omdat het volume aan verwoeste gegevens per kubieke meter exponentieel groter is. Het is ook onhoudbaar om voor elke hectare schijfruimte nog een extra hectare backupruimte op een andere locatie te voorzien. Rampscenario’s zoals in Strasbourg zijn uiteraard uitzonderlijk en de veiligheidssystemen om ze te voorkomen worden steeds beter, maar ze tonen wel aan hoe fragiel het model van cloud-computing kan zijn en tot welke desastreuze gevolgen die enorme schaalvergroting kan leiden.
What you see is what you (for)get
Hoewel bovenstaand relaas misschien anders doet vermoeden, ben ik geen techno-pessimist of (neo-)luddiet en maak ik zelf gretig gebruik van verschillende diensten voor gegevensopslag. Het is een handelswijze die ondertussen ook is doorgedrongen tot de standaardprocedures van vele professionele werkomgevingen, waardoor je moeilijk anders kan dan de stroom volgen. Hoewel niet alle diensten even goed draaien op bepaalde toestellen, sommige – al dan niet bewust – minder performant zijn in combinatie met bepaalde besturingssystemen, de synchronisatie over verschillende apparaten bij de ene al wat soepeler verloopt dan bij de andere en de gelimiteerde startformules en -volumes vaak niet volstaan waardoor de maandelijkse kostprijs van abonnementen flink kan oplopen, heeft de cloud zeker een groter gebruiksgemak, comfort en veiligheidsgevoel opgeleverd – als je je tenminste niet te veel vragen stelt bij de manier waarop persoonlijke documenten gebruikt worden door de bedrijven die erover 'waken' (maar dat is weer een heel andere kwestie). De optimalisatie van digitale werkprocessen door middel van steeds grafischere en gebruiksvriendelijkere interfaces heeft gezorgd voor een mentale shift in onze omgang met wat we via die interfaces produceren en beheren. In die evolutie staan snelheid, zichtbaarheid en intuïtiviteit centraal.
Archivering bestaat enerzijds uit de erkenning van verlies, maar anderzijds ook uit het maken van bewustere keuzes in wat mag en moet verloren gaan.
Een niet-grafisch besturingssysteem zoals MS-DOS of Unix waarin de enige vorm van communicatie tussen gebruiker en machine geschiedt via een lineaire opeenvolging van tekstcommando's en -resultaten vergt een heel andere vorm van concentratie en organisatie dan een omgeving waarin geklikt, gesleept en geswiped kan worden. Het ontbreken van een visueel overzicht dwingt tot de ontwikkeling van een mentale plattegrond: een werkstructuur die logisch, ordelijk, rigide, consequent en helder is, waarbij elke map- en bestandsnaam en -locatie zorgvuldig en bewust gekozen dient te worden. Een efficiënte workflow in zo'n abstracte dimensie vereist het soort mnemotechnisch vernuft dat doet denken aan de 'method of loci' of het 'geheugenpaleis' waarmee de Griekse dichter Simonides van Keos zichzelf bombardeerde tot grondlegger van de geheugenkunst. Sinds het ontstaan en de geleidelijke suprematie van de boekdrukkunst – die andere uitvinding waarvan de impact op mens en maatschappij onmogelijk te overschatten valt – verminderde het belang en de beoefening van dat soort mentale gymnastiek. Ook dat had te maken met de introductie van een grafische ruimte voor de overdracht en conservatie van informatie, iets wat tot dan toe via orale en aurale technieken gebeurde. Ook de manuscriptcultuur behoorde tot die traditie, aangezien zowel het kopiëren als het lezen van geschriften door middel van declamatie en gezang gebeurde. Telkens wanneer een medium de zintuiglijke balans sterker doet doorslaan in het voordeel van het zicht, zijn we geneigd een deel van onze eigen opslagkwaliteiten te verwaarlozen.
Verliesbeheer
De opmars van de grafische gebruikersinterface zorgde ervoor dat digitale werkomgevingen veel tastbaarder en intuïtiever werden, maar de combinatie van een groter gebruiksgemak en een grotere opslagcapaciteit heeft ook de deur voor wildgroei en wanorde beetje bij beetje verder opengezet. In dat opzicht is ook de fysieke transformatie van onze elektronica bedrieglijk. Hoe kleiner, strakker, gladder en gestroomlijnder de omhulsels die onze informatie omsluiten, hoe groter het contrast met wat zich op microniveau aan de binnenkant ervan afspeelt. Daar is het vaak een woestenij van verdwaalde brokstukken, half afgewerkte bouwsels, verlaten ruïnes, sluimerend materiaal en digitaal drijfhout waartussen soms moeilijk te navigeren valt. Bij verwaarlozing slibben informatiestromen aan een sneltempo dicht, waarna ze onvermijdelijk ook uitdrogen. Dat resulteert in ongecontroleerd en soms belangrijk gegevensverlies. We zijn mentaal niet uitgerust om alles wat dagelijks aan informatie binnenkomt en buitengaat te registreren, laat staan te bewaren en onderhouden. Ook bij de gedeeltelijke uitbesteding van dat proces via digitale rekenkracht gaan zaken onvermijdelijk verloren, al was het maar omdat het onmogelijk is om de gemaakte koppelingen tussen scherm en geest allemaal actief en intact te houden. Archivering bestaat enerzijds uit de erkenning van dat verlies, maar anderzijds ook uit het maken van bewustere keuzes in wat mag en moet verloren gaan. We zijn het aan onszelf verplicht om dat eliminatieproces niet zozeer te zien als een vorm van geweld, maar wel als een vorm van zorg.