Bron: Stappenplan Overdracht Digitaal Archief (SODA)

Auteur: Sanne Van Bellingen (PACKED vzw)

    Wat?

    Deze tool toont hoe je stap voor stap je digitaal archief kunt opschonen. Bestanden worden op virussen gecontroleerd en lege mappen of dubbele bestanden worden verwijderd.

    Let wel: documenteer alle acties die je uitvoert, welke documenten en mappen je verwijdert en hoe en waar je aanpassingen hebt aangebracht.    

    Waarom digitaal opschonen?

    Een schoongemaakt klassement neemt minder plaats in op de server. Bovendien krijg je een beter overzicht van alle documenten. Opschonen hoort bij het duurzaam bewaren van elk digitaal archief.    

    Wanneer?

    Een mooie gelegenheid om het digitale archief op te schonen is een trash day.

    Nadat het digitale klassement is geschoond, kun je de waarde van documenten bepalen en bewaartermijnen opstellen.    

    Hoe?

    1. Virusscan

    Virussen kunnen informatieverlies veroorzaken. Controle op virussen is dan ook een belangrijk onderdeel bij het schonen van je digitaal archief.

    Hiervoor heb je een virusscanner nodig. Mogelijkheden zijn:

    Zorg voor een regelmatige update van de software, zodat je steeds met een actuele versie van de antivirussoftware werkt.

    Wat doet een virusscanner?

    • De antivirussoftware scant alle bestanden op de computer en vergelijkt ze met een databank waarin alle gekende virussen beschreven zijn.
    • De software detecteert eventuele overeenkomsten in jouw bestanden met de virusdatabank. Wordt een overeenkomst gevonden, dan is jouw bestand geïnfecteerd met een bepaald virus. De antivirussoftware zal vervolgens het virus verwijderen, het geïnfecteerde bestand in quarantaine plaatsen zodat het virus zich niet kan verspreiden, of, indien nodig, het geïnfecteerde bestand volledig verwijderen
    1. Dubbels opsporen

    Vooraleer dubbele bestanden opgespoord kunnen worden, moeten checksums aangemaakt worden. Dit is de digitale vingerafdruk van een bestand, een controlegetal dat aan bestanden wordt toegekend. Zodra er ook maar iets aan de bestanden is gewijzigd, genereert de checksumsoftware een nieuwe reeks getallen. Elk gewijzigd bestand krijgt met andere woorden een nieuw controlegetal. Dit impliceert dus dat wanneer bestanden in het archief dezelfde checksum hebben, het om dubbels gaat.

    1. Verwijderen van dubbels

    Vaak bewaren meerdere medewerkers eenzelfde document in verschillende mappen. Het gebeurt ook geregeld dat een document in meerdere mappen wordt ondergebracht waar het eigenlijk niet thuis hoort. Softwaretools kunnen deze dubbele mappen of bestanden die verwijderd mogen worden, eenvoudig opsporen.

    Bij het toekennen van checksums krijgt elk uniek bestand een unieke checksum toegekend. Wanneer twee bestanden toch een identieke checksum hebben, gaat het dus feitelijk om hetzelfde bestand.

    Om dubbels op te sporen en te verwijderen bestaan er verschillende softwaretools. Door het detecteren van identieke checksums kunnen die tools dubbels herkennen. Mogelijkheden zijn:

    Let op:

    • Twee identieke bestanden (of bestanden met een identieke checksum) kunnen toch een andere bestandsnaam hebben.
    • Verwijder dubbels niet zomaar. Sommige documenten horen wel degelijk in meerdere dossiers thuis. Door een bestand te verwijderen wijzig je onherroepelijk inhoud en context van dossiers.
    • Dubbels die inhoudelijk hetzelfde zijn maar bewaard werden in verschillende bestandsformaten, worden met deze checksums niet opgespoord.
    1. Verwijderen van lege mappen

    Verwijder tot slot lege mappen uit het klassement. Ze bevatten immers geen archief. Het verwijderen ervan komt de overzichtelijkheid en doorzoekbaarheid ten goede.

    Let op:

    • Lege mappen kunnen op zich wel belangrijke contextinformatie toevoegen aan een archief. Documenteer dus alles wat je verwijdert.

    Mogelijke software voor het verwijderen van lege mappen zijn:

    CC BY-SA