-
NL dienstverlener
-
ISO 28500
-
Betaalbaar
-
Open-source
Wij hebben geheel zelf een SaaS (software as a service) oplossing ontwikkeld die het archiveren van uw website alsmede het in de browser terugkijken en het ontsluiten van archieven bevat.
Onze website archiveringsvoorziening verzorgd 3 functies:
- Het periodiek crawlen van websites en het maken van .warc archieven die voldoen aan de technische eisen in de richtlijn archivering overheidswebsites.
- Een omgeving waarin men de periodiek opgeslagen archieven van uw website rechtstreeks kan bekijken alsof ze over uw website browsen op een gekozen datum in het verleden.
- De ontsluiting van de individuele .warc website archieven en andere bestanden.
Periodiek crawlen / harvesten
Vanuit ons serverplatform op het KPN netwerk wordt door onze website archiveringsvoorziening dagelijks een harvestingsessie opgestart. De server download daarbij elke openbare pagina van uw website. Het is niet nodig om vooraf een lijst met pagina's aan te leveren: onze crawler indexeert alle links op uw pagina's en bezoekt deze automatisch. Dat maakt onze harvestingdienst vrijwel vrij van input uwerzijds. Het enige dat we nodig hebben is de url van uw website en vanaf daar doet onze crawler de rest.
Als onze website archiveringsvoorziening alle pagina's gedownload heeft dan worden deze ingepakt in een zogenaamd .warc archief. Dit is vergelijkbaar met een .zip bestand. Onze .warc archieven voldoen aan de technische eisen uit de richtlijn archivering overheidswebsites. Zo zijn ze niet voorzien van encryptie, worden ze geplitst in bestanden van maximaal 1GB groot en voldoen ze aan ISO 28500-2008. De archieven kunnen door u in een later stadium dus rechtstreeks overgedragen worden aan het nationaal archief, indien gewenst.
Terugkijken en browsen
Onze archiveringsvoorziening bevat een openbare online omgeving aan waarin eenieder de pagina's van uw website kan bekijken in de staat zoals die was op een eerdere datum.
In een datumkiezer kiest men een datum. Onze voorziening zoekt vervolgens automatisch het bijbehorende .warc archief op en pakt deze uit, of combineer archieven als de opgevraagder data in meerdere archieven verspreid opgeslagen staat.
De opgevraagde pagina's worden vervolgens als de oorspronkelijke html/css/javascript naar de browser van de bezoeker gestuurd zodat die over uw website kan browsen en informatie kan raadplegen zoals die op de gekozen datum gepubliceerd was zonder dat daarvoor een .warc archief gedownload hoeft te worden.
Dit zorgt ervoor dat er geen technische kennis vereist is voor eenvoudige zoekvragen en onderzoeken.
Ontsluiting van .warc archieven
Als men toch de individuele .warc website archieven wil onderzoeken dan is dat mogelijk. Via ons platform kan men zelf browsen naar een jaar > maand > dag om alle archieven en bijbehorende bestanden van dat moment te downloaden.
Het openen van .warc archieven vereist meer technische kennis, maar hiermee kan grondiger onderzoek gedaan worden naar de inhoud van uw website en kan vastgesteld worden dat de inhoud tussentijds niet gewijzigd is.
Deze .warc archieven voldoen aan ISO28500.
Inzicht krijgen in de kosten? Neem contact op voor een gratis scan van uw website(s) en een heldere offerte.