Blog

Wat is WARC waarom is het belangrijk?

Een kleine terugblik op het Internet Archief

Al ruim 20 jaar, heeft The Internet Archive een collectie opgebouwd van Internetsites en andere digitale kunstobjecten door gebruik te maken van de WayBack Machine. De collectie bestaat nu uit meer dan 270 miljard pagina’s.

Hiermee heeft deze organisatie een belangrijk rol gespeeld bij het onstsluiten en toegankelijk maken van oude informatie van Internetsites. Ze zijn ook de bedenker van WARC ofwel Web Archive Format Files . WARC is een bestandsformaat met het oog op langdurige duurzame preservatie van digitale data.

WARC Files – The Standard for Long Term Preservation

warc-diagram

Het WARC formaat is nu opgenomen in de internationale ISO standaard (ISO 28500:2017). Vanaf die tijd is WARC geadopteerd door vele orginisaties, (bibliotheken, archieven, softwarebedrijven) als de nieuwe standaard voor het digitaal archiveren van websites. 

Internationaal gezien hebben ook Nationale archief organisaties dit formaat omarmt en wordt het de de-facto standaard.

 

WARC voor Sociale Media berichten.

PageFreezer biedt al enige jaren de optie om websites in WARC formaat te exporteren. Het gebruik van het formaat om sociale media berichten te archiveren is echter een nieuwe toepassing.

warc-download

PageFreezer biedt vanaf nu de mogelijkheid om een sociale media post met een simpele klik in WARC formaat op te halen. Vanzelfsprekend is het ook mogelijk om een hele tijdlijn in WARC formaat te exporteren.

 

WARC voor forensisch onderzoek

Een belangrijke meerwaarde van WARC is ook om dit bestandsformaat te gebruiken bij forensisch onderzoek (e-discovery). Dit omdat naast het bericht zelf ook metadata mee kan worden verzameld en geexporteerd die via de programmainterface van het sociale media kanaal is meegestuurd. Wanneer uw organisatie ook sociale media kanalen archiveert dan voldoet PageFreezer daarmee aan de meest uitgebreide eisen voor digitale preservering en bewijslast!

 

, ,

Comments are closed.