Logo Maurice Kaag

Archivage pérenne

Du papyrus au stockage des données dans l'ADN, on parle d'archivage et d'héritage. Que laisserons-nous à nos descendants ?

Des bords du Nil à Gutenberg

Depuis l’invention du papyrus, l’humanité a sauvegardé un très grand volume d’information qui a pu nous parvenir à travers les âges. L’usage du papier et de l’imprimerie a permis un partage de l’information rapide au plus grand nombre. Ces parchemins et ces livres sont encore parmis nous de nos jours. Je ne peux pas en dire autant des disquettes et autres CDs sur lesquels j’ai sauvegardé de si précieuses données il y a seulement 30 ans.

Paradoxalement depuis l’invention de l’informatique, nous avons généré un volume de données sans précédent et cela s’accélère. Entre 2016 et 2018, nous avions déjà générés 90% des données numériques mondiales. On ne résonne même plus en petabyte (1 PB = 1000 TB), mais en exabyte (EB = 1 million de TB). Des chiffres qui ne parlent pas à beaucoup de monde j’en conviens, à titre de comparaison la bibliothèque du Congrès US tient dans 20 PB. Wikipedia nous apprend que la capacité mondiale de stockage est de 1300 EB, une fois compressées et dédupliquées les données devraient tenir dans 295 EB.

Le papier a-t-il encore de l’avenir dans notre monde numérique ? J’espère bien que oui car il y a peu de structures qui sont capables de préserver les données numériques correctement.

Archivons !

L’archivage n’est pas une sauvegarde, l’archivage numérique est la préservation de l’information et l’accès à cette même information dans le temps. Différents organismes gouvernementaux et non-gouvernementaux oeuvrent pour la préservation de ces données numériques pour nos descendants. Il peut s’agir de lieux de stockage particuliers mais aussi de mise à disposition de technologie adéquate, idéalement libre et gratuite.

Par exemple l’une des missions du Centre Informatique National de l’Enseignement Supérieur (CINES) basé à Montpellier, est la préservation de données scientifiques, patrimoniales et administratives dans des conditions exceptionnelles.

https://www.cines.fr/

Cet organisme va donc se charger de préserver et de mettre à disposition des informations publiques. Mais on ne va pas pouvoir y stocker nos photos de vacances.

Archivage des données privées

Dans le cadre de données personnelles, entendez par là des données familiales, il n’y a pas de solution miracle. Les GAFAM n’ont pas pour mission sacrée de s’occuper de vos photos et de vos documents, ils font leur chiffre d’affaire avec la publicité en monnayant vos données, ils vont plutôt choyez leur client qui paient. Les vols de données étant de plus en plus fréquents (4.5 millions de compte Twitter et 487 millions de compte WhatsApp rien que pendant le mois de novembre 2022), on est en droit de douter de la bonne idée de confier et centraliser nos données auprès d’organisme tiers qui n’ont pas pour vocation l’archivage des données numériques.

Le problème est sensiblement identique pour des données d’entreprises. La différence fondamentale est que l’entreprise va explicitement payer pour le stockage de ses données numériques et papiers. Attention toutefois à multipler les lieux de stockage afin d’éviter le genre de catastrophe qui a touché Secur’Archiv SA en 2009. Ce leader Suisse du stockage sécurisé a vu 80% des documents papiers du dépôt de Lausanne partir en fumée.

https://www.letemps.ch/economie/securarchiv-retour-lausanne-trois-ans-apres-lincendie-avait-detruit-centre

Il n’en reste pas moins que faire appel à des structures privées spécialisées dans l’archivage est la meilleure option pour une entreprise. Mais pourrons-nous relire ces données numériques dans 20 ans ou dans 1000 ans ? En effet les formats de fichiers et les formats de stockage changent constamment.

Format d’archivage

Alors qu’en est-il de mes disquettes 3.5" et de mes CDs ? On trouve facilement des lecteurs avec connexion USB, le problème réside plutot dans le support de stockage. Il est certain que la bande magnétique de ma disquette aura peu souffert des outrages du temps, il en est tout autrement pour mon CD et mes DVD : les données sont gravées au laser sur une surface organique, qui se détériore dans le temps.

Cette dégradation est inéluctable, nous sommes condamnés à transférer les données d’un support à l’autre tous les 4 ou 5 ans. Même le CINES est contraint de prévenir la défaillance de ses supports de stockage et de veiller à transférer ses données d’un disque à l’autre, d’une technologie à l’autre.

Notre héritage

Les avancées technologiques récentes promettent de régler le problème d’archivage dans le temps une bonne fois pour toute, il faudra simplement choisir votre support de stockage et espérer que l’on saura encore les lire dans le futur.

Nous avons d’un côté le DVD/Blu-ray qui dure 1000 ans, le M-DISC ressemble à un DVD, la différence étant que le laser va graver les données sur une surface non-organique, une seule écriture est possible. Un disque de 100 GB coûte environ 20frs (décembre 2022).

Les technologies de stockage dans du cristal sont maintenant une réalité, de même que dans de l’ADN. On pourrait ainsi stocker 360 TB pendant 13.8 milliards d’année sur un cristal grand comme une pièce de 1frs.

Mes recommandations

Tout ceci est formidable mais pas bien réaliste de suite, ainsi je recommande pour les entreprises :

  • Numériser les documents papiers
  • Séparer les documents papiers en plusieurs lots
  • Stocker ces lots auprès de différents prestataires
  • Chiffrer les données sensibles
  • Créer plusieurs copies des données à préserver sur différents formats
  • Préférer les bandes magnétiques à longues durées et les M-DISC
  • Stocker ces données auprès de tiers de confiance (prestataires spécialisés, banque, avocat)

Quant aux particuliers :

  • Numériser les documents papiers
  • Chiffrer les données sensibles
  • Créer plusieurs copies des données à préserver sur M-DISC
  • Stocker ces données auprès de tiers de confiance (amis, famille, banque)

On commencera dans les deux cas à trier les fichiers (contrats, factures, impôts, assurances, fichiers de travail, fichiers temporaires, photos, etc…), pour ensuite établir une stratégie d’archivage, combinée avec une stratégie de sauvegarde.

Dans le cadre d’une entreprise, la norme ISO 14721:2012 apporte un cadre solide pour archiver l’information :

Voici quelques conseils de la Bibliothèque nationale suisse quant à la conservation des documents :

Plus d’informations sur la durée de conservation des documents en Suisse :

Plus d’informations sur la durée de conservation des documents en France :