CGI

2 min

L’archivage à l’ère du Big Data

Les organismes publics et les services de l’État sont depuis quelques années observés sous l’angle de la création de valeur. À ce titre ils doivent améliorer leur offre de service, éclairer les décisions politiques tout en réduisant leurs budgets. Un des leviers d’action consiste dans la valorisation de leurs données.

Partager

La nomination fin 2014 d’un Administrateur Général des Données (AGD) rattaché au Secrétaire Général pour la Modernisation de l’Action Publique, et la reconnaissance par ses services de la donnée comme un « actif stratégique » en témoignent. Or, la valorisation des données est seulement possible s’il y a préservation (et donc archivage) de celles-ci.

C’est dans ce contexte que la DINSIC a lancé en 2015 le programme VITAM, visant à proposer aux institutions publiques, une solution logicielle innovante d’archivage électronique, mutualisée, orientée Big Data et open source, permettant la prise en charge, la conservation et la consultation sécurisée de très gros volumes d’archives numériques.

Dans le domaine de la culture, la conservation des archives est organisée en France « dans l’intérêt public, tant pour les besoins et la justification des droits (…) que pour la documentation historique de la recherche ». Le Service Interministériel des Archives de France est chargé de proposer au ministre de la Culture les choix stratégiques à opérer en matière d’archives patrimoniales et de les mettre en œuvre. Parmi les organismes chargés de la conservation de ces documents, on compte deux institutions majeures : les Archives Nationales et la Bibliothèque Nationale de France.

Les Archives Nationales conservent aujourd’hui près de 200 millions de fichiers numériques, soit 45 To de données. Pour répondre à l’évolution numérique actuelle, l’institution met en œuvre le projet ADAMANT (Administration des Archives et de leurs Métadonnées aux Archives Nationales dans le Temps), premier projet de déploiement de la solution VITAM (projet accompagné par CGI).

La Bibliothèque Nationale de France a lancé en 2009 un vaste chantier de numérisation, qui a conduit à la constitution d’une bibliothèque en ligne contenant plus de 7 millions de documents numérisés de toutes sortes (textes, images, musiques, vidéos). Libérée du problème de stockage de ses données, la BNF doit à présent garantir leur pérennité à long terme.

L’archivage à long terme ne se résume pas seulement au stockage mais nécessite la mise en place d’un dispositif plus complexe, capable de réaliser des opérations spécifiques, comme la migration de formats et de supports, qui assurent la lisibilité des documents à très long terme. C’est l’objet du système SPAR mis en œuvre par la BnF pour couvrir la problématique cruciale de la pérennisation. Sommes-nous certains que, dans dix ans, les documents produits seront encore consultables et que les efforts consentis à leur création ne seront pas définitivement perdus ?

Le volume des documents numérisés dans le cadre de ces projets de transformation fait désormais entrer les projets d’archivage dans l’ère du Big Data.

Aurélia Orus

Directrice Secteur Public CGI

Vidéos associées

Articles associés

Club des acteurs publics

Votre navigateur est désuet!

Mettez à jour votre navigateur pour afficher correctement ce site Web. Mettre à jour maintenant

×