samedi 6 août 2016

Paquets d'archives (AIP) et les technologies Cloud

Après 2 années de préparations intensives et le lancement de la réalisation début 2016, je reviens dans mon blog avec quelques précisions sur le modèle de données Vitam, mais cette fois sur une orientation très "stockage" et "calcul" au service de l'archivage électronique.

Dans le cadre du projet Vitam, des réflexions ont été menées pour gérer et proposer de nouveaux services au mieux dans le cadre des archives numériques publiques. Vitam est un projet français interministériel dont l'objectif est de développer un logiciel libre pour gérer des archives et leurs métadonnées dans un back-office pour les administrations publics en général, que ce soit pour les archivistes et les gestionnaires de données ou que ce soit pour les informaticiens.

L'objectif est de réaliser un logiciel fiable d'archivage, autorisant le stockage et la préservation de plusieurs milliards d'éléments numériques. Chaque élément est un objet numérique (un document, une image, une vidéo, ...) qui possède ses métadonnées elles-aussi numériques (métadonnées techniques, descriptives et de gestion, dont les droits d'accès et les durées de conservation ainsi que le sort final). Ce logiciel devra présenter des garanties de sécurité et maintenir et conserver les valeurs légales de ces éléments (intégrité, valeur probante et confidentialité).

Cet article se concentre sur deux aspects : le stockage des AIP (paquets d'archives définis dans le modèle OAIS [1])

  • en respectant les usages et les nécessaires calculs pour chaque élément numérique, tous les deux dans un contexte de plusieurs milliards d'éléments et d'actions,
  • en assurant une compatibilité d'usage depuis la création et jusqu'aux archives historiques.
Ces deux aspects conduisent à une implémentation suivant l'esprit du stockage en nuage (Cloud storage) et du calcul en nuage (Cloud computing), en fonction des normes et standards qui s'appliquent. Il n'est pas question de stockage auprès d'hébergeur du "Cloud" pour des raisons légales et de sécurités mais bien d'un hébergement réalisé par l'Etat sur ses propres infrastructures. Le modèle fonctionnel de Vitam est basé sur l'OAIS [1] et intègre également les standards de la gestion des enregistrements (records management) comme ICA-Req [2] et MoReq [3] afin d'adapter le système aux besoins des agences publics françaises.

Certains aspects liés à la valeur probante seront abordés, mais ils ne font pas partis du coeur de cet article.

Cet article décrit les motivations et les propositions d'implémentations qui ont à ce jour émergées. Il ne constitue pas une documentation à proprement parlé de Vitam mais une réflexion ouverte au plus grand nombre dans un objectif de partager et d'améliorer ma vision.
Comme toujours, ce blog est réalisé à titre privé et personnel.

mardi 19 juillet 2016

Relais de l'appel à commentaires du Programme Vitam pour les premières API du logiciel back-office Vitam

Programme Vitam #progvitam

Découvrez les API de versement, de recherche et d'accès aux contenus et aux journaux dans un back office Vitam

http://api.programmevitam.fr

Vos commentaires sont attendus !

mercredi 8 octobre 2014

Relais de l'appel officiel à commentaire du Programme VITAM - Métadonnées Descriptives

Madame, Monsieur,
L'équipe du programme VITAM vous a lancé la semaine dernière un appel à commentaires sur ses projets de schéma de métadonnées et de langage de requêtes. Nous vous avions annoncé à cette occasion que les parties du schéma relatives aux métadonnées descriptives ferait l'objet d'un prochain envoi.
Vous trouverez donc ci-dessous un lien vers un fichier ZIP contenant un document de présentation de ce projet de schéma, accompagné du fichier XSD.
Vos réponses sont attendues pour le lundi 20 octobre 2014, par message électronique adressé exclusivement à l'adresse suivante : consultation-vitam "at" culture.gouv.fr. Dans la mesure du possible, nous vous serions reconnaissant de bien vouloir utiliser la fiche d'expression des remarques également jointe (format XLSX, XLS ou ODS). 
Avec nos remerciements,
L'équipe projet VITAM

Lien de téléchargement

mercredi 1 octobre 2014

Relais de l'appel officiel à commentaire du Programme VITAM

Madame, Monsieur,
L'équipe du programme VITAM travaille depuis le début de l'année 2014 à la conception des interfaces de versements et d'accès à la brique logicielle VITAM, et notamment aux deux sujets suivants :
  • un schéma de métadonnées conforme à la nouvelle norme NF Z44-022 (MEDONA) ;
  • un langage de requêtes pour l'accès à la brique logicielle.
Nous souhaitons recueillir vos commentaires sur les deux documents que nous avons élaborés et que vous trouverez en pièce jointe.
Vos réponses sont attendues pour le mercredi 15 octobre 2014, par message électronique adressé exclusivement à l'adresse suivante : consultation-vitam "at" culture.gouv.fr. Dans la mesure du possible, nous vous serions reconnaissant de bien vouloir utiliser la fiche d'expression des remarques également jointe au présent message (format XLSX, XLS ou ODS).
La partie du schéma de métadonnées relative aux métadonnées descriptives fera l'objet d'un prochain appel à commentaires dans les semaines à venir.
Ces travaux, ainsi que les commentaires que vous voudrez bien nous retourner, alimenteront la contribution de l'équipe du programme VITAM aux travaux pilotés par le Service interministériel des archives de France (SIAF) sur l'actualisation du Standard d'échanges de données pour l'archivage (SEDA).
Avec nos remerciements,
L'équipe projet VITAM


dimanche 21 septembre 2014

Présentation préliminaire du schéma VITAM conçu pour le versement d’archives - 3/3 - Exemples d'utilisation

Présentation préliminaire du schéma VITAM conçu pour le versement d’archives - 3/3
Exemples d'utilisation

Dans le cadre du programme VITAM, nous devons définir les interfaces externes de la solution logicielle que nous allons développer. Parmi ces interfaces, le schéma de données accompagnant un versement d’archives est un enjeu important.
Ce troisième billet porte sur des exemples d’utilisation de ce schéma, exemples orientés mis en œuvre et non métier (au sens où nous ne décrirons pas les métadonnées de description mais uniquement les modalités de construction d’un fichier XML).
Toujours à titre personnel, ceci ne constitue pas une publication officielle mais un moyen de recueillir des avis avant la mouture finale, toujours avec appel à commentaires.
Pour rappel, nous nous plaçons dans le cadre des normes et règlements français, nous nous inspirons de la norme MEDONA de l’AFNOR (Z 44-022) qui permet de définir le sur-ensemble des échanges entre partenaires autour d’un Système d’Archivage Électronique (SAE). Nous nous inspirons également de MoReq2010 pour le modèle de données.


Comme pour le précédent billet, vous êtes bien sûr, vous lecteurs, plus que les bienvenus à apporter vos commentaires.

mercredi 17 septembre 2014

Un langage de requêtes pour rechercher et consulter des archives depuis un front-office vers un SAE back-office

Un langage de requêtes pour rechercher et consulter des archives depuis un front-office vers un SAE back-office

Dans le cadre du programme VITAM, nous devons définir les interfaces externes de la solution logicielle que nous allons développer. Parmi ces interfaces, le schéma de données accompagnant un versement d’archives est un enjeu important.
Dans le cadre des normes et règlements français, nous nous inspirons de la norme MEDONA de l’AFNOR (Z 44-022) qui permet de définir le sur-ensemble des échanges entre partenaires autour d’un Système d’Archivage Électronique (SAE). Nous nous inspirons également de MoReq2010 pour le modèle de données.
En effet MEDONA définit les principes ainsi qu’un exemple de schéma, mais ne spécifie pas les parties liées aux contextes métiers concernés par les archives (plan de classement, métadonnées de gestion, ...). L’objet du schéma VITAM est donc de proposer une extension de la norme MEDONA pour proposer un modèle de données pour le versement d’archives, en tant que première interface d’un SAE.

Ce blog étant à caractère personnel, il ne constitue donc pas une publication officielle, mais il m'a semblé intéressant de recueillir des avis avant la mouture finale qui elle suivra une publication officielle, toujours avec appel à commentaires. Cette publication est assez technique, et je m'en excuse par avance...


Présentation préliminaire du schéma VITAM conçu pour le versement d’archives : 2/3 - Les Métadonnées

Présentation préliminaire du schéma VITAM conçu pour le versement d’archives : 2/3
Les Métadonnées


Dans le cadre du programme VITAM, nous devons définir les interfaces externes de la solution logicielle que nous allons développer. Parmi ces interfaces, le schéma de données accompagnant un versement d’archives est un enjeu important.

Ce second billet porte sur une classification des métadonnées ainsi que leur placement respectif dans un schéma XML de versement. Nous n’abordons pas le schéma de « stockage » de ces métadonnées au sein du logiciel VITAM, tel que nous l’envisageons, car il ne s’agit plus des interfaces d’un système implémentant VITAM mais de son implémentation.

Toujours à titre personnel, ceci ne constitue pas une publication officielle mais un moyen de recueillir des avis avant la mouture finale, toujours avec appel à commentaires.

Pour rappel, nous nous plaçons dans le cadre des normes et règlements français, nous nous inspirons de la norme MEDONA de l’AFNOR (Z 44-022) qui permet de définir le sur-ensemble des échanges entre partenaires autour d’un Système d’Archivage Électronique (SAE). Nous nous inspirons également de MoReq2010 pour le modèle de données.


Comme pour le précédent billet, vous êtes bien sûr, vous lecteurs, plus que les bienvenus à apporter vos commentaires.

vendredi 12 septembre 2014

Présentation préliminaire du schéma VITAM conçu pour le versement d’archives 1/3 - Plan de classement et arborescence

Présentation préliminaire du schéma VITAM conçu pour le versement d’archives - 1/3

Plan de classement et arborescence

Dans le cadre du programme VITAM, nous devons définir les interfaces externes de la solution logicielle que nous allons développer. Parmi ces interfaces, le schéma de données accompagnant un versement d’archives est un enjeu important.
Dans le cadre des normes et règlements français, nous nous inspirons de la norme MEDONA de l’AFNOR (Z 44-022) qui permet de définir le sur-ensemble des échanges entre partenaires autour d’un Système d’Archivage Électronique (SAE). Nous nous inspirons également de MoReq2010 pour le modèle de données.

En effet MEDONA définit les principes ainsi qu’un exemple de schéma, mais ne spécifie pas les parties liées aux contextes métiers concernés par les archives (plan de classement, métadonnées de gestion, ...). L’objet du schéma VITAM est donc de proposer une extension de la norme MEDONA pour proposer un modèle de données pour le versement d’archives, en tant que première interface d’un SAE.

Plutôt que de faire une seule et unique publication, nous proposons de réaliser des publications par morceaux via mon blog pour obtenir des premiers avis et retour, avant de proposer une version plus « complète » mais toujours ouverte aux commentaires par les canaux plus classiques.
Ce blog étant à caractère personnel, il ne constitue donc pas une publication officielle, mais il m'a semblé intéressant de recueillir des avis avant la mouture finale qui elle suivra une publication officielle, toujours avec appel à commentaires.
  • Ce premier billet se concentre sur les notions d’arbres et de graphes dans le schéma de métadonnées.
  • Le second billet devrait porter sur une classification des métadonnées et leur placement respectif dans un schéma XML plus général.
  • Enfin le troisième billet voudra présenter le schéma par thème ainsi que des exemples d’usages.
Vous êtes bien sûr, vous lecteurs, plus que les bienvenus à apporter vos commentaires d'ors et déjà.

samedi 26 octobre 2013

Un peu de publicité

Je ne résiste pas à afficher l'annonce du séminaire fonctionnel VITAM, le premier d'une longue série !
Selon mes sources, le nombre de participants est prometteur pour l'avenir du futur comité utilisateur du programme VITAM ! Mes collègues archivistes peuvent être fiers ! Le 6 novembre est une date importante !
Vous aurez noté que cette "publicité" intervient après la clôture des inscriptions... ;-) 

samedi 27 juillet 2013

SAE, OAIS, les 3 âges : vus par un informaticien

Suites aux remarques de Janus et Anouk, je dois essayer de préciser le fond de ma pensée sur la notion des 3 âges pour une archive, mais du coup aussi ce qu'est pour moi un SAE dans la lignée de l'OAIS. Je précise tout de suite (au cas où ce ne serait pas clair) : 
  1. Je ne suis pas archiviste mais informaticien.
  2. Mais je pense pouvoir comprendre ces notions selon une approche pragmatique (d'usages et non de théorie), mais du coup, peut-être biaisée.
  3. Je n'ai pas tout lu, loin s'en faut (et notamment, honte à moi, M Perotin) : je peux donc évidemment être dans l'erreur.
  4. C'est tout l'intérêt des échanges : affiner sa connaissance pour être de moins en moins dans l'erreur, et de moins en moins seul.
Je vous invite à lire les commentaires de l'article précédent et les pointeurs associés :
Je comprends que ma présentation des 3 âges (selon un informaticien, pas un archiviste) est quelque peu déroutante pour vous (archivistes). Je ne pense pas que nous disions quelque chose de fondamentalement différent, modulo quelques éléments de langage.

mercredi 24 juillet 2013

Open Data et Archivage électronique : suite sur quelques focus en réponse à Janus

Bonjour Janus,

Suite à tes commentaires, tu t'en doutes, je ne peux que me réjouir de faire progresser ma propre compréhension du domaine. Je ne prétends pas en effet tout connaître ou tout comprendre. Ma démarche est d'avancer petit à petit, en espérant mettre mes pas dans celui de mes prédécesseurs, mais en m'autorisant des écarts s'il me semble que ceux-ci ont ignoré quelques points (la raison la plus souvent étant que ces points sont "récents" ou peu connus et auraient donc amené ces mêmes prédécesseurs aux mêmes conclusions s'ils en avaient eu connaissance).

mardi 9 juillet 2013

Complément sur les 4 notions de l'archivage : pré-versement et quelques précisions


Je me devais de compléter mon billet, notamment sur ce que nous nommons entre nous le pré-versement.
Je me suis en effet focalisé sur le SAE (Système d'Archivage Électronique) dans le billet précédent (puisque c'était l'objet), mais il est clair qu'avant le versement, un grand nombre d'actions sont à mener, et si possible même très en amont, de façon à ne pas recommencer à chaque versement des opérations fastidieuses, mais au contraire à laisser faire l'informatique là où elle peut être utile (quand c'est possible, bien sûr).
Cependant, l'informatique ne fera pas tout, je dirais même plus, l'informatique ne fera rien pour les archives si les archivistes ne s'en mêlent pas. Appelez ça si vous voulez la paresse des informaticiens...

mercredi 3 juillet 2013

L'archivage électronique : versement, conservation et durabilité au service de l'accès

Après plusieurs mois d'études et d'expérimentations, qui seront très certainement rendues publiques prochainement, je souhaitais faire un petit retour sur certains éléments relatifs à la conception d'une solution d'archivage électronique.
Ce billet se découpera en 4 parties : versement, conservation, durabilité et accès.
Il abordera comment nous voyions une solution d'archivage électronique durable et efficace, en mettant en parallèle les concepts archivistiques avec les moyens technologiques pour parvenir à y répondre. Si l'approche est par nature technique (votre serviteur est un informaticien), elle tente de répondre aux besoins exprimés par les archivistes.