Journée d'études : Implémentations de Records in contexts - 15/22 - Session 3 -Outils et systèmes pour les données RIC

Archives nationales de France

l’année dernière

SESSION 3. OUTILS ET SYSTÈMES POUR LES DONNÉES RIC

Le projet Off-Site : vers une configuration de Heurist basée sur RiC-CM par Natalia Pashkeeva (chercheuse associée CERCEC - UMR 8083 EHESS/CNRS, France) et Maël Le Noc (community technical advisor, Heurist)

[English]
SESSION 3. TOOLS AND SYSTEMS FOR RIC DATA

The Off-Site project: towards a RiC-CM based Heurist configuration
by Natalia Pashkeeva (associate researcher, CERCEC - UMR 8083 EHESS/CNRS, France), and Maël Le Noc (community technical advisor, Heurist)

—

Les premières implémentations de Records in Contexts / Early implementations of Records in Contexts

Le Groupe d'experts sur la description archivistique (EGAD) du Conseil international des archives (ICA) a organisé le 15 novembre 2023 le premier événement international entièrement dédié aux premières implémentations de nouveau standard Records in Contexts (RiC)

voir : https://www.ica.org/fr/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/ pour la description des archives.

Le programme et les supports de présentation, en français ou en anglais, sont disponibles à cette adresse :
https://drive.google.com/drive/folders/1zywJxTuccDjSX-QUrYc4deACs_BTw9z8?usp=drive_link

The Expert Group on Archival Description (EGAD) of the International Council on Archives (ICA) organized on November 15th 2023 the first international event entirely dedicated to early implementations of the new Records in Contexts (RiC) archival description standard https://www.ica.org/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/

The program and the slides of this study day, in French or English, are available at: https://drive.google.com/drive/folders/1zywJxTuccDjSX-QUrYc4deACs_BTw9z8?usp=drive_link

Catégorie

📚

Éducation

Transcription

Afficher la transcription complète de la vidéo

00:00 Bonjour.

00:09 Donc, hello.

00:10 Just a few words in English for the English speaking people.

00:13 I will speak French.

00:14 But you have rather detailed information in my PowerPoint in English,

00:20 so you can follow me.

00:21 Donc, j'ai le privilège de représenter ici l'équipe du projet de recherche off-site,

00:28 qui est financée par le Conseil européen de la recherche et qui a été conçu par l'anthropologue

00:35 Shora Makaremi, qui est chercheuse au CNRS et qui n'est pas dans l'auditorium,

00:41 mais qui est normalement avec nous connectée en ligne.

00:45 Donc, du coup, l'équipe du projet est également rattachée au CNRS.

00:50 Le projet s'intéresse à la violence post-révolutionnaire en Iran dans les années 80.

00:56 En fait, c'est la première décennie après la révolution islamique de 1979.

01:01 Et le projet s'intéresse également aux politiques de mémoire par rapport à cette période.

01:08 Donc, on peut peut-être...

01:10 Next slide, please.

01:12 L'équipe se situe au croisement des disciplines.

01:16 On a les anthropologues, les historiens.

01:18 On a aussi les spécialistes de l'art.

01:21 On a aussi des aspects archivistiques et évidemment, une nouvelle technologie dans une triple perspective, je dirais.

01:28 On a d'abord au sens de l'usage des outils technologiques pour rendre accessibles les sources historiques,

01:36 mais aussi, on investigue vraiment la transformation de la source historique sous l'influence de nouvelles technologiques.

01:43 Et enfin, c'est la nouvelle technologie dans le travail de recherche.

01:48 Parmi les buts du projet, il y avait la construction d'une base de données qu'on appelle "contre-archives".

01:55 Et vous allez comprendre très vite pourquoi on utilise ce mot.

01:59 La base de données a été conçue pour représenter une ethnographie des sources disponibles pour étudier la première décennie post-révolutionnaire en Iran.

02:10 Donc évidemment, non seulement les sources, mais les acteurs qui participaient et qui participent aujourd'hui dans la production, collecte, préservation et diffusion des sources en ligne.

02:21 Donc au sein de Offsite, moi j'ai été censée, entre autres tâches, de concevoir la base de données et je dirais de trouver une solution.

02:31 C'est comme ça que j'appelle ça, ma tâche.

02:33 Une solution pour réaliser la base de données, la solution la plus optimale du point de vue de notre conception de la base de données,

02:43 mais aussi au regard du budget et des ressources humaines du projet.

02:48 Donc sous la solution, j'entends évidemment un schéma de métadonnées et aussi comment la réaliser techniquement, la base de données.

02:55 Donc notre choix final, c'est le modèle conceptuel de RIC intégré dans le système de création de bases de données EURIST.

03:05 Je sais que je ne suis pas dans le panel projet de recherche, mais plutôt "tools and systems",

03:10 mais je vais quand même prendre encore un peu de temps pour vous expliquer ce choix,

03:15 parce que pour cela, j'ai besoin de vous vraiment placer brièvement dans le contexte du projet Offsite.

03:20 Donc on a deux grands thèmes, on prend l'exemple de l'éran post-révolutionnaire d'abord pour étudier la violence dans les états répressifs.

03:28 Cela englobe l'étude des mécanismes, des pratiques de la violence, l'évolution de la législation,

03:34 pratiques de tarture, systèmes et acteurs de surveillance et de punition, le fonctionnement des tribunaux

03:44 et aussi, chose importante, c'est comment les gens, les individus vivent tout cela au quotidien.

03:50 Les expériences individuelles et collectives et aussi les effets à long terme, notamment

03:57 les effets sur la politique et les pratiques sociales au sein des sociétés qui ont vécu

04:05 des périodes de violence particulièrement élevées et massives.

04:09 Et donc le deuxième grand thème, et c'est là que nous nous sommes tournés vers l'ontologie,

04:15 vers le modèle conceptuel de RIC, c'est la production et la circulation des connaissances

04:21 académiques et civiques sur tous ces aspects de la violence.

04:25 La question cruciale, c'est comment collectons les données au moment où la violence se produit

04:31 mais aussi postérieurement.

04:33 Parce que les régimes répressifs mettent en place tout un ensemble de barrières législatives

04:39 et administratives qui entravent d'abord tout simplement la sécurité physique des personnes

04:44 et avec ça, enfin, ils entravent aussi l'accès au terrain.

04:49 Donc, ça empêche le travail ethnographique classique, le travail de terrain empirique.

04:53 Et aussi, cela entrave l'accès aux archives qui permettent d'étudier le passé.

05:00 Cela crée aussi des distances à niveau différent, des distances entre l'expert et l'objet d'étude,

05:07 des distances physiques parce qu'on est positionné géographiquement loin, parfois loin du terrain,

05:16 d'investigation et aussi les distances temporelles avec l'expert d'aujourd'hui,

05:21 donc par rapport aux événements du passé, et aussi les témoins qui ont vécu la violence

05:27 ou leurs proches par exemple, mais qui sont appelés à remémorer tout cela aujourd'hui,

05:34 dans notre époque.

05:35 Et donc, cela crée des régimes différents de discours et de silence,

05:39 parce que les possibles, quand on est à l'intérieur du pays et à l'extérieur du pays,

05:44 parce que les possibilités d'expression ne sont pas les mêmes,

05:48 la formulation d'idées, les échanges sur les idées ne sont pas forcément les mêmes,

05:55 donc il y a les régimes de vérités différents qui s'imposent à l'intérieur et à l'extérieur,

06:00 ce qui nous fait beaucoup d'acteurs qui agissent à l'intérieur et à l'extérieur du pays,

06:08 et qui diffusent des sources aussi variées.

06:12 Sur la page suivante, je vous ai mis juste quelques références,

06:22 mais je n'ai pas le temps d'en parler, parce qu'évidemment notre projet de recherche

06:26 est conceptualisé en fonction et en parallèle avec d'autres initiatives d'analyse et d'approche conceptuelle.

06:39 Il y avait quelques références dans le PowerPoint.

06:42 Mais l'importance est que, à l'intérieur et à l'extérieur du pays,

06:46 nous avons beaucoup d'acteurs qui produisent et qui produisent les sources aujourd'hui,

06:52 qui conservent, collectent, donnent accès à des sources, avec la technologie numérique,

06:58 ce qui nous fait aussi les formes de sources qui sont disponibles et qui sont très différentes.

07:04 Très brièvement, juste trois exemples.

07:09 Nous avons d'abord tout un ensemble d'acteurs qui agissent à l'intérieur du pays.

07:14 Je n'ai pas mis ici le titre, mais nous les appelons archives.ir,

07:17 parce que nous n'avons pas physiquement accès à ces archives,

07:21 parce que nous faisons partie des gens qui écrivent des choses et qui produisent des discours

07:29 qui ne s'alignent pas forcément avec quelques impératifs vraiment importants

07:33 pour les acteurs politiques qui sont actuellement en place à l'intérieur du pays.

07:39 Donc nous avons affaire vraiment à des institutions archives.ir

07:45 qui mettent beaucoup de documents d'archives historiques vraiment précieux,

07:50 identifiables comme sources potentielles importantes pour notre recherche,

07:54 mais qui sont disponibles sous forme de représentations numériques,

07:59 à quelles nous avons affaire.

08:02 Et après l'analyse que nous avons faite dans l'environnement numérique,

08:06 ces substituts numériques sont souvent contextualisés de façon intellectuelle, artificielle,

08:12 avec une ignorance importante du contexte documentaire original.

08:16 Next slide please.

08:19 Donc en parallèle avec ça, à l'extérieur de l'Iran,

08:24 nous avons un faisceau d'acteurs qui agissent dans un régime de vérité totalement différent.

08:30 Ce sont des acteurs, des activistes, des chercheurs, les ONG, associations,

08:36 qui collectent des témoignages et les mettent aussi en ligne,

08:41 de façon partielle, à cause de sensibilité, d'extrême sensibilité de ces données,

08:46 souvent sous forme de transcription nativement numérique.

08:50 Next slide please.

08:52 Donc juste troisième exemple,

08:55 et évidemment nous avons les archives physiques,

09:00 nous avons livres, nous avons rapports,

09:02 qui pressent, qui sont conservés sur des supports non numériques

09:05 par les centres de recherche, par les institutions,

09:08 par les centres d'archives ou les archives privées.

09:11 Next slide please.

09:13 Donc nous avons conçu une base de données complexe pour présenter tout cela.

09:18 L'ensemble d'acteurs, des entités, des ressources,

09:22 les acteurs qui jouent des rôles différents,

09:24 les ressources dont les types sont différents,

09:27 et au moment où nous avons entamé ce travail,

09:30 il y avait encore la toute première draft, je pense, de RIC,

09:35 et donc nous avons examiné la possibilité

09:38 d'utiliser les standards évoques et bullaires classiques,

09:41 Dublin Core, ISA-J, ISAAR, ISDIA,

09:44 et là, évidemment, le problème était qu'aucun de ces standards

09:48 évoques et bullaires ne permettaient pas de présenter

09:50 l'ensemble des entités et ressources auxquelles nous avons pensé,

09:53 et donc j'ai vraiment apprécié la remarque de Meryl Girlings,

09:57 des archives municipales d'Amsterdam,

09:59 qui pointait justement notre problème que, par exemple,

10:02 l'ISA-J ne permet pas de décrire les sources nativement numériques.

10:05 Donc, techniquement aussi, en plus,

10:09 nous n'étions pas certains de pouvoir réunir ces anciens standards

10:12 ensemble en une seule base de données,

10:14 et à ce moment-là, il y avait aussi la question du budget,

10:19 qui était importante en fait, parce qu'il fallait calculer tout ça,

10:21 et à ce moment-là, nous nous sommes tournés

10:24 vers le modèle conceptuel du RIC,

10:25 et nous avons vraiment apprécié beaucoup d'aspects.

10:28 J'ai mis un cours résumé ici,

10:30 mais tout brièvement, le vocabulaire vraiment abstrait,

10:33 donc pour nous, c'était une solution énorme,

10:35 parce que ça nous permet de traiter l'ensemble d'acteurs et de ressources

10:39 en utilisant le même type de métadonnées.

10:42 Le nombre de relations, qui est impressionnant en fait,

10:46 et aussi, pour certaines relations,

10:49 le choix de les présenter de façon aussi souple,

10:53 comme par exemple "has provenance", qui est très général,

10:56 et dans notre cas de figure, c'est très utile,

10:58 parce qu'en fait, souvent, on ne comprend pas

11:01 le rôle concret qu'un tel acteur joue

11:04 dans la diffusion d'une telle ou telle source.

11:06 Donc "has provenance", c'est très large,

11:08 et c'est une solution pour nous.

11:10 Certains attributs qui permettent de discuter de façon analytique

11:14 question d'authenticité, intégrité, c'est crucial,

11:16 et enfin, justement, cette différence établie entre RIC et instantiation,

11:21 ces instantiations en fait,

11:23 qui est importante, parce que ça nous permet

11:25 de traiter les cas de figure difficiles,

11:27 comme par exemple, nous n'avons simplement pas accès

11:30 à l'instantiation authentique, toute première,

11:33 et nous ignorons même si ça existe,

11:37 mais nous avons affaire à des institutions instantiations

11:41 numériques, ou nativement numériques,

11:45 même peut-être les transcriptions d'un REC,

11:47 qui existait apparemment dans les années 80,

11:49 qui existe peut-être quelque part.

11:51 Donc, si j'ai le temps, après,

11:54 je vais donner un exemple très concret,

11:56 mais ce sera après l'intervention de Maël,

11:58 parce que, qui va présenter justement EURIST,

12:01 parce que, nous, notre équipe a décidé de faire intégrer

12:06 le modèle conceptuel de RIC dans EURIST,

12:08 et nous l'avons fait parce que vraiment,

12:10 enfin, ça c'est juste un partage d'expérience,

12:13 nous avons trouvé que c'est un outil simple

12:16 et pratique dans l'usage,

12:18 et nous avons voulu simplement participer

12:20 au développement de cet outil,

12:22 dans l'espoir que les autres équipes de recherche,

12:24 et peut-être éventuellement les archivistes,

12:26 puissent en servir. Maël, je te passe la parole.

12:28 Donc, je vais vous parler brièvement d'EURIST

12:37 et vous vous dire un peu ce que c'est.

12:39 En fait, EURIST, c'est un système de construction,

12:41 de gestion et de partage de bases de données

12:43 qui a été conçu à l'origine pour et par la recherche

12:45 en sciences humaines et sociales.

12:47 C'est développé, entre autres, par Ian Johnson,

12:49 comme une boîte à outils,

12:51 et ça a été vraiment développé au fur et à mesure,

12:53 et ça continue d'être développé

12:55 en lien avec tout un tas de projets de recherche

12:57 qui viennent nous voir et nous disent "Nous, on voudrait ça,

12:59 on voudrait ça, on a besoin de ça".

13:01 Et donc c'est dans ce cadre-là aussi que Offsite

13:03 est venu et nous a dit "Nous, on voudrait ça

13:05 et surtout, on voudrait utiliser Rixem".

13:07 Ce qu'il y a derrière, c'est un système

13:09 un système hybride de GraphNoSQL

13:11 avec une base MySQL.

13:13 Mais en fait, quand on parle d'EURIST,

13:19 on parle d'une infrastructure

13:21 avec trois composantes distinctes.

13:23 D'abord, une structure,

13:25 une structure SQL qui est derrière

13:27 que les utilisateurs ne voient pas mais qui est

13:29 très flexible et à la fois standardisée.

13:31 Un logiciel EURIST

13:33 qui est open source.

13:35 C'est un outil qui est assez facile

13:37 à prendre en main pour manipuler les bases de données

13:39 et c'est ça que

13:41 les utilisateurs voient.

13:43 Et puis, des serveurs EURIST,

13:45 un ensemble de serveurs dans le monde, mais entre autres,

13:47 en France, c'est hébergé sur les serveurs de Humanoom,

13:49 où on a à la fois

13:51 le logiciel qui est hébergé sur le serveur

13:53 et puis les bases de données qu'on va

13:55 concevoir. Après, si vous voulez,

13:57 c'est aussi possible de télécharger le logiciel

13:59 et de l'installer sur vos propres serveurs

14:01 mais ce sera à vous de le maintenir.

14:03 Je vais venir là-dessus, s'il vous plaît.

14:05 Et donc EURIST

14:07 permet de faire tout un tas de choses.

14:09 Là, vous avez une vision d'ensemble de l'interface.

14:11 La suivante.

14:13 D'autres visions de comment

14:17 on structure

14:19 les données, comment on construit les données.

14:21 La suivante.

14:23 Si ça arrive. Donc, en fait, avec EURIST,

14:29 ce qu'on peut faire, c'est à la fois

14:31 créer notre structure de données, remplir les données

14:33 dans l'interface et puis,

14:35 par la suite, gérer tout un tas

14:37 de requêtes pour pouvoir interroger nos données.

14:39 C'est aussi là que les chercheurs

14:41 sont particulièrement intéressés.

14:43 Je vais bien la suivante. Et puis,

14:45 la dernière chose qu'on n'a pas tellement faite

14:47 avec Offsite, mais c'est qu'on peut

14:49 publier sous forme

14:51 de sites Internet

14:53 des sites qui permettent de requêter les données

14:55 pour le public avec, bien sûr,

14:57 des accès plus restreints

14:59 que ce qu'on peut avoir quand on a accès à l'outil derrière.

15:01 Et donc là, vous avez quelques exemples de sites.

15:07 Qui arrive ?

15:09 Et donc, avec Natalia,

15:11 on a implémenté

15:13 RICCM.

15:15 Vous avez un morceau

15:17 de graphes sur lequel on ne voit, bien sûr,

15:19 absolument rien. Mais en fait,

15:21 on a implémenté chacune des

15:23 entités.

15:25 Sous EURIST, ça fonctionne en termes d'entités,

15:27 de champs,

15:29 attributs et de relations. Du coup, c'était assez simple

15:31 de pouvoir

15:33 mapper. C'est ça qu'on a dû faire.

15:35 C'est ça qui a été le plus long, de mapper l'ensemble

15:37 des entités et des champs pour que ça

15:39 corresponde à des formulaires dans EURIST

15:41 et que ça s'intègre dans la base de données.

15:43 Donc, vous avez...

15:45 Vous pouvez voir ce que ça donne quand on clique sur une visualisation.

15:47 On ne voit pas grand-chose, mais

15:49 au jour d'aujourd'hui, on a

15:51 implémenté l'intégralité

15:53 des entités.

15:55 Pas tous les champs

15:57 parce qu'on partait des besoins

15:59 de off-site et certains champs

16:01 et certaines entités,

16:03 par exemple, mandate, ne sont pas vraiment utiles pour off-site.

16:05 Donc, on ne s'est pas attardé sur ça.

16:07 Mais c'est tout à fait possible de les développer par la suite.

16:09 Et puis, l'intégralité des relations

16:11 ont déjà été mises en place.

16:13 La suivante...

16:15 Et ce qui permet aujourd'hui, pour quelqu'un

16:21 qui voudrait développer une base de données

16:23 en RIC, d'aller très très

16:25 rapidement en créant une nouvelle base

16:27 de données. Donc, si vous allez sur le serveur de EURIST Humanum,

16:29 vous tombez là-dessus. Vous pouvez

16:31 cliquer sur

16:33 "New users" et ça va vous...

16:35 Je veux bien la suivante... Vous tombez assez rapidement

16:37 sur un tout petit formulaire qui vous demande, en gros,

16:39 ce que vous voulez faire.

16:41 Après, vous pouvez cliquer directement

16:43 parce que ça va aller assez vite.

16:45 Et donc, on a ce premier formulaire.

16:47 On enregistre notre base de données. On se retrouve sur une base

16:49 de données relativement vierge.

16:51 Et à partir de là, on peut importer

16:53 l'ensemble de la structure

16:55 RIC CM qu'on a mise en place.

16:57 Et ce qui va importer toutes

16:59 les entités, tous les champs.

17:01 Et donc, vous partez sur une base

17:03 vierge où vous allez pouvoir

17:05 commencer à rentrer des données,

17:07 que ce soit, on a vu, les records,

17:09 les agents, etc., dans des

17:11 formulaires et de faire les liens entre eux.

17:13 Je vais bien la suivante. Et peut-être

17:15 une petite précision, mais je pense que Natalia en reparlera

17:17 rapidement. C'est aussi

17:19 très simple de rajouter des champs. C'est-à-dire que si

17:21 vous avez des champs et des besoins qui sont

17:23 spécifiques, qui ne sont pas d'ENRIC CM

17:25 ou qui ne sont pas d'ENRICO, on peut rajouter

17:27 des champs. On l'a fait pour certains

17:29 parce que ça fonctionnait, parce qu'il y avait les

17:31 besoins. Et c'est très simple de rajouter.

17:33 Donc là, vous avez un exemple de... Après,

17:35 4-5 clics et une petite dizaine de minutes,

17:37 vous avez un formulaire tout prêt

17:39 pour commencer à rentrer des données.

17:41 Il y en a peut-être une dernière

17:43 où on peut voir les relations, mais globalement,

17:45 c'était simplement pour que

17:47 vous puissiez voir un peu à quoi ça ressemble

17:49 visuellement une fois que vous êtes lancé.

17:51 - Grosso modo, ce que

18:01 Maëlle a présenté, nos formulaires

18:03 à nous, on les a

18:05 un peu changés.

18:07 Ce que je veux dire, surtout,

18:09 c'est que c'est assez facile de modifier

18:11 la structure et l'essentiel, c'est que

18:13 vos données restent intactes.

18:15 Je ne vais pas donner un exemple

18:17 concret que je voulais donner, cette différence

18:19 entre RECET et Instantiation et à quoi

18:21 ça peut vraiment servir.

18:23 A nous, ça aide beaucoup.

18:25 Mais il y a d'autres

18:27 captures d'écran

18:29 dans PowerPoint, donc vous pouvez

18:31 les regarder.

18:33 N'hésitez pas à s'adresser

18:35 à nous et surtout à l'équipe

18:37 RIST qui est magnifique

18:39 pour des questions.

18:41 Merci pour votre attention.

18:43 [Silence]

Recommandations

25:59

À suivre

Journée d'études : Implémentations de Records in contexts - 14/22 - Session 3 -Outils et systèmes pour les données RIC

Archives nationales de France