• l’année dernière
SESSION 3. OUTILS ET SYSTÈMES POUR LES DONNÉES RIC

Le projet Off-Site : vers une configuration de Heurist basée sur RiC-CM par Natalia Pashkeeva (chercheuse associée CERCEC - UMR 8083 EHESS/CNRS, France) et Maël Le Noc (community technical advisor, Heurist)

[English]
SESSION 3. TOOLS AND SYSTEMS FOR RIC DATA

The Off-Site project: towards a RiC-CM based Heurist configuration
by Natalia Pashkeeva (associate researcher, CERCEC - UMR 8083 EHESS/CNRS, France), and Maël Le Noc (community technical advisor, Heurist)



Les premières implémentations de Records in Contexts / Early implementations of Records in Contexts

Le Groupe d'experts sur la description archivistique (EGAD) du Conseil international des archives (ICA) a organisé le 15 novembre 2023 le premier événement international entièrement dédié aux premières implémentations de nouveau standard Records in Contexts (RiC)

voir : https://www.ica.org/fr/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/ pour la description des archives.

Le programme et les supports de présentation, en français ou en anglais, sont disponibles à cette adresse :
https://drive.google.com/drive/folders/1zywJxTuccDjSX-QUrYc4deACs_BTw9z8?usp=drive_link

The Expert Group on Archival Description (EGAD) of the International Council on Archives (ICA) organized on November 15th 2023 the first international event entirely dedicated to early implementations of the new Records in Contexts (RiC) archival description standard https://www.ica.org/release-of-the-first-three-parts-of-the-records-in-contexts-archival-description-standard-version-1-0-ric-fad-ric-cm-and-ric-o/

The program and the slides of this study day, in French or English, are available at: https://drive.google.com/drive/folders/1zywJxTuccDjSX-QUrYc4deACs_BTw9z8?usp=drive_link

Catégorie

📚
Éducation
Transcription
00:00 Bonjour.
00:09 Donc, hello.
00:10 Just a few words in English for the English speaking people.
00:13 I will speak French.
00:14 But you have rather detailed information in my PowerPoint in English,
00:20 so you can follow me.
00:21 Donc, j'ai le privilège de représenter ici l'équipe du projet de recherche off-site,
00:28 qui est financée par le Conseil européen de la recherche et qui a été conçu par l'anthropologue
00:35 Shora Makaremi, qui est chercheuse au CNRS et qui n'est pas dans l'auditorium,
00:41 mais qui est normalement avec nous connectée en ligne.
00:45 Donc, du coup, l'équipe du projet est également rattachée au CNRS.
00:50 Le projet s'intéresse à la violence post-révolutionnaire en Iran dans les années 80.
00:56 En fait, c'est la première décennie après la révolution islamique de 1979.
01:01 Et le projet s'intéresse également aux politiques de mémoire par rapport à cette période.
01:08 Donc, on peut peut-être...
01:10 Next slide, please.
01:12 L'équipe se situe au croisement des disciplines.
01:16 On a les anthropologues, les historiens.
01:18 On a aussi les spécialistes de l'art.
01:21 On a aussi des aspects archivistiques et évidemment, une nouvelle technologie dans une triple perspective, je dirais.
01:28 On a d'abord au sens de l'usage des outils technologiques pour rendre accessibles les sources historiques,
01:36 mais aussi, on investigue vraiment la transformation de la source historique sous l'influence de nouvelles technologiques.
01:43 Et enfin, c'est la nouvelle technologie dans le travail de recherche.
01:48 Parmi les buts du projet, il y avait la construction d'une base de données qu'on appelle "contre-archives".
01:55 Et vous allez comprendre très vite pourquoi on utilise ce mot.
01:59 La base de données a été conçue pour représenter une ethnographie des sources disponibles pour étudier la première décennie post-révolutionnaire en Iran.
02:10 Donc évidemment, non seulement les sources, mais les acteurs qui participaient et qui participent aujourd'hui dans la production, collecte, préservation et diffusion des sources en ligne.
02:21 Donc au sein de Offsite, moi j'ai été censée, entre autres tâches, de concevoir la base de données et je dirais de trouver une solution.
02:31 C'est comme ça que j'appelle ça, ma tâche.
02:33 Une solution pour réaliser la base de données, la solution la plus optimale du point de vue de notre conception de la base de données,
02:43 mais aussi au regard du budget et des ressources humaines du projet.
02:48 Donc sous la solution, j'entends évidemment un schéma de métadonnées et aussi comment la réaliser techniquement, la base de données.
02:55 Donc notre choix final, c'est le modèle conceptuel de RIC intégré dans le système de création de bases de données EURIST.
03:05 Je sais que je ne suis pas dans le panel projet de recherche, mais plutôt "tools and systems",
03:10 mais je vais quand même prendre encore un peu de temps pour vous expliquer ce choix,
03:15 parce que pour cela, j'ai besoin de vous vraiment placer brièvement dans le contexte du projet Offsite.
03:20 Donc on a deux grands thèmes, on prend l'exemple de l'éran post-révolutionnaire d'abord pour étudier la violence dans les états répressifs.
03:28 Cela englobe l'étude des mécanismes, des pratiques de la violence, l'évolution de la législation,
03:34 pratiques de tarture, systèmes et acteurs de surveillance et de punition, le fonctionnement des tribunaux
03:44 et aussi, chose importante, c'est comment les gens, les individus vivent tout cela au quotidien.
03:50 Les expériences individuelles et collectives et aussi les effets à long terme, notamment
03:57 les effets sur la politique et les pratiques sociales au sein des sociétés qui ont vécu
04:05 des périodes de violence particulièrement élevées et massives.
04:09 Et donc le deuxième grand thème, et c'est là que nous nous sommes tournés vers l'ontologie,
04:15 vers le modèle conceptuel de RIC, c'est la production et la circulation des connaissances
04:21 académiques et civiques sur tous ces aspects de la violence.
04:25 La question cruciale, c'est comment collectons les données au moment où la violence se produit
04:31 mais aussi postérieurement.
04:33 Parce que les régimes répressifs mettent en place tout un ensemble de barrières législatives
04:39 et administratives qui entravent d'abord tout simplement la sécurité physique des personnes
04:44 et avec ça, enfin, ils entravent aussi l'accès au terrain.
04:49 Donc, ça empêche le travail ethnographique classique, le travail de terrain empirique.
04:53 Et aussi, cela entrave l'accès aux archives qui permettent d'étudier le passé.
05:00 Cela crée aussi des distances à niveau différent, des distances entre l'expert et l'objet d'étude,
05:07 des distances physiques parce qu'on est positionné géographiquement loin, parfois loin du terrain,
05:16 d'investigation et aussi les distances temporelles avec l'expert d'aujourd'hui,
05:21 donc par rapport aux événements du passé, et aussi les témoins qui ont vécu la violence
05:27 ou leurs proches par exemple, mais qui sont appelés à remémorer tout cela aujourd'hui,
05:34 dans notre époque.
05:35 Et donc, cela crée des régimes différents de discours et de silence,
05:39 parce que les possibles, quand on est à l'intérieur du pays et à l'extérieur du pays,
05:44 parce que les possibilités d'expression ne sont pas les mêmes,
05:48 la formulation d'idées, les échanges sur les idées ne sont pas forcément les mêmes,
05:55 donc il y a les régimes de vérités différents qui s'imposent à l'intérieur et à l'extérieur,
06:00 ce qui nous fait beaucoup d'acteurs qui agissent à l'intérieur et à l'extérieur du pays,
06:08 et qui diffusent des sources aussi variées.
06:12 Sur la page suivante, je vous ai mis juste quelques références,
06:22 mais je n'ai pas le temps d'en parler, parce qu'évidemment notre projet de recherche
06:26 est conceptualisé en fonction et en parallèle avec d'autres initiatives d'analyse et d'approche conceptuelle.
06:39 Il y avait quelques références dans le PowerPoint.
06:42 Mais l'importance est que, à l'intérieur et à l'extérieur du pays,
06:46 nous avons beaucoup d'acteurs qui produisent et qui produisent les sources aujourd'hui,
06:52 qui conservent, collectent, donnent accès à des sources, avec la technologie numérique,
06:58 ce qui nous fait aussi les formes de sources qui sont disponibles et qui sont très différentes.
07:04 Très brièvement, juste trois exemples.
07:09 Nous avons d'abord tout un ensemble d'acteurs qui agissent à l'intérieur du pays.
07:14 Je n'ai pas mis ici le titre, mais nous les appelons archives.ir,
07:17 parce que nous n'avons pas physiquement accès à ces archives,
07:21 parce que nous faisons partie des gens qui écrivent des choses et qui produisent des discours
07:29 qui ne s'alignent pas forcément avec quelques impératifs vraiment importants
07:33 pour les acteurs politiques qui sont actuellement en place à l'intérieur du pays.
07:39 Donc nous avons affaire vraiment à des institutions archives.ir
07:45 qui mettent beaucoup de documents d'archives historiques vraiment précieux,
07:50 identifiables comme sources potentielles importantes pour notre recherche,
07:54 mais qui sont disponibles sous forme de représentations numériques,
07:59 à quelles nous avons affaire.
08:02 Et après l'analyse que nous avons faite dans l'environnement numérique,
08:06 ces substituts numériques sont souvent contextualisés de façon intellectuelle, artificielle,
08:12 avec une ignorance importante du contexte documentaire original.
08:16 Next slide please.
08:19 Donc en parallèle avec ça, à l'extérieur de l'Iran,
08:24 nous avons un faisceau d'acteurs qui agissent dans un régime de vérité totalement différent.
08:30 Ce sont des acteurs, des activistes, des chercheurs, les ONG, associations,
08:36 qui collectent des témoignages et les mettent aussi en ligne,
08:41 de façon partielle, à cause de sensibilité, d'extrême sensibilité de ces données,
08:46 souvent sous forme de transcription nativement numérique.
08:50 Next slide please.
08:52 Donc juste troisième exemple,
08:55 et évidemment nous avons les archives physiques,
09:00 nous avons livres, nous avons rapports,
09:02 qui pressent, qui sont conservés sur des supports non numériques
09:05 par les centres de recherche, par les institutions,
09:08 par les centres d'archives ou les archives privées.
09:11 Next slide please.
09:13 Donc nous avons conçu une base de données complexe pour présenter tout cela.
09:18 L'ensemble d'acteurs, des entités, des ressources,
09:22 les acteurs qui jouent des rôles différents,
09:24 les ressources dont les types sont différents,
09:27 et au moment où nous avons entamé ce travail,
09:30 il y avait encore la toute première draft, je pense, de RIC,
09:35 et donc nous avons examiné la possibilité
09:38 d'utiliser les standards évoques et bullaires classiques,
09:41 Dublin Core, ISA-J, ISAAR, ISDIA,
09:44 et là, évidemment, le problème était qu'aucun de ces standards
09:48 évoques et bullaires ne permettaient pas de présenter
09:50 l'ensemble des entités et ressources auxquelles nous avons pensé,
09:53 et donc j'ai vraiment apprécié la remarque de Meryl Girlings,
09:57 des archives municipales d'Amsterdam,
09:59 qui pointait justement notre problème que, par exemple,
10:02 l'ISA-J ne permet pas de décrire les sources nativement numériques.
10:05 Donc, techniquement aussi, en plus,
10:09 nous n'étions pas certains de pouvoir réunir ces anciens standards
10:12 ensemble en une seule base de données,
10:14 et à ce moment-là, il y avait aussi la question du budget,
10:19 qui était importante en fait, parce qu'il fallait calculer tout ça,
10:21 et à ce moment-là, nous nous sommes tournés
10:24 vers le modèle conceptuel du RIC,
10:25 et nous avons vraiment apprécié beaucoup d'aspects.
10:28 J'ai mis un cours résumé ici,
10:30 mais tout brièvement, le vocabulaire vraiment abstrait,
10:33 donc pour nous, c'était une solution énorme,
10:35 parce que ça nous permet de traiter l'ensemble d'acteurs et de ressources
10:39 en utilisant le même type de métadonnées.
10:42 Le nombre de relations, qui est impressionnant en fait,
10:46 et aussi, pour certaines relations,
10:49 le choix de les présenter de façon aussi souple,
10:53 comme par exemple "has provenance", qui est très général,
10:56 et dans notre cas de figure, c'est très utile,
10:58 parce qu'en fait, souvent, on ne comprend pas
11:01 le rôle concret qu'un tel acteur joue
11:04 dans la diffusion d'une telle ou telle source.
11:06 Donc "has provenance", c'est très large,
11:08 et c'est une solution pour nous.
11:10 Certains attributs qui permettent de discuter de façon analytique
11:14 question d'authenticité, intégrité, c'est crucial,
11:16 et enfin, justement, cette différence établie entre RIC et instantiation,
11:21 ces instantiations en fait,
11:23 qui est importante, parce que ça nous permet
11:25 de traiter les cas de figure difficiles,
11:27 comme par exemple, nous n'avons simplement pas accès
11:30 à l'instantiation authentique, toute première,
11:33 et nous ignorons même si ça existe,
11:37 mais nous avons affaire à des institutions instantiations
11:41 numériques, ou nativement numériques,
11:45 même peut-être les transcriptions d'un REC,
11:47 qui existait apparemment dans les années 80,
11:49 qui existe peut-être quelque part.
11:51 Donc, si j'ai le temps, après,
11:54 je vais donner un exemple très concret,
11:56 mais ce sera après l'intervention de Maël,
11:58 parce que, qui va présenter justement EURIST,
12:01 parce que, nous, notre équipe a décidé de faire intégrer
12:06 le modèle conceptuel de RIC dans EURIST,
12:08 et nous l'avons fait parce que vraiment,
12:10 enfin, ça c'est juste un partage d'expérience,
12:13 nous avons trouvé que c'est un outil simple
12:16 et pratique dans l'usage,
12:18 et nous avons voulu simplement participer
12:20 au développement de cet outil,
12:22 dans l'espoir que les autres équipes de recherche,
12:24 et peut-être éventuellement les archivistes,
12:26 puissent en servir. Maël, je te passe la parole.
12:28 Donc, je vais vous parler brièvement d'EURIST
12:37 et vous vous dire un peu ce que c'est.
12:39 En fait, EURIST, c'est un système de construction,
12:41 de gestion et de partage de bases de données
12:43 qui a été conçu à l'origine pour et par la recherche
12:45 en sciences humaines et sociales.
12:47 C'est développé, entre autres, par Ian Johnson,
12:49 comme une boîte à outils,
12:51 et ça a été vraiment développé au fur et à mesure,
12:53 et ça continue d'être développé
12:55 en lien avec tout un tas de projets de recherche
12:57 qui viennent nous voir et nous disent "Nous, on voudrait ça,
12:59 on voudrait ça, on a besoin de ça".
13:01 Et donc c'est dans ce cadre-là aussi que Offsite
13:03 est venu et nous a dit "Nous, on voudrait ça
13:05 et surtout, on voudrait utiliser Rixem".
13:07 Ce qu'il y a derrière, c'est un système
13:09 un système hybride de GraphNoSQL
13:11 avec une base MySQL.
13:13 Mais en fait, quand on parle d'EURIST,
13:19 on parle d'une infrastructure
13:21 avec trois composantes distinctes.
13:23 D'abord, une structure,
13:25 une structure SQL qui est derrière
13:27 que les utilisateurs ne voient pas mais qui est
13:29 très flexible et à la fois standardisée.
13:31 Un logiciel EURIST
13:33 qui est open source.
13:35 C'est un outil qui est assez facile
13:37 à prendre en main pour manipuler les bases de données
13:39 et c'est ça que
13:41 les utilisateurs voient.
13:43 Et puis, des serveurs EURIST,
13:45 un ensemble de serveurs dans le monde, mais entre autres,
13:47 en France, c'est hébergé sur les serveurs de Humanoom,
13:49 où on a à la fois
13:51 le logiciel qui est hébergé sur le serveur
13:53 et puis les bases de données qu'on va
13:55 concevoir. Après, si vous voulez,
13:57 c'est aussi possible de télécharger le logiciel
13:59 et de l'installer sur vos propres serveurs
14:01 mais ce sera à vous de le maintenir.
14:03 Je vais venir là-dessus, s'il vous plaît.
14:05 Et donc EURIST
14:07 permet de faire tout un tas de choses.
14:09 Là, vous avez une vision d'ensemble de l'interface.
14:11 La suivante.
14:13 D'autres visions de comment
14:17 on structure
14:19 les données, comment on construit les données.
14:21 La suivante.
14:23 Si ça arrive. Donc, en fait, avec EURIST,
14:29 ce qu'on peut faire, c'est à la fois
14:31 créer notre structure de données, remplir les données
14:33 dans l'interface et puis,
14:35 par la suite, gérer tout un tas
14:37 de requêtes pour pouvoir interroger nos données.
14:39 C'est aussi là que les chercheurs
14:41 sont particulièrement intéressés.
14:43 Je vais bien la suivante. Et puis,
14:45 la dernière chose qu'on n'a pas tellement faite
14:47 avec Offsite, mais c'est qu'on peut
14:49 publier sous forme
14:51 de sites Internet
14:53 des sites qui permettent de requêter les données
14:55 pour le public avec, bien sûr,
14:57 des accès plus restreints
14:59 que ce qu'on peut avoir quand on a accès à l'outil derrière.
15:01 Et donc là, vous avez quelques exemples de sites.
15:07 Qui arrive ?
15:09 Et donc, avec Natalia,
15:11 on a implémenté
15:13 RICCM.
15:15 Vous avez un morceau
15:17 de graphes sur lequel on ne voit, bien sûr,
15:19 absolument rien. Mais en fait,
15:21 on a implémenté chacune des
15:23 entités.
15:25 Sous EURIST, ça fonctionne en termes d'entités,
15:27 de champs,
15:29 attributs et de relations. Du coup, c'était assez simple
15:31 de pouvoir
15:33 mapper. C'est ça qu'on a dû faire.
15:35 C'est ça qui a été le plus long, de mapper l'ensemble
15:37 des entités et des champs pour que ça
15:39 corresponde à des formulaires dans EURIST
15:41 et que ça s'intègre dans la base de données.
15:43 Donc, vous avez...
15:45 Vous pouvez voir ce que ça donne quand on clique sur une visualisation.
15:47 On ne voit pas grand-chose, mais
15:49 au jour d'aujourd'hui, on a
15:51 implémenté l'intégralité
15:53 des entités.
15:55 Pas tous les champs
15:57 parce qu'on partait des besoins
15:59 de off-site et certains champs
16:01 et certaines entités,
16:03 par exemple, mandate, ne sont pas vraiment utiles pour off-site.
16:05 Donc, on ne s'est pas attardé sur ça.
16:07 Mais c'est tout à fait possible de les développer par la suite.
16:09 Et puis, l'intégralité des relations
16:11 ont déjà été mises en place.
16:13 La suivante...
16:15 Et ce qui permet aujourd'hui, pour quelqu'un
16:21 qui voudrait développer une base de données
16:23 en RIC, d'aller très très
16:25 rapidement en créant une nouvelle base
16:27 de données. Donc, si vous allez sur le serveur de EURIST Humanum,
16:29 vous tombez là-dessus. Vous pouvez
16:31 cliquer sur
16:33 "New users" et ça va vous...
16:35 Je veux bien la suivante... Vous tombez assez rapidement
16:37 sur un tout petit formulaire qui vous demande, en gros,
16:39 ce que vous voulez faire.
16:41 Après, vous pouvez cliquer directement
16:43 parce que ça va aller assez vite.
16:45 Et donc, on a ce premier formulaire.
16:47 On enregistre notre base de données. On se retrouve sur une base
16:49 de données relativement vierge.
16:51 Et à partir de là, on peut importer
16:53 l'ensemble de la structure
16:55 RIC CM qu'on a mise en place.
16:57 Et ce qui va importer toutes
16:59 les entités, tous les champs.
17:01 Et donc, vous partez sur une base
17:03 vierge où vous allez pouvoir
17:05 commencer à rentrer des données,
17:07 que ce soit, on a vu, les records,
17:09 les agents, etc., dans des
17:11 formulaires et de faire les liens entre eux.
17:13 Je vais bien la suivante. Et peut-être
17:15 une petite précision, mais je pense que Natalia en reparlera
17:17 rapidement. C'est aussi
17:19 très simple de rajouter des champs. C'est-à-dire que si
17:21 vous avez des champs et des besoins qui sont
17:23 spécifiques, qui ne sont pas d'ENRIC CM
17:25 ou qui ne sont pas d'ENRICO, on peut rajouter
17:27 des champs. On l'a fait pour certains
17:29 parce que ça fonctionnait, parce qu'il y avait les
17:31 besoins. Et c'est très simple de rajouter.
17:33 Donc là, vous avez un exemple de... Après,
17:35 4-5 clics et une petite dizaine de minutes,
17:37 vous avez un formulaire tout prêt
17:39 pour commencer à rentrer des données.
17:41 Il y en a peut-être une dernière
17:43 où on peut voir les relations, mais globalement,
17:45 c'était simplement pour que
17:47 vous puissiez voir un peu à quoi ça ressemble
17:49 visuellement une fois que vous êtes lancé.
17:51 - Grosso modo, ce que
18:01 Maëlle a présenté, nos formulaires
18:03 à nous, on les a
18:05 un peu changés.
18:07 Ce que je veux dire, surtout,
18:09 c'est que c'est assez facile de modifier
18:11 la structure et l'essentiel, c'est que
18:13 vos données restent intactes.
18:15 Je ne vais pas donner un exemple
18:17 concret que je voulais donner, cette différence
18:19 entre RECET et Instantiation et à quoi
18:21 ça peut vraiment servir.
18:23 A nous, ça aide beaucoup.
18:25 Mais il y a d'autres
18:27 captures d'écran
18:29 dans PowerPoint, donc vous pouvez
18:31 les regarder.
18:33 N'hésitez pas à s'adresser
18:35 à nous et surtout à l'équipe
18:37 RIST qui est magnifique
18:39 pour des questions.
18:41 Merci pour votre attention.
18:43 [Silence]

Recommandations