CIFM-CBMA (Corpus des Inscriptions de la France Médiévale - Corpus Burgundiae Medii Aevi)

Table des matières

Information générale
Description des données
Correspondance aux principes FAIR
FAIRisation

Information générale

Nom du corpus	CIFM-CBMA (Corpus des Inscriptions de la France Médiévale - Corpus Burgundiae Medii Aevi)
Adresse web	CIFM-CBMA
Responsables scientifiques et techniques	Eliana Magnani (LAMOP, UMR 8589) Estelle Ingrand-Varenne (CNRS-CESCM)

Description des données

Nature de données	données textuelles, données visuelles (photos des manuscrits, inscriptions)
Format de données	L’ensemble des textes a été extrait des volumes océrisés CIFM au format csv. Ensuite, chaque texte converti en txt. Fichiers xml (textes lemmatisés pour TXM). Images: jpg, tif
Standards des données	Pour les fichiers xml: modèle personnel pour les textes lemmatisés.
Taille des fichiers	1 Mo environs
Unité de donnée et nb.d’unités	2268 textes
Logiciels spécifiques nécessaires pour la lecture des données	TXM, Philologic4 (pour les fichiers xml des textes lemmatisés).
Plateforme d’affichage et de stockage des données	Interrogation et analyse des données: TXM, Philologic4. Stockage des données: en cours de migration vers Nakala.

Correspondance aux principes FAIR

Findable (= Facile à trouver)

F1: Les (méta)données possèdent un identifiant persistant et unique au monde (persistent identifier, PID)	Oui
F2: Les données sont décrites avec des métadonnées riches	Oui
F3: Les métadonnées incluent, d’une façon claire et explicite, l’identifiant des données qu’elles décrivent	Oui
F4: Les (méta)données sont enregistrées ou indexées dans une ressource consultable	Oui

Accessible

A1. Les (méta)données sont récupérables par leur identifiant en utilisant un protocole standard de communication	Oui
A1.1. Le protocole est ouvert, gratuit et largement utilisé	Oui
A1.2. Le protocole permet, si nécessaire, une procédure d’authentification et d’autorisation	Oui
A2. Les métadonnées sont accessibles, même lorsque les données ne sont plus disponibles	Oui

Interoperable (= Interopérable)

I1. Les (méta)données utilisent un langage formel, accessible, partagé et largement répandu pour la représentation des connaissances	Oui
I2. Les (méta)données utilisent des vocabulaires qui suivent les principes FAIR	Oui
I3. Les (méta)données incluent des références qualifiées à d’autres (méta)données	Oui

Reusable (= Réutilisable)

R1. Les méta(données) sont décrites d’une façon complète avec plusieurs attributs précis et pertinents	Oui
R1.1. Les (méta)données sont publiées avec une licence d’utilisation des données claire et accessible	Oui
R1.2. Les (méta)données disposent d’une provenance détaillée	Oui
R1.3. Les (méta)données répondent aux standards communautaires de leur domaine	Oui

FAIRisation

Données FAIRisées	données textuelles: TXT
Dépôt de données	Corpus épigraphique “bourguignon”: Corpus épigraphique “provençal”:
Citation bibliographique	Corpus épigraphique “bourguignon”: “Corpus épigraphique “bourguignon” (VIII^e-XV^e siècle) - Version 2019”, 2021, [Dataset] NAKALA. https://doi.org/10.34847/nkl.e7de18k9 Corpus épigraphique “provençal”: “Corpus épigraphique “provençal” (VIII^e-XV^e siècle) - Version 2020 “, 2021, [Dataset] NAKALA. https://doi.org/10.34847/nkl.a6f1ua6y
Documentation technique	La documentation est incluse dans les dépôts des données.
Infrastructure personnelle	non