Eliana Magnani (LAMOP, UMR 8589) Estelle Ingrand-Varenne (CNRS-CESCM)
Description des données
Nature de données
données textuelles, données visuelles (photos des manuscrits, inscriptions)
Format de données
L’ensemble des textes a été extrait des volumes océrisés CIFM au format csv. Ensuite, chaque texte converti en txt. Fichiers xml (textes lemmatisés pour TXM). Images: jpg, tif
Standards des données
Pour les fichiers xml: modèle personnel pour les textes lemmatisés.
Taille des fichiers
1 Mo environs
Unité de donnée et nb.d’unités
2268 textes
Logiciels spécifiques nécessaires pour la lecture des données
TXM, Philologic4 (pour les fichiers xml des textes lemmatisés).
Plateforme d’affichage et de stockage des données
Interrogation et analyse des données: TXM, Philologic4. Stockage des données: en cours de migration vers Nakala.
Correspondance aux principes FAIR
Findable (= Facile à trouver)
F1: Les (méta)données possèdent un identifiant persistant et unique au monde (persistent identifier, PID)
Oui
F2: Les données sont décrites avec des métadonnées riches
Oui
F3: Les métadonnées incluent, d’une façon claire et explicite, l’identifiant des données qu’elles décrivent
Oui
F4: Les (méta)données sont enregistrées ou indexées dans une ressource consultable
Oui
Accessible
A1. Les (méta)données sont récupérables par leur identifiant en utilisant un protocole standard de communication
Oui
A1.1. Le protocole est ouvert, gratuit et largement utilisé
Oui
A1.2. Le protocole permet, si nécessaire, une procédure d’authentification et d’autorisation
Oui
A2. Les métadonnées sont accessibles, même lorsque les données ne sont plus disponibles
Oui
Interoperable (= Interopérable)
I1. Les (méta)données utilisent un langage formel, accessible, partagé et largement répandu pour la représentation des connaissances
Oui
I2. Les (méta)données utilisent des vocabulaires qui suivent les principes FAIR
Oui
I3. Les (méta)données incluent des références qualifiées à d’autres (méta)données
Oui
Reusable (= Réutilisable)
R1. Les méta(données) sont décrites d’une façon complète avec plusieurs attributs précis et pertinents
Oui
R1.1. Les (méta)données sont publiées avec une licence d’utilisation des données claire et accessible
Oui
R1.2. Les (méta)données disposent d’une provenance détaillée
Oui
R1.3. Les (méta)données répondent aux standards communautaires de leur domaine
Oui
FAIRisation
Données FAIRisées
données textuelles: TXT
Dépôt de données
Corpus épigraphique “bourguignon”: Corpus épigraphique “provençal”:
Citation bibliographique
Corpus épigraphique “bourguignon”: “Corpus épigraphique “bourguignon” (VIIIe-XVe siècle) - Version 2019”, 2021, [Dataset] NAKALA. https://doi.org/10.34847/nkl.e7de18k9 Corpus épigraphique “provençal”: “Corpus épigraphique “provençal” (VIIIe-XVe siècle) - Version 2020 “, 2021, [Dataset] NAKALA. https://doi.org/10.34847/nkl.a6f1ua6y
Documentation technique
La documentation est incluse dans les dépôts des données.