* - Le corpus “CBMA” est constitué de plusieurs sous-corpus (pour plus de détails, voir le site web du projet: www.cbma-project.eu). À l’heure actuelle, le sous-corpus hagiographique “bourguignon” et les clichés des manuscrits photographiés par les Archives départementales de la Côte d’Or ont été versés dans le dépôt Nakala (voir infra: FAIRisation). La révision des données de l’ensemble du corpus “CBMA” est en cours et fera l’objet des futurs versements.
Description des données
Nature de données
données textuelles, données visuelles (photos des manuscrits, inscriptions)
Format de données
csv, tab, xlsx, xml, jpg, txt, pdf, doc/docx Actuellement les formats principaux de la saisie de données: csv pour les métadonnées et txt pour les textes.
Standards des données
Pour les fichiers xml: modèle personnel pour les textes lemmatisés.
Taille des fichiers
30-50 Mo environ
Unité de donnée et nb.d’unités
29318 textes
Logiciels spécifiques nécessaires pour la lecture des données
Logiciel de tableur (formats xlsx, tab) TXM, Philologic4, NoSketchEngine (pour les fichiers xml des textes lemmatisés).
Plateforme d’affichage et de stockage des données
Interrogation et analyse des données: TXM, Philologic4, NoSketchEngine. Visualisation des manuscrits: plateforme Mirador. Stockage des données: en cours de migration vers Nakala.
Correspondance aux principes FAIR
Findable (= Facile à trouver)
F1: Les (méta)données possèdent un identifiant persistant et unique au monde (persistent identifier, PID)
Corpus CBMA (version septembre 2017): (textes) Corpus hagiographique “bourguignon”: (textes) Cartulaires (AD de la Côte d’Or): (photos) Collection CBMA : Pour une liste complète de tous les dépôts de données dans le cadre du projet CBMA voir: Les Données / Outils LAMOP
Citation bibliographique
Corpus CBMA (version septembre 2017): “Corpus CBMA - Version septembre 2017”, 2022, [Dataset] NAKALA. https://doi.org/10.34847/nkl.185e679s Corpus hagiographique “bourguignon”: “Corpus hagiographique bourguignon - Version 09/2019”, 2022, [Dataset] NAKALA. https://doi.org/10.34847/nkl.baa5bj28 Cartulaires (AD de la Côte d’Or) et collection “CBMA”: Le dépôt de données “Nakala” ne propose pas de citation bibliographique pour ses collections. Les citations bibliographiques s’effectuent individuellement pour chaque cliché.
Documentation technique
Corpus CBMA (version septembre 2017) et corpus hagiographique “bourguignon”: La documentation est incluse dans le dépôt des données. Cartulaires (AD de la Côte d’Or): Aucune documentation n’est nécessaire, les données sont explicites en l’état.