Formation humanum 2021
Gérer les données en SHS avec les services et outils proposés par la TGIR Huma-Num
Le programme
6 modules dont 2 modules de TP réservés uniquement à certains participants
Module 1 : Préparer ses données et méta-données pour les déposer sur Nakala
Nouvelle version de Nakala
Cycle de vie des données :des données brutes aux données FAIR, organisation, collecte, traitement, préservation, publication et réutilisation
Définir le périmètre de Nakala : préservation ( dépot/méta, Attribution d'identifiants, gestion des versions) et publication (embargo...)
L'organisation :
La collecte :
- Le service ShareDocs et gitlab
Données du périmètre des sciences Humaines et sociales avec la gestion, le fair, la science ouverte, les plan de gestion des données, le plan science ouverte
Besoin : mise en sécurité des données dès le début du projet avec facilité d'accès tout en gérant les accès afin de partager le travail et travailler sur les données en ligne.
ShareDocs est un gestionnaire de fichier en ligne fait pour le processus de travail sur les données
NAKALA est destiné au stockage de données stabilisées
Quels ordre dans les priorités au cours du processus de collecte ?
Pas de restriction de format des données y compris sur NAKALA. Par contre, le format entre en jeu dans les enjeux de partage.
On peut déposer la même donnée sous plusieurs formats
Il est très important de bien penser à l'organisation en jeu de données de manière accessible pour tout le monde (DMP). Mettre à jour son DMP.
Concernant NAKALA , nous devons regrouper des données sans lien hiérarchique donc y penser aussi dans ShareDocs. Faire des fichiers lisez-moi pour expliquer ce que le dossier contient.
Définir des conventions de nommage des fichiers. C'est indispensable
Ex: nature du fichier, puis sujet, puis date avec _ Logo_RAEE_2021 ou Audio_EntretienADEME_20210715
Identifier les données sensibles. Les services proposées ne garantissent que la sécurité numérique mais pas les considération de pseudonomisation.
Préparer la description
Utiliser un fichier de description séparé, facilité car toutes la description est concentrée et permet l'enrechissement
Dans NAKALA au minimum Type, Titre, Auteur, Date, Licence
1 donnée NAKALA = 1 description + 1ou plusieurs fichier => attribution DOI + lien
Penser à leur réutilisation et à la licence voir DURANUM
Les métadonnées sont toujours visibles
Les champs supplémentaires sont de type DublinCore (https://www.dublincore.org/specifications/dublin-core/dcmi-terms) ex : dcterms:langage
Guide de description des données dans Nakala (bonnes pratiques)
On peut utiliser un autre standard que le DublinCore
ShareDocs
L'opération d'édition de fichier OnlyOffiche sort des serveurs Huma-Num donc à éviter pour l'édition de données sensibles
Cryptage possible via outil ZED encrypt. Les liens de citation dans SharDocs ne sont pas pérennes
Focus Gitlab
Outil de collecte et de travail collaboratif
La règle d'accès au service Huma-num est que le projet doit être porté par une institution française et on peut ouvrir à d'autres partenaires. Prévoir quand même de définir la fermeture des droits d'accès.
Importance des formats
guide des formats ouverts à privilégié https://doranum.fr/stockage-archivage/quiz-format-ouvert-ou-ferme/ ou https://facile.cines.fr/ qui permet aussi de tester le fichier
Si ce n'est pas possible faire une copie en format ouvert.
Identification des formats : outil droid
Documenter dans les métadonnées le statut de chaque format ou leur mode de production Ex : Original en .doc - sauvegarde en .docx (ouvert) - diffusion en .pdf - archivage en .docx (avec embargo) et .pdf
Outils de conversion dans shareDocs = OCR
Conversion pour enrichir mes données (ex: texte numérisé en image) outil sur facile.cines pour les pdf
Le dépôt dans Nakala
- introduction sur les entrepôts
Pluridisciplinaire (ex ZENODO) ou disciplinaire (GenBank)
https://cat.opidor.fr/index.php/Entrep%C3%B4t_de_donn%C3%A9es
https://www.re3data.org/
- L'entrepôt NAKALA
module de création de site WEB
comparaison avec d'autres entrepots https://sharedocs.huma-num.fr/wl/?id=DFmKt8pEXR9zMhFoRiggzNZnZroDBlJy
https://test.nakala.fr
TP - Déposer un jeu de données
Liste des référentiel de donnée isidore
des problèmes sur Nakala : cogrid@huma-num.fr
Jeudi 30 Septembre
Découverte de Nakala Press
Nakala press permet de créer un site web synchronisé avec le dépôt Nakala
L'outil semble très facile pour les habitués du WIKI
Ce ne sont que des formulaires pour créer des pages.
Voici l’éditeur de texte utilisée dans NAKALA_PRESS : https://github.com/jpuri/react-draft-wysiwyg
Les identifiants Nakala
DOI et handles : désolé c'est très technique, je me noie.
Possibilité de visionner les fichier sur le site nakala press
Pour les images - protocole IIIF (région - taille - rotation - qualité - format)
ex : https://api.nakala.fr/iiif/11280/111643de/b11ddf74a574b13ab04d790ebfd6d643db96eaed/250,450,300,300/max/0/default.jpg
https://api.nakala.fr/iiif/11280/111643de/b11ddf74a574b13ab04d790ebfd6d643db96eaed/full/max/45/default.jpg