Formation humanum 2021

Gérer les données en SHS avec les services et outils proposés par la TGIR Huma-Num

Le programme
6 modules dont 2 modules de TP réservés uniquement à certains participants

Module 1 : Préparer ses données et méta-données pour les déposer sur Nakala


Nouvelle version de Nakala

Cycle de vie des données :des données brutes aux données FAIR, organisation, collecte, traitement, préservation, publication et réutilisation

Définir le périmètre de Nakala : préservation ( dépot/méta, Attribution d'identifiants, gestion des versions) et publication (embargo...)

L'organisation :
La collecte :
Données du périmètre des sciences Humaines et sociales avec la gestion, le fair, la science ouverte, les plan de gestion des données, le plan science ouverte

Besoin : mise en sécurité des données dès le début du projet avec facilité d'accès tout en gérant les accès afin de partager le travail et travailler sur les données en ligne.

ShareDocs est un gestionnaire de fichier en ligne fait pour le processus de travail sur les données

NAKALA est destiné au stockage de données stabilisées
Quels ordre dans les priorités au cours du processus de collecte ?

Pas de restriction de format des données y compris sur NAKALA. Par contre, le format entre en jeu dans les enjeux de partage.

On peut déposer la même donnée sous plusieurs formats

Il est très important de bien penser à l'organisation en jeu de données de manière accessible pour tout le monde (DMP). Mettre à jour son DMP.
Concernant NAKALA , nous devons regrouper des données sans lien hiérarchique donc y penser aussi dans ShareDocs. Faire des fichiers lisez-moi pour expliquer ce que le dossier contient.

Définir des conventions de nommage des fichiers. C'est indispensable

Ex: nature du fichier, puis sujet, puis date avec _ Logo_RAEE_2021 ou Audio_EntretienADEME_20210715

Identifier les données sensibles. Les services proposées ne garantissent que la sécurité numérique mais pas les considération de pseudonomisation.

Préparer la description
Utiliser un fichier de description séparé, facilité car toutes la description est concentrée et permet l'enrechissement

Dans NAKALA au minimum Type, Titre, Auteur, Date, Licence
1 donnée NAKALA = 1 description + 1ou plusieurs fichier => attribution DOI + lien

Penser à leur réutilisation et à la licence voir DURANUM
Les métadonnées sont toujours visibles

Les champs supplémentaires sont de type DublinCore (https://www.dublincore.org/specifications/dublin-core/dcmi-terms) ex : dcterms:langage

Guide de description des données dans Nakala (bonnes pratiques)

On peut utiliser un autre standard que le DublinCore

ShareDocs


L'opération d'édition de fichier OnlyOffiche sort des serveurs Huma-Num donc à éviter pour l'édition de données sensibles

Cryptage possible via outil ZED encrypt. Les liens de citation dans SharDocs ne sont pas pérennes

Focus Gitlab

Outil de collecte et de travail collaboratif

La règle d'accès au service Huma-num est que le projet doit être porté par une institution française et on peut ouvrir à d'autres partenaires. Prévoir quand même de définir la fermeture des droits d'accès.

Importance des formats
guide des formats ouverts à privilégié https://doranum.fr/stockage-archivage/quiz-format-ouvert-ou-ferme/ ou https://facile.cines.fr/ qui permet aussi de tester le fichier

Si ce n'est pas possible faire une copie en format ouvert.

Identification des formats : outil droid

Documenter dans les métadonnées le statut de chaque format ou leur mode de production Ex : Original en .doc - sauvegarde en .docx (ouvert) - diffusion en .pdf - archivage en .docx (avec embargo) et .pdf

Outils de conversion dans shareDocs = OCR

Conversion pour enrichir mes données (ex: texte numérisé en image) outil sur facile.cines pour les pdf

Le dépôt dans Nakala

- introduction sur les entrepôts
Pluridisciplinaire (ex ZENODO) ou disciplinaire (GenBank)
https://cat.opidor.fr/index.php/Entrep%C3%B4t_de_donn%C3%A9es
https://www.re3data.org/


- L'entrepôt NAKALA
module de création de site WEB
comparaison avec d'autres entrepots https://sharedocs.huma-num.fr/wl/?id=DFmKt8pEXR9zMhFoRiggzNZnZroDBlJy

https://test.nakala.fr

TP - Déposer un jeu de données

Liste des référentiel de donnée isidore

des problèmes sur Nakala : cogrid@huma-num.fr

Jeudi 30 Septembre


Découverte de Nakala Press

Nakala press permet de créer un site web synchronisé avec le dépôt Nakala
L'outil semble très facile pour les habitués du WIKI
Ce ne sont que des formulaires pour créer des pages.
Voici l’éditeur de texte utilisée dans NAKALA_PRESS : https://github.com/jpuri/react-draft-wysiwyg

Les identifiants Nakala


DOI et handles : désolé c'est très technique, je me noie.

Possibilité de visionner les fichier sur le site nakala press

Pour les images - protocole IIIF (région - taille - rotation - qualité - format)
ex : https://api.nakala.fr/iiif/11280/111643de/b11ddf74a574b13ab04d790ebfd6d643db96eaed/250,450,300,300/max/0/default.jpg
https://api.nakala.fr/iiif/11280/111643de/b11ddf74a574b13ab04d790ebfd6d643db96eaed/full/max/45/default.jpg