Sauter la navigation

Après le dépôt

Une fois que vous aurez soumis votre jeu de données, votre soumission sera mise en file d’attente afin d’être examinée par un(e) curateur(-trice). Le temps qu’exigera le processus de curation dépendra d’un certain nombre de facteurs, y compris la taille de la soumission, la façon dont le contenu est organisé et l’exhaustivité des métadonnées et de la documentation. Vous pouvez vous attendre à ce qu’un(e) curateur(-trice) communique avec vous dans un délai de deux jours ouvrables. Une fois que votre jeu de données sera approuvé pour publication, vous recevrez un courriel de confirmation, votre DOI sera enregistré et certains jeux de données pourraient faire l’objet d’un traitement supplémentaire aux fins de préservation à long terme.

Curation

Toutes les données déposées dans le DFDR seront examinées par un membre de notre équipe de curation. Les curateur(-trice)s collaborent avec les déposant(e)s pour que leurs jeux de données soient globalement plus faciles à trouver, accessibles, interopérables et réutilisables (principes FAIR). Notre équipe de curation utilise les étapes CURATED du Data Curation Network comme cadre d’examen des nouveaux dépôts.

Les déposant(e)s devraient travailler en collaboration avec les curateur(-trice)s tout au long du processus d’examen pour:

  • S’assurer que la documentation est adéquate.
  • Modifier les métadonnées pour corriger les erreurs typographiques ou ajouter d’autres métadonnées utiles comme des mots-clés ou une description plus détaillée. Les curateur(-trice)s peuvent également donner des conseils sur l’interprétation ou l’utilisation des champs de métadonnées et des mots-clés.
  • Examiner les fichiers de données et, au besoin, les corriger pour s’assurer qu’ils pourront être compris et réutilisés par d’autres chercheur(-se)s. Cela pourrait comprendre de proposer des solutions ouvertes propices à la préservation pour remplacer les formats de fichiers exclusifs, le cas échéant.
  • Remplacer tout fichier comportant des problèmes techniques (p. ex., fichiers signalés dans une analyse de maliciel, fichiers corrompus).
  • Régler tout problème potentiel que les curateur(trice)s pourraient signaler concernant les droits de propriété intellectuelle et l’utilisation secondaire des données, et traiter toute sensibilité possible relativement aux données de nature confidentielle, aux données appartenant aux Autochtones et à l’information sur l’emplacement.

Les curateur(-trice)s pourraient communiquer avec le (la) déposant(e) ou lui renvoyer sa soumission si celle-ci doit être mieux préparée ou ne répond pas aux critères de publication dans le DFDR décrits ci-dessus et dans les Conditions d’utilisation du DFDR. Si les curateur(-trice)s renvoient une soumission, ils (elles) en préciseront la raison et proposeront des façons de corriger le jeu de données avant de le soumettre de nouveau.

Remarque : Les modifications proposées par les curateur(-trice)s ne sont apportées qu’avec l’approbation du (de la) déposant(e).

Préservation

Un certain nombre d’activités sont menées dans le DFDR pour assurer l’utilisabilité et l’accessibilité à long terme des données, y compris l’identification, la validation, la caractérisation et la normalisation des fichiers. Ces activités sont collectivement appelées « préservation numérique ».

Une fois que le jeu de données a été approuvé par un(e) curateur(-trice), les sommes de contrôle sont calculées pour chaque fichier du jeu de données, puis enregistrées dans un fichier texte (frdr-checksums-and-filetypes.md) avec le nom de chaque fichier et l’information sur le format. Les chercheur(-se)s peuvent télécharger ces renseignements à partir de la page de le jeux de données dans le DFDR et valider indépendamment l’intégrité des fichiers de données. Les sommes de contrôle sont calculées à l’aide l’algorithme SHA-256, lequel peut être validé au moyen de l’interface graphique QuickHash GUI.

Le DFDR favorise la préservation au niveau des bits pour les jeux de données déposés. Les jeux de données pourraient être évalués et sélectionnés en vue de faire l’objet d’un traitement pour préservation plus poussé au moyen du logiciel Archivematica. Les fichiers de données et les métadonnées sont regroupés dans un paquet d’information archivé (AIP), qui contient des copies des fichiers de données soumis, tout fichier ayant été normalisé aux fins de préservation, les métadonnées du DFDR ainsi que d’autres documents pertinents, les sommes de contrôle et un fichier METS. Les AIP sont alors stockés auprès d’un fournisseur de services de préservation (SciNet – Université de Toronto), qui en vérifiera la fixité et les soumettra à d’autres traitements, au besoin. Pendant le transfert des AIP, les jeux de données sont également conservés dans les serveurs du DFDR afin de demeurer accessibles.

Pour en savoir davantage au sujet du rôle que joue le DFDR dans la préservation des données de recherche au Canada, consultez le rapport publié en 2018 par le groupe d’experts sur la préservation (en anglais seulement).