Préparation de vos données

Organisation de vos fichiers de données

Choix des types de données à déposer

Rassemblez vos fichiers de données, la documentation et toute information nécessaire pour réutiliser votre ensemble de données. Vous pouvez choisir de fournir des données traitées, des données brutes non traitées ou les deux, ainsi que les scripts, le code ou le logiciel nécessaires pour analyser de nouveau vos données.

Vous pouvez télécharger une version de vos scripts d’analyse en même temps que vos données, mais nous vous recommandons de déposer le code source ou le logiciel dans des dépôts spécialisés comme GitHub, GitLab ou Bitbucket. Vous pouvez établir un lien direct avec les autres résultats de vos métadonnées du DFDR et les mentionner dans votre fichier Lisez-moi.

Structure de vos fichiers

Lorsque vous déposez vos données dans le DFDR, la structure de vos fichiers (la façon dont vous avez organisé vos données dans des répertoires ou des dossiers) est conservée. Envisagez de classer ces fichiers par type, date ou analyse pour en faciliter la compréhension. Par exemple :

Exemple a)

├── Code
│   ├── traitement_donnees_brutes.r
│   ├── analyse_1.r
│   ├── analyse_2.r
├── Données
│   ├── Donnees_brutes
│   │   ├── fichier_a.raw
│   │   └── fichier_b.raw
│   └── Donnees_traitees
│   ├── fichier_a.csv
│   └── fichier_b.csv
├── Résultats
│   ├── Figures
│   └── Modèles
└── Lisez-moi.txt

Exemple b)

├── Documentation
│   ├── site_information.csv
│   ├── site_1.shp
│   └── site_2.shp
├── Données
│   ├── annee_01
│   │   ├── site_1.csv
│   │   └── site_2.csv
│   └── annee_02
│   ├── site_1.csv
│   └── site_2.csv
└── Lisez-moi.txt

Conseils pour l’appellation de fichiers

Nommez vos fichiers de façon logique et descriptive, afin que vous et d’autres chercheurs puissiez les comprendre en un coup d’œil. Gardez les noms de fichiers brefs et envisagez d’y inclure des renseignements sur le projet, le contenu, la date ou le numéro de version. Utilisez des caractères alphanumériques et évitez les espaces, les accents et les caractères spéciaux (%^& * ’). Votre convention d ’ appellation doit être décrite dans votre fichier Lisez-moi.

Exemple: MontRoyal_Temperatures_20200801.csv

Exemple: AnalysePoeme_IV05_v03.txt

Pour de plus amples conseils, consultez les conventions d’appellation de fichiers de l’UBC (en anglais).

Choix de formats de fichier faciles à préserver

Les formats de fichier ouverts et non exclusifs sont préférables pour la préservation à long terme, mais il est parfois nécessaire de partager des formats de fichier exclusifs pour la réutilisation des données. Tenez compte des besoins des futurs chercheurs lorsque vous choisissez des types de fichiers à déposer.

Le DFDR est en mesure d’accepter et d’assurer la préservation au niveau de bit pour divers formats de fichier et travaillera avec vous pour conserver vos données dans le format le plus approprié. Toutefois, nous recommandons fortement les formats de fichier faciles à préserver suivants :

Pour plus d’informations sur les formats de préservation, voir les lignes directrices du UK Data Service, de Cornell et de l’University of Edinburgh (en anglais).

Documentation de votre soumission

Les données ne seront utiles (et bénéfiques) à long terme que si elles sont décrites en détail. Pour vous assurer d’une interprétation correcte de vos données, il est important d’inclure un manuel de codes et/ou un fichier Lisez-moi à vos données et de documenter vos méthodes de collecte. Pour cette raison, un responsable de l’intendance du DFDR vous demandera d’ajouter un fichier Lisez-moi à votre soumission. Vous pouvez utiliser le modèle de fichier Lisez-moi du DFDR.

Conseils pour la rédaction de fichiers Lisez-moi :

Vous trouverez d’autres conseils (en anglais) dans le Quick Guide: Creating a README for your dataset de l’UBC et le Guide to writing "readme" style metadata de la Cornell University.

Examen de vos données

Veuillez examiner votre ensemble de données avant de le soumettre pour examen. Voici quelques points à prendre en considération :

Les responsables de l’intendance du DFDR collaboreront avec vous pour examiner vos données au moment de leur soumission afin d’assurer la qualité des métadonnées dans le dépôt et d’améliorer la repérabilité et l’accessibilité de vos données. Les responsables de l’intendance sont habituellement des bibliothécaires employés par des établissements de recherche partout au pays. Il peut aussi s’agir de gestionnaires de données intégrés à des groupes de recherche qui ont accepté de travailler avec le réseau Portage de l’ABRC et qui ont obtenu des autorisations spéciales dans le système du DFDR.

Utilisation secondaire des données ou du code

Avez-vous obtenu des données ou des codes d’un tiers qui pourrait détenir des droits d’auteur ou des droits de propriété intellectuelle qui vous empêcheraient de les redistribuer?

Si vous avez utilisé des données secondaires dans votre recherche, vous devrez confirmer que vous avez la permission de publier de nouveau ces données dans le DFDR avant que votre soumission puisse être approuvée par un responsable de l’intendance. Vous ne savez pas si vous avez besoin d’une permission? Les données qui ont été mises gratuitement à la disposition de la recherche ne sont pas nécessairement « gratuites ». Demandez-vous :

Si les données sont facilement accessibles à partir d’une autre source et que vous n’avez pas manipulé ou modifié les ensembles de données pour votre recherche, veuillez envisager d’établir un lien vers la source originale plutôt que de les publier de nouveau. Pour ce faire, utilisez le champ des identificateurs associés lorsque vous déposez vos données. Veuillez également inclure des citations complètes pour toutes les données ou tous les logiciels que vous avez réutilisés pour votre étude dans votre fichier Lisez-moi.

Données à diffusion restreinte

Sachez que nous ne sommes pas en mesure de restreindre l’accès aux données pour le moment. Bien que nous puissions établir un embargo pour protéger vos données du téléchargement à court terme, toutes les données déposées dans le DFDR selon les modalités actuelles seront éventuellement rendues publiques. Veuillez confirmer que vous pouvez partager vos données et que les mesures appropriées ont été prises pour les traiter et les anonymiser, au besoin. Vous devrez peut-être consulter les formulaires de consentement des participants ou d’autres documents pour confirmer que la publication des données dans le DFDR ne violera pas les conditions selon lesquelles vous avez recueilli vos données.

Voici quelques types courants de données à diffusion restreinte :

Données sur les participants humains

Si votre recherche implique des participants humains ou contient du matériel biologique humain, veuillez confirmer que vous consentez à partager vos données et à préparer vos données conformément aux lignes directrices légales ou éthiques applicables. Apprenez-en davantage sur les restrictions possibles et trouvez des conseils pour le traitement des données à partager sur les participants humains dans ce guide utile : Can I Share My Data? ([traduction] Puis-je partager mes données?). Si vous devez anonymiser ou dépersonnaliser vos données aux fins de dépôt, veuillez consulter le guide De-identification Guidance ([traduction] Conseils sur la dépersonnalisation).

Données appartenant aux Autochtones

Les dirigeants des communautés autochtones sont les mieux placés pour évaluer les avantages et les risques liés au partage du savoir autochtone, ainsi que les données recueillies auprès des peuples autochtones, ou relatives aux terres, à l’eau ou à la glace autochtones. Ces données ne peuvent être partagées dans le DFDR que si les dirigeants communautaires ont convenu que le partage est approprié. Veuillez consulter votre comité d’éthique de la recherche ou, pour de plus amples renseignements, consultez :

Renseignements sur l’emplacement

Vous devrez peut-être supprimer ou rendre approximatifs les renseignements sur l’emplacement si vos données ont été recueillies dans des aires protégées, des sites archéologiques sensibles ou des propriétés privées où le consentement à révéler l’emplacement n’a pas été obtenu, pourrait dévaluer la propriété ou causer une stigmatisation. Vous devrez peut-être aussi supprimer ou rendre approximatives les données sur la présence d’espèces vulnérables. Veuillez consulter la Liste rouge des espèces menacées de l’UICN (en anglais) pour connaître la situation d’une espèce et les risques et menaces connus. Le Guide to Best Practices for Generalising Sensitive Species-Occurrence Data (en anglais) du Système mondial d’information sur la biodiversité comprend une matrice pour évaluer le risque de préjudice et des directives pour généraliser l’information spatiale.