Préparation de vos données

Organisation de vos fichiers de données

Choix des types de données à déposer

Rassemblez vos fichiers de données, la documentation et toute information nécessaire pour réutiliser votre jeu de données. Vous pouvez choisir de fournir des données traitées, des données brutes non traitées ou les deux, ainsi que les scripts, le code ou le logiciel nécessaires pour générer ou analyser de nouveau vos données.

Vous pouvez télécharger une version de vos scripts d’analyse en même temps que vos données, mais nous vous recommandons de déposer les modèles, le code source ou le logiciel dans des dépôts spécialisés comme GitHub, GitLab ou Bitbucket. Ceux-ci peuvent être conservés dans les archives de Software Heritage ou dans Zenodo. Vous pouvez établir un lien direct avec les autres résultats de vos métadonnées du DFDR et les mentionner dans votre fichier Lisez-moi.

Structure de vos fichiers

Lorsque vous déposez vos données dans le DFDR, la structure de vos fichiers (la façon dont vous avez organisé vos données dans des répertoires ou des dossiers) est conservée. Envisagez de classer ces fichiers par type, date ou analyse pour en faciliter la compréhension. Par exemple :

Exemple a)

├── Code
│   ├── traitement_donnees_brutes.r
│   ├── analyse_1.r
│   ├── analyse_2.r
├── Données
│   ├── Donnees_brutes
│   │   ├── fichier_a.raw
│   │   └── fichier_b.raw
│   └── Donnees_traitees
│   ├── fichier_a.csv
│   └── fichier_b.csv
├── Résultats
│   ├── Figures
│   └── Modèles
└── Lisez-moi.txt

Exemple b)

├── Documentation
│   ├── site_information.csv
│   ├── site_1.shp
│   └── site_2.shp
├── Données
│   ├── annee_01
│   │   ├── site_1.csv
│   │   └── site_2.csv
│   └── annee_02
│   ├── site_1.csv
│   └── site_2.csv
└── Lisez-moi.txt

Conseils pour l’appellation de fichiers

Nommez vos fichiers de façon logique et descriptive, afin que vous et d’autres chercheurs puissiez les comprendre en un coup d’œil. Gardez les noms de fichiers brefs et envisagez d’y inclure des renseignements sur le projet, le contenu, la date ou le numéro de version. Utilisez des caractères alphanumériques et évitez les espaces, les accents et les caractères spéciaux (%^& * ’). Votre convention d’appellation doit être décrite dans votre fichier Lisez-moi.

_Exemple : MontRoyal_Temperatures_20200801.csv

_Exemple : AnalysePoeme_IV05_v03.txt

Pour de plus amples conseils, consultez les conventions d’appellation de fichiers de l’UBC (en anglais).

Pour de plus amples conseils, consultez le document Nommage de fichiers et gestion de versions de l’Université d’Ottawa, le document Nommage des fichiers numériques de l’Université de Sherbrooke et les, conventions d’appellation de fichiers de l’UBC (en anglais).

Choix de formats de fichier faciles à préserver

Les formats de fichier ouverts et non exclusifs sont préférables pour la préservation à long terme, mais il est parfois nécessaire de partager des formats de fichier exclusifs pour la réutilisation des données. Tenez compte des besoins des futurs chercheurs lorsque vous choisissez des types de fichiers à déposer.

Le DFDR est en mesure d’accepter et d’assurer la préservation au niveau de bit pour divers formats de fichier et travaillera avec vous pour conserver vos données dans le format le plus approprié. Toutefois, nous recommandons fortement les formats de fichier faciles à préserver suivants :

Pour obtenir de plus amples renseignements sur les formats de préservation, voir les lignes directrices de Bibliothèque et Archives nationales du Québec, du UK Data Service, de Cornell et de l’University of Edinburgh (en anglais).

Documentation de votre soumission

Les données ne seront utiles (et bénéfiques) à long terme que si elles sont décrites en détail. Pour vous assurer d’une interprétation correcte de vos données, il est important d’inclure un manuel de codes et/ou un fichier Lisez-moi à vos données et de documenter vos méthodes de collecte. Pour cette raison, un responsable de la curation du DFDR vous demandera d’ajouter un fichier Lisez-moi à votre soumission. Vous pouvez utiliser le modèle de fichier Lisez-moi du DFDR.

Conseils pour la rédaction de fichiers Lisez-moi :

Vous trouverez d’autres conseils (en anglais) dans le Guide rapide : Créer un fichier README pour vos ensembles de données de l’UBC et danst le Guide to writing "readme" style metadata de la Cornell University.

Examen de vos données

Veuillez examiner votre jeu de données avant de le soumettre pour examen. Voici quelques points à prendre en considération :

Les responsables de la curation du DFDR collaboreront avec vous pour examiner vos données au moment de leur soumission afin d’assurer la qualité des métadonnées dans le dépôt et d’améliorer la repérabilité et l’accessibilité de vos données. Les responsables de la curation sont habituellement des bibliothécaires employés par des établissements de recherche partout au pays. Il peut aussi s’agir de gestionnaires de données intégrés à des groupes de recherche qui ont accepté de travailler avec le réseau Portage de la NOIRN et qui ont obtenu des autorisations spéciales dans le système du DFDR.

Utilisation secondaire des données ou du code

Avez-vous obtenu des données ou des codes d’un tiers qui pourrait détenir des droits d’auteur ou des droits de propriété intellectuelle qui vous empêcheraient de les redistribuer? La source de données originale permet-elle la redistribution, mais avec certaines restrictions?

Si vous avez utilisé des données secondaires dans votre recherche, vous devrez confirmer que vous avez la permission de publier de nouveau ces données dans le DFDR avant que votre soumission puisse être approuvée par un responsable de la curation. Vous ne savez pas si vous avez besoin d’une permission? Les données qui ont été mises gratuitement à la disposition de la recherche ne sont pas nécessairement « gratuites ». Demandez-vous :

Veuillez consulter la licence ou les modalités qui accompagnent les données sources et vous assurer de respecter toutes les modalités. Si vous êtes autorisé à redistribuer des points de données ou des produits dérivés, veuillez choisir une licence compatible avec la licence originale. Certaines licences peuvent vous obliger à sélectionner une licence équivalente (une licence dont les termes correspondent).

Si les données sont facilement accessibles d’une autre source et que vous n’avez pas manipulé ou modifié les ensembles de données pour votre recherche, veuillez envisager d’établir un lien avec la source originale plutôt que de les publier de nouveau.

Si les données sont facilement accessibles à partir d’une autre source et que vous n’avez pas manipulé ou modifié les jeux de données pour votre recherche, veuillez envisager d’établir un lien vers la source originale plutôt que de les publier de nouveau. Pour ce faire, utilisez le champ des identificateurs associés lorsque vous déposez vos données. Veuillez également inclure des citations complètes pour toutes les données ou tous les logiciels que vous avez réutilisés pour votre étude dans votre fichier Lisez-moi.

Si vous avez des questions au sujet d’une source en particulier, ou si vous souhaitez obtenir de l’aide pour choisir une licence, veuillez écrire à support@frdr-dfdr.ca.

Données à diffusion restreinte

Sachez que nous ne sommes pas en mesure de restreindre l’accès aux données pour le moment. Bien que nous puissions établir un embargo pour protéger vos données du téléchargement à court terme, toutes les données déposées dans le DFDR selon les modalités actuelles seront éventuellement rendues publiques. Veuillez confirmer que vous pouvez partager vos données et que les mesures appropriées ont été prises pour les traiter et les anonymiser, au besoin. Vous devrez peut-être consulter les formulaires de consentement des participants ou d’autres documents pour confirmer que la publication des données dans le DFDR ne violera pas les conditions selon lesquelles vous avez recueilli vos données.

Voici quelques types courants de données à diffusion restreinte :

Données sur les participants humains

Si votre recherche implique des participants humains ou contient du matériel biologique humain, veuillez confirmer que vous consentez à partager vos données et à préparer vos données conformément aux lignes directrices légales ou éthiques applicables. Apprenez-en davantage sur les restrictions possibles et trouvez des conseils pour le traitement des données à partager sur les participants humains dans ce guide utile : Puis-je partager mes données?. Si vous devez anonymiser ou dépersonnaliser vos données aux fins de dépôt, veuillez consulter le guide Directives sur la dépersonnalisation des données.

Données appartenant aux Autochtones

Les dirigeants des communautés autochtones sont les mieux placés pour évaluer les avantages et les risques liés au partage du savoir autochtone, ainsi que les données recueillies auprès des peuples autochtones, ou relatives aux terres, à l’eau ou à la glace autochtones. Ces données ne peuvent être partagées dans le DFDR que si les dirigeants communautaires ont convenu que le partage est approprié. Veuillez consulter votre comité d’éthique de la recherche ou, pour de plus amples renseignements, consultez :

Renseignements sur l’emplacement

Vous devrez peut-être supprimer ou rendre approximatifs les renseignements sur l’emplacement dans votre jeu de données. Envisagez de le faire si vous devez protéger la confidentialité des participants à l’étude, ou si vos données ont été recueillies dans des aires protégées, des sites archéologiques sensibles ou des propriétés privées où le consentement à révéler l’emplacement n’a pas été obtenu, pourrait dévaluer la propriété ou causer une stigmatisation. Vous devrez peut-être aussi supprimer ou rendre approximatives les données sur la présence d’espèces vulnérables. Pour de plus amples renseignements, les ressources suivantes peuvent être utiles :