flowchart LR A[Détection des nucléus] --> B[Quantification] B --> C[Analyse spatiale]
Guide à l’usage des chercheurs
Agenda
Comprendre la bio-imagerie
Planification et acquisition d’images
Collecte des métadonnées de l’image
Organiser et partager les données d’images
Partage de flux de travail reproductibles
La bio-imagerie est entrée dans le domaine des big data qui comprennent des ensembles de données de plus en plus complexes. Nous sommes confrontés à de nombreux défis, notamment le traitement des données et la gestion appropriés, ainsi que la création et le partage de flux de travail d’analyse d’images reproductibles.
Les bio-images ont un potentiel de découverte scientifique qui va au-delà de leur objectif d’acquisition initial lorsqu’elles sont traitées conformément aux principes FAIR (Schmidt, et al. 2024; voir Wilkinson, et al. 2016).
Agenda
Comprendre la bio-imagerie
Planification et acquisition d’images
Collecte des métadonnées de l’image
Organiser et partager les données d’images
Partage de flux de travail reproductibles
Le stockage conventionnel basé sur un système de fichiers atteint rapidement ses limites. Avant que les données ne soient générées, les chercheurs doivent réfléchir à la manière dont elles seront stockées, déplacées, documentées et analysées pendant (et après) la durée de vie du projet.
Directions actuelles :
Comment allez-vous traiter vos images ?
Lorsque vous planifiez une expérience d’imagerie, envisagez l’approche la plus appropriée en fonction de vos capacités de traitement et d’analyse des données.
Les paramètres d’acquisition sont essentiels
Pendant l’imagerie, il est nécessaire d’envisager un compromis entre les paramètres nécessaires pour répondre à la question de recherche (grossissement, taille, profondeur de bits) et la puissance de traitement disponible (stockage, puissance de calcul).
Après avoir acquis des images originales en formats propriétaires (c’est-à-dire .CZI ou .LIF), les chercheurs peuvent utiliser différents outils pour ouvrir et transformer les images en formats ouverts (.TIFF).
Format développé par l’Open Microscopy Environment (OME) sur la base de la spécification TIFF. OME-TIFF incorpore des métadonnées OME-XML :
La planification stratégique et la gestion des données, les plateformes et formats adaptés à l’informatique en nuage et le soutien institutionnel garantissent des données d’imagerie extensibles, accessibles et réutilisables.
Agenda
Comprendre la bio-imagerie
Planification et acquisition d’images
Collecte des métadonnées de l’image
Organiser et partager les données d’images
Partage de flux de travail reproductibles
Des métadonnées de haute qualité sont essentielles pour que les données d’imagerie soient FAIR.
Défis actuels :
REMBI donne des directives sur les métadonnées pour répondre aux besoins des diverses communautés de l’imagerie biomédicale.
Un modèle est disponible ici.
Visitez le site MicroMeta App et l’article de recherche associé
Le plugin MethodsJ2 Fiji génère du texte pour le matériel et les méthodes de microscopie en extrayant des informations des métadonnées (fichier MicroMeta App). Visitez ici le dépôt GitHub ou l’article de recherche associé.
OMERO intègre MDEmic (MetaData Editor for microscopy), un outil qui permet d’explorer et d’éditer facilement les métadonnées des images.
Agenda
Comprendre la bio-imagerie
Planification et acquisition d’images
Collecte des métadonnées de l’image
Organiser et partager les données d’images
Partage de flux de travail reproductibles
À terme, les images biomédicales (big data) peuvent représenter téraoctets ou pentaoctets, ce qui dépasse la plupart des solutions standard de partage de fichiers.
Tip
Le stockage efficace des images nécessite une infrastructure, l’optimisation des flux de traitement et des protocoles de partage normalisés.
Pour choisir la modalité de stockage, pensez qu’en tant que chercheurs, nous ne voulons pas simplement stocker l’ensemble de données quelque part, nous voulons le rendre accessible et utilisable.
Nous voulons que nos images soient
Ces instances sont installées dans un espace dédié du réseau (core facility) pour un stockage et un partage à long terme.
Tip
“We strongly discourage author statements that images ‘are available upon request’, as this has been shown to be inefficient”(Schmied et al. 2023)
Agenda
Comprendre la bio-imagerie
Planification et acquisition d’images
Collecte des métadonnées de l’image
Organiser et partager les données d’images
Partage de flux de travail reproductibles
Dans tout processus de recherche, l’analyse des images doit être :
Du point de vue de la RDM, l’analyse des images biomédicales implique idéalement :
Tip
Des conventions de dénomination et fichiers README précis et descriptifs contenant des métadonnées ou des livres de code sont essentiels pour garantir l’intégrité des pipelines d’analyse.
Un flux d’analyse modulaire divise les principales tâches d’analyse d’images en sous tâches indépendantes.
flowchart LR A[Détection des nucléus] --> B[Quantification] B --> C[Analyse spatiale]
Tip
La modularité permet de construire des flux d’analyse complexes à partir de composants indépendants qui peuvent fonctionner ensemble. Cela favorise la réutilisation de modules indépendants.
Niveau bas (connaissances techniques)
Transformer des images en d’autres images ou données :
Niveau haut (connaissances disciplinaires)
Transformer les résultats des tâches de bas niveau en informations ayant une signification biologique :
BioImage.IO est un référentiel de modèles d’IA piloté par la communauté qui donne accès à des modèles d’IA pré-entraînés avec une pléthore de partenaires logiciels ouverts/gratuits.
“La souris est antisociale. L’interface graphique est antisociale. Qu’est-ce que cela signifie ? Vous avez un problème à résoudre, et vous le résolvez avec une interface graphique. Qu’est-ce que vous avez ? Un problème résolu. Mais lorsque vous le résolvez avec une interface de ligne de commande dans un environnement de script, vous avez un artefact. Et tout à coup, cet artefact peut être partagé avec quelqu’un”Jeffrey Snover
Utilisez le CODE et non la souris !
Tip
Le partage des objets de recherche dans des référentiels publics et actifs de gestion de la recherche, comme l’Open Science Framework (OSF), est une excellente stratégie pour promouvoir une science ouverte et reproductible. Veuillez envisager de partager les images d’illustration, les figures et les tableaux utilisés dans la publication.
Tip
En général, il s’agit d’images/figures de faible résolution (.png) qui ne sont pas utilisées pour l’analyse mais pour l’illustration de rapports de recherche (thèses, articles).
Les mentions “Les données sont disponibles sur demande”figurant dans les publications se révèlent souvent peu fiables dans la pratique (Schmidt et al., 2024)
Principe de la science ouverte
Partager les données aussi ouvertement que possible et les garder aussi fermées que nécessaire.
Le dépôt d’un ensemble de données dans un référentiel n’est PAS SEULEMENT un exercice visant à répondre aux exigences des organismes de financement et des revues scientifiques. C’est une responsabilité éthique et professionnelle des chercheurs de garantir la reproductibilité de la recherche, ainsi que l’accès et la réutilisation des données de recherche.
Contactez-nous pour vous assurer que vos données sont bien préparées et qu’elles peuvent être partagées efficacement avec la communauté des chercheurs.
Traitement d’images biomédicales et partage de flux de travail reproductibles - Équipe de curation des données du DFDR