Projet hors du commun
La plus importante banque de données génomiques au monde est désormais accessible à tous les chercheurs de la planète et voilà ce que ça pourrait permettre
La UK Biobank a décidé de partager les données médicales comme les données de génome récoltées depuis 15 ans auprès de 500 000 volontaires
Antoine Flahault
Antoine Flahault, est médecin, épidémiologiste, professeur de santé publique, directeur de l’Institut de Santé Globale, à la Faculté de Médecine de l’Université de Genève. Il a fondé et dirigé l’Ecole des Hautes Etudes en Santé Publique (Rennes, France), a été co-directeur du Centre Virchow-Villermé à la Faculté de Médecine de l’Université de Paris, à l’Hôtel-Dieu. Il est membre correspondant de l’Académie Nationale de Médecine.
Jean-Christophe Pagès
Jean-Christophe Pagès est professeur de biologie cellulaire à l'université Toulouse 3, où il dirige le laboratoire hospitalier de biologie cellulaire. Ses travaux de recherche portent sur la génétique et les approches de transfert de gènes, avec un accent particulier sur la biologie rétrovirale comme outils pour développer des thérapies géniques.
Atlantico : Selon des informations du Guardian, la UK Biobank a fait le choix de partager des données médicales comme les données de génome récoltées depuis 15 ans auprès de 500.000 volontaires. En quoi ce projet est-il hors du commun ? Comment cette base de données a-t-elle pu être constituée ? Quelles sont les données de santé collectées ? Est-ce la base de données de santé la plus importante au monde ?
Jean-Christophe Pagès : Ce qui est ici remarquable est l’ensemble des données collectées pour les personnes qui forment la cohorte : cliniques sur les maladies développées, de suivi avec notamment l’imagerie (Scanner, IRM…), les données biologiques et les données de vie obtenues par un questionnaire. Et, c’est l’objet de la communication faite récemment par UK Biobank, les données des génomes (le patrimoine génétique) complets de chacun de 500 000 individus. Un autre élément saillant est l’interconnexion de toutes ces données. Ceci rend les recherches d’associations possibles. Avec, point très important pour les équipes de recherche, la possibilité d’y avoir accès sur demande, mais dans un cadre défini, en particulier en matière de sélection de l’objet de la recherche.
Il existe aux États-Unis de grandes banques de données, mais une connexion aux données génétiques est une première. La société DeCode dispose pour la population islandaise de données comparable, peut-être un peu moins étendue.
Ces données médicales et cette décision vont-elles permettre de faire progresser la recherche génétique ? Comment ces données pourraient-elles permettre de faire progresser la recherche en santé, notamment pour lutter contre le diabète, le cancer, la démence et d’autres maladies ? De nouveaux médicaments et traitements pourraient-ils être découverts et conçus grâce à cette base de données ?
Jean-Christophe Pagès : Indéniablement ! Et c’est déjà le cas, des articles spécialisés ont été publiés.
Ce type d’outil va permettre d’affiner la compréhension de la composante génétique, et également environnementale (exposition et histoire de vie) par des approches dites non supervisées, et pour certaines faisant appel à l’IA. C’est aussi par des approches plus classiques d’études de familles qu’il faudra confirmer les associations qui seront identifiées. La contribution de ces banques de données sera principalement sur l’identification de la susceptibilité aux maladies et la compréhension de la physiologie.
Sur le plan thérapeutique, c’est une autre question. Pour les formes génétiques des maladies que vous citez, l’identification de certains gènes pourra éventuellement guider des recherches d’approches médicamenteuses. Il faudra néanmoins un important travail expérimental (de laboratoire) puis des essais cliniques pour le confirmer. Dans le cas du traitement des cancers, nous nous orientons plus vers le séquençage des tumeurs, qui sont chacune particulière et qui sont donc à aborder dans leur spécificité. Mais ces banques de données pourront contribuer à comprendre l’influence du contexte génétique sur les réponses aux traitements, et c’est un point important pour les adapter aux patients.
Il est essentiel de comprendre que si ces types de données sont un élément qui ouvrent un chemin pour accéder à une connaissance, la confirmation de cette connaissance se fait par étapes. En matière de thérapie, il reste indispensable d’avoir une vision en retour de la mise en œuvre de chaque thérapie. Si de telles banques de données améliorent la recherche, elles ne se substituent pas aux études cliniques.
Existe-t-il d’autres exemples similaires de bases de données médicales précieuses en Europe ou en France ?
Antoine Flahault : Les Finlandais ont à l’exemple des Britanniques lancé un programme très similaire, avec le soutien et la collaboration étroite d’un consortium de grands laboratoires pharmaceutiques. C’est un projet très ambitieux qui a inclus 10% de la population. Les Québécois et les Chinois ont également mis en route des biobanques très intéressantes à la suite de la pandémie de COVID. Les Allemands ont lancé le projet NAKO voisin de la cohorte française Constances mais sans études du génome des participants à ce jour. Les Français envisagent d’inclure aussi le génome des participants très prochainement. Les Suisses ont un projet voisin encore dans les cartons.Jean-Christophe Pagès : Comme je vous l’ai indiqué les islandais sont en avance. En France, de nombreuses structures disposent d’échantillons et de données. Elles ne sont toutefois pas interconnectées, et ne couvrent pas toutes cet ensemble de données que UK Biobank inclue, notamment la génétique. Mais elles ont permis d’obtenir des résultats dans des domaines ciblés, comme la susceptibilité aux infections. La cohorte Constance est la plus structurée et la plus proche de UK Bionbank.
Le gouvernement a identifié ce point d’amélioration. Un gros effort de mise en commun et de connexion est en cours à l’échelon national, il réunit l’INSERM, les CHU et hôpitaux privés ainsi que les Universités.
Pourquoi ces données de santé sont-elles généralement inutilisées ? Les craintes en matière de confidentialité et de protection des données dans le cadre de telles bases de données sont-elles justifiées ?
Jean-Christophe Pagès : Elles ne sont pas inutilisées, bien au contraire ! Une interrogation des moteurs de recherche de publications scientifiques montre à quel point ces banques sont une source de meilleure compréhension des maladies. Avec des banques antérieures, nombreuses sont les études épidémiologiques qui ont permis de développer des mesures de prévention, de suivi et l’identification de causes à des maladies, essentiellement sur la base de suivis de cohortes. Comme je l’indiquais les projet DeCode en Islande et déjà UK Biobank sont exploités.
Le point de la confidentialité est en effet central. Il a longtemps été un facteur de frein pour la constitution de ces banques. Mais il est aujourd’hui possible de correctement protéger informatiquement les données. De nombreux textes réglementaires et des conventions encadrent tant le stockage que les utilisations. Il reste nécessaire d’être vigilant. Il faut en particulier que ce bien commun, s’il débouche sur des applications, soit reconnu comme tel, et qu’une égalité d’accès et le partage équitable des retombées soient, si ce n’est garantis, l’objet de mesures correctives par les États. Ainsi, nous pourrons collectivement bénéficier de ces structures.
Comment la science et la recherche vont pouvoir progresser grâce à cette base de données ? Qu'est-ce que ces données vont permettre sur le plan scientifique et de la recherche ?
Jean-Christophe Pagès : Comme je le disais précédemment ce sont des outils, parmi d’autres, les axes qu’ils vont faire évoluer touchent à : la mise en relation d’un contexte génétique avec une histoire de vie, un « exposome ». Ceci permettra d’identifier, s’ils existent, des moyens d’anticiper et de comprendre de nouvelles maladies. La difficulté est la quantité de données à traiter. C’est ici que la puissance de l’informatique pourra aider. Comme dans de nombreux domaines, pouvoir connecter des données à grande échelle est important, mais en tirer des informations se fait par étapes et après validation. Dans notre laboratoire, RESTORE, nous avons pu étudier une banque de données américaine par de nouvelles approches de traitement des données à l’aide d’outils d’apprentissage et de réseaux neuronaux. Ceci nous a permis de montrer leur puissance pour extraire des informations cliniques, mais nous a aussi confirmé le besoin de continuer à affiner les modalités d’études.
D’une façon générale, la compréhension des données sera un guide pour la recherche expérimentale, plus classique, qui reste aujourd’hui indispensable au moins à deux niveaux : connaissance des mécanismes des maladies et validation des effets thérapeutiques, par exemple.
En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.
Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !