Pourquoi la mauvaise gestion de nos données personnelles par le système de santé français pourrait se retourner contre les patients<!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Santé
Pourquoi la mauvaise gestion de nos données personnelles par le système de santé français pourrait se retourner contre les patients
©GUILLAUME SOUVANT / AFP

Intelligence superficielle

Un article publié sur Algorithm Watch alerte sur l'état de la base de données utilisée par les hôpitaux en France. Son auteur répond à nos questions.

Nicolas Kayser-Bril

Nicolas Kayser-Bril

Nicolas Kayser-Bril est data-journaliste. Il a cofondé Journalism++ qu'il a géré de 2011 à 2017.

Voir la bio »

Atlantico : Vous avez publié un article sur Algorithm Watch à propos de l'état du système national des données de santé (SNDS). En quoi la qualité de la base de données PMSI utilisée par les hôpitaux en France peut-elle être remise en question ?

Nicolas Kayser-Bril : La qualité des données du PMSI (c'est à dire le lien entre la réalité et les informations contenues dans le PMSI), souffre de deux problèmes. Le premier est très classique et commun à tous les systèmes d'information de cette taille: les personnes qui encodent les informations dans le PMSI peuvent interpréter la réalité de différentes manières, ou bien faire des erreurs (de saisie, par exemple). C'est tout à fait normal, et ça n'empêche pas le PMSI et le SNDS d'être des ressources inestimables pour le recherche scientifique.

Le second problème du PMSI est la tarification à l'activité. Parce que l'administration se fonde sur les informations du PMSI pour décider des montants alloués aux hôpitaux, ces derniers ont un conflit d'intérêt entre "refléter la vérité" et "coder les actes de la manière la plus rémunératrice possible". De nombreuses sociétés privées offrent des services d'optimisation du codage, synonyme de "banalisation de la triche" pour le sociologue Frédéric Pierru. Là encore, c'est un phénomène très classique, connu sous le nom de "loi de Goodhart".

Y a-t-il déjà eu des problèmes médicaux liés à ces défauts de la base de données ?

Pas à ma connaissance. Tant que le PMSI reste un système post-acte, c'est-à-dire tant que les informations du PMSI n'informent pas un acte à venir, la qualité du PMSI ne peut pas influencer sur un acte. (Le PMSI est utilisé par des scientifiques pour produire des études, mais ces scientifiques savent bien quelles pincettes prendre quand ils utilisent de telles données).

Certaines entreprises utiliseraient la base PMSI pour fournir des diagnostics médicaux automatisés via du machine learning.Quelles sont ces entreprises et quels problèmes cela peut poser ?

Il n'y en a pas à ma connaissance (c'était pour trouver la réponse à cette question que j'ai écrit l'article, mais les organisations concernées, en premier lieu l'ATIH et les HCL, n'ont pas répondu à mes questions).

En revanche - d'une part - IBM et Microsoft (et les HCL) affirment faire de l'apprentissage machine pour faire de l'aide au diagnostic et - d'autre part - Villani, dans son rapport, préconise d'utiliser le SNDS pour faciliter l'utilisation de l'"intelligence artificielle" dans le domaine de la santé.

Il est donc légitime de se poser la question.

IBM et Microsoft communiquent sur le sujet depuis longtemps mais il en existe sûrement beaucoup d'autres en France.

Les algorithmes d'apprentissage machine se fondent sur des données passés pour prédire une situation future. Si les données initiales ne correspondent pas à la réalité (parce que des pré-éclampsies ont été codées en éclampsie, pour reprendre l'exemple de l'article), alors les prévisions de l'algorithme deviennent fantaisistes. C'est l'adage "garbage in, garbage out" bien connu en informatique.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !