L’assurance-maladie possède les données de santé de tous les Français depuis 10 ans. Derrière un simple numéro de sécurité sociale se cache l’âge, le sexe, l’adresse, les consultations médicales, le nom du médecin et l’ensemble des prescriptions. Pour 65 millions de Français ! Et depuis 4 ans, elle les organise et les exploite pour améliorer la performance de notre système de santé. Que faut-il en penser ?

Le big data au chevet de l’assurance maladie

Depuis 10 ans, tous les remboursements, tous les actes médicaux, chirurgicaux, toutes les analyses, tous les forfaits hospitaliers jusqu’aux avis de décès, tous les parcours de soins de 65 millions de Français sont centralisés par le SNDS, le Système national des Données de Santé, créé en 2016.

Par an, c’est l’équivalent de 1,2 milliard de feuilles de soins, 500 millions d’actes médicaux et 11 millions de séjours hospitaliers qui alimentent cette base de données de l’Assurance maladie. La plus grande base  au monde pour étudier le lien entre prise de médicament et hospitalisation ! (Par comparaison, la base de données la plus importante aux Étas-Unis compte 8 millions de patients.)

L’exploitation de nos données de santé : un formidable défi de santé publique

« La première utilisation de cette base est le remboursement des soins » explique Dominique Polto, présidente de l’Institut national des données de santé (INDS). « Elle n’est pas adaptée à la recherche clinique ou épidémiologique » poursuit-elle. C’est pourquoi, depuis 2014, le partenariat qui lie l’Initiative Data Science de l’Ecole Polytechnique et la CNAM pour l’exploitation de toutes les données de remboursements de soins, rassemblées dans la base Sniiram (Système national d’information inter-régimes de l’assurance maladie) est primordial et se révèle déjà être porteur de succès !

Sur le papier, l’idée est simple. Il s’agit de (re)structurer tout ou partie de la base de données, de l’organiser et de l’enrichir. « 800 tables différentes avec pour chacune des millions de lignes avec des pointeurs dans tous les sens. La plus importante comportant… 1 milliard de lignes !  » confie Dominique Polton. En deux ans, 5 développeurs ont traité 30 téraoctets de données. La base en compte 300… Il s’agit également d’ajouter les données des dossiers médicaux numériques, des résultats d’examens biologiques ou d’imagerie, voire des données recueillies par les objets connectés. C’est dire l’ampleur de la tâche.

Pour autant, « exploiter au mieux ces données massives de santé est un enjeu stratégique majeur pour la France » confie Dominique Polton. « Que ce soit pour améliorer la performance du système de santé et la qualité des soins ou pour développer une recherche de pointe. » Les résultats ne se font pas attendre.

Vous pouvez dormir tranquille : le nouveau règlement sur la protection des données personnelles arrive !

Un enjeu pour les patients et le monde de la recherche

Détecter les effets secondaires potentiels de médicaments

Un des objectifs du partenariat est « de développer différents types d’algorithmes de traitement des données afin, notamment, d’automatiser la détection de médicaments aux effets secondaires nocifs, voire graves et de permettre ainsi aux autorités sanitaires d’asseoir leurs décisions sur des faits scientifiquement prouvés. » En clair, il s’agit d’accentuer la pharmacovigilance pour certaines pathologies.
Cette année, un premier test a permis de valider l’efficacité de leur approche. Les chercheurs ont, en effet, retrouvé et prouvé le lien de cause à effet entre la survenue de cancers de la vessie suite à la prise de pioglitazone, un antidiabétique aujourd’hui interdit depuis 2011.

L’un des prochains objectifs de cette collaboration CNAM/L’X sera bien réel. Il va s’agir de dépister les médicaments qui augmentent le plus les risques de chute chez les personnes âgées. Une question « qui concerne 12 millions de personnes et quelque 400 médicaments différents : antidépresseurs, traitement contre l’hypertension… » précise Emmanuel Bacry, responsable de l’Initiative Data Science de l’X

Optimiser les parcours de soins de patients

Un second projet a l’ambition d’identifier et d’optimiser les parcours de soin spécifiques pour plus d’1 million de diabétiques. Il faut avoir en tête que 60% des Français ne respectent pas le  traitement médical qui leur a été prescrit ! Outre l’altération de leur état de santé, la non observance thérapeutique représente près de 10 milliards d’euros par an !

limiter les dépenses inutiles 

Un troisième projet consistera à identifier les mésusages et les fraudes : révéler les réseaux de trafic de médicaments chez les pharmaciens…ou identifier les médecins qui, par exemple, délivrent des ordonnances de complaisance pour se procurer des psychotropes.

Comment être sûr que ces données de santé demeurent anonymes ?

Selon Franck von Lennep, directeur de la Drees (Direction de la recherche, des études, de l’évaluation et des statistiques), « les bases seront constituées de données appauvries et de variables regroupées. Les tranches d’âge remplaceront les âges précis, les codes postaux seront regroupés et les codes de séjour à l’hôpital seront agrégés afin que l’on ne puisse plus savoir qui est qui. »

Il est clair que si les/nos employeurs ont accès à ces données très sensibles et que, par recoupement, ils peuvent vous/nous identifier, cela va poser un très réel problème. Mais, même si cette perspective n’est pas agréable, le véritable enjeu n’est pas là.

Cette base est incontestablement une vraie mine d’or pour les professionnels du secteur, des acteurs classiques aux GAFA. Imaginez une mutuelle, par exemple, qui augmenterait ses tarifs en fonction de vos antécédents familiaux (diabète, cancer, obésité…), de vos mauvaises habitudes (tabac, alcool…) ou de votre lieu d’habitation (département où telle pathologie est au dessus de la moyenne nationale…).

Vous l’avez compris, nos pratiques de santé et nos « CV médicaux » nourrissent autant d’espoirs que de craintes. Sont-elles fondées ? Of course. Pour autant, la recherche avance et les premiers résultats sont là.

Le dossier médical partagé : la santé connectée au service des patients ?

Sources

Interview et portrait d’Emmanuel Bacry, Directeur de Recherche au CNRS, Université de Paris-Dauphine, PSL Research University, Paris, Professeur Associé et Responsable de l’Initiative Data Science CMAP, Ecole Polytechnique, Palaiseau
Interview de Franck von Lennep, Directeur de la Drees
Que va-t-il advenir de nos données de santé ?
L’X et la Cnam s’unissent pour étudier les données de santé
L’algorithme qui traque les médicaments dangereux

LQDP