💥 Accédez en illimité à
tous nos livres & vidéos, sur l'IA, le dev, les réseaux... Cliquez ici
-100€ sur l'abonnement annuel à
la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres & vidéos
  2. Quand l’Intelligence Artificielle révolutionne la santé
  3. Les données de santé
Extrait - Quand l’Intelligence Artificielle révolutionne la santé Opportunités et défis
Extraits du livre
Quand l’Intelligence Artificielle révolutionne la santé Opportunités et défis Revenir à la page d'achat du livre

Les données de santé

Introduction

Dans notre monde, qui aujourd’hui se partage entre physique et virtuel, nous assistons à la génération d’un volume de données croissant. Ces données, issues de sources multiples (réseaux sociaux, objets connectés, applications, photos, audio, vidéo, etc.) et aux formats variés, sont devenues essentielles au fonctionnement de notre société, voire vitales.

Il est à noter que ce contenu n’est aujourd’hui ni complètement exploité ni complètement exploitable. En fait, seule une infime partie de celui-ci est utilisée. D’après Earthweb, en 2022, 3 % du volume total des données produites serait à ce jour exploité.

Les applications qui utilisent ces données sont de plus en plus nombreuses, de plus en plus efficaces et de plus en plus innovantes. Elles sont capables aujourd’hui d’utiliser et de croiser de nombreuses sources de données de telle sorte que nos vies deviennent de plus en plus tributaires de ces traitements et surtout de moins en moins privées.

Des données qui à leur origine semblaient anodines, voire anonymes, peuvent devenir après leur croisement avec d’autres sources, particulièrement sensibles. C’est notamment le cas pour les données de santé.

Les données nous permettent de choisir...

Le type de données

Les données sont scindées en trois types distincts :

  • Les données structurées : elles résident dans des formats et des modèles prédéfinis.

  • Les données non structurées : elles sont stockées dans leur format naturel jusqu’à ce qu’elles soient extraites pour analyse.

  • Les données semi-structurées : elles sont essentiellement un mélange de données structurées et non structurées.

Un quatrième type de données est aujourd’hui à considérer : les données synthétiques. Néanmoins, comme nous le verrons dans la suite de ce document, les données synthétiques peuvent être vues comme un sous-ensemble des types précédents.

Les données structurées

Pour la plus grande part, les données structurées sont des informations qui sont organisées dans des fichiers texte, des feuilles de calcul et des bases de données relationnelles. On y trouve : les numéros de téléphone, de sécurité sociale, les divers codes, les champs textuels fixes ou variables dans les enregistrements des bases de données, des ensembles de nombres, etc.

Ces données peuvent être générées par un humain ou par une machine, mais la condition première est qu’elles puissent être facilement classées, retrouvées et extraites.

Les entreprises et organismes sont familiarisés avec ce type de données, que l’on considère comme des données ou des sources de données «  traditionnelles ».

Ces données sont généralement stockées dans des systèmes de bases de données, le plus souvent relationnelles, et associées au système « Back-end » de l’entreprise qui comprend les solutions de CRM : Customer Relationship Management, ERP : Enterprise Resource Planning, SCM : Supply Chain Management, BI : Business Intelligence...

Les données de santé

Définition

Les données de santé sont des données à caractère personnel et considérées comme sensibles. Elles font à ce titre, l’objet d’une protection particulière par les textes (règlement européen sur la protection des données personnelles, loi Informatique et Libertés, code de la santé publique, etc.). Le règlement européen sur la protection des données personnelles (RGPD) qui est entré en application le 25 mai 2018, définit les données de santé comme :

  • Les informations relatives à une personne physique, collectées lors de son inscription en vue de bénéficier de services de soins de santé ou lors de la prestation de ces services.

  • Les informations obtenues lors du test ou de l’examen d’une partie du corps ou d’une substance corporelle, y compris à partir des données génétiques et échantillons biologiques.

  • Les informations concernant une maladie, un handicap, un risque de maladie, les antécédents médicaux, un traitement clinique ou l’état physiologique ou biomédical, de la personne concernée indépendamment de sa source.

  • Toutes données de mesure à partir desquelles il est possible de déduire une information sur l’état de santé de la personne.

Il faut être conscient que le croisement des données de santé avec d’autres données peut permettre de tirer une conclusion sur l’état de santé ou le risque pour la santé d’une personne et peut ainsi générer des données de santé sensibles.

Il est à noter que la loi ne s’applique pas aux traitements qui comporteraient des données de santé à l’usage exclusif de la personne. À titre d’exemple, la loi ne s’applique pas aux applications mobiles en santé qui proposent dans leurs fonctionnalités, la collecte, l’enregistrement ou la conservation de données, à condition que ces opérations s’effectuent localement sur un ordinateur, un smartphone ou une tablette, sans connexion extérieure et à des fins exclusivement personnelles....

En conclusion

Les données de santé sont devenues essentielles au bon fonctionnement de nos organismes de santé, qu’ils soient sanitaires, psychiques ou sociaux et elles sont au cœur de nombreux débats en raison de leur statut de données sensibles. Elles représentent un outil puissant et prometteur dans le domaine et leurs collecte, analyse et utilisation judicieuse peuvent améliorer les soins aux individus, permettre une meilleure gestion des ressources de la santé et favoriser une recherche innovante.

Cependant, il est essentiel de veiller à ce que l’utilisation de ces données respecte les normes éthiques et légales les plus strictes, garantissant la confidentialité et la sécurité des informations personnelles des individus.

Du fait de leur caractère sensible, il est important de les conserver et les protéger afin de garantir le respect de la vie privée des patients.

Il est à noter que le secteur « Santé humaine et action sociale » représente 18 % des 5000 notifications de violation de données personnelles en 2021, faisant de celui-ci le second secteur le plus touché par des attaques, juste derrière le secteur « Activités spécialisées, scientifiques et techniques ».

De plus, comme nous le verrons plus avant...

Sources et références

  • Agence du numérique en santé, « Certification des hébergeurs de données de santé », ministère du Travail de la santé et des Solidarités, 2020. https://esante.gouv.fr/labels-certifications/hds/certification-des-hebergeurs-de-donnees-de-sante

  • CNIL, « Règlement général sur la protection des données (RGPD) », CNIL 2018. https://data.ird.fr/wp-content/uploads/2021/01/RGPD_IRD-data.pdf

  • CNIL, « Qu’est-ce qu’une donnée de santé ? », 2018. https://www.cnil.fr/fr/quest-ce-ce-quune-donnee-de-sante

  • Conseil D’Etat, « Santé et protection des données : Un colloque organisé par le Conseil d’État », La documentation Française, 2020.

  • Coralie Lemke, « Ma santé mes données - Comment nous semons nos informations les plus précieuses… », Premier Parallèle, 2021.

  • Dominique RENAUD, Jacques FOUCAULT, Loïc PANHALEUX, Pierre BEGASSE, « RGPD Le comprendre et le mettre en œuvre - (témoignages de responsables de traitement et référents à la protection des données personnelles) », ENI, 2024.

  • Maxime BERGEAT (INSEE), Nora CUPPENS (CNRS, IMT), Frédéric CUPPENS (CNRS, IMT), Noémie...