Même avant la crise du COVID-19, les systèmes de santé, les chercheurs médicaux et les institutions médicales se débattaient avec des moyens efficaces de recueillir les données des patients tout en préservant la confidentialité des patients.
Lors de la recherche pour l'innovation en santé ou la gestion de crise, les institutions de santé doivent extraire des données d'une multitude de systèmes. Répondre à des questions sur les tendances des maladies chroniques, la viabilité d'un traitement dans une communauté, les taux d'utilisation de certaines procédures, ou la hausse des coûts des soins de santé — tous ces scénarios nécessitent la collecte, l'analyse et le partage des données des patients et de la population.
Malheureusement, ce processus est semé d'embûches avec des violations de données possibles, la navigation dans la réglementation de la confidentialité de l'industrie, la dépendance aux spécialistes en informatique de la santé, et un temps précieux. En plus de cela, compiler et rechercher des données de patients nécessite de naviguer à travers d'énormes quantités de données qui peuvent exister dans une variété de systèmes cloisonnés ou frustrant dispersés à travers différents archives.
En relation : Comment la technologie cloud facilite la gestion des soins aux patients → |
Utilisation des données des patients dans la recherche clinique
La plupart du temps, les chercheurs médicaux doivent soumettre des demandes de données pour même accéder aux données des patients individuels et de la population. Il faut du temps pour demander et recevoir des extractions de données, et encore plus de temps et de compétences pour lire et manipuler les données reçues. Cela nécessite également des requêtes incroyablement spécifiques de la part du professionnel médical, du chercheur ou de l'institution, qui peuvent ou non nécessiter des requêtes supplémentaires pour clarification. La cerise sur le gâteau ? Toutes les informations des patients doivent être expurgées en raison de leur nature sensible. Compromettre la sécurité et la confidentialité des patients en ne supprimant pas tous les attributs identifiants va directement à l'encontre des directives de conformité en matière de santé telles que la loi sur la portabilité et la responsabilité en matière d'assurance maladie (HIPAA), la loi sur la technologie de l'information en santé pour la santé économique et clinique (HITECH), et le règlement général sur la protection des données (GDPR).
Les dossiers de santé électroniques (EHR) sont maintenant numérisés — le progrès qui a amélioré le stockage et l'accès aux dossiers de santé d'un patient ne s'est pas nécessairement traduit par une convergence de ces dossiers. La transition des systèmes de santé hérités vers des systèmes plus agiles basés sur le cloud n'a pas immédiatement effacé les flux de travail (lourds) en matière de communication et collaboration cliniques. Plus probablement, les systèmes de santé doivent maintenant faire face à des données en double qui doivent être nettoyées et à des contrôles d'accès qui doivent être déterminés au cas par cas, titre par titre.
Tout cela illustre qu'il y a une raison pour laquelle les avancées dans les solutions de santé, la santé numérique et la satisfaction des patients n'ont pas nécessairement abouti à la transformation complète et efficace de l'industrie de la santé. C'est un problème mondial. Le système de santé américain est réputé pour être inefficace, mais la pandémie mondiale de COVID-19 a clairement montré qu'il existe des problèmes mondiaux de partage des données, de mise en commun des ressources et d'opportunités de recherche.
Comment résoudre cela ? Comment pouvons-nous vraiment comprendre et apprendre des lacunes dans les soins et la recherche médicale afin de protéger tout le monde sur la planète et éventuellement prévenir une autre pandémie comme le COVID-19 ?
Les données synthétiques offrent une solution convaincante.
Qu'est-ce que les données synthétiques ?
Les données synthétiques sont des données artificielles qui sont enracinées dans des données réelles mais utilisent des programmes et des algorithmes mathématiques, d'apprentissage automatique ou d'intelligence artificielle qui permettent aux chercheurs de n'importe quel domaine de tester des scénarios, de former et de manipuler des données selon des conditions spécifiques, et d'assurer la confidentialité des données — les données synthétiques offrent des possibilités infinies.
Les données synthétiques dans le domaine de la santé
Le guide d'AI Multiple sur les données synthétiques décrit l'utilité des données synthétiques dans les cas où des exigences de confidentialité primordiales limitent la disponibilité des données, les coûts des tests de produits réels restreignent négativement les efforts, ou les ensembles de données doivent être rapidement formés pour être efficaces. Les données synthétiques produisent des ensembles de données statistiquement comparables dans un environnement plus rapide et plus sûr, permettant aux entreprises, institutions et organisations de devenir plus agiles, innovantes et efficaces.
Son application dans l'industrie de la santé présente un potentiel intrigant. Indépendamment de toutes les informations qui sont saisies et consultées par les professionnels de la santé, toutes les informations des patients sont sensibles et nécessitent une protection et une désidentification avant de pouvoir être utilisées à des fins de recherche. L'application des données synthétiques dans le domaine de la santé permet aux chercheurs médicaux de créer et de consulter ces ensembles de données statistiquement comparables sur des patients fictifs.
Pour être clair, ces ensembles de données ne sont pas des coups de chance. Les "patients fictifs" signifient des données de patients non attribuables ; les données de patients non attribuables dépouillent toutes les données des identifiants de patients et démographiques. L'Université de Copenhague résume bien les attributs de ces patients fictifs :
En résumé, les données de santé synthétiques ajoutent à la portée des données existantes ou "réelles", contournant le problème de la disponibilité insuffisante des données.
Protéger l'identité des patients est primordial. Cependant, cette protection stricte provoque des ruptures dans les données cliniques et les flux de travail de recherche clinique. Par exemple, lorsqu'un coordinateur de soins cliniques contacte les administrateurs d'hôpital pour obtenir la documentation des patients, ils doivent envoyer des formulaires par fax, suivre les administrateurs par téléphone et saisir manuellement les données. C'est la procédure pour chaque patient. Les coordinateurs de soins cliniques doivent également veiller à ne pas demander d'informations trop tôt car les documents partagés ont une durée de vie courte. C'est juste un scénario déjà rempli de goulots d'étranglement.
Appliquez maintenant ce flux de travail cahoteux aux chercheurs cliniques ou aux développeurs de médicaments pharmaceutiques, qui essaient de faire des prédictions, d'identifier des tendances et de déterminer des initiatives de santé de la population à plus grande échelle. Certes, les systèmes de santé plus grands peuvent avoir des bases de données (ou lacs de données) plus grandes pour contenir toutes les informations de leurs patients, mais ces bases de données ne sont pas structurées de manière un-à-un. Le dossier médical d'un patient peut exister séparément de ses dossiers de procédures, de références et d'antécédents de soins auxiliaires. Les données médicales d'un patient peuvent même exister séparément entre différentes entités de la même entreprise. Cela se traduit effectivement par une rareté des données.
Comme le diraient les jeunes, la désidentification a marché pour que les données de santé synthétiques puissent courir. La désidentification des données des patients est la censure ou la suppression des attributs identifiables des patients à des fins de recherche sur la santé de la population. La différence entre la désidentification et les données de santé synthétiques est que ces dernières sont complètement séparées des informations des patients. Les données synthétiques ne contiennent aucune donnée personnelle. De plus, les générateurs de données de patients intelligents (iPDG) et les générateurs EHR peuvent être utilisés pour générer des dossiers de patients synthétiques indépendamment de la quantité de données de patients en vrac stockées dans le système administratif d'un hôpital.
Il y a aussi l'acronyme étonnamment formé FHIR. Les Fast Healthcare Interoperability Resources, plus communément appelés FHIR, ont aidé à ouvrir la voie en termes de collecte et de partage de données. FHIR fournit à l'industrie de la santé une norme de stockage de données basée sur le cloud qui améliore l'échange d'informations de santé (HIE) et l'interopérabilité des données. FHIR améliore considérablement la communication et la collaboration cliniques en permettant le marquage et l'organisation des données cliniques au sein du système de données d'une organisation de santé.
Robert Lieberthal, économiste principal de la santé à The MITRE Corporation, estime que "Les données synthétiques sont une solution à bon nombre des problèmes qui affligent notre système informatique de santé... D'une certaine manière, les données synthétiques représentent les normes actuelles de l'informatique de santé tout en incorporant le meilleur de ce que l'informatique de santé pourrait être."
Une fois que les solutions de données synthétiques sont intégrées dans les bases de données d'une organisation de santé, elles ingèrent tous les points de données, automatisant la déduplication et le nettoyage des données, capturant des informations statistiques et des relations entre les points de données, et facilitant le partage, la livraison et la modélisation des données.
Encore une fois, parce que les données synthétiques ne contiennent pas d'informations de santé protégées, les données artificielles générées peuvent être partagées entre les chercheurs médicaux et cliniques et les scientifiques. Ils ne sont plus contraints d'utiliser des informations de patients expurgées qui peuvent ou non adhérer aux directives de conformité en matière de santé lors du développement de nouvelles stratégies de santé, d'initiatives de paiement et de politiques de santé, et du développement de la santé numérique.
Préoccupations concernant l'utilisation des données synthétiques
Bien que les avantages de la génération et de l'application des données synthétiques à la santé soient clairs, elles en sont encore aux premiers stades d'adoption et de mise en œuvre. Les détracteurs des données synthétiques existent, et pour de bonnes raisons, comme pour toute solution qui repose sur l'apprentissage automatique et l'automatisation pour affiner et polir.
Il existe des limitations aux données synthétiques dans un cadre de santé, et toutes les parties prenantes qui souhaitent tirer parti des données synthétiques doivent en être conscientes. |
|
Acteurs dans les données de santé synthétiques
Les données synthétiques, et en particulier les données de santé synthétiques, sont un forum relativement nouveau dans lequel la recherche est menée. En conséquence, la liste suivante des acteurs des données de santé synthétiques est courte mais s'allongera à mesure que cette technologie de santé sera plus largement acceptée et améliorée.
MDClone
MDClone est un fournisseur de technologies de santé basé en Israël avec pour mission de faciliter l'accès aux données de santé et d'améliorer les méthodes globales de recherche et d'activité en santé. La plateforme de MDClone vise à démocratiser les données à travers l'écosystème de la santé en permettant l'utilisation large des données qui résident à l'intérieur des systèmes de santé.
Synthea
Synthea est un générateur de données de patients synthétiques open-source qui peut être utilisé pour créer des modèles d'historique médical de patients synthétiques. Le lac de données gratuit de Synthea permet la recherche de données de santé tout en respectant les restrictions de confidentialité et de sécurité, quel que soit le secteur de la santé.
Statice
Statice a développé des solutions d'anonymisation des données conformes à la confidentialité qui peuvent être utilisées par les entreprises et les organisations de tous les secteurs. Statice permet aux institutions de santé de travailler plus rapidement, plus sûrement et en conformité, tout en faisant progresser la recherche, le développement et la prestation de soins aux patients.
MHMD
Le cabinet de conseil Lynkeus a dirigé le projet MyHealthMyData (MHMD) financé par l'Union européenne qui visait — et a réussi — à prouver la validité et l'utilité de rendre les données anonymisées (lire : synthétiques) disponibles pour la recherche ouverte.
Simulacrum
La société Human Data Science, IQVIA a collaboré avec la société de recherche biopharmaceutique AstraZeneca pour développer la base de données synthétique Simulacrum. Simulacrum est composé uniquement de données artificielles (lire : synthétiques) pour mener des recherches et effectuer des analyses sur les soins du cancer de la population.
Voie à suivre
L'impact potentiel de la création et de l'utilisation de données synthétiques pour améliorer la recherche clinique et les stratégies de santé est énorme. Comme pour la plupart des choses, il faut du temps pour qu'une industrie tire parti des avantages d'une nouvelle technologie ou d'un nouveau processus avant que tout le monde ne monte à bord. Cependant, lors d'une crise sanitaire mondiale, nous manquons de temps et de ressources. Les communautés médicales régionales et mondiales doivent prendre des indices des leaders actuels des données de santé synthétiques pour transformer la façon dont elles partagent et protègent les données des patients, encouragent la collaboration clinique et initient le changement nécessaire dans leur approche de la création et de l'amélioration des plans, stratégies et initiatives de santé.
Lire la suite : Le rôle critique de la télémédecine dans la crise du COVID-19 → |
Vous voulez en savoir plus sur Logiciel de soins de santé ? Découvrez les produits Soins de santé.

Jasmine Lee
Jasmine is a former Senior Market Research Analyst at G2. Prior to G2, she worked in the nonprofit sector and contributed to a handful of online entertainment and pop culture publications.