Recherche
La task force data Covid-19 de l'AP-HP se révèle être une véritable "force de frappe"
Depuis mars, 120 personnes se mobilisent auprès de l'entrepôt des données de santé (EDS) de l'AP-HP pour extraire et exploiter la multitude d'informations qui ressort des prises en charge liées au coronavirus. Une plus-value pour comprendre le virus.À l'Assistance publique-hôpitaux de Paris (AP-HP), l'épidémie de coronavirus a vu l'installation en mars d'une véritable "task force data" dévolue exclusivement au Covid-19 au sein de l'entrepôt des données de santé (EDS) pour répondre à un besoin urgent d'exploitation des données. À ses débuts, elle était uniquement constituée de personnels du CHU francilien : médecins de santé publique, data scientists, techniciens de la direction du système d'information et de celle de la stratégie et de la transformation, personnels de l'Institut Imagine, etc. Mais cette équipe s'est rapidement étoffée avec des arrivées externes de l'Institut national de recherche en informatique et en automatique (Inria), de diverses entreprises du secteur (Capgemini, Datacook, OVH, Philips...) et d'une vingtaine de volontaires à titre individuel (data ingénieurs, data scientists, développeurs). Soit des effectifs quintuplés avec au final 120 personnes mobilisées 7 jours sur 7 et parfois 15 heures par jour, a indiqué l'AP-HP ce 24 avril face à la presse.
Ce travail de la task force a tout d'abord commencé par l'intégration et la réunion des résultats de virologie des différents hôpitaux, avec comme critère d'inclusion dans la base EDS Covid-19 la réalisation des tests PCR (pour réaction de polymérisation en chaîne). Ces derniers ont ensuite été rapidement chaînés aux nombreuses autres données patients issues du système d'information de l'AP-HP (données administratives, cliniques, d'imagerie, de biologie, de bactériologie, de prescription médicamenteuse, de codage des actes médicaux...), souligne pour sa part le Dr Mélodie Bernaux. Sans oublier les données issues de la base Covidom, qui concerne le suivi à domicile des patients suspects, celles des urgences ou des ressources humaines. Ce qui en fait "l'une des plus grandes bases de données Covid-19 au monde", d'ailleurs rapidement standardisée pour faciliter son interopérabilité à l'international.
En retour, un dashboard a pu voir le jour en ligne, vu comme un "véritable support et outil d'aide à décision" pour la cellule de crise. Actualisé chaque jour, il permet de suivre en temps "quasi réel" les nouveaux cas, les parcours et flux de patients, les bassins de recrutement, les caractéristiques d'âge, de sexe et les principales comorbidités, les durées de séjour mais aussi d'estimer les probabilités de sortie. En plus, c'est un "outil de partage et de dialogue" au sein des équipes de soins et administratives, qui permet par ailleurs également de restituer les premières explorations des travaux de recherche (lire notre article et l'encadré).
De quoi lui permettre de participer à un consortium international d'EDS créé à l'initiative de l'université américaine d'Harvard mais aussi de susciter une trentaine de projets de recherche (création d'outils de prédiction, caractérisation des patients ou encore évaluation de l'efficacité et dangerosité des thérapeutiques en vie réelle). C'est "un travail absolument dantesque d'extraction des données", reconnaît le Pr Étienne Audureau. Et cet "effet de masse" se révèle être une réelle "plus-value" pour ne pas dire une "force de frappe" contre le Covid-19.
Un chaînage de données multiples
Trois séries de tâches ont été canalisées. Sur l'ingénierie, le travail a consisté à accélérer la récupération des données, à les consolider et les enrichir en prenant en compte de nouvelles bases. Il a fallu également renforcer cette infrastructure avec un rajout de serveurs et une accélération du traitement pour disposer des données les plus fraîches possibles. Troisième axe d'action : l'analyse en tant que telle avec la réalisation d'indicateurs et l'exploitation des informations ainsi remontées pour venir appuyer la cellule de crise. "La coordination de ces 120 personnes, qui en plus n'étaient pas forcément des gens qui connaissaient bien l'environnement EDS, a été un défi", reconnaît Élisa Salamanca, à la tête du département web innovations et données de l'AP-HP. Il a fallu des outils collaboratifs, entre autres pour assurer un certain équilibre entre les personnels du CHU et ceux venant de l'extérieur. Et une chose est sûre, "ça n'aurait pas été possible" sans l'existence préalable de l'EDS (lire ici et là nos articles).Ce travail de la task force a tout d'abord commencé par l'intégration et la réunion des résultats de virologie des différents hôpitaux, avec comme critère d'inclusion dans la base EDS Covid-19 la réalisation des tests PCR (pour réaction de polymérisation en chaîne). Ces derniers ont ensuite été rapidement chaînés aux nombreuses autres données patients issues du système d'information de l'AP-HP (données administratives, cliniques, d'imagerie, de biologie, de bactériologie, de prescription médicamenteuse, de codage des actes médicaux...), souligne pour sa part le Dr Mélodie Bernaux. Sans oublier les données issues de la base Covidom, qui concerne le suivi à domicile des patients suspects, celles des urgences ou des ressources humaines. Ce qui en fait "l'une des plus grandes bases de données Covid-19 au monde", d'ailleurs rapidement standardisée pour faciliter son interopérabilité à l'international.
Un dashboard en temps quasi réel
En outre, plusieurs groupes de travail ont été installés pour structurer ces données : l'un pour le traitement automatique des langues (avec un recours à l'intelligence artificielle pour isoler les caractéristiques patients et de leur prise en charge dans les documents médicaux) ; l'autre sur la biologie (en vue d'éliminer les résultats de laboratoire anormaux) ; et enfin un dernier sur l'épidémiologie (avec ici une analyse spatiotemporelle des survenues de cas Covid-19 et l'identification de clusters de contamination). En parallèle, un groupe de travail de data quality a été mobilisé sur la fiabilisation de l'information : les indicateurs clés (nombre d'hospitalisations et de réanimations) sont quotidiennement comparés à ceux ressortis du système d'information pour le suivi des victimes (Sivic).En retour, un dashboard a pu voir le jour en ligne, vu comme un "véritable support et outil d'aide à décision" pour la cellule de crise. Actualisé chaque jour, il permet de suivre en temps "quasi réel" les nouveaux cas, les parcours et flux de patients, les bassins de recrutement, les caractéristiques d'âge, de sexe et les principales comorbidités, les durées de séjour mais aussi d'estimer les probabilités de sortie. En plus, c'est un "outil de partage et de dialogue" au sein des équipes de soins et administratives, qui permet par ailleurs également de restituer les premières explorations des travaux de recherche (lire notre article et l'encadré).
Un "travail absolument dantesque d'extraction" pour la recherche
Pour aider aux recherches sur le coronavirus, plusieurs "pipelines" ont été mis en place, entre autres pour extraire : des informations sur les médicaments (par exemple pour suivre la consommation des produits sous tension) ; certaines données cliniques ciblées (tabac, obésité...) ; des concepts médicaux sans a priori par la fouille approfondie des comptes rendus. Au final, "plus d'un million de textes cliniques ont été traités et plus de 20 millions de points d'information récupérés pour 35 000 patients", note l'AP-HP.De quoi lui permettre de participer à un consortium international d'EDS créé à l'initiative de l'université américaine d'Harvard mais aussi de susciter une trentaine de projets de recherche (création d'outils de prédiction, caractérisation des patients ou encore évaluation de l'efficacité et dangerosité des thérapeutiques en vie réelle). C'est "un travail absolument dantesque d'extraction des données", reconnaît le Pr Étienne Audureau. Et cet "effet de masse" se révèle être une réelle "plus-value" pour ne pas dire une "force de frappe" contre le Covid-19.