Chaque terme verbatim saisi par un investigateur dans votre eCRF finit sur le bureau d'un codeur. Dans un essai multinational de taille moyenne, cette file d'attente grossit vite. Les benchmarks industrie montrent régulièrement que 20 à 30 % des termes verbatim nécessitent une revue manuelle, même lorsque le codage automatique est activé. C'est la charge permanente que votre équipe de data management absorbe avant que la base de données puisse être verrouillée.
Le codage médical convertit ces saisies en texte libre en codes standardisés à l'aide de dictionnaires reconnus à l'échelle internationale. Les effets indésirables passent par MedDRA. Les médicaments concomitants passent par WHODrug. Sans ce mapping, « headache », « cephalalgia » et « head pain » restent trois enregistrements distincts au lieu d'un seul. Les régulateurs voient des lacunes. Les équipes de pharmacovigilance ratent des signaux. Les biostatisticiens obtiennent du bruit.
Cet article explique comment fonctionne le codage médical, là où il génère des frictions, et ce qui change lorsqu'il s'intègre directement dans votre EDC.
Qu'est-ce que le codage médical dans les essais cliniques ?
Le codage médical mappe les termes verbatim rapportés par les investigateurs sur des entrées de dictionnaires hiérarchisés, produisant des données structurées qui peuvent être analysées, comparées et soumises entre sites, études et agences réglementaires.
Les deux dictionnaires standards en recherche clinique :
- MedDRA (Medical Dictionary for Regulatory Activities) : couvre les effets indésirables, les antécédents médicaux et les indications. MedDRA organise les termes sur cinq niveaux, des Termes de Bas Niveau (LLT) jusqu'aux Termes Préférentiels (PT), Termes de Haut Niveau (HLT), Groupes de Termes de Haut Niveau (HLGT) et Classes Système-Organe (SOC). Le codage quotidien se fait principalement au niveau PT. MedDRA publie deux nouvelles versions par an, en mars et en septembre.
- WHODrug (WHO Drug Dictionary) : couvre les médicaments concomitants et antérieurs, mappés sur les codes de classification ATC. Comme MedDRA, WHODrug suit un calendrier de publication semestriel : mars et septembre.
La plupart des systèmes EDC modernes intègrent le codage comme fonctionnalité native, mais la profondeur de cette intégration varie significativement d'une solution à l'autre.
Pourquoi le codage médical ne peut pas être une réflexion après coup
Lorsque le codage prend du retard, les conséquences dépassent l'équipe de data management. Quatre domaines sont directement touchés :
- Soumissions réglementaires. Les soumissions réglementaires à la FDA et à l'EMA exigent des données codées sur les effets indésirables et les médicaments. Des codes incohérents ou manquants peuvent retarder ou bloquer les approbations. Il n'existe aucun contournement au moment de la soumission.
- Cohérence des données. MedDRA mappe « headache », « cephalalgia » et « head pain » sur un Terme Préférentiel unique. Sans ce mapping, votre analyse des effets indésirables surestime le nombre d'événements distincts et sous-estime la fréquence de chaque terme.
- Détection des signaux de sécurité. Les équipes de pharmacovigilance identifient des patterns dans les effets indésirables entre études et populations, y compris dans les études en vie réelle. Des données non codées ou mal codées cassent le signal avant qu'il puisse être détecté.
- Calendrier de verrouillage de la base de données. Un backlog de termes verbatim non résolus est l'une des causes les plus fréquentes de retard dans le verrouillage de la base de données. Chaque semaine que votre file de codage reste ouverte est une semaine supplémentaire dans votre calendrier de soumission.
Comment fonctionne le processus de codage
Le processus démarre lorsqu'un investigateur saisit un terme verbatim dans l'eCRF. Ce qui se passe ensuite détermine la part de temps que votre équipe consacre au codage.
Le système EDC tente de faire correspondre le terme verbatim aux entrées du dictionnaire à l'aide de règles prédéfinies et de tables de synonymes. Les termes qui correspondent passent automatiquement. Les 20 à 30 % qui ne correspondent pas sont mis en file d'attente pour revue manuelle : descriptions ambiguës, fautes de frappe, abréviations propres au site, saisies en plusieurs langues.
Un codeur qualifié recherche dans le dictionnaire concerné, sélectionne le terme MedDRA approprié au niveau PT et soumet le code pour validation. Un gestionnaire de données révise et verrouille l'entrée dans le cadre du processus de nettoyage des données. Plus cette séquence s'exécute au sein d'une plateforme unique, moins votre équipe gère de transferts entre la saisie et le verrouillage.
Là où le codage traditionnel génère des frictions
Le taux de revue manuelle de 20 à 30 % n'est pas seulement un problème de volume. Quatre facteurs structurels maintiennent ce taux élevé tout au long de la vie d'une étude.
- Variabilité linguistique et inter-sites. Un essai décentralisé avec 40 sites dans 10 pays génère des termes verbatim en anglais, français, espagnol et allemand. Chaque site apporte ses propres conventions et abréviations. Tout terme non reconnu par le système part dans la file manuelle.
- Cycles de mise à jour des dictionnaires. MedDRA et WHODrug publient chacun deux nouvelles versions par an, en mars et en septembre. Chaque version peut nécessiter un re-codage partiel des termes existants. Lorsque ce processus se déroule hors de l'EDC, il crée une tâche de réconciliation distincte.
- Outils déconnectés. Lorsque le codage se fait dans un système séparé de la saisie de données, votre équipe exporte les termes, les code, puis réimporte les résultats dans l'EDC. Chaque transfert est un délai et une source potentielle de discordance. Un EDC avec codage intégré supprime ce problème.
- Tables de synonymes statiques. Le codage automatique s'exécute sur un ensemble fixe de synonymes reconnus. Si les tables de synonymes ne sont pas mises à jour au fur et à mesure que l'étude génère de nouveaux termes, la file manuelle reste importante du premier patient jusqu'à la dernière visite.
Le codage médical avec Datacapt
Datacapt intègre le codage médical directement dans son EDC. Les codeurs travaillent dans le même environnement que celui où les données sont saisies. Aucun export, aucun système parallèle, aucune étape de réconciliation entre outils.
En pratique, cela change la charge de travail quotidienne de votre équipe de codage :
- Le codage automatique s'exécute à la saisie. Lorsqu'un investigateur soumet un terme verbatim, le système recherche immédiatement dans MedDRA ou WHODrug. Les termes qui correspondent partent en revue sans intervention manuelle. Vos codeurs se concentrent sur ce que le système ne peut pas résoudre.
- Les termes non correspondants restent en contexte. Les codeurs recherchent, sélectionnent et valident les termes dans la plateforme où se trouve l'entrée eCRF d'origine. Aucun export, aucun changement d'outil.
- Les tables de synonymes s'enrichissent entre les études. Chaque terme codé manuellement par votre équipe devient candidat à l'ajout dans la liste de synonymes. Au fil du temps, votre taux de codage automatique s'améliore entre les études, pas seulement au sein d'une seule.
- Les mises à jour des dictionnaires sont gérées dans la plateforme. Les versions de mars et de septembre de MedDRA et WHODrug sont prises en charge sans export ni réimport. Votre équipe applique la mise à jour, révise les termes concernés et continue.
- Chaque action de codage est tracée. La piste d'audit capture qui a codé quoi, quand et contre quelle version du dictionnaire, couvrant les principales exigences de la 21 CFR Part 11 : piste d'audit, contrôles d'accès et signatures électroniques pour les enregistrements utilisés dans les soumissions réglementaires.
Datacapt associe le codage médical à l'ePRO, à l'eConsent et à la randomisation dans une plateforme unique. Les données résolues par vos codeurs sont les mêmes que celles analysées par vos biostatisticiens. Aucune rupture entre la saisie et la soumission.













