Codificación médica en ensayos clínicos: MedDRA, WHODrug y EDC

Cada término verbatim que un investigador introduce en su eCRF acaba sobre el escritorio de un codificador. En un ensayo multinacional de tamaño medio, esa cola crece con rapidez. Los benchmarks del sector muestran de forma consistente que entre el 20 y el 30 % de los términos verbatim requieren revisión manual, incluso cuando la codificación automática está activada. Esa es la carga de trabajo permanente que su equipo de gestión de datos absorbe antes de que la base de datos pueda bloquearse.

La codificación médica convierte esas entradas de texto libre en códigos estandarizados mediante diccionarios reconocidos internacionalmente. Los eventos adversos pasan por MedDRA. Los medicamentos concomitantes pasan por WHODrug. Sin ese mapeo, «headache», «cephalalgia» y «head pain» son tres registros distintos en lugar de uno. Los reguladores detectan lagunas. Los equipos de seguridad pierden señales. Los bioestadísticos obtienen ruido.

Este artículo explica cómo funciona la codificación médica, dónde genera fricción y qué cambia cuando se ejecuta dentro de su EDC.

¿Qué es la codificación médica en ensayos clínicos?

La codificación médica mapea los términos verbatim notificados por los investigadores sobre entradas de diccionarios jerárquicos, creando datos estructurados que pueden analizarse, compararse y enviarse entre centros, estudios y agencias regulatorias.

Los dos diccionarios estándar en investigación clínica:

MedDRA (Medical Dictionary for Regulatory Activities): cubre eventos adversos, antecedentes médicos e indicaciones. MedDRA organiza los términos en cinco niveles, desde los Términos de Bajo Nivel (LLT) hasta los Términos Preferidos (PT), Términos de Alto Nivel (HLT), Grupos de Términos de Alto Nivel (HLGT) y Clases de Sistema Orgánico (SOC). La codificación diaria se realiza principalmente a nivel PT. MedDRA publica dos nuevas versiones al año, en marzo y septiembre.
WHODrug (WHO Drug Dictionary): cubre medicamentos concomitantes y previos, mapeados en códigos de clasificación ATC. Al igual que MedDRA, WHODrug sigue un calendario de publicación semestral: marzo y septiembre.

La mayoría de los sistemas EDC modernos incluyen la codificación como funcionalidad integrada, aunque la profundidad de esa integración varía considerablemente de una solución a otra.

Por qué la codificación médica no puede ser una reflexión posterior

Cuando la codificación se retrasa, las consecuencias van más allá del equipo de gestión de datos. Cuatro áreas se ven directamente afectadas:

Presentaciones regulatorias. Las presentaciones regulatorias ante la FDA y la EMA exigen datos codificados de eventos adversos y medicamentos. Los códigos inconsistentes o ausentes pueden retrasar o bloquear las aprobaciones. No existe ninguna solución alternativa en el momento de la presentación.
Coherencia de los datos. MedDRA mapea «headache», «cephalalgia» y «head pain» en un único Término Preferido. Sin ese mapeo, su análisis de eventos adversos sobreestima el número de eventos distintos y subestima la frecuencia de cada término.
Detección de señales de seguridad. Los equipos de farmacovigilancia identifican patrones en los eventos adversos entre estudios y poblaciones, incluidos los estudios de evidencia del mundo real. Los datos no codificados o mal codificados rompen la señal antes de que pueda detectarse.
Calendario de bloqueo de la base de datos. Un acumulado de términos verbatim sin resolver es una de las causas más frecuentes de retraso en el bloqueo de la base de datos. Cada semana que su cola de codificación permanece abierta es una semana más en su calendario de presentación.

¿Busca información más detallada sobre las funcionalidades de los EDC? Leer la guía

Cómo funciona el proceso de codificación

El proceso comienza cuando un investigador introduce un término verbatim en el eCRF. Lo que ocurre a continuación determina qué parte del tiempo de su equipo se destina a la codificación.

El sistema EDC intenta hacer coincidir el término verbatim con las entradas del diccionario utilizando reglas predefinidas y tablas de sinónimos. Los términos que coinciden se procesan automáticamente. El 20-30 % que no coincide entra en cola de revisión manual: descripciones ambiguas, errores tipográficos, abreviaturas específicas del centro, entradas en varios idiomas.

Un codificador cualificado busca en el diccionario correspondiente, selecciona el término MedDRA adecuado a nivel PT y envía el código para su aprobación. Un gestor de datos revisa y bloquea la entrada como parte del proceso de limpieza de datos. Cuanto más de esa secuencia se ejecute dentro de una sola plataforma, menos transferencias gestionará su equipo entre la captura y el bloqueo.

Dónde la codificación tradicional genera fricción

La tasa de revisión manual del 20-30 % no es solo un problema de volumen. Cuatro factores estructurales mantienen ese porcentaje elevado a lo largo de la vida de un estudio.

Variabilidad lingüística e inter-centros. Un ensayo descentralizado con 40 centros en 10 países genera términos verbatim en inglés, francés, español y alemán. Cada centro tiene sus propias convenciones y abreviaturas. Cualquier término que el sistema no reconoce va a la cola manual.
Ciclos de actualización de diccionarios. MedDRA y WHODrug publican dos nuevas versiones al año, en marzo y septiembre. Cada versión puede requerir una recodificación parcial de los términos existentes. Cuando ese proceso se realiza fuera del EDC, crea una tarea de reconciliación adicional.
Herramientas desconectadas. Cuando la codificación se realiza en un sistema separado de la captura de datos, su equipo exporta los términos, los codifica e importa los resultados de vuelta al EDC. Cada transferencia es un retraso y una posible fuente de discrepancias. Un EDC con codificación integrada elimina ese problema.
Tablas de sinónimos estáticas. La codificación automática opera sobre un conjunto fijo de sinónimos reconocidos. Si las tablas de sinónimos no se actualizan a medida que el estudio genera nuevos términos, la cola manual permanece elevada desde el primer paciente hasta la última visita.

Codificación médica con Datacapt

Datacapt integra la codificación médica directamente en su EDC. Los codificadores trabajan en el mismo entorno donde se capturan los datos. Sin exportaciones, sin sistemas paralelos, sin pasos de reconciliación entre herramientas.

En la práctica, esto cambia la carga de trabajo diaria de su equipo de codificación:

La codificación automática se ejecuta al capturar los datos. Cuando un investigador envía un término verbatim, el sistema realiza una búsqueda inmediata en MedDRA o WHODrug. Los términos que coinciden pasan a revisión sin intervención manual. Sus codificadores se centran en lo que el sistema no puede resolver.
Los términos no coincidentes permanecen en contexto. Los codificadores buscan, seleccionan y aprueban términos en la plataforma donde se encuentra la entrada original del eCRF. Sin exportaciones, sin cambiar entre sistemas.
Las tablas de sinónimos crecen entre estudios. Cada término codificado manualmente por su equipo se convierte en candidato para la lista de sinónimos. Con el tiempo, su tasa de codificación automática mejora entre estudios, no solo dentro de uno.
Las actualizaciones de diccionarios se gestionan en la plataforma. Las versiones de marzo y septiembre de MedDRA y WHODrug se gestionan sin exportaciones ni reimportaciones. Su equipo aplica la actualización, revisa los términos afectados y continúa.
Cada acción de codificación queda registrada. La pista de auditoría captura quién codificó qué, cuándo y con qué versión del diccionario, cubriendo los principales requisitos de 21 CFR Part 11: pista de auditoría, controles de acceso y firmas electrónicas para los registros utilizados en presentaciones regulatorias.

Datacapt combina la codificación médica con ePRO, eConsent y randomización en una plataforma única. Los datos que resuelven sus codificadores son los mismos que analizan sus bioestadísticos. Sin brechas entre la captura y la presentación.

Codificación médica en ensayos clínicos