Anales de la RANM

20 A N A L E S R A N M R E V I S T A F U N D A D A E N 1 8 7 9 ESTIMACIONES DE CAUSALIDAD CON IMAGEN MÉDICA EN ONCOLOGÍA Luis Martí-Bonmatí An RANM. 2021;138(01): 16 - 23 económico y de investigadores involucrados (Figura 3). Con estos estudios se pretende emular los ensayos de investigación incluyendo pacientes del mundo real y aprovechando la información disponible en las historias clínicas digitales (16). Aunque estos estudios tienen una menor aceptación científica, para extraer inferencias causales válidas debe controlarse adecuadamente la mayor hetero- geneidad y minimizar la falta de estandarización en la calidad de los datos en origen. Por ejemplo, debemos normalizar las imágenes médicas dada su alta variabilidad en los protocolos de adquisición. Para establecer razonablemente las relaciones de causalidad en los estudios observaciones deben tenerse en cuenta una serie de requisitos para emular la construcción de un estudio prospec- tivo (17). Así, deben definirse las variables que se van a recoger en la base de datos del estudio, con su descripción y relevancia. Debe analizarse la distribución y representatividad de la población diana que se quiere estudiar. Por otro lado, debe considerarse la minimización del número de variables a aquellas relevantes y eliminar las variables redundantes para evitar las asociaciones causales espurias. Los datos recogidos deben estratificarse como variables descriptoras de la población diana, variables predictoras (o de entrada) y variables de respuesta (o de salida) del modelo. Las variables recogidas deben constituirse en un Conjuntos de Datos Básicos Mínimos para los objetivos que se hayan definido en el estudio, siguiendo criterios de evidencia científica. Deben emplearse los estándares que faciliten la extracción universal de datos de las historias clínicas (OMOP-CDM, Common Data Model ), identificando y eliminando los elementos redundantes (18). Para garantizar una universalidad y reproducibi- lidad aceptable de los resultados debe calcularse inicialmente el tamaño muestral mínimo para evitar el sesgo del submuestreo. Debe también ajustarse la potencia estadística necesaria aumentando la fuerza de asociación con criterios más exigentes (tales como un p-valor<0.005 y el uso de las correcciones por FDR, False Discovery Rate ) que eviten los sesgos de serendipia. Debe analizarse además la magnitud del efecto inducido, su relevancia y la coherencia con lo ya conocido, además de validar el resultado en otras series de casos tanto similares (validación interna) como diferentes (validación externa). De esta forma se emularán los diseños experimentales acotando el problema de la investigación con datos mediante un control de la selección y la evaluación de las variables (19, 20, 21). EMULAR ESTUDIOS EXPERIMENTALES CON DATOS DEL MUNDO REAL PARA INFERIR CAUSALIDAD Figura 3. Principales modelos de investigación en Medicina. En este trabajo se desarrolla la inferencia de causalidad a partir de los estudios observacionales analíticos de casos-control.

RkJQdWJsaXNoZXIy ODI4MTE=