
¿Qué pasaría si una computadora pudiera leer las notas médicas de un paciente y ayudar a los médicos a determinar información importante para sus tratamientos?
por Hayley Kamin, Universidad Médica de Carolina del Sur
En el Centro Oncológico MUSC Hollings, investigadores dirigidos por el Dr. Jihad Obeid y el Dr. Mario Fugal utilizan una forma avanzada de inteligencia artificial (IA) para lograr precisamente eso: desvelar detalles cruciales ocultos en los historiales médicos para personalizar los tratamientos contra el cáncer cerebral. Su modelo de alta precisión podría transformar la forma en que los médicos clasifican y tratan los tumores metastásicos, ofreciendo respuestas más rápidas y una atención más personalizada sin aumentar la carga de trabajo de los médicos.
En el nuevo estudio, publicado en JCO Clinical Cancer Informatics , los investigadores utilizaron una forma de IA llamada procesamiento del lenguaje natural (PLN) para resolver un problema frustrante: cómo comunicar de manera eficiente los detalles del diagnóstico del paciente entre médicos de diferentes especialidades si el paciente tiene programada radiación para tumores cerebrales .
Rastreando los orígenes del cáncer
La mayoría de los cánceres cerebrales, conocidos como metástasis cerebrales, no se originaron allí. Más bien, estos cánceres se originaron en otras partes del cuerpo, como el pulmón, la mama, la piel, el riñón o el tracto digestivo, y luego se desplazaron al cerebro.
Saber dónde se originaron las metástasis cerebrales es fundamental en el proceso clínico. Esto es especialmente cierto para los pacientes que reciben un tratamiento especializado llamado radiocirugía estereotáctica (SRS), que administra una alta dosis de radiación dirigida en una sola sesión. Si bien es muy eficaz, la SRS conlleva riesgos, como los efectos secundarios por exceso de radiación y el posible daño al tejido sano no canceroso circundante.
Sin embargo, estos riesgos pueden reducirse o incluso evitarse si los tratamientos de los pacientes se adaptan a sus tipos de cáncer originales, ya que cada tipo de cáncer responde de forma distinta a la radiación. Por ejemplo, el cáncer de pulmón es muy sensible a la radiación y puede tratarse con dosis más bajas. En cambio, el cáncer de riñón tiende a ser resistente a la radiación y requiere un tratamiento más prolongado.
«El cerebro es un órgano tan sensible que queremos ser lo más precisos posible con la dosis de radiación», dijo Fugal. «Pero primero, necesitamos saber exactamente qué estamos tratando y luego desarrollar un plan de tratamiento específico con base en esa información».
Las notas clínicas contienen abundante información sobre el diagnóstico y el tratamiento de un paciente. Sin embargo, analizar minuciosamente las notas individuales para extraer los detalles relevantes es un proceso laborioso y que requiere mucho tiempo.
«Los historiales médicos nunca fueron diseñados para la investigación. Suelen ser confusos e imperfectos», explicó Obeid. «Pero si logramos comprenderlos, podemos convertirlos en algo que ayude a médicos y pacientes, mejorando las investigaciones y permitiendo una atención más precisa».
Ahí es donde el PNL, una rama de la IA que entrena a las computadoras para comprender el lenguaje humano, puede ser útil. El PNL permite a las computadoras interpretar lo que escribimos o decimos, acortando la distancia entre la comunicación humana y los datos informáticos.
Encontrar un lenguaje común
A algunas personas les puede sorprender la necesidad de una mejor manera de identificar los diagnósticos de cáncer. Los profesionales médicos ya cuentan con un lenguaje diagnóstico común para registrar y rastrear enfermedades, conocido como los códigos de la Clasificación Internacional de Enfermedades (CIE).
Desafortunadamente, en casos complejos como las metástasis cerebrales, estos códigos suelen ser ineficaces. Esto se debe a que los códigos CIE pueden no abordar el origen subyacente del tumor, especialmente en pacientes con más de un tipo de cáncer o cuando el cáncer se propaga tempranamente. Además, los códigos carecen de la especificidad necesaria para desglosar los subtipos de cáncer.
«La nota clínica es lo más cercano a la verdad de lo que ocurre», dijo Fugal, «porque tiene matices que los códigos CIE carecen. Un código simplemente dirá ‘cáncer de pulmón’. No especificará si se trata del pulmón izquierdo o derecho, la parte superior o inferior del pulmón, o de células pequeñas o no pequeñas. Pero las notas contienen esos detalles».
Leyendo entre líneas
En este estudio, los investigadores desarrollaron un modelo de PLN que podía «leer» las notas médicas e identificar palabras y frases clave que indicaban el tipo de cáncer primario; por ejemplo, palabras como «ductal» para cáncer de mama y «melanoma» para cáncer de piel. Al desarrollar un PLN que extraía automáticamente estos datos de las notas clínicas, los investigadores esperaban facilitar la agrupación de pacientes para tratamiento e investigación.
«Con mejores datos, podemos diseñar mejores estudios, hacer descubrimientos más rápidos y adaptar los tratamientos con mayor precisión a cada paciente», enfatizó Fugal.
Los investigadores probaron el modelo de PNL con las notas médicas presentes en los historiales médicos electrónicos , específicamente, las notas de oncología radioterápica con descripciones detalladas de los tipos de cáncer y sus antecedentes. Querían comprobar si el modelo podía identificar los diagnósticos originales de cáncer con mayor precisión que los códigos médicos estándar.
Los investigadores probaron el modelo en 82.000 notas clínicas de los historiales médicos de más de 1.400 pacientes tratados con SRS por metástasis cerebrales. El modelo fue diseñado para leer las notas, buscar patrones en el texto y utilizar esos datos para determinar el tipo de cáncer primario de cada paciente. Revisores expertos examinaron manualmente las notas para su confirmación.
Mejores datos, mejor atención
El modelo de PLN fue sorprendentemente preciso. Si bien los códigos CIE a menudo eran erróneos o poco claros, el modelo identificó correctamente el cáncer primario en más del 90 % de los casos. Para cánceres comunes como el de pulmón, mama y piel, la clasificación fue casi perfecta (97 %). El programa incluso pudo identificar subtipos de cáncer de pulmón, algo que los códigos CIE no podían identificar. Estos resultados validan el PLN como una herramienta poderosa para la extracción de datos clínicos, capaz de superar a los códigos médicos tradicionales a la hora de determinar el diagnóstico original de cáncer de un paciente.
«Este enfoque cubre una necesidad crucial», afirmó Fugal. «Nuestra herramienta de IA extrajo los diagnósticos de las notas médicas con rapidez, precisión y sin esfuerzo adicional para los equipos de atención».
Es importante destacar que el modelo fue diseñado para ser simple y eficiente. No requiere grandes conjuntos de datos , ejemplos de entrenamiento robustos ni una gran capacidad de procesamiento, y evita muchas de las preocupaciones éticas asociadas con los modelos de IA generativos más grandes.
«La verdadera ventaja de este enfoque es que es ligero y escalable», afirmó Obeid. «Otros hospitales podrían usar esta herramienta fácilmente, incluso con recursos limitados».
El equipo de investigación describe este trabajo como un gran paso hacia la atención personalizada y basada en datos para pacientes con cáncer. Una mayor eficiencia y precisión en la clasificación del cáncer podría, en última instancia, traducirse en una investigación más rápida, un mejor tratamiento y menos conjeturas para los médicos.
El equipo trabaja actualmente en un estudio que utiliza un enfoque de PNL similar para identificar a los pacientes con riesgo de necrosis por radiación (inflamación cerebral, un efecto secundario poco frecuente, pero grave, del exceso de radiación). Esta iniciativa podría ayudar a detectar complicaciones de forma temprana o evitarlas por completo. Los futuros investigadores también podrían utilizar el modelo de PNL con otros sistemas de salud y otros tipos de cáncer, o incorporar datos de salud, como imágenes o análisis de laboratorio.
Para Obeid, este trabajo refleja una tendencia más amplia en el cuidado de la salud: utilizar registros médicos electrónicos no sólo para documentación, sino como una rica fuente de datos que puede mejorar la atención en tiempo real.
«Automatizar la extracción de datos de notas no estructuradas que ya se encuentran en los historiales médicos genera conjuntos de datos precisos y actualizados», afirmó. «Este enfoque ahorra tiempo y facilita una investigación más significativa sobre los resultados tras la radiocirugía y otros tratamientos».
A medida que el tratamiento del cáncer se vuelve más complejo, herramientas basadas en datos como esta cobran mayor importancia. Al enseñar a las computadoras a leer las notas médicas que redactan los médicos, los investigadores ayudan a reducir la brecha entre los datos brutos y la comprensión real.
Más información: Mario Fugal et al., Clasificación de pacientes de radiocirugía estereotáctica según diagnóstico primario mediante el procesamiento del lenguaje natural de notas clínicas, JCO Clinical Cancer Informatics (2025). DOI: 10.1200/CCI-24-00268
