Una mala noche de sueño presagia un día con los ojos vidriosos, pero también podría indicar enfermedades que atacarán años después. Un nuevo modelo de inteligencia artificial desarrollado por investigadores de Stanford Medicine y sus colegas puede utilizar registros fisiológicos de una noche de sueño para predecir el riesgo de una persona de desarrollar más de 100 afecciones de salud.
por el Centro Médico de la Universidad de Stanford
Conocido como SleepFM, el modelo se entrenó con casi 600.000 horas de datos de sueño recopilados de 65.000 participantes. Los datos provienen de la polisomnografía, una evaluación integral del sueño que utiliza diversos sensores para registrar la actividad cerebral, la actividad cardíaca, las señales respiratorias, los movimientos de las piernas y los movimientos oculares, entre otros.
La polisomnografía es el estándar de oro en los estudios del sueño que monitorizan a los pacientes durante la noche en un laboratorio. Además, los investigadores se dieron cuenta de que es una mina de oro sin explotar de datos fisiológicos.
«Registramos una cantidad asombrosa de señales cuando estudiamos el sueño», afirmó el Dr. Emmanual Mignot, profesor de Medicina del Sueño Craig Reynolds y coautor principal del nuevo estudio, publicado en Nature Medicine . «Se trata de un tipo de fisiología general que estudiamos durante ocho horas en un sujeto completamente cautivo. Es una fuente de datos muy rica».
Solo una fracción de esos datos se utiliza en la investigación y la medicina del sueño actuales. Gracias a los avances en inteligencia artificial, ahora es posible comprender una parte mucho mayor. El nuevo estudio es el primero en utilizar IA para analizar datos del sueño a tan gran escala.
«Desde la perspectiva de la IA, el sueño ha sido relativamente poco estudiado. Hay muchos otros trabajos de IA que se centran en la patología o la cardiología, pero relativamente pocos en el sueño, a pesar de que este es una parte tan importante de la vida», afirmó el Dr. James Zou, profesor asociado de ciencia de datos biomédicos y coautor principal del estudio.
Aprendiendo el lenguaje del sueño
Para aprovechar la gran cantidad de datos sobre el sueño, los investigadores crearon un modelo base, un tipo de modelo de IA que puede entrenarse con grandes cantidades de datos y aplicar lo aprendido a una amplia gama de tareas. Los modelos de lenguaje de gran tamaño, como ChatGPT, son ejemplos de modelos base entrenados con grandes cantidades de texto.
Las 585.000 horas de datos de polisomnografía con los que se entrenó SleepFM provienen de pacientes que se habían sometido a evaluaciones del sueño en diversas clínicas del sueño. Los datos del sueño se dividen en incrementos de cinco segundos, de forma similar a las palabras con las que se entrenan los modelos de lenguaje de gran tamaño.
«SleepFM consiste básicamente en aprender el lenguaje del sueño», afirmó Zou.
El modelo pudo incorporar múltiples flujos de datos (electroencefalografía, electrocardiografía, electromiografía, lectura del pulso y flujo de aire respiratorio, por ejemplo) y comprender cómo se relacionan entre sí.
Para lograrlo, los investigadores desarrollaron una nueva técnica de entrenamiento, llamada aprendizaje contrastivo «dejando uno afuera», que esencialmente oculta una modalidad de datos y desafía al modelo a reconstruir la pieza faltante basándose en las otras señales.
«Uno de los avances técnicos que logramos en este trabajo fue descubrir cómo armonizar todas estas diferentes modalidades de datos para que puedan unirse y aprender el mismo lenguaje», dijo Zou.
Pronóstico de enfermedades
Después de la fase de entrenamiento, los investigadores pudieron ajustar el modelo a diferentes tareas.
Primero, probaron el modelo en tareas estándar de análisis del sueño, como la clasificación de las diferentes etapas del sueño y el diagnóstico de la gravedad de la apnea del sueño. SleepFM tuvo un rendimiento igual o superior al de los modelos más avanzados que se utilizan actualmente.
Luego, los investigadores abordaron un objetivo más ambicioso: predecir la aparición de enfermedades a partir de los datos del sueño. Para identificar qué afecciones podían predecirse, necesitaban comparar los datos de la polisomnografía de entrenamiento con los resultados de salud a largo plazo de los mismos participantes. Afortunadamente, tenían acceso a más de medio siglo de historiales médicos de una clínica del sueño.
El Centro de Medicina del Sueño de Stanford fue fundado en 1970 por el difunto Dr. William Dement, considerado ampliamente el padre de la medicina del sueño. La cohorte más grande de pacientes que se entrenó con SleepFM —unos 35.000 pacientes de entre 2 y 96 años— registró sus datos de polisomnografía en la clínica entre 1999 y 2024. Los investigadores compararon los datos de polisomnografía de estos pacientes con sus historiales médicos electrónicos, lo que proporcionó hasta 25 años de seguimiento en algunos casos.
Los registros de polisomnografía de la clínica son aún más antiguos, pero solo en papel, dijo Mignot, quien dirigió el centro del sueño de 2010 a 2019.
SleepFM analizó más de 1000 categorías de enfermedades en los historiales médicos y encontró 130 que podían predecirse con razonable precisión a partir de los datos de sueño del paciente. Las predicciones del modelo fueron especialmente acertadas para cánceres, complicaciones del embarazo, afecciones circulatorias y trastornos mentales, alcanzando un índice C superior a 0,8.
El índice C, o índice de concordancia, es una medida común del desempeño predictivo de un modelo, específicamente, su capacidad para predecir cuál de dos individuos de un grupo experimentará un evento primero.
Para todos los pares posibles de individuos, el modelo clasifica quién tiene mayor probabilidad de experimentar un evento —un infarto, por ejemplo— antes. Un índice C de 0,8 significa que el 80 % de las veces, la predicción del modelo coincide con lo que realmente ocurrió, afirmó Zou.
SleepFM se destacó en la predicción de la enfermedad de Parkinson (índice C 0,89), demencia (0,85), enfermedad cardíaca hipertensiva (0,84), ataque cardíaco (0,81), cáncer de próstata (0,89), cáncer de mama (0,87) y muerte (0,84).
«Nos sorprendió gratamente que, para un conjunto bastante diverso de condiciones, el modelo sea capaz de hacer predicciones informativas», dijo Zou.
Los modelos de menor precisión, con índices C en torno a 0,7, como los que predicen la respuesta de un paciente a diferentes tratamientos contra el cáncer, han demostrado ser útiles en entornos clínicos, añadió.
Interpretación del modelo
El equipo está trabajando en formas de mejorar aún más las predicciones de SleepFM, quizás agregando datos de dispositivos portátiles, y para comprender exactamente qué está interpretando el modelo.
«No nos lo explica en inglés», dijo Zou. «Pero hemos desarrollado diferentes técnicas de interpretación para comprender qué analiza el modelo al realizar una predicción de una enfermedad específica».
Los investigadores señalan que, si bien las señales cardíacas son un factor más destacado en las predicciones de enfermedades cardíacas y las señales cerebrales son un factor más destacado en las predicciones de salud mental, fue la combinación de todas las modalidades de datos la que logró las predicciones más precisas.
«La mayor información que obtuvimos para predecir enfermedades fue contrastando los diferentes canales», dijo Mignot. Los componentes corporales desincronizados (un cerebro que parece dormido pero un corazón que parece despierto, por ejemplo) parecían indicar problemas.
Rahul Thapa, estudiante de doctorado en ciencia de datos biomédicos, y Magnus Ruud Kjaer, estudiante de doctorado en la Universidad Técnica de Dinamarca, son coautores principales del estudio.
Al trabajo contribuyeron investigadores de la Universidad Técnica de Dinamarca, el Hospital Universitario de Copenhague-Rigshospitalet, BioSerenity, la Universidad de Copenhague y la Facultad de Medicina de Harvard.
Más información
Un modelo de base del sueño multimodal para la predicción de enfermedades, Nature Medicine (2026). DOI: 10.1038/s41591-025-04133-4
