jueves, junio 19Una producción de Corporación Medios Digitales del Sur

Investigador utiliza herramienta de IA para diagnosticar cánceres de garganta a través de la voz humana


Incluso antes de formarse como otorrinolaringólogo, el investigador Anthony Law comprendió que todos somos científicos de la voz por naturaleza, con la capacidad intuitiva de escuchar las voces de las personas y saber si algo anda mal. «Cuando me contagié de COVID en 2021», comenta, «en los primeros cinco segundos de nuestra conversación telefónica, mi madre supo que algo andaba mal. Lo notaba en mi voz».


por Tony Van Witsen, Universidad Emory


Hoy en día, su formación le permite analizar afecciones vocales similares en sus pacientes con la precisión de un especialista. Actualmente se desempeña como profesor adjunto de otorrinolaringología en la Facultad de Medicina de la Universidad Emory y en el Instituto Oncológico Winship.

«Este señor vino a mi clínica hace un par de meses», dice. «Por su voz áspera, tensa y grave, sé que hay una alta probabilidad de que tenga cáncer de laringe. La gravedad de estos cambios en la voz indica que probablemente el cáncer esté en una etapa avanzada».

Los cánceres de laringe en etapa temprana son fáciles de tratar si los médicos de atención primaria los detectan a tiempo. El problema es que esos cambios en la voz, llamados disfonía, pueden ser síntoma de muchas otras cosas además del cáncer. Law lo llama una búsqueda de aguja en un pajar para quienes no están capacitados.

«Casi todas las personas con cáncer de laringe experimentan cambios en la voz», dice Law. «Producimos la voz cerrando la laringe. Es casi como dos manos aplaudiendo. Al cerrarse, vibra y emite un sonido. Cuando se tiene cáncer, a menudo ese cierre no es completo. Esto produce una voz áspera y tensa, muy entrecortada».

Law divide su tiempo entre tratar pacientes y realizar investigaciones más técnicas, utilizando matemáticas y computación para ayudar a quienes atiende en la clínica. Obtuvo un doctorado en biofísica y aprendió sobre el poder de la inteligencia artificial (IA) gracias a sus amigos de Microsoft mientras realizaba su residencia en el noroeste.

Hoy utiliza un modelo de IA llamado red neuronal profunda , que imita ampliamente la arquitectura del cerebro, para poner su experiencia en análisis de voz a disposición de los médicos de atención primaria para que puedan usar la voz para diagnosticar el cáncer de laringe con tanta precisión como un especialista.

«Para los laringólogos capacitados, es muy fácil detectar que alguien tiene una masa en la laringe», dice Law. «Pero no para los médicos de atención primaria. Carecen de la formación necesaria para distinguir entre voces preocupantes y no preocupantes, y para descartar a las personas con cambios en la voz debidos a un resfriado y a un cáncer».

Entrenamiento del modelo de IA para detectar cambios de voz

El modelo actual de IA de Law tiene un éxito de aproximadamente el 93 % al identificar a personas con una masa en la laringe, lo cual se considera un buen indicador del cáncer subyacente. Sin embargo, se necesitaron años de trabajo arduo y dedicado para crear la base de datos de 15 000 grabaciones de voz necesarias para entrenar el modelo de IA.

«Hemos sido muy cuidadosos para asegurarnos de ser justos y equitativos al construir nuestros modelos», afirma. «Si detectamos el cáncer de laringe con mucha eficacia en mujeres, pero no en hombres, hemos generado un sesgo. O si detectamos el cáncer de laringe con eficacia en personas del Medio Oeste sin acento, pero con muy poca eficacia en personas del Sur, hemos excluido a una población».

Las primeras pruebas funcionaron mejor en el impecable entorno del laboratorio que en el ruidoso entorno de las clínicas. Para mejorar esto, Law desarrolló una aplicación móvil que los médicos pueden usar para analizar fácilmente los datos de voz de los pacientes, integrándose a la perfección en el ajetreado flujo de trabajo de una clínica médica.

«El proceso completo de usar la aplicación toma unos cuatro o cinco minutos», dice. «Uno o dos minutos para el consentimiento. Después, se obtienen datos demográficos que nos ayudan a comprender quién es el paciente. Luego, hay una serie de diez indicaciones de voz. Ahora mismo, estamos intentando obtener datos más diversos.

Esperamos realizar un ensayo aleatorizado en seis u ocho meses , con algunas clínicas que lo utilizan y otras que no. Veremos si podemos mejorar los tiempos de derivación. Cuando los pacientes acuden a nosotros, si se han sometido a la prueba con nuestra aplicación, ¿tienen tumores más pequeños? ¿Los estamos detectando antes? Y, en última instancia, ¿esto mejora la supervivencia de los pacientes con cáncer de laringe ?

Law afirma que el aprendizaje automático en medicina se encuentra en un punto de inflexión y que su aplicación experimental forma parte de él. Si el ensayo clínico tiene éxito, cree que la aplicación de voz podría ampliarse para analizar también otros problemas de salud.

«Podemos optar por dos caminos», afirma. «O bien, podemos concentrar todo el poder de esta herramienta tan innovadora en manos de unos pocos. O, si se usa correctamente, podemos aprovechar la experiencia que tenemos en las grandes universidades para democratizarla y ampliar el acceso para los pacientes. Por eso seguimos entusiasmados».