Sector Público

¿Es posible compartir conocimiento médico mediante inteligencia artificial respetando la privacidad de los pacientes? (Parte I)

Antonio Conde Quintero
18 January 2022

Resulta indispensable avanzar en el uso de soluciones basadas en inteligencia artificial que puedan ayudar al diagnóstico clínico, como el piloto¹ que estamos llevando a cabo a través del programa Digitaliza con varios hospitales de renombre en España. Y es precisamente en ese piloto donde nos planteamos el reto de cómo podíamos hacer para mejorar los modelos que apoyan al diagnóstico clínico en términos de precisión y exhaustividad, manteniendo la privacidad de los pacientes y la seguridad del algoritmo, antes de siquiera pensar en poder implementarlo para su uso en el día a día.

En este blog, junto a Daniel Torbellino Rubio, Smart Cities Professor at MIOTI, queremos haceros una visita guiada por las diferentes tecnologías que hacen posible resolver el oxímoron de compartir la información manteniendo la privacidad de los datos.

¿Todos listos? ¿Mascarillas en posición? Arrancamos la visita en nuestra primera parada, un modelo basado en entrenamiento federado.

Sentando las bases

Antes de entrar a la definición de modelo federado, dejadme que os cuente por qué necesitábamos ese modelo de aprendizaje para resolver nuestro puzle. Aviso a navegantes, intentaré no entrar en mucho detalle, primero porque estoy lejos de ser una eminencia en la materia y segundo, porque en toda visita que se precie, debes contar los hechos más relevantes sin abrumar a los visitantes con todos los detalles, por lo que dejaré algún enlace para los más curiosos.

Empecemos por el principio: los datos que estamos analizando en esta primera fase del piloto son imágenes, concretamente radiografías y el tipo de algoritmos de facto para el análisis de imágenes son redes neuronales convolucionales.

La principal razón por la que se eligen este tipo de redes neuronales es que son capaces de mantener la información relacionada con la posición de las características y su jerarquía… vamos, que no significa lo mismo si una piña tiene al lado una ardilla, una bola de Navidad o un plátano. Pues lo mismo con “formas” en radiografías.

Foto: https://towardsdatascience.com/chest-x-rays-pneumonia-detection-using-convolutional-neural-network-63d6ec2d1dee

En nuestro caso, cada hospital tiene acceso a una cantidad limitada de radiografías y, por suerte, la mayor parte es de pacientes sanos, sin contar que las imágenes nunca son perfectas y distan mucho de ser idénticas en el enfoque, ángulo o perspectiva, lo que hace que la tarea de aprendizaje requiera un mayor número de imágenes, además que, por el tipo de imágenes, la transferencia de conocimiento desde otras redes neuronales ya entrenadas puede no ser tan sencillo si no usan el mismo tipo de imagen diseño de red. También se están haciendo estudios de redes Maestro-Alumno² para ser aplicadas en estos casos.

Además, si queremos aprender más características de las imágenes, necesitamos usar modelos más complejos, y eso también requiere un mayor número de imágenes para no llegar a aprenderse la muestra de memoria por sobreajuste (overfitting en inglés). Siguiendo el ejemplo de nuestra visita guiada, si siempre haces el mismo recorrido en el mismo museo, te lo acabas aprendiendo, pero eso no quiere decir que sepas de arte más allá de esos cuadros que has memorizado.

Por tanto, como dice Edd Wilder-James en Harvard Business Review³: “El mayor obstáculo para usar el análisis de datos no es la falta de conocimiento o tecnología, sino simplemente el acceso a los datos”.

Y éste era exactamente nuestro caso y dónde el equipo de CapGemini Engineering tuvo que dedicar más neuronas, nunca mejor dicho.

Entrenamiento Federado

Entonces, ¿Por qué no usar datos de varios hospitales para hacer el aprendizaje? Buena idea, ¿verdad? Pero aquí aparece el obstáculo de la privacidad de los datos. Es de Perogrullo, pero no se pueden sacar las radiografías de un paciente de un hospital a otro tan alegremente y eso sin contar el ancho de banda necesario para tan magna tarea, por lo cual necesitábamos una aproximación distinta y es aquí donde aparece el aprendizaje federado.

Foto: https://www.businesswire.com/news/home/20200511005132/en/%C2%A0Intel-Works-with-University-of-Pennsylvania-in-Using-Privacy-Preserving-AI-to-Identify-Brain-Tumors

Como aparece definido en Advances and Open Problems in Federated Learning⁴: “El aprendizaje federado (FL) es un entorno de aprendizaje automático en el que muchos clientes (por ejemplo, dispositivos móviles u organizaciones enteras) entrenan en colaboración un modelo bajo la orquestación de un servidor central (por ejemplo, proveedor de servicios), mientras mantienen los datos de entrenamiento descentralizados. FL incorpora los principios de la recopilación y minimización de datos, y puede mitigar muchos de los riesgos y costos de privacidad sistémicos que resultan de los enfoques tradicionales y centralizados de aprendizaje automático y ciencia de datos.”

Por tanto, aplicando este tipo de aprendizaje, somos capaces de utilizar la información agregada de todos los hospitales mientras mantenemos la privacidad de los datos de cada paciente dentro de cada hospital. Al mismo tiempo, podemos democratizar el acceso al conocimiento, ya que el siguiente hospital que se conecte al modelo federado, aunque solo aporte 10 radiografías, se verá beneficiado de la información de las cientos o miles de radiografías de los grandes centros.

Además hay otros elementos claves que hacen funcionar una solución como ésta, por ejemplo resolver cómo vamos a ser capaces de trabajar con un modelo federado entre hospitales, y es ahí donde las soluciones de Edge Computing de Cisco brindan la oportunidad de crear una arquitectura resiliente; o cómo dotamos de seguridad a todo este desarrollo de CapGemini Engineering utilizando los últimos chips de Intel o comunicaciones seguras de Vodafone; o de cómo dotar de una fácil gestión a este tipo de plataforma para que pueda ser utilizada por centros de cualquier tamaño.

Gracias por acompañarnos en este recorrido. Y si como a nosotros os apasiona el alcance ilimitado de la inteligencia artificial, dejad vuestro comentario o duda y con gusto os responderemos.

Referencias

1:Inteligencia Artificial que respeta la privacidad de los pacientes de COVID-19 (2021).

2: Evaluating knowledge transfer in neural network for medical images. Sina Akbarian, Laleh Seyyed-kalantari, Farzad Khalvati, and Elham Dolataba arXiv:2008.13574v2 [eess.IV] 17 Sep 2020

3: Breaking Down Data Silos. Edd Wilder-James (2016)

4: Advances and Open Problems in Federated Learning. Peter Kairouz, H. Brendan McMahan, et al. arXiv:1912.04977 [cs.LG] 10 (2019).

Leer más:

La inteligencia artificial es clave en la transformación digital

Cómo la tecnología puede contribuir al proceso de vacunación mundial

Cómo digitalizar el sector sanitario

Tags: