Trabajos recientes sugieren nuevas herramientas de aprendizaje profundo para la detección, segmentación y caracterización de los trastornos oculares . La segmentación precisa de las lesiones del fondo de la retina y las anomalías en los datos de imágenes es un paso técnico importante para la detección temprana y el tratamiento de los trastornos oculares comunes, y un desafío algorítmico central para los enfoques de aprendizaje supervisado en este contexto si la escasez de datos etiquetados. Revisamos varios trabajos nuevos que sugieren nuevas herramientas y arquitecturas de red como aprendizaje profundo en modelos oftalmológicos para tratar este problema.
[4] sugieren un enfoque de aprendizaje semi-supervisado para la segmentación de la copa óptica en imágenes del fondo de la retina ; un codificador automático variacional [3] está capacitado para aprender una representación de características a partir de datos no etiquetados, y una red de codificadores está entrenada en un pequeño número de imágenes de segmentación anotadas, representadas como vectores de características densos del codificador automático. Entrenan y validan su modelo con datos de EyePACScon 12,000 imágenes de fondo de ojo, 600 de las cuales se utilizan como un conjunto de datos anotado. Este nuevo modelo logra una mejora del 1% en la puntuación de los dados en la red CNN de U-Netcuando se entrena en el conjunto de datos completo, con una puntuación del 80%. Además, cuando el número de ejemplos anotados es menor, la ventaja se vuelve más significativa, con un 73% frente a un 69% en comparación con el índice de referencia U-Net. El método puede ser aplicable a otras modalidades, especialmente cuando la forma de segmentación tiene características similares en todos los datos.
[2] adopte un enfoque diferente y sugiera el uso de informes clínicos textuales como ayuda para la detección de microaneurismas en imágenes de fondo de ojo , con el propósito de un tratamiento temprano de la retinopatía diabética . Los datos en este problema generalmente sufren un grave desequilibrio, y los autores sugieren usar las características de la CNN junto con una palabra clave basada en la incrustación del texto para la tarea de clasificación.
Otros trabajos sobre la detección de retinopatía diabética son [6] y [7]. [6] use Inception-Resnet [5] como una red de sucursales principal, y agregue dos sucursales de redes auxiliares que localicen y amplíen áreas relevantes de la imagen. Este mecanismo de atención, como se ilustra en la figura a continuación, puede utilizarse para otras tareas de detección de lesiones . El modelo logró una recuperación del 85% en el conjunto de datos de EyePACS.
La ilustración anterior del modelo CNN de [6] muestra que consta de tres subredes: M-Nety C-Net clasifican, respectivamente, la imagen y los parches sospechosos de alta resolución, mientras que A-Net genera los mapas de atención de acercamiento con zoom. Para localizar regiones sospechosas.
En [7], se utiliza un algoritmo CNN de dos etapas para señalar las lesiones en las imágenes en color del fondo del ojo , y para producir también grados de gravedad para la retinopatía diabética . También sugieren utilizar un mapa de lesiones ponderadas para tratar el problema de desequilibrio de datos; en la primera etapa, una CNN identifica parches en las imágenes que se sospechan como lesiones; luego, se producen y ponderan dos mapas: un mapa de predicción de probabilidad máxima y un mapa de predicción de etiqueta. En la segunda etapa, estos dos mapas se utilizan como entrada para otra CNN. Los autores muestran en el documento que este nuevo método de aprendizaje profundo supera a los modelos de referencia SVM y Random-Forest.
[1] considere el problema del monitoreo de los trastornos oculares a lo largo del tiempo en las imágenes OCT y se enfoca en la enfermedad en etapa tardía de la degeneración macular relacionada con la edad (DMAE) , donde la segmentación es difícil debido a las formas patológicas irregulares en los datos. Utilizan una red con bloques residuales dilatados en una arquitectura de codificador-decodificador asimétrico que llaman Branch-U Residual , para segmentar múltiples capas retinianas en secciones transversales de OCT. La diferencia en arquitectura de la U-Net estándar radica principalmente en el uso de conexiones de salto entre diferentes capas dentro de la rama del codificador. Los resultados de este modelo proporcionan una ligera ventaja sobre la U-Net en términos de puntaje de dados, con un tiempo de convergencia de entrenamiento más rápido y un tiempo de ejecución de predicción un 30% más corto.
Comentarios recientes