Resumen
Introducción
Esta es una revisión sistemática de los algoritmos principales que utilizan el aprendizaje automático (ML) en el procesamiento de imágenes retinianas para el diagnóstico y detección de glaucoma. ML ha demostrado ser una herramienta importante para el desarrollo de tecnología asistida por computadora. Además, la investigación secundaria se ha llevado a cabo ampliamente a lo largo de los años para oftalmólogos. Dichos aspectos indican la importancia de ML en el contexto del procesamiento de imágenes retinianas.
Métodos
Las publicaciones que se eligieron para componer esta revisión se obtuvieron de las bases de datos Scopus, PubMed, IEEEXplore y Science Direct. Luego, se seleccionaron los artículos publicados entre 2014 y 2019. Se excluyeron las investigaciones que utilizaron el método de disco óptico segmentado. Además, solo se consideraron los métodos que aplicaron el proceso de clasificación. El análisis sistemático se realizó en dichos estudios y, a continuación, se resumieron los resultados.
Discusión
Basado en arquitecturas usadas para ML en el procesamiento de imágenes retinianas, algunos estudios aplicaron extracción de características y reducción de dimensionalidad para detectar y aislar partes importantes de la imagen analizada. De manera diferente, otros trabajos utilizaron una red convolucional profunda. Según las investigaciones evaluadas, la principal diferencia entre las arquitecturas es la cantidad de imágenes que se requieren para el procesamiento y el alto costo computacional requerido para usar técnicas de aprendizaje profundo.
Conclusiones
Todas las publicaciones analizadas indicaron que era posible desarrollar un sistema automatizado para el diagnóstico de glaucoma. La gravedad de la enfermedad y sus altas tasas de ocurrencia justifican las investigaciones que se han llevado a cabo. Las técnicas computacionales recientes, como el aprendizaje profundo, han demostrado ser tecnologías prometedoras en imágenes de fondo de ojo. Aunque dicha técnica requiere una base de datos extensa y altos costos computacionales, los estudios muestran que las técnicas de aprendizaje de transferencia y aumento de datos se han aplicado como una forma alternativa de optimizar y reducir la capacitación en redes.
Objetivo
Este artículo describe métodos supervisados para el cribado de glaucoma en imágenes retinianas. Los estudios revisados en este artículo se clasificaron en métodos de aprendizaje profundo y no profundo. Por lo tanto, su objetivo principal es evaluar los algoritmos recientemente propuestos por diferentes grupos, así como describir los pasos preeminentes en el desarrollo de un sistema de diagnóstico automatizado. Además, los algoritmos de aprendizaje automático pueden contribuir de manera significativa al diagnóstico temprano y automatizado del glaucoma, así como a otras afecciones oculares anormales.
Métodos
Una revisión de la literatura tiene como objetivo sintetizar trabajos en una fuente de investigación para ayudar a futuras investigaciones. Los métodos utilizados en el presente estudio se basaron en los cinco pasos descritos por Khan et al. [ 1], como sigue: enmarcar preguntas para una revisión, identificar trabajos relevantes, evaluar la calidad de los estudios, resumir la evidencia e interpretar los hallazgos. Inicialmente, se definió el objetivo del estudio. En segundo lugar, se determinó el estado actual de los algoritmos que combinan el procesamiento de imágenes retinianas. Luego, se definieron las fuentes y los criterios para incluir los estudios en esta revisión. Después de eso, se seleccionaron las obras más significativas. Además, se produjo el análisis de aquellos que presentaron discusiones y perspectivas de algoritmos de ML en el procesamiento de imágenes retinianas para la detección y diagnóstico de glaucoma. En consecuencia, se realizó un análisis para determinar las convergencias y divergencias en medio de los estudios.
Identificación y extracción de datos.
En esta revisión, se consideraron las siguientes bases de datos en línea para la investigación bibliográfica: PubMed, Biblioteca Nacional de Medicina de EE. UU. Instituto Nacional de Salud, Biblioteca Digital IEEE Xplore, Science Direct y Scopus.
Todos los artículos se publicaron durante el período comprendido entre enero de 2014 y agosto de 2019. La búsqueda se restringió a las siguientes palabras clave: “Aprendizaje automático e imagen retiniana”, “Glaucoma y aprendizaje automático”, “Disco óptico y aprendizaje automático”, “Aprendizaje profundo Y glaucoma “. El resultado de búsqueda de palabras clave en 15,228 obras. Cuando se aplicaron los criterios de exclusión, quedaban un total de 110 obras.
Criterios de selección y exclusión.
El proceso de selección se realizó de acuerdo con los siguientes criterios de exclusión:
- Estudios que contienen las palabras “OCT” y “Campo visual” en el título;
- Artículos que no incluyeron tanto “Glaucoma” como “Disco óptico” como palabras clave;
- Artículos que no incluyeron la palabra “Glaucoma” en los metadatos.
En el paso de selección de estudio, las investigaciones se analizaron mediante la lectura del resumen, las palabras clave y los métodos. Como resultado, fue posible adquirir los criterios de selección de los estudios.
Los resúmenes, palabras clave y métodos de los 110 estudios restantes se leyeron para analizar su importancia e influencia. En esta etapa, se aplicaron los siguientes criterios a la selección de los más significativos.
- Adquisición de datos: imagen retiniana;
- Técnicas de procesamiento: aprendizaje automático y aprendizaje profundo;
- Estructura analizada del ojo: disco óptico (OD);
- Métodos que incluyeron el proceso de clasificación de imágenes;
- Los factores de riesgo en la detección de glaucoma como la edad, la ascendencia familiar y la raza;
- Factor de impacto de la revista y número de cita del artículo;
- Los estudios publicados en los procedimientos fueron desconsiderados.
De acuerdo con estos criterios, se seleccionaron 40 artículos para una lectura integral. Posteriormente, se excluyeron las investigaciones que no incluían el paso de clasificación (que presentaba solo segmentación). En resumen, se eligieron 18 artículos para esta revisión: 10 de ellos incluyeron diversos enfoques de aprendizaje automático y los otros 8 incluyeron métodos con aprendizaje profundo.
Antecedentes
El glaucoma es una enfermedad neuropática que se caracteriza por la degeneración de las células ganglionares [ 2 , 3 ]. Por lo tanto, una atrofia de la fibra del nervio óptico es seguida por la erosión del tejido del borde, que se manifiesta como un agrandamiento de la copa. Actualmente, la detección de daños y cambios estructurales glaucomatosos es uno de los aspectos más desafiantes de los métodos de diagnóstico de la enfermedad [ 4 , 5 ]. Además, el glaucoma generalmente se diagnostica mediante el análisis de la presión intraocular (PIO), que debe ser superior a 22 mmHg sin medicación, el ahuecamiento glaucomatoso del disco óptico y los defectos del campo visual glaucomatoso [ 3 ].
Uno de los mayores desafíos con respecto al diagnóstico de glaucoma es el aspecto asintomático de la enfermedad antes de las etapas graves. De esta manera, el número de pacientes no diagnosticados es mayor que el número de diagnosticados [ 6 ]. Sin embargo, el tamaño y la forma del disco de la copa óptica es otro aspecto importante a tener en cuenta durante el diagnóstico de glaucoma [ 7 ]. Por lo tanto, el aumento vertical de la copa es una característica de la neuropatía óptica glaucomatosa. Al analizar la figura 1 c, d, es posible identificar un aumento en la copa si se compara con la figura 1 a, b. Ese es un signo claro de glaucoma.
Los principales tipos de glaucoma se pueden clasificar en dos categorías: glaucoma primario de ángulo abierto (POAG) y glaucoma primario de ángulo cerrado (PACG) [ 8 ]. Estos dos tipos se consideran las primeras etapas del glaucoma. Aún así, hay otra categoría llamada glaucoma secundario, que puede ser el resultado de un trauma, de algunos tipos específicos de medicamentos (p. Ej., Corticosteroides), inflamación, tumor u otras condiciones anormales [ 9 ].
No hay un patrón específico para el diagnóstico de glaucoma. Por lo tanto, determinar si el paciente tiene la enfermedad se convierte en una tarea complicada [ 10 ]. Entonces, la evaluación longitudinal y la documentación del daño estructural al nervio óptico son de suma importancia para el diagnóstico [ 11 ].
Se pueden usar diferentes instrumentos técnicos para ayudar al diagnóstico del glaucoma. Por ejemplo, la prueba de imagen retiniana, también conocida como imagen de fondo de ojo, es ampliamente utilizada entre los expertos en tecnología [ 3 ]. Del mismo modo, existen diferentes métodos utilizados para la detección del glaucoma.
Las imágenes de fondo de ojo permiten la identificación de las principales estructuras oculares, como el disco óptico (DO), la copa del disco óptico (copa OD), la región mácula [ 12 ], la fóvea [ 13 ] y los vasos sanguíneos [ 14 ]. Esta prueba también puede detectar condiciones anormales, incluidos microaneurismas, sangrado, exudados y manchas de algodón [ 15 ]. En cuanto a las principales ventajas de la imagen retiniana, se puede destacar la no invasividad, la seguridad, el bajo costo, la facilidad de adopción por parte de los oftalmólogos para el diagnóstico, la coloración completa y una mejor detección de hemorragias de disco.
Debido a sus características, las imágenes de fondo de ojo se usan ampliamente en el desarrollo de sistemas de soporte de diagnóstico. Dichos sistemas tienen como objetivo detectar y / o diagnosticar condiciones anormales mediante el análisis de imágenes médicas, actuando como una segunda opinión para el profesional de la salud [ 16 , 17 ]. Los sistemas de apoyo diagnóstico proporcionan decisiones clínicas para ayudar a los médicos con respecto a sus acciones para evitar diagnósticos erróneos o diagnósticos incompletos.
En el campo de la oftalmología, se han llevado a cabo varios estudios que tienen como objetivo desarrollar un sistema de apoyo para el diagnóstico. En los últimos años, muchos sistemas de apoyo han sido investigados en el campo oftálmico. Sin embargo, una de las limitaciones del desarrollo de sistemas es la diversidad de los exámenes. Con referencia a las imágenes de la retina, existen rasgos distintivos debido a su variación en los tipos de lesiones y al hecho de que difieren dentro de sí mismos [ 18 ].
Estadísticas
La discapacidad visual y la ceguera son causas importantes de discapacidad en todo el mundo [ 19 , 20 , 21 ]. En números de prevalencia, el glaucoma es la segunda enfermedad que causa tales afecciones [ 3 ]. Para examinar la prevalencia global de las variaciones de glaucoma POAG y PACG, así como para proyectar el número de personas afectadas en 2020 y 2040, Tham et al. [ 22 ] desarrolló una revisión sistemática y un metanálisis con datos de 50 estudios basados en la población. Por lo tanto, según los resultados, en 2020 el glaucoma afectará a alrededor de 80 millones de personas en todo el mundo. En cuanto a 2040, este número puede llegar a 1115 millones [ 22 ]. Esta predicción puede reflejar la característica asintomática de la enfermedad.
La tasa de incidencia de muchos tipos de glaucoma es otro aspecto importante, ya que varía en diferentes grupos raciales y étnicos [ 23 , 24 ]. La Tabla 1 muestra las estimaciones para cada continente. La estimación para Asia y África es que más de 85 millones de personas tendrán glaucoma para 2040.
Tabla 1 Proyección del número de personas (entre 40 y 80 años, en millones) con glaucoma primario en 2020 y 2040
Región mundial a | 2020 a | 2040 a |
---|---|---|
Asia | 46,24 (33,08−65,91) | 66,83 (48,39–93,77) |
África | 10,31 (6,41−15,28) | 19,14 (11,89–28,30) |
Europa | 7.12 (5.20−9.68) | 7.85 (5.76–10.55) |
Norteamérica | 3.94 (2.61−5.72) | 4.72 (3.13–6.75) |
América Latina y el Caribe | 8.11 (4.46−14.62) | 12.86 (7.12–22.85) |
Oceanía | 0.30 (0.16−0.50) | 0,42 (0,22–0,69) |
En todo el mundo | 76,02 (51,92–111,7) | 111,82 (76,50–162,9) |
Aprendizaje automático en el contexto del procesamiento de imágenes.
El desarrollo de nuevas tecnologías ha demostrado su relevancia para el diagnóstico y el tratamiento del glaucoma. Hasta este punto, las técnicas de aprendizaje automático (ML) han demostrado ser esenciales para obtener buenos resultados de investigación. Aún así, la característica principal de este enfoque es la resolución automatizada de tareas mediante un sistema computacional inteligente [ 25 ].
ML es un método de análisis de datos que automatiza la construcción de modelos analíticos, que se utilizan en una amplia gama de tipos de datos, incluidas las imágenes [ 26 ]. Mitchell [ 27 ] define el aprendizaje automático como la capacidad de mejorar el rendimiento en la realización de una tarea a través de la experiencia.
Los sistemas que usan ML pueden aprender de los datos, identificar patrones y tomar decisiones con una mínima intervención humana. Por lo tanto, en el contexto del modelado de diagnóstico utilizando el paradigma de clasificación, dicho proceso de aprendizaje se basa en la observación de datos como ejemplos. En esta situación, el modelo se construye aprendiendo de los datos junto con sus etiquetas anotadas.
Para usar algunos modelos ML cuando se producen problemas en el procesamiento de imágenes, es necesario reducir la cantidad de entradas de datos. Una imagen se puede transformar en millones de píxeles para tareas como clasificaciones. En este sentido, la entrada de datos dificultaría mucho el procesamiento. Luego, para hacerlo más fácil, la imagen se transforma en un conjunto reducido de características. Esta operación selecciona y mide las propiedades representativas de los datos de entrada sin formato en una forma reducida [ 28 ]. Además, dicho conjunto representa la información relevante requerida para realizar una tarea deseada. Se puede representar por color, textura, forma o una parte simple de la imagen [ 29 ].
Los objetivos principales de los estudios en este campo son identificar características para reducir los requisitos de memoria y tiempo de procesamiento, eliminar atributos irreversibles y simplificar el modelo generado. Los estudios anteriores generalmente aplicaban métodos de visión por computadora para extraer manualmente las características diseñadas. En consecuencia, algunos métodos utilizaron un método no basado en la segmentación, que diseña varias características, como la entropía [ 30 ], wavelet [ 31 ] o dimensiones fractales [ 32 ]. No obstante, los métodos alternativos aplican un enfoque basado en la segmentación, que genera medidas comunes para el diagnóstico de glaucoma.
La segmentación de la imagen es la separación de la región objetivo, las correspondientes al objeto del mundo real, del fondo de la imagen. Para este proceso, Cheng et al. [ 33 ] propuso un sistema de segmentación de disco óptico y copa óptica que utiliza la clasificación de superpíxeles. Además, Chrástek et al. [ 34 ] desarrolló un método para la segmentación de la cabeza del nervio óptico (ONH) cuya validación se basó en operaciones morfológicas. En ambas técnicas, la región objetivo se basa en las necesidades de aplicaciones específicas. Por lo general, corresponde a la cognición subjetiva y la experiencia del operador [ 35 ].
En los últimos años, se realizaron algunas revisiones para describir qué métodos automatizados se han aplicado en el diagnóstico de glaucoma. Díaz-Pinto y col. [ 36 ] empleó cinco modelos diferentes de aprendizaje profundo para evaluar el glaucoma. Sin embargo, Almazroa et al. [ 37 ] revisaron las metodologías y técnicas de segmentación para los límites del disco y la copa, las estructuras utilizadas para ayudar a diagnosticar el glaucoma. Mientras que el primer estudio se centró únicamente en los métodos de aprendizaje profundo, el segundo empleó solo técnicas heurísticas y de procesamiento de imágenes. Por otro lado, en la presente revisión, hemos analizado los métodos supervisados, categorizando los algoritmos de aprendizaje profundo y no profundo para el diagnóstico de glaucoma.
Tabla 2 Estudios principales con extracción de características
Métodos | Año | Datos | Preprocesamiento | Extracto de características | No. de características | El mejor clasificador a | Resultados a (%) | ||
---|---|---|---|---|---|---|---|---|---|
Acc | Sp | Sn | |||||||
Noronha y col. [ 38 ] | 2014 | 272 | Cambiar el tamaño de la imagen con el método de interpolación | Características acumulativas de orden superior | 35 | nótese bien | 92,65 | 100.00 | 92.00 |
Acharya y col. [ 39 ] | 2015 | 510 | Cambio de tamaño de imagen con ecualización de histograma | Transformación de Gabor | 32 | SVM | 90,98 | 91,63 | 91,32 |
Issac y col. [ 40 ] | 2015 | 67 | Cambio de tamaño de imagen con características estadísticas | Imagen de entrada recortada después de la segmentación | 3 | SVM | 94,11 | 90 | 100 |
Raja y col. [ 45 ] | 2015 | 158 | Conversión en escala de grises y ecualización de histograma | Transformación wavelet hiperanalítica | dieciséis | SVM | 90,14 | 85,66 | 94,30 |
Singh y col. [ 47 ] | 2016 | 63 | N / A | Extracción de la característica Wavelet | 18 años | k-NN | 94,75 | 100 | 90,91 |
Maheshwari y col. [ 30 ] | 2017 | 488 | Conversión en escala de grises | Descomposición en modo variacional | 4 4 | LS-SVM | 94,79 | 95,88 | 93,62 |
Soltani y col. [ 48 ] | 2018 | 104 | Ecualización de histograma y filtrado de ruido. | Transformación aleatoria de Hough | 4 4 | Lógica difusa | 90,15 | 94,80 | 97,80 |
Koh y col. [ 49 ] | 2018 | 2220 | N / A | Histograma piramidal de palabras visuales y vector de Fisher | 4 x 4 (cuadrícula) | RF | 96.05 | 95,32 | 96,29 |
Mohamed y col. [ 50 ] | 2019 | 166 | Selección de canales de color y corrección de iluminación. | Módulo de extracción de características Superpixel | 256 | SVM | 98,63 | 97,60 | 92,30 |
Rehman y col. [ 51 ] | 2019 | 110 | Filtrado bilateral | Características estadísticas basadas en intensidad e histograma de texto en mapa | 2 | SVM | 99,30 | 99,40 | 96,90 |
- a Solo se dejaron los mejores resultados obtenidos en cada método
- Clasificador k-NN, máquina de vector de soporte de mínimos cuadrados LS-SVM, RF de bosque aleatorio, ingenuo Bayes NB, máquina de vector de soporte SVM
Resultados
En esta sección, presentamos una descripción general de la literatura existente sobre algoritmos de aprendizaje automático para el procesamiento de imágenes retinianas. Inicialmente, se muestran los estudios que utilizan métodos de extracción de características (enumerados en la Tabla 2 ). Luego, se presentan específicamente técnicas de aprendizaje profundo, como las arquitecturas de redes neuronales convolucionales (CNN) (como se describe en la Tabla 3 ). Los métodos se abordan en el contexto de la detección del glaucoma. Finalmente, todas las métricas utilizadas para evaluar los resultados, así como sus valores, se resumen en las Tablas 2 y 3 .
Tabla 3 Principales estudios utilizando una red convolucional profunda
Métodos | Año | Arquitectura | Métricas (%) | ||
---|---|---|---|---|---|
Acc | Sp | Sn | |||
Li y col. [ 55 ] | 2018 | Inception-v3 | 92 | 95,6 | 92,34 |
Fu y col. [ 58 ] | 2018 | Red de conjunto con reconocimiento de disco (DENet) | 91,83 | 83,80 | 83,80 |
Raghavendra y col. [ 62 ] | 2018 | CNN de dieciocho capas | 98,13 | 98,3 | 98 |
dos Santos Ferreira y col. [ 63 ] | 2018 | U-net para segmentación y completamente conectado con deserción para clasificación | 100 | 100 | 100 |
Christopher y col. [ 65 ] | 2018 | ResNet50 | 97 | 93 | 92 |
Chai y col. [ 68 ] | 2018 | MB-NN | 91,51 | 92,33 | 90,90 |
Bajwa y col. [ 69 ] | 2019 | Cuatro capas convolucionales y capas completamente conectadas. | 87,40 | 85 | 71,17 |
Liu y col. [ 72 ] | 2019 | ResNet | 99,6 | 97,7 | 96,2 |
- a Solo se ingresaron los mejores resultados obtenidos en cada método
Ver fuente de información completa
Comentarios recientes