Daniel H. Martínez S. - UdeA
dhumberto.martinez@udea.edu.co
La histopatología es el estudio y diagnóstico de una enfermedad mediante el examen microscópico de una biopsia que se procesa y se fija en un portaobjetos de vidrio. Para visualizar diferentes componentes del tejido, las secciones se tiñen con tintes con el objetivo de revelar los componentes celulares. Los patólogos han utilizado la tinción con hematoxilina-eosina (H&E) durante más de 100 años [1-3].
Figura 1. Imagenes de histopatología digitalizada, a) muestras pertenecientes de la clase 1 (con cáncer en la región central), b) muestras pertenecientes de la clase 0 (sin cáncer en la región central), c) selección de la región central para la clase 1 y d) white-padding en la región central de la clase 0.
Para este proyecto se ha seleccionado una competencia de Kaggle sobre detección histopatológica del cáncer, la cual estuvo activa desde el 16/10/2018 hasta el 30/03/2019. En este proyecto se debe crear un algoritmo para identificar el cáncer de tejido metastásico en pequeños recortes de imágenes tomadas de exploraciones patológicas digitales más grandes. Los datos son una versión de los datos de referencia de PacthCamelion (PCam) que a su vez son derivados de los datos de CAMELYON16 [4-7].
El objetivo del proyecto es predecir la probabilidad de que en la región central
$(32\times32\ pix)$ de la imagen, contenga al menos un pixel de tejido tumoral. Para estudiar este problema de clasificación, se seleccionaron de forma aleatoria 5400 imágenes las cuales estan divididas en archivos <25M en la carpeta data.
En este proyecto la métrica de validación utilizada fue el AUC (Area under the receiver operating characteristic curve) entre la probabilidad predicha y el objeto observado.
Esta métrica es igual a la probabilidad de que un clasificador clasifique una muestra aleatoria positiva más alta que una muestra aleatoria negativa.
Para entender esto es importante saber que los falsos negativos (muestras con cáncer detectadas como negativas) y los falsos positivos (muestras sin cáncer detectadas como positivas), son muestras que se clasificaron incorrectamente. Por el contrario, los verdaderos negativos (muestras sin cáncer detectadas como negativas) y los verdaderos positivos (muestras con cáncer detectadas como positivas) son muestras que se clasificaron correctamente. Esta información se cuantifica en la matriz de confusión.
• 01– Exploración de datos: Se estudia el número de imágenes y clases, luego se selecciona una muestra de 5400 imágenes localizada en la carpeta data con el fin de facilitar su análisis y el posterior entrenamiento de diferentes modelos.
• 02 – Estudio de la métrica AUC: Se separan de los datos train
, val
y test
. Se crea un modelo de prueba para evaluar el comportamiento de diferentes métricas de validación para un clasificador biclase como el AUC, el Recall, la matriz de confusión, entre otros.
• 03 – Aplicación de modelos de CNN: Se prueban diferentes arquitecturas de Redes Neuronales Convolucionales (CNN), variando tanto el número como el tipo capas. Se evalúan 6 modelos (A, B, C, D, E y F) en función de las métricas de validación (en los moedelos C, D, E y F se aplica transfer learning).
• 04 – Modelos con datos aumentados: Con el objetivo de intentar disminuir el overfiting encontrado en los resultados del notebook 03
, se prueban los 6 modelos en un nuevo dataset con datos aumentados. Para lograr esto, se utilizan las imágenes iniciales y se les agrega un white-padding (wp) en la región central a las muestras que no tienen células cancerígenas (clase 0
), mientras que a las muestras que tienen cáncer (clase 1
), se hace el wp en la región por fuera del centro. Con estas nuevas imágenes se aumentan los datos del entrenamiento.
• 05 – Modelos con datos aumentados - 02: Con el objetivo de intentar disminuir el overfiting se realiza un procedimiento similar al notebook 04
, pero aumentando los datos de entrenamiento solo realizando el wp a las muestras que no tienen células cancerígenas (clase 0
).
En general los modelos presentan overfiting. De acuerdo a las ideas expresadas en los notebooks 04
y 05
, se aumentó el tamaño de los datos de entrenamiento. Las iteraciones anteriores arrojaron los siguientes resultados respecto a la métrica AUC:
Modelos | |||
---|---|---|---|
A | 0.650 | 0.719 | 0.680 |
B | 0.717 | 0.784 | 0.758 |
C | 0.868 | 0.891 | 0.830 |
D | 0.902 | 0.732 | 0.863 |
E | 0.937 | 0.913 | 0.914 |
F | 0.905 | 0.884 | 0.912 |
Donde
Estos resultados nos muestras que con la estrategia de wp se mejora el score solo en los modelos A, B, C para
Algunas ideas para continuar mejorando el score podrían ser aumento de color, normalización de la tinción o alineación de dominios con GAN (Generative Adversarial Networks) [8].
- Se obtuvo un AUC de 0.937 con el Modelo-E correspondiente a la implementación de transfer learning del modelo Xception, superando una implementación análoga con los modelos Resnet50 e InceptionV3.
- La metodología implementada de aumento de datos, tuvo mejor desempeño en la variante de White-padding a ambas clases, pero no superaron el score del modelo-E utilizando los datos originales.
[1] M. N. Gurcan, L. E. Boucheron, A. Can, A. Madabhushi, N. M. Rajpoot, and B. Yener, “Histopathological Image Analysis: A Review,” IEEE Rev Biomed Eng, vol. 2, pp. 147–171, 2009, doi: 10.1109/RBME.2009.2034865.
[2] American Cancer Society, “Lymph Nodes and Cancer.” Accessed: Sep. 27, 2023. [Online]. Available: https://www.cancer.org/content/dam/CRC/PDF/Public/7902.00.pdf
[3] H. West and J. Jin, “Lymph Nodes and Lymphadenopathy in Cancer,” JAMA Oncol, vol. 2, no. 7, p. 971, Jul. 2016, doi: 10.1001/jamaoncol.2015.3509.
[4] B. E. Bejnordi et al., “Stain Specific Standardization of Whole-Slide Histopathological Images,” IEEE Trans Med Imaging, vol. 35, no. 2, pp. 404–415, Feb. 2016, doi: 10.1109/TMI.2015.2476509.
[5] B. S. Veeling, J. Linmans, J. Winkens, T. Cohen, and M. Welling, “Rotation Equivariant CNNs for Digital Pathology,” Jun. 2018.
[6] C. Szegedy et al., “Going Deeper with Convolutions,” Sep. 2014.
[7] W. Cukierski, “Histopathologic Cancer Detection.” Kaggle, 2018. [Online]. Available: https://kaggle.com/competitions/histopathologic-cancer-detection
[8] Stacke, K., Eilertsen, G., Unger, J., & Lundström, C. (2021). "Measuring Domain Shift for Deep Learning in Histopathology". IEEE Journal of Biomedical and Health Informatics, 25(2), 325–336. https://doi.org/10.1109/JBHI.2020.3032060