Predicción en el diagnóstico de tumores de cáncer de mama empleando métodos de clasificación

Autores/as

DOI:

https://doi.org/10.36825/RITI.08.15.009

Palabras clave:

Cáncer de Mama, Bosques Aleatorios, Redes Neuronales, Máquina de Soporte de Vectores, Métodos de Clasificación

Resumen

El presente trabajo consiste en la aplicación de las ciencias de datos con el objetivo de predecir si un tumor de cáncer de mama es benigno o no, para esto se emplean los métodos de clasificación siguientes: redes neuronales, bosques aleatorios y máquina de soporte de vectores. Se utilizó un conjunto de datos del Hospital de la Universidad de Wisconsin relacionados con el cáncer de mama. Se usan las matrices de confusión para conocer las medidas de los modelos de pronósticos y la curva ROC (Receiver Operating Characteristics) para determinar la capacidad discriminante de estos, apoyándose en el valor de AUC (Area Under the Curve). Los modelos planteados alcanzan valores de exactitud que indican que se pueden realizar con ellos predicciones muy acertadas, aunque es importante resaltar que el modelo de máquina de soporte de vectores es el que resulta más conveniente utilizar pues su nivel de exactitud en el pronóstico supera el 99%. Se recomienda el empleo de estas técnicas en los hospitales y laboratorios donde se realice la detección de esta enfermedad, pues puede constituir una herramienta de apoyo en el diagnóstico del cáncer de mama.

Citas

American Cancer Society. (2019). Surveillance, Epidemiology, and End Results (SEER). National Cancer Institute. Recuperado de: https://cancerstatisticscenter.cancer.org/?_ga=2.151790777.1241982100.1584820087-1304861891.1584820087#!/

MLData. (2018). Breast Cancer: Predict if tumor is benign or malignant. Recuperado de: https://www.mldata.io/dataset-details/breast_cancer/

Aldás, J., Uriel, E. (2017). Análisis Multivariante aplicado con R (2da Ed.). Madrid, España: Ediciones Paraninfo.

Hair, J. F., Anderson, R. E., Tatham, R. L., Black, W. C. (1999). Análisis Multivariante. Madrid: Prentice Hall.

Hodnett, M., Wiley, J. F. (2018). R Deep Learning Essentials (2da Ed.). UK: Packt Publishing Ltd.

Cirillo, A. (2017). R Data Mining. Implement data mining techniques through practical use cases and real-world datasets. Birmingham, Mumbai: Packt Publishing Ltd.

Villalba Bergado, F. (2017). Aprendizaje supervisado en R. Recuperado de: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

del Castillo Collazo, N. (2020). Incidencias en el pronóstico al aplicar reducción de variables. Un ejemplo práctico. Revista de Investigación en Tecnología de la Información (RITI), 8 (15), 50-69. doi: https://doi.org/10.36825/RITI.08.15.006

Publicado

2020-05-06

Cómo citar

del Castillo Collazo, N. (2020). Predicción en el diagnóstico de tumores de cáncer de mama empleando métodos de clasificación. Revista De Investigación En Tecnologías De La Información, 8(15), 96–104. https://doi.org/10.36825/RITI.08.15.009

Número

Sección

Artículos