Predicción en el diagnóstico de tumores de cáncer de mama empleando métodos de clasificación
DOI:
https://doi.org/10.36825/RITI.08.15.009Palabras clave:
Cáncer de Mama, Bosques Aleatorios, Redes Neuronales, Máquina de Soporte de Vectores, Métodos de ClasificaciónResumen
El presente trabajo consiste en la aplicación de las ciencias de datos con el objetivo de predecir si un tumor de cáncer de mama es benigno o no, para esto se emplean los métodos de clasificación siguientes: redes neuronales, bosques aleatorios y máquina de soporte de vectores. Se utilizó un conjunto de datos del Hospital de la Universidad de Wisconsin relacionados con el cáncer de mama. Se usan las matrices de confusión para conocer las medidas de los modelos de pronósticos y la curva ROC (Receiver Operating Characteristics) para determinar la capacidad discriminante de estos, apoyándose en el valor de AUC (Area Under the Curve). Los modelos planteados alcanzan valores de exactitud que indican que se pueden realizar con ellos predicciones muy acertadas, aunque es importante resaltar que el modelo de máquina de soporte de vectores es el que resulta más conveniente utilizar pues su nivel de exactitud en el pronóstico supera el 99%. Se recomienda el empleo de estas técnicas en los hospitales y laboratorios donde se realice la detección de esta enfermedad, pues puede constituir una herramienta de apoyo en el diagnóstico del cáncer de mama.
Citas
American Cancer Society. (2019). Surveillance, Epidemiology, and End Results (SEER). National Cancer Institute. Recuperado de: https://cancerstatisticscenter.cancer.org/?_ga=2.151790777.1241982100.1584820087-1304861891.1584820087#!/
MLData. (2018). Breast Cancer: Predict if tumor is benign or malignant. Recuperado de: https://www.mldata.io/dataset-details/breast_cancer/
Aldás, J., Uriel, E. (2017). Análisis Multivariante aplicado con R (2da Ed.). Madrid, España: Ediciones Paraninfo.
Hair, J. F., Anderson, R. E., Tatham, R. L., Black, W. C. (1999). Análisis Multivariante. Madrid: Prentice Hall.
Hodnett, M., Wiley, J. F. (2018). R Deep Learning Essentials (2da Ed.). UK: Packt Publishing Ltd.
Cirillo, A. (2017). R Data Mining. Implement data mining techniques through practical use cases and real-world datasets. Birmingham, Mumbai: Packt Publishing Ltd.
Villalba Bergado, F. (2017). Aprendizaje supervisado en R. Recuperado de: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html
del Castillo Collazo, N. (2020). Incidencias en el pronóstico al aplicar reducción de variables. Un ejemplo práctico. Revista de Investigación en Tecnología de la Información (RITI), 8 (15), 50-69. doi: https://doi.org/10.36825/RITI.08.15.006
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2020 Revista de Investigación en Tecnologías de la Información
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Esta revista proporciona un acceso abierto a su contenido, basado en el principio de que ofrecer al público un acceso libre a las investigaciones ayuda a un mayor intercambio global del conocimiento.
El texto publicado en la Revista de Investigación en Tecnologías de la Información (RITI) se distribuye bajo la licencia Creative Commons (CC BY-NC), que permite a terceros utilizar lo publicado citando a los autores del trabajo y a RITI, pero sin hacer uso del material con propósitos comerciales.