El presente trabajo corresponde a una de las actividades realizadas en la asignatura de Machine Learning Aplicado, impartida por el Dr. Julio Waissman Vilanova en el semestre 2022–1, que forma parte del conjunto de materias de la Maestría en Ciencia de Datos de la Universidad de Sonora. El proyecto en formato de artículo está disponible en este enlace de Medium.
El objetivo es presentar algunas de las métricas y herramientas más utilizadas para la evaluación de los resultados otorgados por un algoritmo de clasificación binaria. Estos conceptos se abordarán desde un punto de vista práctico atacando una problemática del área de la medicina y se trabajará con datos reales utilizando Python. El desarrollo se describe en la libreta clasificacion_binaria.ipynb
.
La información original contenida en el archivo data/IndicesMalignidad.csv
fue recabada por el Dr. Carlos Dávila Portillo y se conforma de observaciones reales de mujeres atendidas en el Hospital Integral de la Mujer del Estado de Sonora en el periodo comprendido de enero de 2011 a diciembre de 2016. Se aplicó una corrección a los índices siguiendo el procedimiento descrito en la libreta correccion_indices.ipynb
, de donde resultó el archivo data/IndicesMalignidadV2
que es el que se utiliza en el proyecto.