- Jorge Padilla
- Daniel Bustos
- Alain Ruales
Este repositorio contiene el código fuente usado para el proyecto final de Visualización de Datos. Para ello, se utilizó Python 3.10 y MySQL 8.0 para el almacenamiento de datos. La generación de datos aleatorios se llevó a cabo con la librería Faker y para la visualización de datos se utilizó Power BI.
El proyecto propuesto solventa las necesidades analíticas de la compañía Tracklink.ec. Para ello, se desea saber la efectividad de su nuevo aplicativo TrackltApp para captar nuevos clientes y determinar los puntos de mejora en base a las interacciones de los usuarios. Esta solución implementa un proceso ETL vinculado a una base de datos MySQL y permite visualizar los resultados en Power BI.
En este proyecto, se busca resolver las siguientes necesidades analíticas del negocio:
- Cantidad de ventas concretadas dentro del aplicativo móvil en base a un rango mensual variable.
- Principales motivos por los que las ventas no se han concretado.
- Principales regiones de clientes que utilizan la aplicación.
- Servicios más exitosos a nivel comercial dentro de la aplicación.
El proyecto está estructurado de la siguiente manera:
config
: directorio que contiene los archivos de configuración de la aplicación.etl_db.properties
: archivo de configuración de la base de datos de ETL.source_db.properties
: archivo de configuración de la base de datos fuente.
constants
: directorio que contiene los archivos de constantes de la aplicación.data
: directorio que contiene los archivos para la generación de datos aleatorios.csv
: directorio que contiene los archivos CSV con los datos generados.
etl
: directorio que contiene los scripts de ETL.extract
: directorio que contiene los scripts de extracción de datos.transform
: directorio que contiene los scripts de transformación de datos.load
: directorio que contiene los scripts de carga de datos.
docs
: directorio que contiene los manuales del proyecto.manual_instalacion.pdf
: manual de instalación de las herramientas necesarias para el proyecto.manual_ejecucion.pdf
: manual de ejecución del proyecto.
sql
: directorio que contiene los scripts SQL para la creación de tablas de la base de datos.etl
: directorio que contiene los scripts SQL para la creación de tablas de la base de datos de ETL.source
: directorio que contiene los scripts SQL para la creación de tablas de la base de datos fuente.
util
: directorio que contiene los archivos de utilidades de la aplicación.visualization
: directorio que contiene el archivo de visualización de datos en Power BI.config.py
: archivo de configuración de la aplicación.data_setup.py
: archivo que genera los datos aleatorios.etl_process.py
: archivo que ejecuta el proceso de ETL.
Para la instalación de las herramientas necesarias para el proyecto, se debe seguir el manual de instalación disponible en el directorio docs
.
Para la ejecución del proyecto, se debe seguir el manual de ejecución disponible en el directorio docs
.