Trabajo para la asignatura de estadistica del grado de ingeneria informatica de la UPV.
- Juan Martinez Alonso
- Alejandro Muñoz Zafra
El objetivo del trabajo es hacer un estudio estadistico a partir de unos datos. En nuestro caso, hemos usado un dataset de kaggle a cerca de medio millon de repositorios publicados en GitHub.
Para el analisis de datos hemos usado Python y las siguientes librerias principalmente:
- numpy: para manipular series de datos
- pandas: para leer, describir y manipular los datos
- matplotlib: para graficar los datos
- scipy: en concreto
scipy.stats
para calcular estadisticos y graficos - distfit: para el ajuste de distribuciones