Una plantilla de CookieCutter para ETLs en Python.
βββ config <- AcΓ‘ va el archivo .env y otros archivos
β de configuraciΓ³n.
β
βββ data <- Almacena los datos procesados y los datos crudos
β β organizados en carpetas.
β βββ processed
β βββ raw
β
βββ docs <- AcΓ‘ va la documentaciΓ³n del proyecto en
β formatos .md, .pdf, etc.
β
βββ log <- Contiene los archivos de registro.
β
βββ models <- Almacena los modelos necesarios para ML o DBs.
β
βββ notebooks <- AcΓ‘ van los archivos de Jupyter notebooks.
β
βββ scripts <- Almacena los archivos principales del ETL.
β
βββ test <- Contiene los tests automatizados.
β
βββ utils <- AcΓ‘ van los mΓ³dulos auxiliares y las bibliotecas
β que se reutilizan en el proyecto.
β
βββ .gitignore <- Ficheros que Git ignorarΓ‘.
β
βββ environment.yml <- Manifiesto utilizado por Conda.
β
βββ requirements.txt <- Enlista todas las librerΓas de Python necesarias
β y sus versiones para que el proyecto funcione.
β
βββ README.md <- El README principal.
python -m venv env
-
En Windows:
env\Scripts\activate
-
En Unix o MacOS:
source env/bin/activate
pip install cookiecutter
cookiecutter https://github.com/natayadev/cookiecutter4etls.git
Hecho por Nataya Flores (@natayadev), espero que te sea ΓΊtil.