Aquesta pràctica s'ha realitzat sota el context de l'assignatura Tipologia i cicle de vida de les dades, del Màster en Ciència de Dades de la Universitat Oberta de Catalunya. En aquesta pràctica s'apliquen tècniques de web scraping mitjançant el llenguatje de programació Python per extreure així les dades dels jugadors de les lligues de futbol professionals espanyoles de la pàgina web Marca i generar un dataset.
L'activitat ha estat realitzada en conjunt pels següents integrants:
- Marc López Vila.
- Eduard López i Fina.
- source/main.py: punt d'entrada al programa. Inicia el procés de scraping.
- src/scraper.py: conté la implementació de la classe PlayerScraper els mètodes de la qual generen el conjunt de dades a partir dels links de primera i segona divisió.
L'enllaç del DOI del Dataset resultant: https://doi.org/10.5281/zenodo.7795945