Code Monkey home page Code Monkey logo

openclassroomsproject-p2's Introduction

Logo

OpenClassrooms Projet P2

Objectif

Books Online est une importante librairie en ligne spécialisée dans les livres d'occasion. À l'origine, Books Online essayait de suivre manuellement les prix des livres d'occasion sur les sites web de ses concurrents, mais cela représentait trop de travail : il y a trop de livres et trop de librairies en ligne ! L'objectif de ce projet est d'automatiser cette tâche laborieuse via un programme (un scraper) développé en Python, capable d'extraire les informations tarifaires d'autres librairies en ligne.

Compétences acquises

  • Gérer les données à l'aide du processus ETL
  • Utiliser le contrôle de version avec Git et GitHub
  • Appliquer les bases de la programmation en Python

Technologies Utilisées

Requirements

  • beautifulsoup4
  • certifi
  • charset-normalizer
  • idna
  • requests
  • soupsieve
  • urllib3

Architecture et répertoires

Project
├── scrapper.py : script principal
├── requirements.txt
│
├── donnees_resultat : répertoire contenant les résultats après lancement du script

Configuration locale

Installation

1. Récupération du projet sur votre machine locale

Clonez le repository sur votre machine.

git clone https://github.com/GDSDC/OpenclassroomsProject-P2.git

Accédez au répertoire cloné.

cd OpenclassroomsProject-P2

2. Création d'un environnement virtuel

Créez l'environnement virtuel env.

python3 -m venv env

3. Activation et installation de votre environnement virtuel

Activez votre environnement virtuel env nouvellement créé.

source env/bin/activate

Installez les paquets présents dans la liste requirements.txt

pip install -r requirements.txt

Utilisation

Lancer simplement le script python scraper.py présent à la source du dossier de travail.

python scraper.py

Résultat

Une fois le script exécuté, le résultat se trouve dans le dossier donnees_resultat/. Vous y trouverez les fichiers CSV correspondant aux informations de tous les livres de chaque catégorie de livre présente sur le site https://books.toscrape.com/index.html.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.