Ce projet vise à explorer un jeu de données sur l'immobilier en France à l'aide de techniques de big data et de l'analyse de données en Python. Il nous permet de récupérer des données de site tel que seLoger.com, leboncoin, logic immo et beaucoup d'autres..
- Python 3.x
- Les bibliothèques suivantes :
- Pandas,
- BeautifulSoup,
- Selenium,
- Jupyter
-
Clonez ce dépôt sur votre ordinateur local (git clone https://github.com/NabiilS/HouseScape.git)
-
Ouvrir le dossier avec Visual Studio Code
-
Ajouter python dans les variables d'environnement PATH (ajouter script et libs)
-
Installez les bibliothèques requises en exécutant les commandes suivantes:
- pip install pandas
- pip install bs4
- pip install selenium
- pip install jupyter
- pip install seaborn
- pip install scikit-learn
-
Une fois que Jupyter est installé, ajouter jupyter aux variables d'environnements. Procédure pour windows: CTRL X -> Système -> Paramètres avancés du système -> variables d'environnements -> variables sytèmes -> double clique sur PATH -> Ajouter le fichier de destionation de l'installation de Jupyter,
- C:\Users\Admin\AppData\Roaming\Python\Python310\Scripts
- C:\Users\Admin\AppData\Roaming\Python\Python310\site-packages Ou alors on peut vérifier l'emplacement de l'installation avec pip show jupyter
- Lancer Visual Sudio
- Exécutez le script principal
houseScape.py
en utilisant la commandepython houseScape.py
- Exécutez jupiter notebook pour consulter l'affichage des données au propre
Nous sommes toujours ouverts aux contributions et suggestions pour améliorer ce projet. N'hésitez pas à soumettre des suggestions afin que nous puissions améliorer notre projet de groupe :)
Souleymane - Soufiane - Yanice - Nabil