Code Monkey home page Code Monkey logo

sidi_projets_data-science's Introduction

Sidi_Projet_Data-Science

Au cours de ma formation de Full Stack à JEDHA Bootcamp, j’ai appris les langages de programmation (Python et SQL) et réalisé plusieurs projets (individuels et en Binôme) en data Science sur des sujets variés notamment en : Data Visualization, Machine Learning, Deep Learning (Image Processing et Natural Language Processing) avec l’utilisation de différentes librairies (Scikit-learn, Pandas, Numpy, Matplotlib, Seaborn, TensorFlow, Spacy).

Data Visualization :

Projet 1 -- Speed Dating Challenge

Dans ce projet, notre objectif principal était de comprendre chacune des variables présentes dans le dataset à l’aide d’une visualisation et d'exploration de données. Nous avons donc fait une analyse descriptive des principaux facteurs qui influencent le fait d'obtenir un deuxième rendez-vous lors Speed Dating.

Machine learning supervised & unsupervised :

Projet 2 -- Conversion rate challenge

Le Taux de Conversion web est un indicateur clé de performance permettant de mesurer la performance marketing d’un site web ou l’efficacité d’une campagne de web marketing. Optimiser des taux de conversion est une des tâches les plus importantes d'un Data Scientist. Dans ce projet, on nous demandait d'utiliser nos connaissances en Machine Learning Supervisé pour construire le meilleur modèle qui permettra de prédire le taux de conversion des clients sur un site web et faire des recommandations à l’équipe marketing afin d'augmenter ces revenus.

Projet 3 -- Fraudulent Activities - Challenge

Le but de ce projet était de construire un modèle qui permet de prédire la probabilité de transactions frauduleuses sur un site E-commerce. Nous avons utilisé un dataset provenant d'une entreprise anonyme qui vend des vêtements en ligne. Nous proposons plusieurs modèles afin de trouver la meilleure prédiction des transactions frauduleuses. Ce travail a été structuré de la manière suivante :

• L'exploration et la préparation des données, • La visualisation des données, • La corrélation des variables, • Les modèles de Machine Learning

Projet 4 -- UBER PICKUPS - Challenge

Le but de ce projet était d'optimiser les points stratégiques des chauffeurs Uber dans la ville de New York en utilisant les techniques de clustering en Machine Learning. Pour ce faire, nous avons essayé de répondre aux questions suivantes

• Trouver le nombre de clusters optimum qui permet aux chauffeurs UBER de maximiser leurs chances de trouver des courses en fonction des périodes de la journée

• Localiser ces clusters sur une map

• Regarder la différence entre KMeans et DBSCAN

Deep Learning (Image Processing and Natural Language Processing)

Projet 5 -- Détection d'Objet - YoloV3

La détection d'objets dans une image est un des grands sujets d'application du Deep Learning. Le principe est simple : en plus d'entrainer un algorithme à détecter et dire ce qu'il y a sur une image, il va être entrainé à dire où l'objet se trouve dans l'image. Compte tenu des difficultés à mettre en place tout le processus d'entrainement de l'algorithme, nous avons appris à l'utiliser grâce à ce dépôt GitHub : Implémenter YoloV3 Notre but était donc de Cloner ce dépôt sur notre dossier en local et de l'utiliser pour de la détection d'images.

Projet 6 -- NPL with Disaster Tweets

Twitter est devenu un canal de communication important en cas d'urgence. L'omniprésence des smartphones permet aux gens d'annoncer une urgence qu'ils observent en temps réel. C'est pourquoi de plus en plus d'agences (Organisations de secours en cas de catastrophe, Agences de presse, etc.) s'intéressent à la surveillance programmatique de Twitter. Mais il n'est pas toujours évident de savoir si les Tweets d'une personne annoncent réellement une catastrophe. Ici, notre objectif éait de prédire si un Tweet annonce une vraie catastrophe ou pas.

Projet 7 -- SMS SPAM DETECTOR

Dans ce projet, nous avons créer une application via le microframework (FLASK) qui permet à l'utilisateur d'entrer un SMS dans un formulaire. Ensuite, notre application devait être capable de lire ce message et de prédire si ce texte est un SPAM ou non.

Projet 8 -- Projet fin de formation (Predicting Primary School Achievement with School-Related and Socioeconomic Factors)

L'ojectif de ce travail est de prédire la réussite scolaire de l'élève compte tenu des caractéristiques socioéconomique de son milieu. Au passage, un accent est mis sur la distance qui sépare le domicile de l'élève et son école en prenant en compte les moyens d'accès à lécole. Mots clés: Data Exploration & Visualisation, Correlation Matrix, Machine Learning non-suprvisé (KMeans Clustering, DBSCAN), Machine Learning Supervisé (Random Forest, Grandient Boosting, AdaBoost, XGBoost)

sidi_projets_data-science's People

Contributors

sdoumbouya avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.