Code Monkey home page Code Monkey logo

avalimovel's Introduction

Avaliador de Imóveis

Solução completa de Data Science: Avaliador de imóveis da cidade de Ponta Grossa - PR.
Desenvolvido desde a definição do problema, coleta, limpeza e análise dos dados, até a modelagem e disponibilização dos resultados em uma aplicação web. Projeto final do curso Como criar uma solução completa de Data Science.

Etapas do Projeto

1 - Definição do Problema

O problema principal abordado nesse projeto é a precificação de imóveis. Será possível criar uma solução automatizada que faça a avaliação de imóveis? Suponhamos que você seja um corretor de imóveis, porém está sem tempo para avaliar os diversos imóveis que recebe dos seus clientes. Com a solução apresentada aqui é possível precificar imóveis somente com as principais características do imóvel.

2 - Coleta dos Dados scraping.ipynb

A coleta dos dados foi feita através de WebScraping do site Procure Imóvel. Foram coletadas todas as casas disponíveis do site no dia 19 de Junho de 2020. Para essa etapa foi utilizado a biblioteca BeatifulSoup. A páginas html foram baixadas do Procure Imóveis e os dados foram coletados de cada imóvel. Todo o código do scraping está no arquivo scraping.ipynb.

O dataset criado nesse projeto foi publicado no Kaggle Casas à Venda - Ponta Grossa PR

3 - Preparação dos Dados dataCleaning.ipynb

Como ss dados coletados das páginas html são "sujos" é importante que a Limpeza e Preparação dos dados seja bem feita. Foram feitas limpezas de características com muitos dados faltantes e limpeza de alguns dados absurdos. Nessa etapa utilizou-se principalmente da biblioteca Pandas e Numpy. O código pode ser visualizados no arquivo dataCleaning.ipynb

4 - Análise de Dados EDA.ipynb

Etapa do projeto onde são extraídas algumas informações dos dados. Foram analisadas as distribuições dos valores, as tendências dos imóveis em relação ao preço e a correlação entre as variáveis. Nessa etapa foi utilizado principalmente matplotlib e seaborn. EDA.ipynb

5 - Modelagem modelo.ipynb

Nessa etapa foi criado o modelo de regressão que fará a precificação dos imóveis. Nessa etapa o dataset foi dividido entre treino e validação e foram criados modelos (RandomForest e LightGBM) para a tarefa. Após a criação do modelo foi executado o tuning dos hiperparâmetros com Random Search e Bayesian Optimization, melhorando o modelo em 10% na sua métrica primária.

Tecnologias utilizadas

  • Linguagem de Programação: Python
  • IDE: Jupyter Lab
  • Bibliotecas:
    • beautifulsoup4==4.8.2
    • joblib==0.14.1
    • numpy==1.19.0
    • Flask==1.1.1
    • lightgbm==2.3.1
    • numpy==1.19.0
    • pandas==1.0.4
    • requests==2.22.0
    • scikit-learn==0.23.1
    • scikit-optimize==0.7.4
    • scipy==1.5.1
    • seaborn==0.10.0
    • statsmodels==0.11.0
    • tqdm==4.42.1
    • matplotlib==2.1.2

Kaggle

Com os dados coletados na parte do scraping foi criado um dataset com as casas à venda da cidade de Ponta Grossa - PR. O dataset está disponível no Kaggle Casas à Venda - Ponta Grossa PR.

Contato

Victor Stein - LinkedIn

avalimovel's People

Contributors

vitorstein avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.