Code Monkey home page Code Monkey logo

pfi_anderson_pardo's Introduction

Valorar.ar - Exploration

Repositorio de pruebas para la solución Valorar.ar. Contiene tanto trabajos de análisis exploratorio como modelado de machine learning

Requerimientos

  • Python 3.10 +

Instalación

Antes de comenzar con la instalación, se deben configurar las variables de entorno a ser utilizadas por la aplicación. Crear una copia del archivo .env_example y llamarla .env. Completar el archivo con la información requerida.

Realizar la instalación de las librerias con el siguiente comando:
pip install -r requirements.txt

Guía de Repositorio

El repositorio se encuentra dividido en dos carpetas principales, Price y Sentiment.

Price

Aquí se podran encontrar los distintos trabajos realizados en relación a la estimación de precio de alquiler.

Dentro de la carpeta Exploration se podrán encontrar los distintos notebooks que fueron utilizados tanto para realizar un análisis de datos sobre la informacion como para las tareas de normalización.

A partir de estos, se generaron los llamados Processors que son versiones cortas del proceso de normalización, utilizado como forma de ETL.

Tenemos también el archivo machine_learning.ipynb. Aquí se realizaron las distintas pruebas de los modelos de machine learning a ser utilizados en la solución. En este archivo se podrán encontrar los modelos finales utilizados y los distintos parámetros utilizados para las tareas de búsqueda de hiperparámetros o grid search

El archivo best_model.ipynb contiene el modelo que mejor performa hasta la fecha.

Por último, se encuentra el archivo predictor.py, el cual genera una estimación de precio de renta a partir de nueva información, utilizando el mejor modelo generado a partir de las tareas de machine learning.

Sentiment

Aquí se podrán encontrar las tareas tanto de recolección de notas periodisticas como el "cálculo" de opinion.

El archivo principal es sentiment_processor.py. Este archivo se encarga de realizar tareas de scrapping de los diarios Clarín, Página 12, La Nación, Ámbito Financiero e Infobae en busca de noticias relacionadas al mercado inmobiliario.

Una vez que se recoleccionan las noticias, se analiza la opinion de la misma para luego dejar la información en la base de datos.

pfi_anderson_pardo's People

Contributors

meli-manderson avatar handerllon avatar leonardopardo avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.