Code Monkey home page Code Monkey logo

data-science's Introduction

El objetivo de este proyecto es realizar un primer análisis exploratorio sobre un dataset, partiendo de la importación de las bibliotecas necesarias para la exploración y descripción de los datos. Para este análisis se utilizan las bibliotecas Pandas, Numpy, Seaborn y MatplotLib.

El objetivo de este proyecto es continuar con la limpieza de datos, aplicando diferentes técnicas para remover valores faltantes y outliers, también agregar nuevos atributos al DataFrame.

El objetivo general de este proyecto es armar un modelo sencillo para predecir el precio de propiedades en dólares, utilizando DecisionTreeRegressor y KNeighborsRegressor de Scikit-learn. El objetivo específico es lograr mayor precisión en la predicción del modelo, para ello se trabaja en el ajuste de los parámetros y su evaluación. La métrica utilizada es RMSE (raíz del error cuadrático medio) y se trabaja sobre un Dataset sobre propiedades a la venta, el cual ya ha sido limpiado.

El objetivo de este proyecto corto se centra en optimizar los parámetros sobre el modelo Decision Tree utilizado en el proyecto Modelos de Predicción, por ello se sigue trabajando con el dataset filtrado y transformado a partir de los datos de propiedades en venta publicadas en el portal Properati. Se utiliza el RMSE (raíz del error cuadrático medio) como métrica.

El objetivo de este proyecto, es realizar una clasificación de comentarios de acuerdo al sentimiento positivo o negativo expresado en ellos. El análisis se realiza en un conjunto de datos sobre reviews de películas y se trabaja con procesamiento de texto para luego aplicar diferentes técnicas predictivas. En este caso no se utiliza un archivo '.csv', sino con un directorio estructurado.

En este proyecto se construye un sistema de recomendación de películas utilizando la librería Surprise para su creación y análisis. Se trabaja sobre el dataset de versión 100k de MovieLens el cual se basa en un sistema de rating de cinco estrellas y texto libre para tags. Contiene 100.000 ratings para 1.682 películas con datos creados por 943 usuarios, los cuales calificaron al menos 20 películas cada uno. Además, se emplean otras librerías como MatPLotLib, Numpy y Collections.

data-science's People

Contributors

viviancaro avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.