Code Monkey home page Code Monkey logo

santander-questions-classification's Introduction

Santander Questions Classification 2020 - Second Place

馃弲 TOP 3 - 0.86639

Exploraci贸n de datos y explicaci贸n de la soluci贸n:

https://github.com/jeffersonlicet/santander-questions-classification/blob/master/Informe.ipynb

Soluci贸n:

Indicaciones para entrenar los modelos:

Se adjuntan 4 archivos:

  • LSTM_GRU_0_86.ipynb Notebook con todo el c贸digo para entrenar los modelos basados en LSTM y GRU
  • BERT_0_86.ipynb Notebook con todo el c贸digo para entrenar el modelo basado en BERT
  • Informe.ipynb Notebook con el informe y el an谩lisis de datos.
  • assemble.py Script que ensambla las predicciones de los 3 modelo y genera un archivo listo para ser enviado a la competencia.

1: Entrenar los modelos:

Correr los notebooks preferiblemente en paralelo y utilizando Google Colaboratory.

  • LSTM_GRU_0_86.ipynb con GPU Activado
  • BERT_0_86.ipynb con TPU Activado

2: Descargar los archivos

Una vez finalizado el entrenamiento, que toma algo m谩s de una hora, ambos notebooks van a intentar descargar archivos, en caso de que no posean permisos para descargarlos por parte del browser puede intentar descargarlos manualmente.

3: Ensamblar la soluci贸n

Archivos que deben estar descargados y en el mismo directorio:

  • test_ids.npy Contiene los ids de los casos de testing
  • labels.npy Contiene los nombres de las clases mapeadas a indices
  • bert.npy Contiene la distribuci贸n de probabilidad calculada usando BERT
  • lstm.npy Contiene la distribuci贸n de probabilidad calculada usando LSTM
  • gru.npy Contiene la distribuci贸n de probabilidad calculada usando GRU

Con los archivos en el mismo directorio que el archivo assemble.py que se encuentra adjuntado realizar lo siguiete:

pip install numpy

y luego

python assemble.py

Finalmente se va a generar un archivo llamado submission.csv con las predicciones correspondientes.

Gracias.

santander-questions-classification's People

Contributors

jeffersonlicet avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    馃枛 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 馃搳馃搱馃帀

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google 鉂わ笍 Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.