Code Monkey home page Code Monkey logo

data-insight-assessment's Introduction

Data Insight Assessment 🔭

Pô, mais um teste?

Devido à natureza remota da vaga e os desafios técnicos envolvidos, entendemos que uma das melhores —e mais justas— formas de saber quem você é, profissionalmente, seja através de uma amostra de seu trabalho 🤝

No entanto, sabemos que fazer testes para pleitear uma vaga envolve uma medida considerável de esforço. Mais esforço ainda se este é um trabalho que envolve análise e manipulação de dados: Estimamos que você possa gastar em torno de 10h para concluir o projeto a fim de cumprir com as expectativas. Portanto, em virtude do investimento realizado por sua parte, nos comprometemos a emitir uma avaliação detalhada do trabalho enviado, independentemente do resultado do processo seletivo.

O Desafio

O desafio envolve analisar campanhas de marketing de uma institiução bancária. Nas campanhas é vendido ao cliente um produto adicional de débito automático. Queremos saber se um determinado cliente se inscreve ou não ao produto. Portanto, é um problema de classificação:

  1. ou o cliente se inscreve
  2. ou o cliente não se inscreve

O Objetivo

É importante ressaltar que não se trata de uma competição de problemas de machine learning: não queremos o melhor escore do modelo e sim a sua melhor análise. Portanto, o objetivo deste desafio não é escovar os 3% de otimização na performance. E sim, a análise mais clara e objetiva que vai, consequentemente, permitir aos stakeholders entender melhor os dados e quais são os possíveis planos de ação e suas respectivas argumentações.

Portanto, em termos claros, os objetivos —e entregáveis— deste desafio podem ser divididos em duas categorias:

  1. Code:

    1. Implementar um modelo de classificação com uma performance aceitável

      1. O aceitável é explicitamente arbitrário. Aceitável de modo que viabilize uma análise estatisticamente fundamentada
    2. Conjunto de dados contendo a coluna da previsão, y'

  2. Insight:

    1. Elencar e analisar quais features são determinantes para aderência de um cliente ao produto
    2. Descrever um plano de ação para futuras campanhas de marketing fundamentado na análise deste conjunto de dados

Os critérios

O que será avaliado pode ser dividido em duas categorias de capacidades

Analíticas: de exploração de dados

  1. na exploração uni e multivariada dos dados
  2. para correção e transformação de dados (quando for necessário)
  3. para encontrar e responder às perguntas certas
  4. para decidir quais visualizações devem ser feitas (e quais devem permanecer na análise)
  5. para entender o comportamento estatístico das variáveis e seu peso na orientação das análises

Problemas: de aprendizado de máquina

  1. na definição de quais métricas vão ser usadas para avaliar a performance
  2. na apresentação e análise dos resultados obtidos
  3. na avaliação do over-underfitting do(s) modelo(s) (e o que pode ser feito para minimizar estes efeitos)
  4. no manuseio das features: avaliação de importância, da seleção e criação/transformação

Insumos

O que você precisa para realizar as análises:

  1. data/campaigns.csv: O conjunto de dados
  2. data/campaigns-names.txt: Breve anotação das colunas, em inglês

O conjunto de dados não foi separado em treino e validação. No entanto, foi separada uma amostra aleatória com 10% do volume total dos dados. Esta amostra é o conjunto de teste e será usado para avaliação das entregas.

Disclaimer: Este conjunto de dados está disponível publicamente para pesquisa. Como não se trata de um artigo acadêmico, a citação será feita pela referência sugerida pela política de citação do centro de pesquisa: Dua, D. and Graff, C. (2019). UCI Machine Learning Repository.

Regras

  1. Qualquer tipo de plágio e/ou cópia de análises e artigos é veementemente proibido e desclassificatório
  2. O notebook deve ser no formato jupyter
  3. A linguagem de implementação deve ser python, da versão 3.6+
  4. É liberado (e encorajado) o uso de quaisquer framework e bibliotecas publicadas com licenças para uso e redistribuição
    1. auto-sklearn, pandas, numpy, plotly, etc
  5. O idioma da análise pode ser português ou inglês

O que devo fazer para entregar?

Temos um checklist pra isso:

  • Fazer um fork deste repositório
  • Prepare um café
  • 🔬 Trabajo 🔬
  • Certifique que o trabajo realizado cumpre os requisitos e segue as orientações
  • Revise-o
  • Esteja satisfeit@ com a revisão
  • Abra um PR para este repositório e notifique a Zi

🤘 É isto. Boa sorte 🤘


Ficou com dúvida sobre alguma coisa? Mande um e-mail para [email protected]

data-insight-assessment's People

Contributors

ruiconti avatar johndelara1 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.