Code Monkey home page Code Monkey logo

work-at-olist-data's Introduction

Teste prático (work-at-olist-data)

Esta é a página sobre o teste prático para os candidatos ao processo seletivo de cientistas, analistas e engenheiros de dados para o time de Business Science & Analytics do olist.

Conhecendo nosso time de dados:

BSA: um time de pessoas que vão além das ferramentas e números

Cenário

O olist é a maior loja de departamentos dos marketplaces. Possui um catálogo com mais de 950 mil produtos, centenas de milhares de pedidos e uma rede de mais de 9 mil lojistas parceiros espalhados por todas as regiões do Brasil. Entendemos que a área de dados e inteligência é uma das principais alavancas de crescimento do negócio, por isso buscamos profissionais apaixonados por dados para integrar a nossa equipe de Business Science e Analytics (BSA).

Estamos o tempo todo gerando dados, dados e muito mais dados. Nosso cenário é de big data!

Como é o nosso banco de dados?

Considere que a figura abaixo seja a estrutura do nosso banco de dados de e-commerce e que cada tabela desse banco de dados esteja disponível como um dataset. Aqui estão os datasets. Perceba que os dados são amostrais e estão apresentados no modelo relacional, pois foram extraídos diretamente, sem qualquer tratamento, do ambiente transacional.

Estrutura do Banco de Dados

Bom, e aqui você pode observar como um produto é exibido na plataforma de e-commerce.

Exemplo de produto exibido na plataforma

Desafio

Esta plataforma de e-commerce transaciona dados do varejo brasileiro. Assim, as áreas de negócio da empresa estão com algumas dúvidas e desafios como:

  • Será que nossos diferentes lojistas associados conseguem manter o preço do mesmo produto sem grandes discrepâncias?
  • Podemos dar os mesmos benefícios para todos os lojistas (sellers)? Ou existe algum que merece destaque?
  • Existe diferença no valor do frete praticado em regiões/cidades diferentes? Ou podemos aplicar as mesmas regras de subsídio de frete para qualquer localidade?
  • Será que nosso catálogo de produtos é abrangente? Ou tem foco em categorias específicas?
  • Será que sempre vendemos os mesmos produtos? Ou existem sazonalidades?
  • Será que existe um modelo preditivo para nos preparar para o futuro?
  • Será que o atual banco de dados vai suportar o nosso crescimento? Ou existe uma opção mais escalável?

Ficou confuso(a). Segue abaixo, dicas mais específicas para cada função.

Cientista de dados

  • Que tal uma análise textual dos clientes que deixaram comentários sobre suas compras?
  • Alguns clientes não escreveram um comentário. Mas por que eles estão satisfeitos?
  • Com as informações da data de compra, você poderá prever vendas futuras!
  • Você também poderá focar na logística e encontrar maneiras de otimizar os tempos de entrega.
  • Esses dados possuem coordenadas de geolocalização. Há diferenças no padrão de consumo por regiões?
  • Divirta-se descobrindo as categorias de produtos mais propensas à insatisfação do cliente.
  • Crie recursos deste rico conjunto de dados, feature engineering ou anexe algumas informações públicas externas a ele.
  • E um modelo para precificar os produtos do nosso catálogo? Modelagem matemática para otimizar rotas? Testes de hipóteses para validar algum questionamento?
  • O que acha de escrever um relatório ou slides detalhando as suas descobertas?
  • Fique livre para criar sua própria abordagem, caso considere que as dicas anteriores não sejam pertinentes.

Analista de dados e Business Intelligence

  • Pense em alguns KPIs para monitoramento. Talvez outros para direcionamento dos gestores!
  • Um cruzamento dos dados poderia gerar relatórios interessantes. Afinal, quem são os Top 10 em vendas? Que tipo produtos eles vendem? Qual é o impacto deles para o negócio?
  • Que tal realizar uma análise exploratória dos dados. E então? Algo lhe chama a atenção?
  • Você poderia apresentar esses dados em um dashboard. Isso daria agilidade na tomada de decisão!
  • Temos interesse em suas habilidades com matemática aplicada e estatística descritiva. O que você pode nos mostrar com os dados?
  • O que acha de escrever um relatório ou slides detalhando as suas descobertas?
  • Fique livre para criar sua própria abordagem, caso considere que as dicas anteriores não sejam pertinentes.

Engenheiro(a) de dados

  • Gostaríamos de analisar suas habilidades com SQL, modelagem dimensional e integração de dados. Mostre seus conhecimento em processos de ETL e conceitos de Data Warehouse. Que tal replicar nossos datasets, remodelar em um banco de dados e apresentar as melhorias realizadas em sua criação.
  • É possível utilizar o modelo proposto em um ambiente cloud? Quais plataformas ou serviços você utilizaria? Quais as vantagens do modelo escolhido em questões de performance?
  • Alguns membros do time dizem que a atual modelagem do banco de dados é adequada para o uso dos cientistas de dados e analistas de BI, porém, outros dizem que existem formas de modelar bancos de dados que trarão mais eficiência. Qual é a sua opinião sobre isso?
  • Estamos preocupados com o vertiginoso aumento do volume em nosso banco de dados atual? Você consideraria uma opção mais escalável ou devemos manter a estrutura existente?
  • Nossa ferramenta de visualização de dashboards está lenta e o nosso time detectou que o problema está na infraestrutura de dados. Como você abordaria esta situação do ponto vista de arquitetura de dados?
  • Nosso banco de dados está hospedado na nuvem e nossas ferramentas de análise de dados são "on premisses". Você manteria este arranjo ou faria mudanças visando mais performance?
  • Nossa área operacional necessita de informações em tempo real, porém os diretores da empresa, que acompanham somente informações de KPIs mensais, alegam que isso é desnecessário e acarretaria custos. Qual é o seu posicionamento sobre isso?
  • Nosso time que está focado em Governança de Dados alega que documentar os processos é mais importante do que refatorar os mais de 500 scripts que estão funcionando com lentidão. Como você atuaria neste impasse, se tivesse que priorizar o trabalho?
  • Aqui no olist, somos muito mão na massa! Como Engenheiro(a) de dados, mostre pra gente o que você consegue fazer na prática com esse nosso banco de dados. (Sabemos que é uma amostra, mas imagine que o todo pode ser petabytes de dados)
  • O que acha de escrever um relatório ou slides sobre a sua abordagem na solução de alguns desses problemas?
  • Fique livre para criar sua própria abordagem, caso considere que as dicas anteriores não sejam pertinentes.

O que esperamos do candidato?

Queremos entender sua proficiência técnica, raciocínio analítico e apresentação de resultados.

Você não precisa responder todas as perguntas ou dicas que foram listadas anteriormente, são apenas sugestões (mantenha o foco naquilo que você tem mais afinidade). Porém, queremos ter uma clara percepção sobre como você resolve problemas.

Para isso, fique a vontade para adotar softwares, processos e ferramentas que considerar adequados.

Você terá um prazo de até 7 dias e após a finalização do teste, nos encaminhe um relatório contextualizando o trabalho realizado e suas soluções. Pode ser em qualquer formato, queremos apenas entender como você apresenta os resultados do seu trabalho.

Não esqueça de indicar em seu relatório os links/endereços, caso tenha hospedado códigos/arquivos em algum repositório na internet.

work-at-olist-data's People

Contributors

acsjunior avatar ana-malucelli avatar andresionek91 avatar franciscomagioli avatar leodabague avatar nosbielcs avatar tatianagaleazzi avatar walterhorning avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.