Code Monkey home page Code Monkey logo

mba_ds-s_fundsql_banco-de-dados-para-analistas-e-cientistas-de-dados's Introduction

Banco de Dados

Um banco de dados (sua abreviatura é BD, em inglês DB, database) é uma entidade na qual é possível armazenar dados de maneira estruturada e com a menor redundância possível. Estes dados devem poder ser utilizados por programas e por diferentes tipos de usuários (usuários finais, analistas, cientistas, etc). Assim, a noção básica de dados é acoplada geralmente a uma rede, a fim de poder pôr, conjuntamente, estas informações, daí o nome banco. Fala-se, geralmente, de sistema de informação para designar toda a estrutura que reúne os meios organizados para poder compartilhar dados. (mais...)

SQL

Essa habilidade consiste na capacidade de consultar dados contidos em tabelas (não apenas em tabelas) nas mais diversas Fontes de Dados (consulte na seção Classificação de dados (Data Classification)). Em grande parte das vezes, estas consultas, buscam atender alguma necessidade do negócio, da empresa na qual esta trabalhando! Normalmente utilizando a linguagem padrão SQL (Structured Query Language). A Linguagem SQL, é subdivida em alguns tipos de linguagem, são elas:

  • DDL (Data Definition Language) — principais comandos: CREATE DATABASE | DROP DATABASE | ALTER DATABASE | CREATE TABLE | ALTER TABLE | DROP TABLE | TRUNCATE | RENAME
  • DML (Data Manipulation Language) — principais comandos: INSERT | UPDATE | DELETE
  • DCL (Data Control Language) — principais comandos: GRANT | REVOKE
  • TCL (Transaction Control Language) — principais comandos: ROLLBACK | COMMIT | SAVE POINT
  • DQL (Data Query Language) — principais comandos: SELECT (esse aqui será nosso foco) — observação, na literatura também pode ser que encontrem comandos SELECT dentro de DML. (mais...)

Ferramentas utilizadas

Projeto

Análise de Dados utilizando SQL

Somos a empresa: data.z - consultoria em dados

A empresa sales.z nos contratou para realizarmos uma consultoria em seus dados de venda. Nos passaram um banco de dados de amostra e como sua modelagem relacional, contendo alguns dados fictícios, mas que obedece a estrutura real do banco de dados deles em produção.

Nos informaram por e-mail, que estão realizando um estudo e gostaria que nós criássemos algumas consultas para auxiliar neste processo, consultas para responder as seguintes questões:

Observação 1: não alterar nada na base de dados, apenas nas consultas mesmo! (uma consulta por questão)

Observação 2: qualquer dúvida, pode procurar diretamente o cliente - Alex Souza

Fase 1:

  • Quantidade de dependentes
  • Quantidade de dependentes por sexo
  • Quantidade de clientes da região sul
  • Uma descrição breve dos produtos da empresa (codigo, nome, tipo)
  • Quais os 5 produtos mais vendidos de 2021?
  • Nome, Nome em Maiúsculo e Nome em Minúsculo, dos vendedores do sexo feminino
  • Nome e idade de todos os dependentes, ordenados do mais velho para o mais novo
  • Somatório do Valor Total de Vendas (concluídas e não deletadas) por Estado
  • Somatório de Unidades Vendidas (concluídas e não deletadas) por Produto
  • Média do Valor Total de Vendas por Estado
  • Nome dos clientes que compram o produto 1
  • Quantidade mínima e qual o respectivo produto
  • Uma descrição detalhada dos produtos da empresa (codigo, nome, tipo, Qtd em Estoque)
  • Nome dos Vendedores que realizaram determinadas Vendas (Codigo da Venda, Data da Venda, Produto e nome do vendedor)
  • Relação com o nome dos vendedores e seus respectivos filhos (dependentes - nome e data de nascimento) -- montar uma view com estes dados
  • Criar uma view com informações de vendas, produto, estoque, cliente, vendedores (apenas concluídas e não deletadas)
  • View de quantidade de vendas por canal

Fase 2:

  • Filtrar a tabela de vendedores pelo vendedor de nome: Vendedor 6
  • Uma consulta que retorne o nome dos dependentes, mas quando for o dependente de código 5, retorne o seu nome. (Usando IF ou CASE)
  • Retornar todas as vendas entre os dias 07/05/2019 a 03/03/2021 unidas com as todas as vendas entre os dias 11/09/2011 a 03/09/2012
  • Retornar o nome do produto (apenas os 5 primeiros caracteres) e a quantidade de venda com 10 dígitos, completando com zeros a esquerda.
  • Qual o produto que tem a maior quantidade de vendas no canal: Ecommerce?
  • Existiram vendas para produtos em MVP - validação? Quais foram?
  • Quantas vendas encontram-se deletadas logicamente?
  • Quantas vendas encontram-se canceladas?
  • Na tabela de dependentes, temos o código da Escola que o dependente estuda, precisamos além do códido da escola (INEP), saber o nome da escola de cada um dos dependentes estudam. (planilha com nome da escola em anexo)

Entrega do Projeto para o cliente:

A entrega do projeto para o cliente fica a seu critério, normalmente aqui na data.z utilizamos o GitHub para documentar nossas entregas, mas fique a vontade para utilizar a ferramenta que mais tem familiaridade.

Data: 08/05/2022 até as 23:59hs


Alex Souza


github-contribution-grid-snake

mba_ds-s_fundsql_banco-de-dados-para-analistas-e-cientistas-de-dados's People

Contributors

aasouzaconsult avatar alexsouza-compass avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.