hugomuniz94 Goto Github PK
Name: Hugo Muniz
Type: User
Company: Globo Comunicação e Participações SA
Bio: Data Scientist at Globo
Location: Rio de Janeiro, Brasil
Name: Hugo Muniz
Type: User
Company: Globo Comunicação e Participações SA
Bio: Data Scientist at Globo
Location: Rio de Janeiro, Brasil
Neste trabalho foi realizado o web scrapping, utilizando a linguagem R e o R Studio, do site G1 do Globo.com para notícias relacionadas ao BNDES durante o mês de novembro e dezembro de 2020. Posteriormente foi realizado a extração das entidades relacionadas em cada notícia, também pelo R e R Studio, para que fosse possível criar um grafo no programa Gephi. No Gephi foi feito uma análise da força da relação entre os assuntos relacionados ao BNDES em cada comunidade. Este foi um trabalho realizado para aprovação na disciplina de Análise de Mídias Sociais e Mineração de textos do MBA de Business Analytics e Big Data da FGV-RJ.
Análises de Predições de Vendas e Predições de Subscrições de Serviço. A base Retail foi utilizada nos modelos de regressão para previsão de vendas e a base marketing foi utilizada no modelo de classificação para previsão de subscrições do serviço. No trabalho como um todo foram utilizados os modelos de Regressão Linear e Logística, Árvore de Decisão, SVM e Redes Neurais. Observação: Baixe o arquivo HTML para ver o trabalho completo em formato de relatório.
Análise de Predições de Subscrições de Serviço. A base marketing foi utilizada para previsão de subscrições do serviço com modelos de classificação. No trabalho como um todo foram utilizados os modelos de Regressão Logística, Árvore de Decisão, SVM e Redes Neurais. Observação: Baixe o arquivo HTML para ver o trabalho completo em formato de relatório.
Análise de Clusters utilizando a base de dados de compras anuais dos clientes de um distribuidor atacadista de Portugal (Wholesale Dataset - UCI repository).
Trabalho realizado para a aprovação na disciplina de Estatística Espacial da FGV-RJ. Análise do Padrão de Pontos, Efeitos de Primeira e Segunda Ordem, testes de hipótese, Índice de Moran Local e Global,
Modelo de classificação de espessura do friso da roda de trem abaixo de 26mm. Os dados utilizadas são dados reais da empresa Vale. Este foi um trabalho desafiador em termos de modelagem devido a larga escala do dataset (mais de 3 milhões de observações), sendo necessário utilizar o Spark para o processamento destes dados. E em termos de entendimento dos dados, já que o problema era de alta complexidade. O trabalho foi feito com a linguagem R e com a biblioteca SparkR e a apresentação foi montada no R Markdown. No futuro próximo serão feitas melhorias no modelo e na análise exploratória para que seja possível atingir uma melhor perfomance nos modelos.
This project aims to present an unsupervised semantic sentiment analysis model that not only captures the overall sentiment of the text but also provides a way to analyze the complexity of emotions and subjectivity of the text while maintaining high performance.
Exercícios do módulo 1 - Bootcamp EDC - IGTI 2021
Trabalho para aprovação na disciplina Aplicações em Estatística Espacial. Análise Descritiva/Exploratória, Preparação dos Dados, Modelagem Espacial SAR e CAR.
Trabalho realizado para aprovação na disciplina de Análise Preditiva na FGV. Análise Exploratória, Pré-processamento, Modelagem e Análise Preditiva.
Desafio Final do BootCamp de Engenharia de Dados do IGTI. Neste desafio utilizei o Airflow via Docker para orquestração do Pipeline de extração de dados do MongoDB e da API do IBGE, e ingestão no Data Lake S3 da AWS. Após isso os dados foram tratados e filtrados apenas para o público alvo para serem disponibilizados em um DW pelo RDS da AWS utilizando o banco de dados Postgree. Pipelines de Dados. Containers. Bases de Dados SQL e NoSQL. Conexão a APIs. ETL. Data Lake. Processamento de dados distribuído.
A tarefa é prever a quantidade total de produtos vendidos em cada loja para o conjunto de teste. Neste script foram realizadas técnicas de Pre-Processamento, Feature Engineering e Ensemble Modeling (Primeiro Nível: Catboost, XGBoost, Random Forest, Regressão Linear, KNN, Segundo Nível: Regressão Linear sobre as predições do primeiro nível).
Trabalho realizado para aprovação na disciplina de Análise de Séries Temporais. Foi realizado a análise e modelagem da serie temporal da entrega de fertilizantes ao mercado brasileiro em mil toneladas no período mensal de janeiro de 1998 até abril de 2020 (Fonte: ANDA)
Análise Exploratória e Modelagem do dataset de uma empresa de telecomunicações, para prever se os clientes irão desistir ou continuar contratando os serviços da empresa. Um típico problema de classificação de Churn. Foi feita a manipulação, limpeza e visualização dos dados, e aplicado Regressão logística, Random Forest e XGBTree para a etapa de modeloagem.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.