philsf-biostat / analise_dados_rc_2016 Goto Github PK
View Code? Open in Web Editor NEWConsultoria em análise de dados para Rodrigo Cardoso (Mestrado Profissional INTO, 2016)
License: GNU General Public License v2.0
Consultoria em análise de dados para Rodrigo Cardoso (Mestrado Profissional INTO, 2016)
License: GNU General Public License v2.0
A nomenclatura correta é gênero.
Exemplo de tabela descritiva:
Local_Cancer
Acetábulo (E) Pelve Alox Braço Bubis
2.2 2.2 2.2 2.2
Clavícula Coluna toráxica Escapula Fêmur
2.2 2.2 6.5 30.4
Fíbula Ilíaco Joelho Mão
4.3 6.5 2.2 4.3
Ombro Pé Pelve Quadril
6.5 4.3 6.5 4.3
Tíbia Úmero
2.2 8.7
Pesquisar como exportar o conteúdo da tabela 1 (pacote tableone
) para o Word.
Talvez seja necessário criar um arquivo Rmarkdown.
Foi requerido pela banca de qualificação uma análise que associe a relação entre o tempo de diagnóstico e o Óbito.
Foi requerido pela banca de qualificação uma análise que associe a relação entre o tempo de diagnóstico e a presença de Metástase.
Foi requerido hoje que os gráficos tivessem eixos que ultrapassem as barras - i.e., se a barra tem altura 17, o eixo não deve se encerrar na altura 15, e sim na próxima altura disponível (no caso, provavelmente 20).
Investigar se há como consultar o objeto do barplot() (como é possível no hist() para descobrir os ticks. Caso não seja viável em pouco tempo, definir os ylim manualmente.
Foi requerido pela banca de qualificação uma análise que associe a relação entre o tempo de diagnóstico e o Estadiamento.
Foi requerido pela banca de qualificação uma análise que associe a relação entre o tempo de diagnóstico e o Tipo Histológico.
O uso de attach()
no dataframe fere as boas práticas, e polui desnecessariamente o código. Usar with(dados, ...)
. Roteiro da limpeza:
cleanup.R
Calcular o tempo de diagnóstico, como factor (ordinal) com os cortes:
Os pacientes mencionados em #26 devem ser corrigidos ou removidos das tabelas. Caso a remoção seja necessária, isto deve ser propriamente documentado na metodologia e/ou resultados.
É necessário uma descrição detalhada da Metodologia utilizada, possivelmente atualizando a versão declarada do R, e principais pacotes utilizados, caso haja.
É necessário providenciar um bom conjunto de exemplos de como redigir a interpretação dos principais resultados
Em todos os barplots, o ylab ficou faltando.
Escolher um entre:
É necessário dar pelo menos um bom exemplo de como descrever as legendas das figuras e tabelas.
Incluir no relatório
Legendas explicitando os detalhes essenciais (teste de significância utilizado, unidades, etc)
Usar a nova variável, incluída na planilha de setembro para:
Duas variáveis de interesse:
Um exemplo de TC com óbito:
Obito
Tipo_Histologico Não Sim
D 9 9
G1 50 2
G2 20 7
G3 2 2
Obito
Tipo_Histologico Não Sim
D 8.7 8.7
G1 50.0 2.2
G2 19.6 6.5
G3 2.2 2.2
Por padrão o R ordena os factor levels alfabeticamente. Isso não é aceitável para a exibição dos resultados.
Os labels das categorias não cabem integralmente no espaço reservado para o frame, então alguns nomes de categorias foram suprimidos.
Solução: rotacionar os labels para garantir a exibição de todos, com legibilidade
Algumas tabelas de contingência estão invertidas, i.e., os preditores estão representados nas colunas e as respostas nas linhas. Corrigir antes de salvar os novos gráficos individuais na issue #13.
Foi requerido hoje que todos os gráficos fossem produzidos individualmente, i.e., sem ser agrupados em grids 2x2.
A resolução (700x700) está muito grande, e com isso todas as strings dos gráficos ficam muito pequenas.
possíveis soluções:
cex
e afins)Foi feita uma Análise Exploratória dos dados do tempo de diagnóstico e foram identificadas algumas inconsistências entre a marcação manual dos dados, e a contabilização automática dos mesmos.
Além disso 2 pacientes tem o dado suspeito:
Na planilha original (Dados Epidemiologicos CONDROSSARCOMA 17_10_2016.xlsx), estes pacientes estão, respectivamente, nas linhas 20, e 50. Estas datas precisam ser corrigidas ou serão desconsideradas desta análise.
A figura abaixo mostra a distribuição dos dados, e os cortes escolhidos:
Os títulos das legendas dos barplots estão simplesmente printando os nomes das variáveis. É necessário usar nomes significativos, ao invés de codificações.
Possíveis soluções:
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.