Code Monkey home page Code Monkey logo

analise_dados_rc_2016's People

Watchers

 avatar  avatar

analise_dados_rc_2016's Issues

Descrição: tabelas

Exemplo de tabela descritiva:

  • Local do câncer
Local_Cancer
Acetábulo (E) Pelve                Alox               Braço               Bubis 
                2.2                 2.2                 2.2                 2.2 
          Clavícula     Coluna toráxica            Escapula               Fêmur 
                2.2                 2.2                 6.5                30.4 
             Fíbula              Ilíaco              Joelho                 Mão 
                4.3                 6.5                 2.2                 4.3 
              Ombro                  Pé               Pelve             Quadril 
                6.5                 4.3                 6.5                 4.3 
              Tíbia               Úmero 
                2.2                 8.7 

Planejamento

  • Refazer, e redigir o planejamento da análise.
  • Atualizar o README do repositório

Exportar tabela 1 para Word

Pesquisar como exportar o conteúdo da tabela 1 (pacote tableone) para o Word.

Talvez seja necessário criar um arquivo Rmarkdown.

Descrição: gráficos

Criar gráficos descritivos tomando como resposta

  • Metástase
  • Óbito

Um exemplo de gráfico de óbito

bp-obitos_hist

Alongar os eixos y dos barplots, para que ultrapassem as barras

Foi requerido hoje que os gráficos tivessem eixos que ultrapassem as barras - i.e., se a barra tem altura 17, o eixo não deve se encerrar na altura 15, e sim na próxima altura disponível (no caso, provavelmente 20).

Investigar se há como consultar o objeto do barplot() (como é possível no hist() para descobrir os ticks. Caso não seja viável em pouco tempo, definir os ylim manualmente.

Não usar attach()

O uso de attach() no dataframe fere as boas práticas, e polui desnecessariamente o código. Usar with(dados, ...) . Roteiro da limpeza:

  • Tabelas de contingência
  • Gráficos
  • remover cleanup.R

Refazer o tempo de diagnóstico a partir dos dados

Calcular o tempo de diagnóstico, como factor (ordinal) com os cortes:

  • < 3 meses
  • 3 a 6 meses
  • 6 meses a 1 ano
  • 1 ano a 3 anos
  • '> 3 anos

Os pacientes mencionados em #26 devem ser corrigidos ou removidos das tabelas. Caso a remoção seja necessária, isto deve ser propriamente documentado na metodologia e/ou resultados.

Redação final da metodologia

É necessário uma descrição detalhada da Metodologia utilizada, possivelmente atualizando a versão declarada do R, e principais pacotes utilizados, caso haja.

barplots: falta ylab

Em todos os barplots, o ylab ficou faltando.

Escolher um entre:

  • Frequência
  • Quantidade

Modelos (exemplos) de redação de Legendas (Figs/Tabelas)

É necessário dar pelo menos um bom exemplo de como descrever as legendas das figuras e tabelas.

Incluir no relatório

  • Figura com legenda
  • Tabela com legenda

Legendas explicitando os detalhes essenciais (teste de significância utilizado, unidades, etc)

Nova variável: Estadiamento

Usar a nova variável, incluída na planilha de setembro para:

  • tabelas de contingência
  • barplots
  • modelo logístico (preditor para metástase, e óbito)

TC - Cruzar dados categóricos

Duas variáveis de interesse:

  • Metástase (presença)
  • Óbito

Um exemplo de TC com óbito:

                Obito
Tipo_Histologico Não Sim
              D    9   9
              G1  50   2
              G2  20   7
              G3   2   2

                Obito
Tipo_Histologico  Não  Sim
              D   8.7  8.7
              G1 50.0  2.2
              G2 19.6  6.5
              G3  2.2  2.2

Mudar ordem dos níveis dos fatores

Por padrão o R ordena os factor levels alfabeticamente. Isso não é aceitável para a exibição dos resultados.

  • no tipo histológico, o D deve ser o último, e não o primeiro

barplot: tipo_cirurgia xlab não cabe no frame

Os labels das categorias não cabem integralmente no espaço reservado para o frame, então alguns nomes de categorias foram suprimidos.

Solução: rotacionar os labels para garantir a exibição de todos, com legibilidade

corrigir tabelas de contingência

Algumas tabelas de contingência estão invertidas, i.e., os preditores estão representados nas colunas e as respostas nas linhas. Corrigir antes de salvar os novos gráficos individuais na issue #13.

Descrição: Metodologia

  • Introduzir os métodos e testes utilizados na estatística descritiva
  • métodos e testes utilizados nas associações

Aumentar a fonte exibida nos gráficos

A resolução (700x700) está muito grande, e com isso todas as strings dos gráficos ficam muito pequenas.
possíveis soluções:

  • modificar propriamente o tamanho dos textos (cex e afins)
  • reduzir a resolução dos gráficos

Conferir dados do tempo de diagnóstico

Foi feita uma Análise Exploratória dos dados do tempo de diagnóstico e foram identificadas algumas inconsistências entre a marcação manual dos dados, e a contabilização automática dos mesmos.

Além disso 2 pacientes tem o dado suspeito:

  • Um paciente tem tempo negativo ( Início dos sintomas posterior ao diagnóstico)
  • Um paciente tem tempo 0 (Início dos sintomas = Diagnóstico)

Na planilha original (Dados Epidemiologicos CONDROSSARCOMA 17_10_2016.xlsx), estes pacientes estão, respectivamente, nas linhas 20, e 50. Estas datas precisam ser corrigidas ou serão desconsideradas desta análise.

A figura abaixo mostra a distribuição dos dados, e os cortes escolhidos:

eda-tempo

Substituir título das legendas pelos nomes

Os títulos das legendas dos barplots estão simplesmente printando os nomes das variáveis. É necessário usar nomes significativos, ao invés de codificações.

Possíveis soluções:

  • incluir um novo argumento na função mybarplot()
  • Construir as strings do gráfico a partir de dois argumentos que "traduzam" o significado da variável para linguagem comum (mas provavelmente overkill)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.