Abre o indice da documentação da linguagem
help.start()
help.start()
Abre o indice da documentação da linguagem
Retorna a documentação do termo passado como parametro
help("termo")
help("search")
Retorna a documentação da função search.
Utilize o caracter "?" como forma abreviada do comando help() Ex.: ?search
Retorna os termos que contém a palavra digitada
apropos(palavra)
apropos("sear")
Retorna todos os termos que contém "sear"
Retorna a assinatura da função passada como parametro, ou seja a lista de argumentos
args("funcao")
getwd("sd")
Retorna a lista de argumentos da função "sd"
Ao digitar somente o nome da função, ou seja sem os (), é retornado o código fonte em C da mesma.
Retorna o diretório de trabalho atual
getwd()
getwd()
Retorna o diretório de trabalho atual
Seta um diretório de trabalho passado como parametro
setwd(path)
setwd("/home/diogo/work/R")
Seta o diretório de trabalhado para a caminho "/home/diogo/work/R"
Retorna a lista de arquivos do diretório padrão
dir()
dir()
Retorna a lista de arquivos do diretório padrão
Salva os estado da sessão de trabalho
save.image("nome-do-arquivo")
save.image("projeto-teste.RData")
Grava no arquivo "projeto-teste.RData" o estado atual da sessão de trabalho.
Carrega a sessão de trabalho salva no arquivo passado como parametro
load(file="nome-do-arquivo")
load(file="projeto-teste.RData")
Carrega o arquivo "projeto-teste.RData".
Instala os pacotes passados como parâmetros
install.packages(pacote,pacote,..., dependencies = TRUE|FALSE)
install.packages("ggplot2", dependencies = TRUE)
Instala o pacote ggplot2 com todas suas dependências devido a passagem o parametro dependencies = TRUE.
Remove os pacotes passados como parâmetros
remove.packages(pacote,pacote,...)
remove.packages("ggplot2")
Remove o pacote ggplot2.
Retornar todos pacotes instalados na máquina
installed.packages()
installed.packages()
Retorna os pacotes instalados
Carrega para o uso os pacotes passados como parâmetros
libray(pacote)
library(ggplot2)
Carrega para o uso o pacote ggplot2
Descarrega da memória o pacote passado como parametro
detach("package:nome-do-pacote")
detach("package:ggplot2")
Descarrega da memória o pacote ggplot2
Mostra todos pacotes carregados na memória
search()
search()
Mostra os pacotes carregados.
Cada função retorna o valor de uma configuração passada como parametro e seta um configuração respectivamente
getOption("opcao") e setOption("opcao")
getOption("OutDec") e setOption(OutDec=",")
Retorna o separador decimal e seta o separador decimal respectivamente.
- OutDec => Separdor decimal
- defaultPackages => Retorna os pacotes padrões carregados na memória
Importante:
A `help("options")` retorna a lista completa de opções de confiração na documentação
-
Caracter
-
Numérico
-
Inteiro
-
Fator
-
Data
NA representa o valor não disponível, ou seja, NOT AVALIABLE
No R toda variável é tratada como um vetor. Ex.: a = 10 é um vetor com uma posição númerica.
- =
a = 10
- ->
a -> 10
- <-
10 <- a
class(variavel)
typeof(variavel)
is.numeric(variavel)
is.character(variavel)
is.integer(variavel)
idade = 35L
ou
idade = as.integer(35)
O "as" pode ser usado com outros tipos.
Converter um tipo em outro
as.tipo-dado(dados)
n1 = "10";
class(n1);
# Retorna character
n1 = as.numeric(n1)
class(n1);
# Retorna numeric
Pode-se utilizar com outros tipo como data.frame, list, integer.
- Criando um vetor
vet = c(1,2,3,4,5,6)
- Ordenando um vetor
sort(vet)
- Retornando o maior e menor valor de um vetor
max(vet);min(vet)
- Filtrando dados do vetor
vet[vet>3]
- Mostrando a ordem dos valores no vetor
order(vet)
- Somando os valores de dois vetores
vet + vet
- Somando um valor a cada item do vetor
vet = vet + 5
- Retornando o tamanho do vetor
length(vet)
- Alterando o tamanho do vetor
length(vet) = 12
- Alterando valores em um indice especifico do vetor
vet[c(11,12)] = c(6,6)
- Criando uma matriz com dados distribuidos por linha (byrow=T)
matr = matrix(c(1,2,3,4,5,6), nrow=2,ncol=3,byrow=T)
- Criando uma matriz com dados distribuidos por coluna (byrow=F)
matr = matrix(c(1,2,3,4,5,6), nrow=2,ncol=3,byrow=F)
- Nomeando as linhas e colunas de uma matriz
dimanmes(matr) = list(c("L1","L2","L3"),c("C1","C2","C3"))
- Alterando um valor especifico da matriz
matr[1,2] = 0
- Retornando dimensões da matriz
dim(matr)
Lista são conjuntos de objetos de classe que podem ser diferentes, por exemplo matrizes, vetores e outras listas.
- Criando uma lista
lista = list(USPersonalExpenditure, ability.cov$center, c(1,2,3,4,5), "Frase frase")
- Colocando nome nos objetos de um lista de 4 itens
names(lista) = c("Matriz","VetZero","Vet12345","Texto")
- Acessando o segundo objeto da lista
lista[[2]]
- Forma alternativa caso os itens da lista estejam nomeados
lista$nome-item
Data frames se assemelham a tabelas, ou seja, podem trazer dados de tipos diferentes em suas colunas.
- Criando um data frame
id = c(1,2,3)
nome = c("Diogo","Maria","João")
idade = c(39L,25L,53L)
cadastro_ativo = c(T,T,F)
limite_credito = c(5000.00,10550.50,0)
clientes = data.frame(id,nome,idade,cadastro_ativo,limite_credito)
- Verificando o tipo de uma coluna do data frame
class(clientes$idade)
- Alterando os dados de um data frame via R Editor
fix(clientes)
- Abrindo o R Editor para alterar os dados do data frame e atribuindo o resultado alterado à outra variável
clientes_edit = edit(clientes)
Coleção de observações feitas sequencialmente ao longo do tempo
- Criando uma série temporal
serie_temp = ts(c(1:60), start=c(2010,1), end=c(2014,12), frequency = 12 )
Fatores são vetores de elementos numerados.
- Criando um fator de meses do ano
meses = factor(c(1:12), labels = c('jan','fev','mar','abr','mai','jun','jul','ago','set','out','nov','dez'), ordered = TRUE)
Para criar uma variavel com conteúdo do tipo Date é necessário passar em formato de caracter e converter para date.
data = as.Date("1979-07-10")
Para saber a diferença entre duas datas basta fazer um subtração entre os dois valores.
nasc = as.Date("1979-07-10"); hoje = Sys.Date(); dif = hoje - nasc;dif;
O resultado é "Time difference of 14491 days"
format(data,format="mascara")
format(data,format="%d/%m/%Y")
Retorna o formato d/mm/aaaa
format(Sys.time(),format="%d/%m/%Y %H:%M:%S")
Retorna a data e hora atual no formato especificado.
Concatena duas ou mais strings
paste(string1, string2, stringN, sep="separador")
frase = paste("O cachorro","latiu",sep=" ")
Retorna "O cachorro latiu" para a variavel "frase".
Lista todas variáveis em memória
objects()
objects()
Retorna a lista de objetos na memória
Remove objetos da memória
rm(variavel)
rm(list=objects())
Remove todo objetos da memória
Retorna todos grupos de dados carregados no R
data()
data()
data(package = .packages(all.avaliable=TRUE))
Retorna lista de grupos de dados instalados
combina os valores passados como parâmetros em um vetor ou lista
c(....)
c(1,10,15,20,25)
Gera um vetor [1,10,15,20,25]
c(T,F,T,T,F)
Gera um vetor [TRUE,FALSE,TRUE,TRUE,FALSE]
c(1:100)
Gera um vetor com número de 1 a 100
Gera um vetor com um sequencia de valores.
seq(from=num-ini,to=num-fim,by=intervalo)
s1 = seq(from=1, to=1000, by=10)
Gera um vetor com numeros sequenciais de 1 a 1000 em intervalos de 10 ([10,20,30,40,....,1000])
Abre um prompt para digitação de valores que irão compor um vetor
scan()
v1 = scan()
Abre um prompt para digitar valores do tipo numeric que irão compor v1.
v2 = scan(what="character")
Abre um prompt para digitar valores do tipo character que irão compor o v2.
Gera uma amostra de dados aleatórios baseados nos parâmetros informados
sample(x, size, replace = FALSE, prob = NULL)
sample(c(0,1), 10, replace = TRUE, prob = c(0.5,0.5))
Gera um vetor (amostra) de tamanho 10 contendo valores 0,1 aleatorios cuja probabilidade de ocorrer 0 é de 50% e 1 também de 50% e os dados não podem se repetir
set.seed(numero) gera uma seed de geração de números aleatórios fixa, passada como parâmetro.
attach coloca um conjunto de dados (data frame, list...) no "search path" do R e detach retira. Já o with utiliza o conjunto de dados passsado como primeira parametro para as expressões passadas no parametro seguinte.
attach(conj-dados)
detach(conj-dados)
with(conj-dados,expressao)
attach(cars);
# Adiciona cars no search path
mean(speed);
# utiliza a coluna speed sem precisar declarar cars$speed
detach(cars);
# Retira do search path.
with(cars,mean(speed))
# Utiliza cars na expressão mean(speed)
read.table(arquivo,sep = char-separador,dec = "separador-decimal",header = T|F)
tab = read.table("arquivo.csv",sep = ";",dec = ".",header = T)
Importa o arquivo de nome "arquivo.csv com separador de campos sendo ponto e virgula, usando ponto como separador decimal e considerando a primeira linha como cabeçalho
tab = read.table(file.choose(),sep = ";",dec = ".",header = T)
Executa a mesma tarefa do exemplo anterior porem utiliza a função file.choose() para abrir uma caixa de dialogo para seleção do arquivo.
save(dados,file="nome-arquivo.rdata")
v1 = seq(from=1,to=1000,by=5)
save(v1, file="vetor.rdata")
Salva o vetor gerado em um arquivo no formato binário.
load(nome-arquivo)
load("vetor.rdata")
Carrega os dados do arquivo passado como parametro.
Lista os arquivos e pastas de um diretório
list.files()
list.files()
Lista os arquivos do diretório de trabalho
list.files("/home/user/")
Lista os arquivos do diretório /home/user/
Respectivamente mostram as primeiras e as ultimas linha de um conjunto de dados
head(dados)
tail(dados)
head(t1)
# Retorna as primeiras linha de t1
tail(data1,n=4L)
# Retorna as últimas 4 linhas de data1
Retorna ou seta as dimensões de uma matriz
dim(x)
x = 1:12; dim(x) = c(3,4); dim(x);
X recebe 12 valores aleatorios de 1 a 12, em seguida transforma-se esse vetor em uma matriz de 3 linha e 4 colunas. Por fim retorna o as dimensões da matriz gerada.
Gera uma amostra stratificada de um conjunto de dados
strata(dados,colunas,size=c(proporcao, proporcao...),method="srswor")
summary(infert)
Calcula a proporção usando total da categoria dividido total de registro multipilicado pelo numero de amostras desejadas.
0->5 = 5
round(12/248*100)
6->11 = 48
round(120/248*100)
12+ = 47
round(116/248*100)
amostra = strata(infert,c("education"), size=c(5,48,47),method="srswor")
summary(amostra)
Retorna um sumário da amostra extratifica de infert. O parâmetro method="srswor"
significa que a função gera amostras aleatórias sem reposição.
Cria uma amostra sistemática com inicio aleatório
S.SY(qtde-amostra,intervalo)
S.SYS(20,2)
Em um total de 20 amostras gera uma inicial aleatoria e apartir dela gera uma a cada 2.
Retornam, respectivamente, o nome das colunas e das linhas de um conjunto de dados
colnames(dados)
rownames(dados)
colnames(iris)
# Retorna o nome das colunas de iris
rownames(iris)
# Retorna o nome das linhas de iris
Retorna a média de um conjunto de valores.
mean(dados)
mean(c(1,2,3,4))
Retorna a média dos valores passados como parâmetros
Retorna a mediana de um conjunto de valores.
median(dados)
median(c(1,2,3,4,5))
Retorna a 3 que é o valor mediano do conjunto de dados passados.
Retorna os quartis de um conjunto de valores.
quantile(dados)
quantile(c(1,2,3,4,5))
Retorna os quartis do conjunto de dados passados.
Sumariza um objeto passado como argumento
summary(object)
summary(iris)
Retorna um sumário de informações sobre a base de dados que acompanha a linguagem R denominada "iris".
Retorna o desvio padrão de um conjunto de valores.
sd(dados)
sd(c(1,2,3,4))
Retorna o desvio padrão do conjunto de valores passados como parâmetros
Retorna o variância de um conjunto de valores.
var(dados)
var(c(1,2,3,4))
Retorna o desvio padrão do conjunto de valores passados como parâmetros
Gera uma distribuição normal baseada nos parâmetros passados.
rnorm(qtde-valores, mean = media, sd = desvio-padrao)
rnorm(10, mean = 20, sd = 3)
Gera uma distribuição normal com 10 valores cuja média é 20 e o desvio padrão é 3.
Gera uma distribuição de Poisson baseada nos parâmetros passados.
rpois(qtde-valores,lambda=valor)
rpois(10, lambda=4)
Gera uma distribuição de Poisson com 10 valores cuja lambda é 4.
Gera uma distribuição binomial baseada nos parâmetros passados.
rbinom(dados,size=tamanho, prob=probabilidade)
rpois(10, lambda=4)
Gera uma distribuição binomial.
Verifica se um conjunto de dados de uma dada variável aleatória é uma distribuição normal.
shapiro.test(dados)
shapiro.test(rnorm(10, mean = 20, sd = 3))
Verifica se o resultado da função rnorm retornou uma distribuição normal.
Verifica se existe uma correlação entre os valores passados como parâmetros. Retorna um valor entre -1 e 1 para indicar a correlação.
cor(dados1,dados2)
cor(women$height,women$weight)
Verifica se existe uma correlação entre os valores de women$height e women$weight
Retorna um modelo de regressão linear.
lm(formula-modelo)
lm(women$height ~ women$weight)
Gera um modelo de regressão linear de women$height e women$weight
Retorna os valores acumulados somados, o produto, máximo ou mínimo respectivamente.
cumsum(x)
cumprod(x)
cummax(x)
cummin(x)
cumsum(c(1,2,3,4))
# retorna [1,3,6,10]
Retorna cumulativamente somadas do vetor passado.
Aplica, linha a linha ou coluna a coluna um função passada como parametro em um conjunto de dados.
apply(dados,1|2|nome-coluna|nome-linha,funcao)
apply(USPersonalExpenditure,1,median)
# Retorna média das linhas
apply(USPersonalExpenditure,2,median)
# Retorna média das colunas
apply(USPersonalExpenditure,2,sum)
# Retorna somatório das colunas
apply(USPersonalExpenditure,1,sum)
# Retorna somatório das linhas
Cria uma tabela de contingência baseada nos colunas passadas como parâmetros.
table(col1,col2)
table(infert$education,infert$induced)
Retorna os dados tabulados das colunas indicadas.
plot(Orange$age,Orange$circumference)
plot(Orange$age,Orange$circumference, xlab = "Idade", ylab = "Circunferencia")
plot(Orange$age,Orange$circumference, xlab = "Idade", ylab = "Circunferencia", col = "blue", main = "Laranjeiras")
plot(Orange$age,Orange$circumference, xlab = "Idade", ylab = "Circunferencia", col = "blue", main = "Laranjeiras", pch = 20)
plot(Orange$age,Orange$circumference, xlab = "Idade", ylab = "Circunferencia", col = "blue", main = "Laranjeiras", pch = 24, type = "b")
* `plot(AirPassengers)` * `plot(Theoph[,1:3])`
boxplot(iris[,1:4],main = "Iris")
dados = subset(USArrests,UrbanPop > 80)
pie(dados$Murder)
setores = paste(row.names(dados), dados[,1])
pie(dados$Murder, setores, main = "Taxa de assassinatos")
barplot(dados$Murder)
barplot(dados$Murder, name = row.names(dados),main="Assassinatos por Estado", xlab="Estados", ylab = "Assassinatos por 100 mil hab.")
barplot(dados$Murder, name = row.names(dados),main="Assassinatos por Estado", xlab="Estados", ylab = "Assassinatos por 100 mil hab.", las=2)