Code Monkey home page Code Monkey logo

modul2_probstat_5025211169's Introduction

Modul2_Probstat_5025211169

Nomor 1

Seorang peneliti melakukan penelitian mengenai pengaruh aktivitas 𝐴 terhadap kadar saturasi oksigen pada manusia. Peneliti tersebut mengambil sampel sebanyak 9 responden. Pertama, sebelum melakukan aktivitas 𝐴, peneliti mencatat kadar saturasi oksigen dari 9 responden tersebut. Kemudian, 9 responden tersebut diminta melakukan aktivitas 𝐴. Setelah 15 menit, peneliti tersebut mencatat kembali kadar saturasi oksigen dari 9 responden tersebut. Berikut data dari 9 responden mengenai kadar saturasi oksigen sebelum dan sesudah melakukan aktivitas 𝐴

image

Berdasarkan data pada tabel diatas, diketahui kadar saturasi oksigen dari responden ke-3 ketika belum melakukan aktivitas 𝐴 sebanyak 67, dan setelah melakukan aktivitas 𝐴 sebanyak 70.

poin a

Carilah Standar Deviasi dari data selisih pasangan pengamatan tabel diatas

Penyelesaian dengan data dari tabel tersebut dimasukkan dalam sebuah vektor x dan y yang nantinya akan dicari selisihnya dan dicari standar deviasinya.

x <- c(78, 75, 67, 77, 70, 72, 78, 74, 77)
y <- c(100, 95, 70, 90, 90, 90, 89, 90, 100)

delta <- y-x
sd(delta)

Hasil yang didapat adalah sebagai berikut:

image

poin b

Carilah nilai t (p-value)

Pasangan data x dan y dari poin sebelumnya dicari p-value nya dengan memanfaatkan fungsi t.test() dengan parameter pasangan data x dan y

t.test(y, x, paired = TRUE)

Hasil yang didapat adalah sebagai berikut:

image

poin c

Tentukanlah apakah terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴 jika diketahui tingkat signifikansi 𝛼 = 5% serta H0 : “tidak ada pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴”

P-value yang didapat dari poin b adalah 6.003e-05, nilai tersebut lebih kecil dibanding dengan nilai 𝛼 = 5%. Maka keputusan yang diambil adalah tolak H0 dan terima H1 karena perbedaan mean populasi x dan y tidak sama dengan nol pada tingkat signifikansi 5%.

Nomor 2

Diketahui bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun. Untuk menguji klaim ini, 100 pemilik mobil yang dipilih secara acak diminta untuk mencatat jarak yang mereka tempuh. Jika sampel acak menunjukkan rata-rata 23.500 kilometer dan standar deviasi 3900 kilometer. (Kerjakan menggunakan library seperti referensi pada modul).

poin a

Apakah Anda setuju dengan klaim tersebut?

Berdasarkan nilai klaim rata-rata, standar deviasi, serta rata-rata sample yang diberikan, kemungkinan besar klaim tersebut valid. Bila diasumsikan confident levelnya adalah 95%, rentang yang rata-rata populasi berada pada 22726 hingga 24273 dengan bukti sebagai berikut:

nx <- 100
meanx <- 23500
sdx <- 3900
tsum.test(meanx, sdx, nx, var.equal = TRUE, mu = 20000)

Hasil yang didapat adalah sebagai berikut:

image

poin b

Jelaskan maksud dari output yang dihasilkan!

Berdasarkan confidence interval yang didapat dengan asumsi tingkat signifikansi 𝛼 = 5%, klaim rata-rata "lebih dari 20000" masih masuk pada confidence interval sehingga klaim diterima. Kode program pembuktian identik dengan penjelasan pada poin a menggunakan fungsi tsum.test() dengan parameter yang sudah diinputkan pada poin sebelumnya

tsum.test(meanx, sdx, nx, var.equal = TRUE, mu = 20000)

Hasil yang didapat adalah sebagai berikut:

image

poin c

Buatlah kesimpulan berdasarkan P-Value yang dihasilkan!

p-value yang didapat lebih kecil dibanding tingkat signifikansi, maka terima H0

Nomor 3

Diketahui perusahaan memiliki seorang data analyst ingin memecahkan permasalahan pengambilan keputusan dalam perusahaan tersebut. Selanjutnya didapatkanlah data berikut dari perusahaan saham tersebut.

image

Dari data diatas berilah keputusan serta kesimpulan yang didapatkan dari hasil diatas. Asumsikan nilai variancenya sama, apakah ada perbedaan pada rata-ratanya (α= 0.05)? Buatlah:

poin a

H0 dan H1

  • H0: μ1 == μ2 (rata-rata saham di Bandung sama dengan di Bali)
  • H1: μ1 =/= μ2 (rata-rata saham di Bandung tidak sama dengan di Bali)

poin b

Hitung Sampel Statistik

Data statistik yang diberikan akan dihitung untuk mendapat perbedaan mean x (bandung) dan y (bali) dengan tingkat signifikansi 0.05

nx <-19
meanx <- 3.64
sdx <- 1.67

ny<-27
meany <- 2.79
sdy <- 1.32
tsum.test(meanx, sdx, nx, meany , sdy, ny,alternative = "greater", var.equal = TRUE)

Hasil yang didapat adalah sebagai berikut:

image

poin c

Lakukan Uji Statistik (df =2)

Untuk melakukan uji statistik dengan df = 2 maka digunakan fungsi plotDist dari Mosaic library untuk mendapatkan visualisasi grafiknya

plotDist(dist ='t', df =2)

Hasil yang didapat adalah sebagai berikut:

image

poin d

Nilai Kritikal

Nilai kritikal didapat dengan memanfaatkan fungsi qchisq dengan nilai df custom bernilai 2

alpha <- 0.05
qchisq(alpha, df =2, lower.tail = FALSE)

Hasil yang didapat adalah sebagai berikut:

image

poin e

keputusan

Keputusan yang diambil berdasarkan uji statistik yand telah dilakukan adalah tolak H0 dan terima H1

poin f

kesimpulan

Dapat disimpulkan bahwa terdapat perbedaan rata-rata sehingga μ1 =/= μ2

Nomor 4

Seorang Peneliti sedang meneliti spesies dari kucing di ITS . Dalam penelitiannya ia mengumpulkan data tiga spesies kucing yaitu kucing oren, kucing hitam dan kucing putih dengan panjangnya masing-masing. Jika :

diketahui dataset https://intip.in/datasetprobstat1 H0 : Tidak ada perbedaan panjang antara ketiga spesies atau rata-rata panjangnya sama

Tahap pertama adalah dengan memanggil library dan file yang akan digunakan pada poin-poin berikutnya:

library("ggplot2")
tabel <- read.table(url("https://rstatisticsandresearch.weebly.com/uploads/1/0/2/6/1026585/onewayanova.txt"), h=T)
attach(tabel)
names(tabel)

poin a

Buatlah masing masing jenis spesies menjadi 3 subjek "Grup" (grup 1,grup 2,grup 3). Lalu Gambarkan plot kuantil normal untuk setiap kelompok dan lihat apakah ada outlier utama dalam homogenitas varians.

Grouping dilakukan menggunakan fungsi subset dengan pencocokan nama group dari data tabel. Plot quartil normal menggunakan fungsi qqnorm() dan qqline() pada tiap group.

tabel$Group <- as.factor(tabel$Group)
tabel$Group = factor(tabel$Group, labels = c("Kucing Oren", "Kucing Hitam", "Kucing Putih"))

class(tabel$Group)

Group1 <- subset(tabel, Group == "Kucing Oren")
Group2 <- subset(tabel, Group == "Kucing Hitam")
Group3 <- subset(tabel, Group == "Kucing Putih")

qqnorm(Group1$Length)
qqline(Group1$Length)

qqnorm(Group2$Length)
qqline(Group2$Length)

qqnorm(Group3$Length)
qqline(Group3$Length)

Hasil yang didapat adalah sebagai berikut:

-Group 1 (kucing oren):

image

-Group 2 (kucing hitam):

image

-Group 3 (kucing putih):

image

poin b

carilah atau periksalah Homogeneity of variances nya , Berapa nilai p yang didapatkan? , Apa hipotesis dan kesimpulan yang dapat diambil ?

Homogenitas varians dapat dicari menggunakan fungsi bartlett.test()

bartlett.test(Length ~ Group, data = tabel)

Hasil yang didapat adalah sebagai berikut:

image

P-value yang didapat melebihi nilai tingkat signifikan (0.05) maka varians homogen.

poin c

Untuk uji ANOVA, buatlah model linier dengan Panjang versus Grup dan beri nama model tersebut model 1.

model1 didapat dari fungsi lm() dengan parameter panjang Group dan data tabel lalu dijalankan uji anova untuk model1 tersebut:

model1 <- lm(Length ~ Group, data = tabel)
anova(model1)

Hasil yang didapat adalah sebagai berikut:

image

poin d

Dari Hasil Poin C , Berapakah nilai-p ? , Apa yang dapat Anda simpulkan dari H0?

Berdasarkan hasil poin c didapat p-value sebesar 0.0013. p-value tersebut lebih kecil dari tingkat signifikansi (0.05) maka tolak H0

poin e

Verifikasilah jawaban model 1 dengan Post-hooc test TukeyHSD , dari nilai p yang didapatkan apakah satu jenis kucing lebih panjang dari yang lain? Jelaskan.

Digunakan g fungsi Tukey dengan argumen aov(model1) yang telah didapat sebelumnya:

TukeyHSD(aov(model1))

Hasil yang didapat adalah sebagai berikut:

image

poin f

Visualisasikan data dengan ggplot2

Visualisasi menggunakan fungsi ggplot2():

ggplot(tabel, aes(Group, Length)) + geom_boxplot() + scale_x_discrete() + xlab("Group") + ylab("Length (cm)")

Hasil yang didapat adalah sebagai berikut:

image

Nomor 5

Data yang digunakan merupakan hasil eksperimen yang dilakukan untuk mengetahui pengaruh suhu operasi (100˚C, 125˚C dan 150˚C) dan tiga jenis kaca pelat muka (A, B dan C) pada keluaran cahaya tabung osiloskop. Percobaan dilakukan sebanyak 27 kali dan didapat data sebagai berikut: Data Hasil Eksperimen.

Pertama import library dan file data:

library(ggplot2)
library(dplyr)
library(multcompView)
library(readr)
GTL <- read.csv("GTL.csv")
head(GTL)
str(GTL)

poin a

Buatlah plot sederhana untuk visualisasi data

visualisasi menggunakan fungsi qplot():

qplot(x = Temp, y = Light, geom = "point", data = GTL) + facet_grid(.~Glass, labeller = label_both)

Hasil yang didapat adalah sebagai berikut:

image

poin b

Lakukan uji ANOVA dua arah untuk 2 faktor

Untuk melakukan uji anova dua arah dibutuhkan factor independen, factor dapat didapat dari fungsi as.factor(). Lalu dapat dilakukan uji anova dengan analisis varians dengan aov().

GTL$Glass <- as.factor(GTL$Glass)
GTL$Temp_Factor <- as.factor(GTL$Temp)
str(GTL)
anova <- aov(Light ~ Glass*Temp_Factor, data = GTL)
summary(anova)

Hasil yang didapat adalah sebagai berikut:

image

poin c

Tampilkan tabel dengan mean dan standar deviasi keluaran cahaya untuk setiap perlakuan (kombinasi kaca pelat muka dan suhu operasi)

Dilakukan fungsi group-by() dengan argumen file GTL, Glass, dan Temp dengan masing-masing mean dan standar devias menggunakan summarise():

hasil <- group_by(GTL, Glass, Temp) %>% summarise(mean = mean(Light), sd = sd(Light)) %>% arrange(desc(mean))
print(hasil)

Hasil yang didapat adalah sebagai berikut:

image

poin d

Lakukan uji Tukey

Dilakukan uji tukey menggunakan fungsi Tukey()

tukey <- TukeyHSD(anova)
print(tukey)

Hasil yang didapat adalah sebagai berikut:

image

poin e

Gunakan compact letter display untuk menunjukkan perbedaan signifikan antara uji Anova dan uji Tukey

tukey.cld <- multcompLetters4(anova, tukey)
print(tukey.cld)

cld <- as.data.frame.list(tukey.cld$`Glass:Temp_Factor`)
hasil$Tukey <- cld$Letters
print(hasil)

Hasil yang didapat adalah sebagai berikut:

image

modul2_probstat_5025211169's People

Contributors

mengz04 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.