Selasa, 12 November 2019

Artikel ini merupakan kelanjutan dari artikel sebelumnya yang membahas tentang uji normalitas dengan menggunakan uji formal. Namun, sebelum melakukan uji normalitas menggunakan uji statistik formal, ada baiknya kita melihat normalitas suatu data melalui grafik dan statistik deskripsi lainnya.

Seperti yang diketahui sebelumnya, banyak uji statistik seperti uji korelasi, regresi, dan analisis ANOVA membutuhkan data yang mengikuti distribusi normal atau Gaussian distribution. Uji tersebut disebut dengan tes parametrik, karena validitas uji tersebut bergantung pada distribusi datanya.

Sebelum melakukan uji parametrik, kita harus melakukan uji untuk memastikan bahwa data yang akan kita gunakan telah memenuhi asumsi yang dibutuhkan untuk melakukan uji tersebut. Jika asumsi tersebut ternyata tidak terpenuhi atau terlanggar, maka kita sebaiknya menggunakan uji non-parametrik untuk mengatasi hal tersebut.



Pada kesempatan kali ini, akan dibahas mengenai pengecekan normalitas data dengan melihat grafik dari data menggunakan aplikasi R.

Install Package yang Dibutuhkan

Package R dibutuhkan untuk melakukan eksplorasi data adalah dplyr. Lalu untuk visualisasi data adalah ggpubr

> install.packages("dplyr")
> install.packages("ggpubr")

Panggil Package yang Telah di Install

> library("dplyr")
> library("ggpubr")
  
Lakukan Import Data

#Jika formatnya adalah .txt, maka gunakan ini
> my_data <- read.delim(file.choose())
#Jika format data adalah .csv, maka gunakan ini
> my_data <- read.csv(file.choose())

 
Perlu diketahui bahwa menurut Teori Limit Pusat, sampel yang besarnya lebih dari 30 dapat dianggap berdistribusi Normal. Namun, untuk meyakinkan dan mendapatkan kepastian, maka perlu dilakukan pengecekan terhadap distribusi data kita.

Membuat Density Plot

> ggdensity(mydata, main="Density Plot")




Kita dapat melihat grafik yang dihasilkan dan membandingkan dengan grafik distribusi normal secara teori. Jika dilihat dari grafik data, maka bentuk grafik tersebut telah menyerupai grafik distribusi normal.

Membuat Q-Q Plot

> ggqqplot(mydata, main="QQ Plot") 

f

Selain melihat dari grafik kepadatan, kita juga dapat melihat grafik QQ Plot dari data yang kita miliki. Melihat QQ Plot dapat memberikan gambaran mengenai penyebaran data kita apakah sesuai dengan penyebaran data teoritis. Jika melihat QQ Plot yang dihasilkan dari data eksperimen kita, maka penyebaran data berada di sekitar titik teoritis. Hal ini mengindikasikan bahwa data kita memiliki distribusi sebaran normal.

Mendapatkan Dukungan dari Uji Formal

Setelah melakukan pendeteksian menggunakan grafik, maka ada baiknya dilakukan uji formal untuk mendapatkan kepastian mengenai distribusi dari data yang kita miliki. Namun, jika kita sudah cukup yakin dengan melihat grafik, maka uji formal dapat tidak dilakukan.

Uji formal normalitas dapat menggunakan beberapa uji. Shapiro-Wilk Test merupakan salah satu uji normalitas yang cukup powerful. Selain Shapiro-Wilk test, ada juga uji Jarque Berra, uji Kolmogorov-Smirnov, uji Lilifors, dan uji Anderson Darling. Semua uji tersebut memiliki kelebihan dan kekurangan masing-masing. Pemilihan uji normalitas dapat disesuaikan dengan karakteristik data yang kita miliki.

0 comments:

Posting Komentar