Selasa, 05 April 2022

Nonprobability Sampling merupakan teknik pemilihan sampel dimana tidak semua populasi memiliki peluang yang sama untuk terpilih menjadi sampel.


Suatu survei atau penelitian dilakukan untuk mendapatkan data ataupun informasi yang akan digunakan untuk mengambil suatu keputusan. Data atau informasi tersebut biasanya didapatkan dari sampel. Teknik pemilihan sampel sangat bergantung pada pertimbangan dari peneliti atau pelaksana survei, terlebih lagi teknik sampling yang digunakan juga akan sangat bergantung kepada tujuan survei itu sendiri. Jika populasi target yang akan diteliti tidak memiliki kerangka sampel, maka teknik nonprobability sampling dapat digunakan.

nonprobability sampling


Definisi Nonprobability Sampling

Nonprobability Sampling merupakan teknik pemilihan sampel tidak dipilih secara acak dari populasi. Sampel yang dipilih pada nonprobability sampling didasarkan pada kriteria yang telah ditetapkan oleh peneliti, jadi sampel yang dipilih murni berdasarkan subjektifitas peneliti. Metode sampling ini banyak digunakan oleh peneliti untuk melakukan penelitian kualitatif.


Nonprobability Sampling sangat cocok digunakan untuk studi eksplorasi sebelum survei dengan probability sampling dilaksanakan. Metode nonprobability sampling digunakan oleh peneliti ketika sangat sulit untuk mendapatkan/membuat kerangka sampel karena keterbatasan waktu dan biaya.

Tipe-tipe Nonprobability Sampling

Beberapa jenis Nonprobability Sampling yang cukup umum:

  1. Convenience sampling
  2. Pada teknik pemilihan sampel ini, peneliti memilih sampel dari populasi berdasarkan sampel yang tersedia dan dapat dijangkau oleh peneliti. Sampel yang dipilih pada metode ini hanya dipilih karena sampel tersebut mudah diakses dan peneliti menyadari bahwa sampel yang dipilih tidak mewakili populasi.

  3. Quota sampling
  4. Teknik sampling ini mengklasifikasikan populasi menjadi beberapa kelompok menurut kriteria tertentu (yang ditentukan oleh peneliti). Lalu kemudian, peneliti menentukan jumlah sampel dari setiap kelompok yang telah diklasifikasikan. Pada teknik ini, pengklasifikasian yang dibuat oleh peneliti dapat menimbulkan bias. Penjelasan lebih lanjut tentang quota sampling sudah dibahas pada artikel Pengertian Quota sampling dan contoh penggunaannya.

  5. Snowball sampling
  6. Snowball Sampling adalah teknik sampling non probabilitas yang digunakan ketika sampel yang dicari memiliki karakteristik yang sulit ditemukan. Teknik snowball sampling menggunakan pengambilan sampel dimana sampel berikutnya merupakan rekomendasi ataupun penunjukan dari sampel sebelumnya.

  7. Purposive sampling
  8. Purposive sampling atau judgemental sampling merupakan teknik pemilihan sampel dimana peneliti memilih sampel hanya berdasarkan penilaian dan pertimbangan dari peneliti itu sendiri.

Kelebihan penggunaan Nonprobability sampling

  • Sesungguhnya, akan lebih mudah bagi peneliti untuk melakukan survei menggunakan nonprobability sampling di dunia nyata. Kemudahan ini disebabkan peneliti tidak memerlukan kerangka sampel dalam melakukan pemilihan sampel. Meskipun para statistisi akan cenderung lebih memilih probabilty sampling.
  • Penggunaan nonprobability sampling pada penelitian juga akan menghemat biaya dan waktu yang digunakan dalam pengumpulan data. Hal ini dikarenakan sampel yang dipilih oleh peneliti akan lebih mudah diteliti.

Data dapat dikategorikan kedalam salah satu dari empat kategori berikut. Yaitu, nominal, ordinal, interval, dan rasio. Setiap kategori memiliki kekurangan dan kelebihannya masing-masing.

1. Skala Nominal

Biasa disebut juga sebagai skala kategori. Data yang diukur dengan skala nominal tidak dapat dijumlahkan, dikali, dibagi ataupun dikurangi. Skala nominal juga merupakan yang paling lemah dari empat skala pengukuran. Skala nominal membedakan satu objek atau peristiwa dari yang lain atas dasar nama.

Contoh.
Agama : Islam, Kristen, Katolik, Budha, Hindu, dll
Jenis Kelamin : Laki-laki, perempuan
Tempat lahir : semua nama tempat yang mungkin

2. Skala Ordinal

Skala pengukuran ini selain memiliki sifat pengukuran nominal, yaitu membedakan, skala ordinal juga memiliki tingkatan. 

Contoh.
Peringkat Kelas : 1st, 2nd, 3rd, ...
Pendapatan (menurut kategori) : pendapatan rendah, pendapatan menengah, pendapatan tinggi
Skala Liker : sangat tidak setuju, tidak setuju, normal, setuju, dan sangat setuju

3. Skala Interval

Skala pengukuran ini, selain memiliki sifat membedakan dan memiliki tingkat, skala pengukuran ini juga memiliki jarak ataupun selisih. Sehingga ada perbedaan yang jelas antar tingkatan,

Contoh.
Suhu ruangan (baik dalam Celcius, Farenheit, ataupun satuan suhu lainnya)
Tingkat IQ

4. Skala Rasio

Skala rasio merupakan satu-satunya skala pengukuran yang memiliki sifat nol mutlak. Artinya, jika sesuatu bernilai nol, maka hal tersebut menunjukkan tidak adanya sifat yang diukur. Misalkan, jika anda memiliki tinggi 0 cm, itu artinya anda tidak ada. 

Contoh.
Umur
Tinggi Badan
Berat badan
Jumlah penjualan
Jumlah anak
dan masih banyak lainnya



snowball sampling

Snowball Sampling adalah teknik nonprobability sampling yang digunakan ketika sampel yang dicari memiliki karakteristik yang sulit ditemukan. Teknik snowball sampling menggunakan pengambilan sampel dimana sampel berikutnya merupakan rekomendasi ataupun penunjukan dari sampel sebelumnya.

Contohnya, ketika kita ingin meneliti kepuasan pengunjung rutin di suatu klub malam (sebut saja Holywi*gs), tentu akan sulit untuk mengetahui siapa saja yang sering mengunjungi klub malam tersebut. Kita bisa saja mencari satu persatu orang yang ingin kita survei, namun tentu saja akan lebih mudah jika kita menanyakan langsung kepada orang pertama yang menjadi sampel, siapa saja yang akan menjadi sampel berikutnya.

Contoh lainnya, kita ingin melakukan survei perlakuan yang diterima oleh penderita AIDS dari masyarakat. Kita akan kesulitan untuk menemukan orang yang menderita AIDS, sehingga kita perlu menemui komunitas penderita AIDS dan meminta kontak penderita AIDS dari mereka.

Snowball Sampling seperti namanya, dimana jumlah sampel akan terus meningkat seperti bola salju yang berguling, sehingga peneliti memiliki cukup sampel untuk dilakukan analisa dan mengambil keputusan. Teknik snowball sampling juga sering digunakan pada dunia bisnis, dimana tak jarang karakteristik sampel yang dibutuhkan sulit untuk ditemui.


Jenis-Jenis Teknik Snowball Sampling

  1. Linear Snowball Sampling: Sampel bermula dari satu orang/individu lalu sampel pertama memberikan informasi tentang satu orang/individu lain yang memenuhi kriteria. Hal itu terus berlanjut hingga jumlah sampel yang diinginkan terpenuhi
  2. Exponential Non-Discriminative Snowball Sampling: Pada tipe ini, subjek/sampel pertama merekomendasikan beberapa sampel lainnya, dan semua sampel hasil rekomendasi digunakan. Begitu juga sampel berikutnya merekomendasikan beberapa sampel lainnya lagi. Hal ini terus berlanjut hingga jumlah sampel yang diinginkan terpenuhi
  3. Exponential Discriminative Snowball Sampling: Pada tipe ini, subjek/sampel pertama merekomendasikan beberapa sampel lainnya, namun dari beberapa subjek hasil rekomendasi, hanya satu yang dipilih sesuai dengan kebutuhan penelitian. Begitu seterusnya hingga jumlah sampel yang diinginkan terpenuhi


Kelebihan Teknik Snowball Sampling

  1. Lebih Mudah Mendapatkan Sampel: Rekomendasi dari sampel yang telah kita teliti membuat kita lebih mudah mendapatkan sampel yang sesuai dengan kriteria yang telah ditetapkan pada awal penelitian. Waktu penelitian yang sedianya digunakan untuk mencari sampel dapat dialihkan untuk melakukan hal yang lain.
  2. Lebih Murah: Selain lebih mudah, rekomendasi sampel yang biaya yang dikeluarkan menjadi lebih sedikit dikarenakan tidak akan sulit untuk mencari sampel yang dibutuhkan.
  3. Responden yang Ragu-Ragu: Untuk penelitian dengan topik yang cukup sensitif, teknik snowball sampling sangat cocok digunakan untuk menghindari keragu-raguan yang ditunjukkan oleh responden. 

Kekurangan Teknik Snowball Sampling

  1. Sampling Bias dan Margin of Error: Dikarenakan teknik snowball sampling ini merupakan teknik sampling non probabilitas, serta sampel yang didapat merupakan rekomendasi dari sampel sebelumnya, maka akan ada potensi terjadinya sampling bias dan margin of error.
  2. Kurang Kerjasama: Ada kemungkinan responden awal yang kita temui akan sulit untuk dimintai rekomendasi untuk sampel berikutnya. Hal ini mungkin terjadi pada topik-topik penelitian yang sangat sensitif. 

Selasa, 12 Mei 2020

Badan Pusat Statistik baru-baru ini mengeluarkan rilis mengenai statistik ketenagakerjaan di Indonesia. Ditengah pandemi Corona yang sedang menimpa dunia saat ini, BPS tetap melakukan rilis data meskipun harus dilakukan secara online. Data tersebut didapatkan melalui Survei Angkatan Kerja Nasional (SAKERNAS) yang dilaksanakan pada Februari 2020. Survei SAKERNAS sendiri merupakan survei rutin yang dilakukan oleh BPS setiap 2 kali setahun (Februari dan Agustus), yang bertujuan untuk melakukan pendataan terhadap situasi angkatan kerja di Indonesia. Rilis resmi dari BPS dapat didownload langsung di website resmi BPS (www.bps.go.id), sedangkan rilis resmi Statistik Ketenagakerjaan Februari 2020 dapat diunduh disini.

Rilis BPS tersebut menyatakan tingkat pengangguran terbuka (TPT) di Indonesia pada Februari 2020 adalah sebesar 4,99 persen. Hal tersebut berarti dari 100 orang angkatan kerja, terdapat 4 hingga 5 orang yang tidak memiliki pekerjaan. Secara persentase, TPT pada Februari 2020 menurun jika dibandingkan dengan TPT Februari 2019 (5,01 persen). Namun, secara jumlah, orang pengangguran di Indonesia bertambah 60 ribu jiwa.

Tingkat pengangguran lulusan SMK lebih besar dibandingkan lulusan lainnya


Jika dilihat lebih jauh, terdapat fakta yang cukup menarik, dimana tingkat pengangguran pada lulusan SMK pada Februari 2020 adalh 8,49 persen, lebih tinggi dibanding tingkat pendidikan lainnya. Artinya, seseorang yang merupakan lulusan SMK lebih berpeluang menganggur dibandingkan seseorang lulusan lainnya. Padahal, lulusan SMK adalah orang-orang yang diharapkan langsung dapat terserap kedalam dunia kerja. Pendidikan SMK memang dikhususkan untuk membentuk orang yang langsung siap diterjunkan ke dalam dunia pekerjaan. Lalu, apakah pendidikan SMK sudah berhasil membuat lulusan yang siap bekerja? Atau malah menambah jumlah pengangguran di Indonesia?

Media Kompas mengatakan bahwa pengangguran di Indonesia didominasi oleh lulusan SMK


Mencermati Data

Perlu diketahui bahwa pengangguran di Indonesia tidaklah didominasi oleh lulusan SMK. Setidaknya, tidak ada data BPS yang mendukung klaim tersebut. Data BPS pada rilis resminya hanya menyatakan bahwa tingkat pengangguran lulusan SMK lebih tinggi dibandingkan lulusan tingkat pendidikan lainnya. Artinya, dari seluruh pengangguran secara keseluruhan, belum tentu lulusan SMK mendominasi. Berdasarkan publikasi BPS yang berjudul Indikator Pasar Tenaga Kerja Agustus 2019 (dapat didownload disini), pengangguran di Indonesia memang didominasi oleh lulusan Sekolah Menengah (SMA, SMK, dan sederajat). Namun, tidak ada data lanjutan yang menyatakan bahwa lulusan SMK mendominasi pengangguran di Indonesia.

Tetap Menjadi Masalah

Akan tetapi, permasalahan tingginya tingkat pengangguran pada lulusan SMK tetap menjadi permasalahan yang harus dipecahkan oleh pemerintah. Beberapa tahun yang lalu, pemerintah berusaha mempromosikan SMK. Pemerintah bertujuan meningkatkan supply angkatan kerja yang memiliki kemampuan yang sesuai dengan permintaan pasar. Namun, gencarnya promosi tersebut malah membawa masalah disaat ini. Terjadi over supply pada pasar tenaga kerja yang menyebabkan tingginya tingkat pengangguran lulusan SMK.

Apa yang Salah Dengan SMK?

SMK adalah sekolah menengah yang didesain untuk menghasilkan lulusan yang memiliki keahlian dan siap untuk masuk kedalam pasar tenaga kerja. Pada tahun 2019, terdapat 14.064 SMK diseluruh Indonesia. Menariknya, 75 persen dari jumlah tersebut merupakan swasta. Hal ini dikarenakan pemerintah memang menggandeng pihak industri dalam menyiapkan lulusan SMK, sehingga lulusan SMK dapat sesuai dengan harapan pihak industri.

Terdapat juga beberapa stigma negatif di masyarakat terhadap SMK. Kasus-kasus tawuran yang dilakukan oleh beberapa SMK memperkuat stigma negatif tersebut. Selain itu, kurikulum SMK saat ini dinilai belum sesuai dengan keinginan pasar tenaga kerja saat ini. Oleh sebab itu, pemerintah diharapkan melakukan perubahan terhadap kurikulum SMK yang ada saat ini. Kurikulum SMK diharapkan lebih mampu menolong para siswa sebelum mereka terjun kedalam dunia pekerjaan yang sesungguhnya.

Harapan Pada Mendikbud Baru

Terpilihnya Nadiem Makarim sebagai Menteri Pendidikan memberikan harapan bagi permasalahan ini. Pengalaman Nadiem pada perusahaan start up raksasa diharapkan mampu memberikan perubahan terhadap sistem pendidikan di Indonesia, terutama permasalahan yang dihadapi oleh lulusan SMK saat ini.

Industri 4.0 menuntut sumber daya manusia yang dapat bersaing dengan teknologi yang semakin canggih. Jika lulusan SMK tidak dapat menyesuaikan dengan kebutuhan industri saat ini, maka program pemerintah mempromosikan pendidikan vokasi akan menambah beban pada pemerintah saat ini.



Minggu, 29 Maret 2020

Statistik merupakan bagian penting dari ilmu pengetahuan. Seluruh bidang ilmu pengetahuan menggunakan statistik untuk menguji kebenaran-kebenaran baru, ataupun menguji suatu teori terhadap suatu populasi tertentu. Selain pada ilmu pengetahuan, statistik juga memiliki peranan penting dalam dunia industri. Beberapa produsen biasanya terlebih dahulu melakukan survey sebelum meluncurkan produk mereka. Hal itu dilakukan untuk mengetahui tanggapan konsumen terhadap produk-produk produsen tersebut. 

Secara umum, statistik terbagi atas dua. Statistik deskriptif yaitu statistik yang menganalisis data populasi dengan cara mendeskripsikan atau menggambarkan data, tanpa memberikan kesimpulan yang berlaku umum (generalisasi). Biasanya, statistik deskriptif tak dapat digunakan sebagai gambaran terhadap populasi. Yang kedua adalah statistik inferensia yaitu jenis statistik yang menganalisis data sampel dan membuat generalisasi pada populasi. Statistik inferensia dapat digunakan untuk menentukan karakteristik dari sebuah populasi.

Statistik inferensia yang lazim digunakan adalah statistik yang dilakukan untuk mengestimasi parameter dan melakukan uji hipotesis. Hal tersebut biasanya disebut dengan statistik parametrik. Namun, statistik parametrik memiliki beberapa persyaratan, yaitu :
  1. Variabel penelitian (data yang ada) harus mengikuti distribusi normal;
  2. Ukuran sampel terpenuhi;
  3. Skala pengukuran paling kuat (biasanya adalah skala rasio);
  4. Serta asumsi-asumsi lainnya.
Pada beberapa situasi, persyaratan diatas sangat sulit dipenuhi. Salah satu persyaratan yang paling sulit dipenuhi adalah data mengikuti distribusi normal dan skala pengukuran. Tak jarang, beberapa survei yang dilakukan perusahaan tidak menggunakan skala pengukuran yang kuat (biasanya skala nominal). Sehingga, akan menjadi sulit untuk melakukan estimasi parameter. Selain itu, beberapa survei yang dilakukan perusahaan tidak menggunakan kerangka sampel dalam penarikan sampelnya. Hal tersebut menyebabkan statistik parametrik tidak mungkin dilakukan.

Statistik nonparamterik hadir untuk mengatasi permasalahan-permasalahan diatas. Statistik nonparamterik dapat digunakan meskipun variabel penelitian tidak mengikuti distribusi normal. Selain itu, terdapat beberapa kelebihan dari statistik nonparametrik, antara lain :
  1. Tidak memerlukan ukuran sampel yang harus memenuhi syarat;
  2. Uji statistik dapat digunakan untuk ukuran sampel data yang kecil;
  3. Berlaku untuk semua jenis skala pengukuran. Mulai dari skala nominal hingga skala rasio
  4. Uji dapat dilakukan pada sampel-sampel yang diambil dari populasi yang berbeda


Meskipun demikian, pengujian statistik nonparametrik menimbulkan kelemahan-kelemahan jika dibandingkan dengan pengujian statistik parametrik. Adapun kelemahannya, antara lain :
  1. Jika ukuran sampel cukup besar, asumsi variabel berdistribusi normal dan skala pengukuran interval, maka hasil uji statistik nonparametrik lebih lebih dibandingkan uji statistik parametrik. Kelemahan ini dapat dilihat dari power efisiensi yang dihasilkan masing-masing uji.
  2. Uji statistik nonparametrik tidak bisa melakukan uji interaksi antar variabel.
  3. Memungkinkan adanya informasi yang terbuang.

Minggu, 09 Februari 2020

Kemiskinan masih menjadi perhatian bagi pemerintah. Meskipun angka kemiskinan secara nasional telah dibawah 10 persen, namun penanganan kemiskinan masih terus dilakukan oleh pemerintah. Beberapa program bantuan sosial terus dilakukan, seperti beras sejahtera, bantuan sembako, dan bantuan premi BPJS. Selain pemerintah pusat, pemerintah daerah juga melakukan program-program untuk mengatasi kemiskinan di wilayahnya masing-masing. 

Sebagai salah satu indikator keberhasilan terhadap penanganan kemiskinan, pemerintah menggunakan data kemiskinan yang dihitung oleh BPS. Data kemiskinan dihitung BPS melalui Survei Sosial Ekonomi Nasional (SUSENAS). Lalu, sebenarnya, provinsi mana yang memiliki persentase penduduk miskin yang paling besar? Berikut data yang didapatkan dari website Badan Pusat Statistik.

Provinsi Persentase Penduduk Miskin 
PAPUA 26,55
PAPUA BARAT 21,51
NUSA TENGGARA TIMUR 20,62
MALUKU 17,65
GORONTALO 15,31
Sumber : SUSENAS September 2019

Tabel tersebut menunjukkan bahwa 5 Provinsi dengan persentase penduduk miskin terbanyak semuanya berada di wilaya Indonesia bagian timur. Data tersebut juga semakin memperjelas bahwa memang terjadi ketimpangan antara wilayah Indonesia bagian timur dengan wilayah Indonesia bagian barat.

Secara tidak mengejutkan, Papua dan Papua Barat masih memiliki persentase penduduk miskin terbanyak. Menurut data dari BPS, 1 dari 4 orang di Papua merupakan penduduk miskin. Sedangkan, 1 dari 5 orang di Papua Barat dan NTT hidup dibawah garis kemiskinan. Faktor infrastruktur yang sangat terbelakang membuat wilayah bagian timur Indonesia, khususnya Papua, semakin sulit mengatasi kemiskinan. Dibutuhkan kerjasama dan sinergi yang baik antara pemerintah pusat dan pemerintah daerah.

Untuk wilayah barat Indonesia, Provinsi Aceh menjadi pemimpin klasemen untuk urusan persentase penduduk miskin (secara keseluruhan, Provinsi Aceh peringkat 6). Persentase penduduk miskin di Aceh mencapai angka 15,01 persen. Angka tersebut menurun jika dibandingkan pada periode Maret 2019 (15,32 persen). Lalu, apakah memang Aceh harus melakukan ekspor ganja untuk keluar dari jurang kemiskinan?

Selasa, 12 November 2019

Artikel ini merupakan kelanjutan dari artikel sebelumnya yang membahas tentang uji normalitas dengan menggunakan uji formal. Namun, sebelum melakukan uji normalitas menggunakan uji statistik formal, ada baiknya kita melihat normalitas suatu data melalui grafik dan statistik deskripsi lainnya.

Seperti yang diketahui sebelumnya, banyak uji statistik seperti uji korelasi, regresi, dan analisis ANOVA membutuhkan data yang mengikuti distribusi normal atau Gaussian distribution. Uji tersebut disebut dengan tes parametrik, karena validitas uji tersebut bergantung pada distribusi datanya.

Sebelum melakukan uji parametrik, kita harus melakukan uji untuk memastikan bahwa data yang akan kita gunakan telah memenuhi asumsi yang dibutuhkan untuk melakukan uji tersebut. Jika asumsi tersebut ternyata tidak terpenuhi atau terlanggar, maka kita sebaiknya menggunakan uji non-parametrik untuk mengatasi hal tersebut.



Pada kesempatan kali ini, akan dibahas mengenai pengecekan normalitas data dengan melihat grafik dari data menggunakan aplikasi R.

Install Package yang Dibutuhkan

Package R dibutuhkan untuk melakukan eksplorasi data adalah dplyr. Lalu untuk visualisasi data adalah ggpubr

> install.packages("dplyr")
> install.packages("ggpubr")

Panggil Package yang Telah di Install

> library("dplyr")
> library("ggpubr")
  
Lakukan Import Data

#Jika formatnya adalah .txt, maka gunakan ini
> my_data <- read.delim(file.choose())
#Jika format data adalah .csv, maka gunakan ini
> my_data <- read.csv(file.choose())

 
Perlu diketahui bahwa menurut Teori Limit Pusat, sampel yang besarnya lebih dari 30 dapat dianggap berdistribusi Normal. Namun, untuk meyakinkan dan mendapatkan kepastian, maka perlu dilakukan pengecekan terhadap distribusi data kita.

Membuat Density Plot

> ggdensity(mydata, main="Density Plot")




Kita dapat melihat grafik yang dihasilkan dan membandingkan dengan grafik distribusi normal secara teori. Jika dilihat dari grafik data, maka bentuk grafik tersebut telah menyerupai grafik distribusi normal.

Membuat Q-Q Plot

> ggqqplot(mydata, main="QQ Plot") 

f

Selain melihat dari grafik kepadatan, kita juga dapat melihat grafik QQ Plot dari data yang kita miliki. Melihat QQ Plot dapat memberikan gambaran mengenai penyebaran data kita apakah sesuai dengan penyebaran data teoritis. Jika melihat QQ Plot yang dihasilkan dari data eksperimen kita, maka penyebaran data berada di sekitar titik teoritis. Hal ini mengindikasikan bahwa data kita memiliki distribusi sebaran normal.

Mendapatkan Dukungan dari Uji Formal

Setelah melakukan pendeteksian menggunakan grafik, maka ada baiknya dilakukan uji formal untuk mendapatkan kepastian mengenai distribusi dari data yang kita miliki. Namun, jika kita sudah cukup yakin dengan melihat grafik, maka uji formal dapat tidak dilakukan.

Uji formal normalitas dapat menggunakan beberapa uji. Shapiro-Wilk Test merupakan salah satu uji normalitas yang cukup powerful. Selain Shapiro-Wilk test, ada juga uji Jarque Berra, uji Kolmogorov-Smirnov, uji Lilifors, dan uji Anderson Darling. Semua uji tersebut memiliki kelebihan dan kekurangan masing-masing. Pemilihan uji normalitas dapat disesuaikan dengan karakteristik data yang kita miliki.

Rabu, 30 Mei 2018

Secara umum, statistik dapat digolongkan menjadi dua, yakni statistik deskriptif dan statistik inferensia. Kedua statistik ini tidak dapat dipisahkan antara satu dengan yang lain. Statistika deskriptif adalah kumpulan kegiatan yang mencakup tentang pengumpulan data, pengolahan, dan penyajian data dalam bentuk yang baik, seperti grafik, tabel, dan lain sebagainya. Sedangkan statistik inferensia adalah alat bantu pada statistik yang digunakan untuk mengolah data, menganalisis data, dan menarik kesimpulan populasi berdasarkan sampel. Contoh dari statistik inferensia adalah statistik non-parametrik dan statistik parametrik.



Penggunaan uji statistik non-parametrik atau statistik parametrik didasarkan pada distribusi data yang digunakan. Jika distribusi data yang digunakan berdistribusi normal, maka uji statistik parametrik dapat digunakan. Suatu data dapat dikatakan normal apabila nilai dari rata-ratanya sama dengan nilai modusnya atau mode.

Mengapa asumsi normalitas sering diperlukan dan dipertanyakan? 

Dalam dunia statistik, berbagai macam populasi sering dianggap berdistribusi normal. Oleh karena itu, pengambilan sampel pada statistik juga diasumsikan disekitaran nilai rata-rata dan mode (modus) dari populasi. sehingga sampel yang diambil dapat menggambarkan populasi. Oleh karena itu, asumsi normalitas merupakan hal yang cukup penting untuk dipenuhi.

Dalam beberapa uji statistik parametrik, asumsi normalitas harus terpenuhi. Seperti analisis regresi linear berganda dengan penduga Ordinary Least Square (OLS), yang harus memenuhi asumsi normalitas. Menurut Baltagi (2008 : 98), terpenuhinya asumsi normalitas akan membuat penduga OLS menjadi MVU (minimum variance unbiased). Hal itu menunjukkan bahwa asumsi normalitas cukup penting untuk terpenuhi dalam persamaan regresi. Pada regresi data panel, terlanggarnya asumsi normalitas ini dapat diatasi dengan menggunakan estimator GLS (Generalized Least Square).

Asumsi normalitas tak hanya berlaku untuk variabel dependen (Y) saja, akan tetapi harus terpenuhi untuk seluruh variabel, termasuk variabel X. Akan tetapi, pengujian tidak dilakukan independen, ataupun satu per satu variabel, namun yang diuji normalitasnya adalah error dari persamaan.

Pengujian normalitas data dapat dilakukan dengan beberapa metode seperti: Anderson-Darling test, Kolmogorov-Smirnovtest, Pearson Chi-Square test, Cramer-von Mises test, Shapiro-Wilktest, Fisher’s cumulate test. Beberapa yang sering digunakan adalah Kolmogorov-Smirnov Test, Shapiro-Wilktest, dan Jarque Berra.

Pada kesempatan kali ini, saya akan melakukan uji normalitas terhadap error dari regresi berganda dengan aplikasi R Studio. Beberapa uji normalitas yang akan saya gunakan adalah Kolmogorov Smirnov, Shapiro-Wilktest, dan Jarque Bera Test.

Sebelumnya, persamaan yang saya gunakan adalah sebagai berikut :

Lokasi : Provinsi-provinsi di Indonesia
Tahun : 2016

Variabel Y : Tingkat Pengangguran Terbuka
Variabel X1 : Pertumbuhan Ekonomi (PE)
Variabel X2 : Indeks Pembangunan Manusia (IPM)
Variabel X3 : Upah Minimum Provinsi (UMP)

  1. Jarque Berra Test

  2. Prinsip dasar dari Jarque Berra Test ini adalah untuk menguji apakah skewness dan kurtosis dari data mengikuti distribusi normal.

    Dimana n = jumlah sampel ; k = jumlah dari koefisien variabel independen ; S = nilai skewness dari error ; C = nilai kurtosis dari error.

    Hasil Output Regresi Linear Berganda dengan R Studio

    Gambar diatas merupakan hasil dari regresi linear berganda. Error dari persamaan diataslah yang harus diuji normalitasnya. 

    Syntax dan hasil output dari uji JB test dengan R Studio

    Uji JB Test memiliki hipotesis sebagai berikut :
    H0 (hipotesis nol)           : Error berdistribusi normal
    H1 (hipotesis alternatif)  : Error berdistribusi selain normal

    Berdasarkan hasil output JB Test, didapatkan nilai p-value sebesar 0,621. Jika p-value lebih besar dari alpha (yang biasanya bernilai 0,05 atau 0,1), maka H0 gagal ditolak. Sehingga tidak cukup bukti untuk mengatakan bahwa error berdistribusi selain normal. Kesimpulan yang didapat adalah error dari persamaan berdistribusi normal, dan asumsi normalitas terpenuhi.

    Artikel mengenai normalitas lainnya :

    MENGECEK NORMALITAS DATA DENGAN R PROGRAMMING


Minggu, 27 Mei 2018

Dunia statistik terus mengalami perkembangan, baik dari segi metode pengumpulan data, pengolahan data, hingga kepada metode penghitungan untuk penarika kesimpulannya. Beberapa permasalahan dapat dilakukan dengan data yang diambil pada suatu waktu tertentu pada beberapa amatan, data ini lebih dikenal dengan data cross-section, ataupun data yang diambil pada beberapa periode waktu pada suatu amatan, atau lebih dikenal dengan data time-series. Namun, terkadang data cross-section ataupun data time-series belum mampu menjelaskan permasalahan

Seiring berkembangnya ilmu pengetahuan, maka ditemukan juga jenis data yang merupakan gabungan antar data cross-section dan data time-series, jenis data ini dikenal dengan pooled data atau data panel.

Persamaan pada regresi data panel memiliki bentuk umum seperti berikut :

Yit= β0+ β1X1it + ... + βKXKit
dimana
Yit = variabel dependen / variabel terikat, dimana i = 1 ... N (jumlah amatan), t= 1 ... T (jlh waktu)
β0  = merupakan intercept dari persamaan
β1 = merupakan koefisien dari variabel pertama
   dst

Data panel memiliki beberapa kelebihan jika dibandingkan dengan data cross-section ataupun time series, diantaranya (Baltagi, 2008) :
  1. Data panel akan memberikan informasi dan variasi yang lebih besar, sehingga estimasi parameter akan lebih efisien. Hal ini disebabkan data panel menciptakan degree of freedom yang lebih besar.
  2. Data panel mampu menangkap dan mengontrol heterogenitas individu. Hal tersebut tidak dapat dilakukan oleh data cross section atau data time series.
  3. Data panel lebih mampu menangkap dinamika yang ada pada data. Data panel mampu melihat perbedaan antar individu sekaligus membandingkan kondisi individu yang sama antar waktu.
  4. Data panel lebih baik digunakan untuk mempelajari isu yang dinamis dan kompleks.
Secara umum, terdapat beberapa model yang biasa digunakan pada regresi data panel, yaitu; Pooled Least Square, Fixed Effect, dan Random Effect Model. Hal ini akan dijelaskan pada artikel selanjutnya.


Kamis, 12 April 2018



Dunia sedang diramaikan dengan kasus kelalaian facebook yang membuat data-data dari para pengguna facebook disalah gunakan oleh Cambridge Analytica. Hal ini disebabkan adanya perjanjian yang dilanggar oleh pihak Cambridge Analytica. Data yang dalam perjanjian seharusnya sudah dihapus, namun malah dimanfaatkan oleh Cambridge Analytica untuk kepentingan yang lain. Sebagai informasi tambahan, Cambridge Analytica merupakan konsultan sosial media dari tim kampanye pemilihan presiden AS 2016, Donald Trump. Sekarang ini, kongres Amerika Serikat sedang menyelidiki adanya kemungkinan kecurangan yang terjadi pada pemilihan presiden AS 2016 dengan memanfaatkan data privacy yang didapatkan dari facebook.

Kondisi seperti ini menyebabkan para pengguna facebook menjadi was-was. Bahkan, ada gerakan di Belanda yang ingin men-deactive-kan akun facebook mereka (link berita). Hal ini menunjukkan bahwa privasi seseorang memang masih sangat diperlukan. Meskipun hal tersebut sulit didapatkan pada dunia era digital saat ini.



Situasi ini dapat mengakibatkan tantangan yang semakin berat bagi Badan Pusat Statistik (BPS). Sebagai penyedia data terpercaya, tentu BPS berhadapan dengan data-data yang cukup sensitif dan menyangkut data privasi dari para responden BPS, baik responden rumah tangga, maupun responden perusahaan. Para responden BPS mungkin khawatir datanya disalahgunakan untuk kepentingan lain yang dapat merugikan diri responden.

BPS sebagai lembaga penyedia data memiliki komitmen yang tinggi untuk menjaga kerahasiaan data dari para respondennya. Hal tersebut juga diatur pada Undang-Undang Negara Republik Indonesia Nomor 16 Tahun 1997 Tentang Statistik. Pada pasal 21 dikatakan bahwa setiap penyelenggara kegiatan statistik wajib menjaga kerahasiaan keterangan yang diperoleh dari responden. Sehingga, ketika data privasi responden bocor ataupun tidak terahasiakan, maka menurut undang-undang, masyarakat dapat menuntut penyelenggara kegiatan statistik tersebut, dalam hal ini BPS.

Data publikasi yang dikeluarkan oleh BPS merupakan data makro, ataupun gabungan. Tidak ada informasi pribadi yang dimuat pada publikasi tersebut. Seluruh data makro tersebut merupakan perhitungan dari data-data individu, rumah tangga ataupun perusahaan, sehingga informasi pribadi responden, seperti nama, umur, alamat, pendapatan, pengeluaran, omset perusahaan, dan lain-lain, tetap terjaga kerahasiaannya.

Komitmen BPS untuk menjaga kerahasiaan para respondennya juga dilakukan ketika memberikan data mikro (atau data individu) kepada pihak lain. BPS biasanya memberikan data mikro untuk kepentingan penelitian. Selain itu, data mikro yang diberikan tidak lengkap, untuk data individu, nama dan data-data sensitif lainnya telah dihapus. Sehingga, pengguna data tak dapat mengetahui secara spesifik siapakah responden tersebut.

Jadi, kepada para masyarakat ataupun teman-teman sekalian yang berkesempatan menjadi responden BPS, tak usah khawatir akan kerahasiaan data anda. Kerahasiaan data anda dilindungi oleh Undang-Undang. Selain itu, responden juga diharapkan memberikan data yang sebenar-benarnya, karena hal ini akan sangat berguna bagi kualitas data yang akan dihasilkan oleh BPS. Data yang berkualitas dapat membantu pemerintah untuk melakukan kebijakan yang tepat.

Ayo, membangun Indonesia, dengan memberikan data yang sebenar-benarnya.