statistika untuk penelitian
Kelompok Ilmiah Remaja (KIR) Delayota Experiment Team (D’Expert) 2013 Freeaninationwallpaper.blogspot.com
Apa itu Statistika ? • Statistika adalah ilmu yang mempelajari cara pengumpulan, pengolahan, penyajian, dan pengambilan kesimpulan berdasarkan data.
• Ilmu Statistika berperan penting dalam penelitian-penelitian kuantitatif, yakni sebagai dasar dalam melakukan analisis hingga pengambilan kesimpulan untuk memecahkan masalah.
Cabang Statistika • STATISTIKA DESKRIPTIF merupakan cabang statistika yang secara khusus mempelajari cara pengumpulan, pengolahan, hingga penyajian data. • STATISTIKA INFERENSI merupakan cabang statistika yang secara khusus mempelajari cara penarikan kesimpulan dari sekumpulan data. • Kedua cabang statistika ini saling berkaitan dan sama pentingnya dalam penelitian.
Ilustrasi (1) • Fino ingin mengetahui pengaruh Bantuan Program Nasional Pemberdayaan Masyarakat (PNPM) Mandiri di DIY terhadap laba usaha para penerimanya. • Lihat kembali materi tentang populasi dan sampel penelitian!
– Populasi dalam penelitian ini adalah seluruh masyarakat DIY yang menerima bantuan PNPM Mandiri. – Populasi ini tersebar di berbagai kecamatan di DIY, sehingga perlu dilakukan pengambilan sampel.
Ranah Statistika deskriptif
Ranah Statistika inferensi
• Fino mengumpulkan data penerima bantuan PNPM Mandiri di DIY. • Fino mengambil beberapa penerima bantuan PNPM Mandiri sebagai sampel penelitian. • Fino mengumpulkan data penghasilan sampel sebelum dan sesudah adanya bantuan PNPM Mandiri. • Fino menghitung rata-rata dan simpangan baku penghasilan sampel. • Fino menarik kesimpulan tentang kondisi populasi berdasarkan sampel: menjawab pertanyaan apakah laba usaha populasi dipengaruhi oleh adanya bantuan PNPM Mandiri.
Ilustrasi (2) • Aga ingin mengetahui pengaruh pemberian ekstrak buah kluwih terhadap kadar glukosa darah pada mencit (tikus). • Untuk itu, ia melakukan percobaan pengukuran kadar gula darah mencit sebelum dan sesudah pemberian ekstrak buah kluwih pada dosis tertentu.
Ranah Statistika deskriptif
Ranah Statistika inferensi
• Bagaimana cara Aga mengetahui adanya perubahan kadar gula darah mencit sebelum dan sesudah pemberian ekstrak buah kluwih ? • Berapa banyak mencit yang harus digunakan sebagai “bahan” dalam percobaan ini ? • Bagaimana Aga menjamin bahwa perubahan kadar gula darah pada mencit (bila ada) merupakan akibat dari pemberian ekstrak buah kluwih ? • Seandainya Budi mengulangi percobaan Aga ini, apakah ia juga akan mendapatkan kesimpulan yang sama dengan Aga ?
Bagian I
STATISTIKA DESKRIPTIF
Ringkasan Data • Pada umumnya, orang tidak dapat mengambil kesimpulan apapun hanya dengan melihat atau membaca sekumpulan angka. • Agar kumpulan angka tersebut dapat memiliki makna dan dapat digunakan untuk menarik kesimpulan, angka-angka tersebut haruslah diringkas, diolah, atau disajikan sedemikian rupa dengan bantuan statistika deskriptif. • Teknik penyajian data telah dibahas pada slide lain berjudul “Penyajian Data”, sehingga tidak akan dibahas lagi pada slide ini.
Ukuran Kecenderungan Data • Para ahli statistika umumnya menggunakan beberapa ukuran di bawah ini untuk menggambarkan karakteristik suatu data. – Ukuran kecenderungan memusat – Ukuran kecenderungan memencar / menyebar – Ukuran letak – Ukuran kelancipan – Ukuran kemencengan – Frekuensi relatif / proporsi
Ukuran Kecenderungan Memusat • Pada umumnya, hasil amatan berada di sekitar nilai-nilai tertentu. Nilai tertentu inilah yang dinamakan ukuran kecenderungan memusat. • Beberapa contoh ukuran kecenderungan memusat yang dapat digunakan: – Rata-rata hitung (arithmatic mean) – Rata-rata ukur (geometric mean) – Rata-rata harmonis (harmonic mean) – Modus – Median
Rata-rata Hitung • Misal dimiliki n buah data, x1, x2, ..., xn. Rata rata hitung didefinisikan sebagai 1 n rata - rata hitung x i n i 1
• Bila tidak disebutkan lain, maka yang dimaksud dengan “rata-rata” biasanya adalah rata-rata hitung (arithmatic mean) di atas.
Rata-rata Ukur • Misal dimiliki n buah data, x1, x2, ..., xn. Rata rata ukur didefinisikan sebagai rata - rata ukur n x 1x 2 ...x n
• Rata-rata ukur pada umumnya digunakan bila perbandingan tiap dua data berurutan tetap atau hampir tetap (lihat Sudjana, 1992:72).
Rata-rata Harmonis • Misal dimiliki n buah data, x1, x2, ..., xn. Rata rata harmonis didefinisikan sebagai rata - rata harmonis
n n
1
x i1
i
• Rata-rata harmonis dapat digunakan misalnya pada ukuran rasio / perbandingan (lihat Sudjana, 1992:75; Dajan, 1995:159).
Modus • Modus didefinisikan sebagai data yang paling sering muncul atau data dengan frekuensi kemunculan tertinggi. • Pada data kuantitatif, modus jarang digunakan sebagai ukuran kecenderungan memusat karena suatu kumpulan data • Bisa tidak memiliki modus, atau • Bisa memiliki tepat satu modus, atau • Bisa memiliki lebih dari satu modus.
Median • Misal dimiliki statistik peringkat atau order statistics, yakni data yang telah diurutkan dari yang terkecil hingga terbesar. Median merupakan nilai yang membagi statistik peringkat tersebut menjadi dua kumpulan yang jumlah anggotanya sama. • Ilustrasi: x1
x2
x3
...
Median
...
xn-1
xn
Ukuran Kecenderungan Menyebar • Ukuran kecenderungan menyebar / memencar menunjukkan persebaran data di sekitar nilai tengah (ukuran kecenderungan memusat). • Beberapa ukuran yang sering digunakan: - jangkauan (range) - ragam (variance) - simpangan baku Same center, different variation
Jangkauan • Jangkauan (range) menyatakan selisih datum terbesar (xmax) dengan datum terkecil (xmin). • Meskipun paling mudah dihitung, jangkauan jarang digunakan karena sangat dipengaruhi oleh nilai-nilai ekstrim. Selain itu, jangkauan tidak dipengaruhi oleh data di antara datum terbesar dan datum terkecil itu.
Ragam • Ragam atau varians (variance) didefinisikan sebagai rata-rata kuadrat jarak masing-masing datum terhadap nilai tengah (rata-rata). • Misal dimiliki n buah data, x1, x2, ..., xn, dan x menyatakan rata-rata sampel, ragam sampel didefinisikan sebagai: n 2 • Akar kuadrat dari ragam (x i x) disebut simpangan baku 2 i1 s atau deviasi standar. n -1
Ukuran Kemencengan • Ukuran kemencengan (skewness) menunjukkan bentuk distribusi data; suatu data dapat berdistribusi simetris, menceng ke kanan, maupun menceng ke kiri.
Ukuran Kelancipan • Ukuran kelancipan suatu distribusi data disebut kurtosis. Berdasarkan nilai kurtosis, kita mengenal tiga macam distribusi. • Dalam analisis statistika sehari-hari, kurtosis maupun ukuran kemencengan jarang digunakan.
Bagian II
STATISTIKA INFERENSI
Mengapa diperlukan Inferensi ? • Dalam penelitian, seringkali kita berhadapan dengan penentuan sifat-sifat populasi, yang meliputi: – Rata-rata populasi (biasa dilambangkan μ) – Simpangan baku populasi (biasa dilambangkan σ) – Proporsi dalam populasi (biasa dilambangkan π)
• Baik μ, σ, maupun π tidak dapat diketahui atau dihitung secara langsung, namun dapat dipelajari melalui proses inferensi berdasarkan data sampel yang dimiliki.
• Contoh 1: • Dalam kasus I di muka, seharusnya Fino membandingkan rata-rata penghasilan populasi, yakni seluruh penerima bantuan PNPM Mandiri, sebelum dan sesudah penyaluran bantuan. Fino tidak mungkin menanyai seluruh penerima bantuan ini, sehingga rata-rata penghasilan populasi tidak dapat diketahui. Yang dapat Fino kumpulkan hanyalah data penghasilan sebagian penerima bantuan PNPM Mandiri sebagai sampel. Dari data sampel inilah Fino harus menyelidiki ratarata penghasilan populasi.
• Contoh 2: • Menanggapi ide penggunaan hasil UN sebagai syarat masuk Perguruan Tinggi, ingin diketahui persepsi siswa SMA di Indonesia (setuju/tidak setuju) terhadap ide tersebut. Untuk itu, seharusnya dilakukan referendum kepada seluruh siswa SMA, namun hal ini tidak dapat dilakukan mengingat banyaknya jumlah siswa dan distribusi sekolah dari kota hingga pelosok. Oleh karena itu, tidak dapat diketahui besarnya bagian (proporsi) keseluruhan siswa SMA yang setuju terhadap wacana tersebut. Yang dapat diketahui hanyalah proporsi dari sampel siswasiswi SMA.
• Dalam ilustrasi di atas, parameter populasi θ dapat berupa rata-rata (μ), simpangan baku (σ), maupun proporsi (π) akan dipelajari melalui statistik sampel (θ1, ..., θk).
Alur Berpikir dalam Inferensi Diambil sebagian (secara acak)
sampel populasi
Parameter populasi
Dianalisis untuk memperoleh
PROSES INFERENSI
statistik sampel
Prosedur Inferensi
Estimasi
• Menduga nilai-nilai parameter populasi berdasarkan informasi atau data statistik sampel
Uji Hipotesis
• Menentukan apakah hipotesis tentang parameter populasi didukung oleh informasi sampel.
Estimasi • Estimasi atau pendugaan dapat dilakukan dengan dua cara, yakni estimasi titik dan estimasi interval. • Pada estimasi titik, nilai statistik sampel langsung digunakan sebagai penduga (estimator) parameter populasi. • Pada estimasi interval, statistik sampel digunakan membentuk suatu selang (interval) yang memuat parameter populasi dengan probabilitas tertentu. Hasil estimasi interval disebut “selang kepercayaan” atau “interval konfidensi”.
– Contoh: Diketahui 60% sampel siswa SMA menolak ide penggunaan hasil UN sebagai syarat masuk perguruan tinggi. – Hasil estimasi titik: 60% siswa SMA di Indonesia (populasi) menolak ide tersebut. – Hasil estimasi interval: Peluang bahwa 55% sampai 65% siswa SMA di Indonesia menolak ide tersebut adalah sebesar 0,95. Interval 55% - 65% ini merupakan suatu “interval konfidensi”.
populasi (rata-rata, μ, tidak diketahui)
Rata-rata X = 50
Saya 95% yakin bahwa rata-rata populasi μ di antara 40 & 60.
Sampel acak
Permasalahan yang timbul pada estimasi interval adalah bagaimana menentukan batas keyakinan dengan peluang tertentu. Untuk ini perlu dipahami distribusi / sebaran data.
Uji Hipotesis • Dalam pengujian hipotesis, mula-mula peneliti menyusun hipotesis statistik, yakni dugaan tentang nilai parameter populasi. • Suatu hipotesis statistik selalu dinyatakan dalam bentuk pasangan – Hipotesis nol (H0): hipotesis yang tidak memihak – Hipotesis alternatif (H1 atau Ha): lawan dari hipotesis nol.
• Contoh pembentukan hipotesis statistik dari masalah nyata dapat dilihat pada slide berikut.
• Dalam kasus 1 di muka, misal μ1 menyatakan rata-rata laba usaha masyarakat penerima PNPM Mandiri sebelum bantuan diberikan dan μ2 menyatakan rata-rata laba usaha masyarakat penerima PNPM Mandiri setelah bantuan diberikan. • Hipotesis nol dan hipotesis alternatif dapat disusun sebagai berikut: – H0: μ1 - μ2 ≤ 0 (rata-rata laba usaha masyarakat sebelum penerimaan bantuan tidak lebih besar daripada setelah penerimaan bantuan) – H1: μ1 - μ2 > 0 (rata-rata laba usaha masyarakat sebelum penerimaan bantuan lebih besar daripada setelah penerimaan bantuan)
• Selanjutnya, dari data sampel akan dihitung ratarata selisih laba usaha sampel penerima bantuan PNPM Mandiri sebleum dan sesudah pemberian bantuan. Rata-rata selisih laba usaha sampel ini akan dibandingkan dengan nilai tertentu. • Bila nilainya jauh lebih besar daripada nol, maka kita akan menolak Hipotesis nol (dengan demikian menerima hipotesis alternatif). • Bila nilainya lebih kecil atau berada di sekitar nol, kita akan menerima hipotesis nol (dengan demikian menolak hipotesis alternatif). • Aturan penerimaan atau penolakan hipotesis nol ini dinamakan daerah kritik.
Kesalahan dalam Uji Hipotesis • Dalam pengujian hipotesis, kesimpulan yang diambil berdasarkan sampel belum tentu cocok dengan kondisi populasi, namun kita tak pernah tahu kondisi populasi tersebut. Yang dapat kita ketahui mengenai tepat tidaknya kesimpulan pada uji hipotesis adalah sebagai berikut. Kesimpulan yang diambil H0 tidak ditolak H0 ditolak
Kondisi Populasi Sebenarnya Sesuai H0
Tidak sesuai H0
Keputusan Tepat Keputusan salah (tipe II) Keputusan salah (tipe I) Keputusan tepat
• Pandang suatu kasus persidangan seseorang yang diduga melakukan tindak pidana korupsi. • H0: terdakwa tidak bersalah • H1: terdakwa bersalah • Bila H0 benar, tentu terdakwa harus dinyatakan bebas, sebaliknya bila H1 benar, terdakwa akan dihukum. • Dalam analogi di atas, kesalahan tipe I adalah menghukum terdakwa yang tidak bersalah, sedang kesalahan tipe II adalah membebaskan terdakwa yang bersalah. Kesalahan tipe I dipandang lebih serius daripada tipe II, sehingga perlu diperhatikan peluang terjadinya kesalahan tipe I (biasa dilambangkan dengan huruf yunani α).
• Nilai α selalu dibuat kecil, namun tidak pernah sama dengan nol karena kesalahan tipe I akan selalu ada. Oleh karena itu, • Pada penelitian-penelitian kedokteran atau farmasi (yang berkaitan dengan nyawa manusia), umumnya diambil α sebesar 0,01. • Pada penelitian-penelitian pertanian, sosial budaya, kependidikan, umumnya diambil α yang lebih besar, yakni 0,05. • Penentuan nilai α akan berpengaruh terhadap daerah kritik suatu pengujian hipotesis.
Contoh Prosedur Uji Hipotesis Claim: rata-rata usia populasi penduduk suatu daerah adalah 50 tahun. H0: μ = 50
Populasi Ambil sampel acak
Is X 20 likely if μ = 50? If not likely, REJECT Null Hypothesis
Misalkan rata-rata usia sampel adalah 20 tahun, x = 20
Sampel
Bagian III
SEBARAN PELUANG
Mengapa Perlu Sebaran Peluang ? • Melalui proses inferensi, seorang peneliti akan menarik kesimpulan mengenai keadaan atau sifat-sifat populasi berdasarkan informasi dari sampel. • Proses inferensi tidak pernah lepas dari kesalahan. Oleh karena itu, diperlukan cara untuk mengukur peluang atau probabilitas terjadinya kesalahan tersebut. • Mengingat sifat data populasi yang bermacammacam, peluang dalam inferensi akan ditentukan dengan memodelkan data populasi mengikuti suatu sebaran peluang tertentu.
Apa itu Sebaran Peluang? • Sebaran peluang atau probability distribution merupakan suatu fungsi yang digunakan untuk menyatakan peluang suatu variabel (random) memiliki suatu nilai tertentu. • Contoh: – Variabel tinggi badan siswa peluang terdapat siswa dengan tinggi badan 160 cm – 180 cm. – Variabel jenis kelamin siswa dari 5 siswa yang diambil secara acak di suatu SMU, peluang bahwa seluruhnya duduk di kelas X program MIPA.
Sebaran Binomial • Sebaran Binomial digunakan untuk memodelkan peluang data hasil percobaan binomial, yakni: – Hanya dapat menjalani tepat satu dari dua hasil yang mungkin. – Peluang terjadinya hasil-hasil tersebut selalu tetap. – Percobaan (upaya) dilakukan berulang sebanyak n kali.
• Contoh: Memodelkan banyaknya anak yang terkena penyakit cacar air di suatu daerah: hasil yang mungkin adalah “anak terkena cacar air” dan “anak sehat”.
• Bila percobaan dalam peluang distribusi binomial diulang n kali, peluang mendapatkan x hasil “sukses” dapat dihitung dengan: P(x)
n! x ! (n x )!
X
P (1- P)
nX
Dalam model ini p menyatakan peluang tercapainya “sukses” dalam setiap ulangan. • Sebaran binomial umumnya digunakan pada inferensi tentang proporsi populasi (banyaknya anggota populasi yang termasuk dalam suatu kategori / kelompok tertentu) dan uji independensi antarvariabel kategorik.
• Selain menggunakan rumus, peluang suatu sebaran binomial juga dapat ditentukan dengan bantuan tabel distribusi binomial atau dengan bantuan Microsoft Excel.
Sebaran Normal • Sebaran normal lebih umum dijumpai daripada sebaran binomial, karena banyak sekali distribusi data dalam kehidupan seharihari yang mengikuti pola distribusi normal. • Ide dasar distribusi normal adalah data yang sedikit memiliki ekstrem namun tinggi di bagian tengah.
• Bentuk kurva distribusi normal bergantung pada mean (μ) dan simpangan baku (σ) pada persamaan berikut: f(x)
1
2π
e
(x μ)2 /2σ 2
• Secara khusus didefinisikan distribusi normal standar yakni distribusi normal dengan nilai μ = 0 dan σ = 1.
• Peluang pada sebaran normal ekuivalen dengan luas daerah yang berada di bawah kurva normal, sehingga dapat dihitung dengan kalkulus integral.
• Perhitungan nilai probabilitas dengan pengintegralan fungsi distribusi normal di atas sangat merepotkan, sehingga digunakan transformasi berikut
X μ Z σ untuk “membawa” distribusi normal N (μ,σ2) ke distribusi normal standard N(0,1).
• Peluang distribusi normal standard dapat ditentukan menggunakan tabel distribusi peluang normal standard atau sering disebut tabel Z.
Sebaran Student-t • Dibandingkan sebaran normal, distribusi student-t memiliki ujung (ekor) yang lebih tinggi. Bentuk kurva student-t ditentukan oleh derajat bebas (degree of freedom) sebesar k, dengan persamaan: k 1 k 1 2 2 1 x 2 1 f(x;k) k k k 2 • Perhitungan peluang dengan mengintegralkan fungsi di atas sangat sulit, sehingga digunakan tabel.
• Perbandingan bentuk kurva distribusi student-t dengan berbagai nilai derajat bebas.
• Catatan: nama “student-t” merupakan samaran dari William Searly Gosset, penemu distribusi ini.
RUJUKAN • Dajan, Anto. 1991. Pengantar Metode Statistika II. Jakarta: LP3ES. • Gunardi. 1999. Diktat Kuliah Metode Statistika. Yogyakarta: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Gadjah Mada. • Subanar. 2013. Statistika Matematika. Yogyakarta: Graha Iklmu • Sudjana. 1989. Metode Statistika. Bandung: Tarsito