Pertemuan kelima
ANALISIS dan INTERPRETASI DATA Salah satu tugas utama statistika inferensia adalah melakukan pengujian hipotesis. Pengujian hipotesis dilakukan sebagai upaya memperoleh gambaran mengenai suatu populasi dari sampel. Dengan demikian, informasi yang diperoleh dari sampel digunakan untuk menyusun suatu pendugaan terhadap nilai parameter populasinya yang tidak diketahui. Suatu nilai parameter populasi diasumsikan, kemudian suatu sampel acak diambil dari populasinya dan berdasarkan informasi yang diperoleh sampel tersebut, kita membuat keputusan atau menarik suatu kesimpulan, apakah cukup bukti atau alasan untuk menolak atau menerima nilai yang diasumsikan tersebut. A. Pengertian Hipotesis Hipotesis (hypothesis) berasal dari bahasa Yunani, Hupo = sementara; dan Thesis = pernyataan/dugaan. Karena merupakan pernyataan sementara, maka hipotesis harus diuji kebenarannya. Hipotesis dibedakan menjadi dua, yaitu hipotesis penelitian dan hipotesis statistic. Hipotesis penelitian, sifatnya proporsional (verbal), karena itu hipotesis penelitian tidak bisa diuji secara empirical. Agar hipotesi penelitian bisa diuji, maka harus diterjemahkan dulu kedalam hipotesis statistic. Criteria menterjemahkan dugaan penelitian (hipotesis penelitian) kedalam hipotesis statistic adalah dalam bentuk H0 dan H1. Yang mencerminkan dugaan penelitian (harapan penelitian) adalah H1, kecuali apabila dugaan penelitian yang mengisyaratkan tanda sama dengan (=), maka dugaan penelitian dicerminkan oleh H 0. Adapun yang diuji adalah hipotesis nol (H0), dan selama data belum ada maka H0 yang benar. Hal lain yang perlu diperhatikan adalah bahwa H 0 dan H1 bersifat komplementer, artinya apa yang ada dalam H0 tidak terdapat dalam H1, dan sebaliknya. Dalam bentuk notasi dapat dituliskan :
P (Hi) = 1 – P(H0) = P(
0)
Contoh Ada dugaan bahwa secara rata-rata tingkat partisipasi masyarakat desa dalam pembangunan lebih tinggi dari pada rata-rata tingkat partisipasi masyarakat kota. Dugaan penelitian di atas, selanjutnya diterjemahkan dalam bentuk H0 dan H1 dengan memperhatikan langkah kerja sebagai berikut : a. Tentukan dengan tegas, menurut dugaan apa parameter yang akan diuji. Dalam contoh kasus, parameter yang akan diuji adalah rata-rata partisipasi masyarakat dalam pembangunan b. Nyatakan parameter yang akan diuji dalam bentuk operasional. Dalam contoh kasus, rata-rata tingkat partisipasi masyarakat desa dinotasikan dengan , dan rata-rata tingkat partisipasi masyarakat kota dinotasikan dengan . Berdasarkan kedua langkah tersebut, selanjutnya kita dapat membuat hipotesis statistic seperti berikut : H0 : ≤ dan H1 : > . Perhatikan tanda lebih besar (>) pada H1, tanda tersebut menunjukkan uji hipotesis satu arah, yaitu ke sebelah kanan. IBM LENOVO | FE-UWP-STATISTIKA
1
B. Kemungkinan Kesalahan Pada Pengujian Hipotesis Pengujian hipotesis hanya memberikan dua kemungkinan keputusan, yaitu menolak atau tidak dapat menolak hipotesis nol. Keputusan untuk menolak atau tidak dapat menolak (mendukung), tidak berarti bahwa peneliti telah membuktikan salah atau benarnya hipotesis nol (Sudjana, 1982). Mengapa ? Karena pada tataran atau keadaan sebenarnya, hipotesis nol itu tidak pernah dapat dibuktikan (Cooper & Emory, 1997). Ada dua kesalahan yang mungkin dilakukan peneliti : 1. Melakukan kesalahan tipe I, yaitu menolak hipotesis nol padahal dalam kenyataannya hipotesis nol adalah benar. 2. Melakukan kesalahan tipe II, yaitu tidak menolak hipotesis nol padahal dalam kenyataannya hipotesis nola adalah salah. Dalam pengujian hipotesis, para ahli statistika menunjuk dan bukan sebagai criteria dalam pengambilan keputusan pengujian hipotesis. Apa artinya ? Artinya, pengujian hipotesis selalu didasarkan pada asumsi bahwa, dalam keadaan sebenarnya hipotesis nol adalah benar. Dalam hal ini para ahli statistika menyebut sebagai tingkat signifikansi (the level of significance), dan (1 – ) sebagai tingkat kepercayaan atau tingkat keyakinan (the level of confidence) terhadap kebenaran dari keputusan yang diambil. C. Pola Umum Pengujian Hipotesis Langkah-langkah dalam pengujian hipotesis secara umum adalah (Harun Al Rasyid, 2004:4) : 1. Nyatakan hipotesis statistic (H0 dan H1) yang sesuai dengan hipotesis penelitian yang diajukan 2. Menentukan taraf kemaknaan/nyata (level of significance ) 3. Kumpulkan data melalui sampel peluang (probability sample/random sampel) 4. Gunakan statistic uji yang tepat 5. Tentukan titik kritis dan daerah kritis (daerah penolakan) H 0 6. Hitung bilai statistic uji berdasarkan data yang dikumpulkan. Perhatikan apakah nilai hitung statistic uji jatuh di daerah penerimaan atau penolakan ? 7. Berikan kesimpulan statistic (statistical conclusion) 8. Menentukan nilai ( - value) D. Nilai Nilai merupakan nilai yang memberitahukan seberapa besar resiko keliru apabila seorang peneliti menolak H0 yang seharusnya diterima. Aturan yang dipakai adalah jika - value lebih kecil atau sama dengan (≤) dari 0,05, artinya H0 ditolak. Maksudnya adalah bahwa nilai 0,05 ini (= taraf signifikan ) merupakan nilai resiko terbesar yang dapat ditolelir oleh seorang peneliti untuk menolak H0 yang seharusnya diterima. Dengan demikian, apabila nilai melebihi 0,05, maka seorang peneliti disarankan untuk menerima H 0. Cara menghitung - value : 1. Nilai r letaknya searah dengan nilai kritis. Apabila daerah kritis ada disebelah kiri (kanan), maka nilai r ada disebelah kiri (kanan) 2. Secara manual nilai dihitung dari table statistik yang sesuai dengan statistic uji yang digunakan. Misalnya, jika statistic uji yang digunakan adalah uji z, maka nilai dihitung dari table distribusi normal bakau, dan bila statistic uji yang digunakan adalah uji t, maka nilai dihitung dari table t – student. 3. Nilai dihitung dari interpolasi linier, dengan catatan, interpolasi linier hanya bisa dilakukan bila nilai statistic uji terletak diantara dua nilai table. Kalau tidak terletak diantara dua nilai, maka interpolasi linier tersebut tidak dapat dihitung. IBM LENOVO | FE-UWP-STATISTIKA
2
4. Khusus untuk distribusi normal bakau dan distribusi t – student, interpolasi linier selalu dilakukan pada ekor kanan, sebab table normal baku dan table t bentuknya simetris dan nilai-nilai pada table tersebut menunjukkan daerah kanan. 5. Interpretasi - value. Secara umum untuk menginterpretasikan (menafsirkan) value dapat mengikuti kalimat berikut : “Apabila kita menolak H0, maka resiko kita keliru menolak H 0 yang seharusnya diterima adalah sebesar - value” Contoh Apakah partisipasi masyarakat kota dalam pembangunan lebih rendah dari pada masyarakat desa ? (Apakah ada perbedaan tingkat partisipasi dalam pembangunan antara masyarakat kota dengan masyarakat desa) Dugaan : Partisipasi masyarakat kota dalam pembangunan lebih rendah dari pada masyarakat desa Langkah pengujian : 1. Hipotesis Statistik : H0 : M1 ≥ M2 H1 : M1 < M2 M1 = Masyarakat kota M2 = Masyarakat desa 2. = 0,05 3. Statistic Uji (Mann Whitney Test)
4. Data dan proses pengujian Hasil pengukuran partisipasi dalam pembangunan 12 orang masyarakat kota dan 15 orang masyarakat desa yang dipilih secara “Simple Random Sampling” Kota Desa No No X R(X) Y R(Y) 1 45 1 45 2 45 2 32 3 32 3 50 4 40 4 50 5 31 5 32 6 32 6 41 7 48 7 50 8 50 8 49 9 32 9 42 10 36 10 35 11 40 11 35 12 45 12 50 13 49 14 36 15 47
IBM LENOVO | FE-UWP-STATISTIKA
3
ANALISIS KORELASI Definisi penelitian menurut Paradigma Positif (Positivist Paradigm), adalah kegiatan yang dilaksanakan atau dilakukan secara sistematik (terarah terencana), empiric dan kritis dengan tujuan untuk mengungkapkan proposisi hipotetik mengenai hubungan phenomenon alami. Berdasarkan definisi di atas terdapat dua kata yang bias kita ungkap, yaitu hubungan dan proposisi. Hubungan antar variable dibedakan menjadi dua bentuk, yaitu hubungan yang simetris dan hubungan yang tidak simetris. Model analisis untuk hubungan yang simetris ini adalah model analisis korelasi (correlation). Sementara itu dalam hubungan yang tidak simetris kita bisa mengetahui mana yang menjadi variable independen dan mana yang menjadi variable dependen. A. Pengertian Korelasi Korelasi artinya saling berhubungan atau hubungan timbale balik. Dalam ilmu statistika istilah korelasi diberi pengertian sebgai hubungan antara dua variable atau lebih. Hubungan antara dua variable dikenal dengan istilah bivariate correlation, sedangkan hubungan antar lebih dari dua variable disebut multivariate correlation. Contoh bivariate correlation : Hubungan antara motivasi kerja dengan kinerja. Contoh multivariate correlation : Hubungan antara motivasi kerja dan disiplin kerja dengan kinerja. Tujuan dilakukan analisi korelasi antara lain : 1. Untuk mencari bukti terdapat tidaknya hubungan (korelasi) antar variable 2. Bila sudah ada hubungan, untuk melihat besar kecilnya hubungan antar variable, dan 3. Untuk memperoleh kejelasan dan kepastian apakah hubungan tersebut berarti (meyakinkan/signifikan) atau tidak berarti (tidak meyakinkan) B. Koefisien Korelasi Tinggi rendah, kuat-lemah, atau besar-kecilnya suatu korelasi dapat diketahui dengan melihat besar kecilnya suatu angka (koefisien) yang disebut angka indeks korelasi atau coeffisient of correlation, yang disimbolkan dengan (baca Rho, untuk populasi) atau r (untuk sampel). Dengan kata lain angka indeks korelasi adalah sebuah angka yang dapat dijadikan petunjuk untuk mengetahui seberapa besar kekuatan korelasi diantara variable yang sedang diselidiki korelasinya. Angka korelasi berkisar antara 0 sampai dengan ± 1,00 (antara paling tinggi ± 1,00 dan paling rendah 0) C. Korelasi untuk Variabel Ordinal-Ordinal Apabila kita punya dua variable x dan y yang kedua-duanya punya tingkat pengukuran ordinal maka parameter yang bisa menyatakan hubungan kedua variable itu adalah koefisien korelasi Spearman atau Spearman`s Coefficient of (Rank) Correlation; serta koefisien korelasi Kendall atau Kendall`s Coefficient of (Rank) Correlation. Untuk pembahasan contoh dibawah kita gunakan korelasi Spearman.
IBM LENOVO | FE-UWP-STATISTIKA
4
Rumus :
Dimana : = Koefisien korelasi rank spearman n = banyaknya ukuran sampel = Jumlah kuadrat dari selisih rank variable x dengan rank variable y Rumus di atas berlaku bila kurang dari 20% skor-skor pada sebuah kelompok peringkatnya sama. Bila lebih dari 20%, rumus koreksian harus digunakan. Rumus koreksian itu sebagai berikut :
Dimana :
d = selisih dari rank variable x dengan rank variable y t = banyaknya anggota kembar pada suatu perkembaran Rumus koreksian lain yang dapat digunakan apabila terdapat data kembar (tied value) adalah dari Conover, W.J. rumusnya :
Di mana : = koefisien korelasi rank spearman = jumlah dari hasil kali rank variable x dengan rank variable y = jumlah dari rank kuadrat variable x = jumlah dari rank kuadrat variable y = rank variable x = rank variable y n = banyaknya ukuran sampel Koefisien Rank Spearman merupakan perhitungan untuk menunjukkan ada tidaknya suatu hubungan antar variable dan untuk melihat derajat keeratan kedua variable yang dicari hubungannya. Dengan catatan bahwa derajat keeratan itu dapat diukur apabila hasil uji statistic terhadap koefesien korelasi rank spearman menunjukkan adanya penolakan pada H 0. Uji statistic untuk menguji koefisien asosiasi tersebut adalah dengan t – test, rumusnya :
IBM LENOVO | FE-UWP-STATISTIKA
5
Di mana : t = nilai hitung uji = koefisien korelasi spearman n = banyaknya responden Keterangan Uji t ini hanya dilakukan apabila penelitian dilakukan dengan ukuran sampel (penelitian sampel), dengan tujuan agar dapat menarik kesimpulan untuk populasi (generalisasi dari sebagian untuk seluruh). Dengan kata lain apabila penelitian kita adalah populasi, maka cukup sampai perhitungan r kita sudah dapat menarik kesimpulan. Sementara kalau penelitian kita adalah penelitian sampel setelah perhitungan r, maka kita tidak dapat menarik kesimpulan karena kesimpulan itu hanya untuk ukuran sampel yang bersangkutan, bukan kesimpulan untuk keseluruhan/populasi. Contoh (dalam kasus uji t) Seorang peneliti sedang melakukan penelitian untuk menghimpun fakta empiric objektif mengenai : apakah ada hubungan antara sikap indisipliner seorang pegawai dengan kinerjanya. Peneliti tersebut kemudian mengukur sikap disiplin kerja dan dengan alat ukur “Likert Attitudinal Items” yang memberikan nilai numeric dalam skal ordinal, kepada 10 orang karyawan. Skor yang didapat untuk sikap indisipliner dan kinerja adalah sebagai berikut : Nama karyawan A B C D E F G H I J Sikap indisipliner (x) 37 41 38 44 35 43 40 42 36 39 Kinerja (Y) 63 45 60 50 65 52 55 47 64 59 Diminta : 1. Tentukan apakah ada hubungan antara sikap indisipliner seorang karyawan dan kinerjanya; 2. Tentukan ukuran keeratan kedua variable tersebut. ( = 0,05) Penyelesaian : Langkah-langkah kerja 1. Menentukan hipotesis statistic H0 : = 0 H1 : ≠ 0 2. = 0,05 3. Data dan hasil perhitungan X Y Rx Ry 37 63 3 8 41 45 7 1 38 60 4 7 44 50 10 3 35 65 1 10 43 52 9 4
Rx.Ry
Rx2
Ry2
D2
D -5 6
IBM LENOVO | FE-UWP-STATISTIKA
6
40 42 36 39
55 47 64 59
6 8 2 5
5 2 9 6
∑
langkah selanjutnya setelah kita memperoleh nilai koefisien korelasi adalah melakukan pengujian keberartian terhadap nilai koefisien korelasi tersebut melalui uji t.
4. Daerah dan titik kritis. Nilai table t pada 2,306.
= 0,05 dengan df = n – 2 = 8 adalah -
Titik kritis Dengan demikian nilai uji t berada di daerah penolakan H 0, artinya H0 ditolak. 5. Kesimpulan statistic Berdasarkan hasil survey terhadap 10 responden yang dipilih secara cross section, diperoleh indikasi objektif bahwa ada hubungan antara sikap indisipliner seorang karyawan karyawan dengan kinerjanya. Kesimpulan penelitian Ada hubungan antara sikap indisipliner dengan kinerja 6. - value < 0,005 kritis
Perhatikan nilai uji t 5,5090359 pada table t dengan df = n – 2 = 10 – 2 = 8, nilai ini terletak antara dua nilai, karena itu tidak bisa dilakukan perhitungan interpolasi linier. Interpretasi : Apabila kita menolak H0, maka kita akan berhadapan dengan resiko keliru menolak H0 yang seharusnya diterima, paling besar nilainya adalah 0,005. Secara statistic klsik resiko ini kecil (yaitu kurang dari 0,005). Maka menolak H 0 dapat dilakukan/lebih baik dibandingkan kita menerima H0.
IBM LENOVO | FE-UWP-STATISTIKA
7
Berdasarkan perhitungan di atas maka kesimpulan atas pertanyaan pada kasus ini adalah terdapat hubungan antara sikap indisipliner seorang karyawan dengan kinerjanya. Contoh Seorang peneliti sedang melakukan penelitian untuk menghimpun fakta empiric objektif mengenai apakah ada hubungan antara sikap indispliner seorang pegawai dengan kinerjanya. Peneliti tersebut kemudian mengukur sikap indisipliner kerja dan kinerja dengan alat ukur “Likert Attitudinal Items” yang memberikan nilai numeric dalam skal ordinal, kepada 15 orang karyawan. Skor yang didapat untuk sikap indispliner dan kinerja sebagai berikut : Nama karyawan Sikap Indisipliner (x) Kinerja (y) A 94 51 B 83 63 C 62 65 D 58 97 E 94 53 F 72 68 G 72 70 H 69 81 I 62 90 J 80 53 K 75 62 L 70 63 M 68 65 N 85 58 O 90 55 Diminta : 1. Tentukan apakah ada hubungan atau tidak antara sikap indispliner seorang karyawan dengan kinerjanya 2. Tentukan ukuran keeratan kedua variable tersebut. ( = 0,05 ) Solusi Langkah-langkah kerja 1. Menentukan hipotesis statistic 2. ( = 0,05 ) 3. Data dan hasil perhitungan x y Rx Ry Rx.Ry Rx2 Ry2 D D2 94 51 83 63 62 65 58 97 94 53 72 68 72 70 69 81 62 90 80 53 75 62 70 63 68 65 IBM LENOVO | FE-UWP-STATISTIKA
8
85 90
58 55
Dengan rumus dari conover :
rs = …. Dengan rumus dari Sidney Siegel dan N. John Castellan,Jr : Perhatikan data di atas : Pada variable x terdapat tiga group skor kembar, yaitu 94, 62, dan 72. Pada group ke-1 ada dua unsur, group ke-2 ada 2 unsur, dan group ke-3 ada dua unsur. Banyak skor yang peringkatnya kembar itu ada 6 buah (dari 2 + 2 + 2); sehingga besarnya persentase adalah besarnya 6/15 x 100% = 40% Pada variable y, terdapat tiga group skor kembar, yaitu 63, 65, dan 53. Pada group ke-1 ada dua unsur, group ke-2 ada 2 unsur, dan group ke-3 ada dua unsur. Banyak skor yang peringkatnya kembar itu ada 6 buah (dari 2 + 2 + 2); sehingga besarnya persentase adalah besarnya 6/15 x 100% = 40%. Dengan demikian karena jumlah persentase perkembaran baik pada variable x dan variable y adalah 40% atau lebih besar dari 20%, maka untuk menghitung koefisien korelasinya kita gunakan rumus koreksian, yaitu :
Dimana :
Dari data diketahui : Skor kembar variable x Skor kembar 62 72 94
=…
dan n = 15 Jumlah kembar 2 2 2
0,5 0,5 0,5 = 1,5
IBM LENOVO | FE-UWP-STATISTIKA
9
Skor kembar variable y Skor kembar
Jumlah kembar
62 72 94
2 2 2
0,5 0,5 0,5 = 1,5
Maka koefisien korelasi Spearman adalah :
Berdasarkan pemakaian kedua rumus di atas ternyata diperoleh nilai koefisien korelasi yang sama yaitu -0,86715 Langkah selanjutnya setelah kita memperoleh nilai koefisien korelasi adalah melakukan pengujian keberartian terhadap nilai koefisien korelasi tersebut melalui uji t. Kemudian lakukan langkah ke-4, 5, dan 6 seperti contoh di atas. D. Korelasi untuk Variabel Interval-Interval Product Moment Coefficient (Pearson`s Coefficient of Correlation). Koefisien korelasi product moment dikembangkan oleh Karl Pearson. Koefisien korelasi ini digunakan untuk mengetahui derajat keeratan dua variable yang memiliki skala pengukuran minimal interval. Bila pada perhitungan korelasi Spearman yang dikorelasikan adalah data peringkatnya (rangking), maka pada korelasi product moment data observasinya yang dikorelasikan. Koefisien korelasi product moment diperoleh dengan rumus :
Contoh Pimpinan PT Rumah Kita mengadakan penelitian bagi pegawai dilingkungannya. Tujuannya ingin mengetahui hubungan antara motivasi kerja dengan produktivitas kerja. Data sebanyak 12 orang sebagai berikut : No. Urut Nama Karyawan X Y X2 Y2 X.Y 1 A 60 450 2 B 70 475 3 C 75 450 4 D 65 470 5 E 70 475 6 F 60 455 7 G 80 475 8 H 75 470 9 I 85 485 10 J 90 480 11 K 70 475 12 L 85 480 ∑ 12 885 5640 Diminta IBM LENOVO | FE-UWP-STATISTIKA
10
Tentukan besarnya koefisien korelasi Penyelesaian
rxy = … setelah itu konsultasikan dengan table r. E. Pengujian Keberartian Koefisien Korelasi Untuk tujuan itu dapat ditempuh dengan uji t (t student). Langkah pengujian hipotesisnya : 1. Menentukan rumusan hipotesis statistic H0 : = 0 = Tidak ada hubungan antara variable x dengan variable y Ha : ≠ 0 = Ada hubungan antara variable x dengan variable y 2. Menentukan uji statistika, yaitu 3. Menentukan nilai kritis dan daerah kritis dengan derajat kebebasan = n – 2 4. Membandingkan nilai uji t terhadap nilai t table (1 – /2)(dk) dengan criteria pengujian : jika nilai uji t ≥ t table, maka tolak H0 5. Membuat kesimpulan F. Interpretasi terhadap Nilai Koefisien Korelasi Untuk dapat mengetahui kuat lemahnya tingkat atau derajat keeratan hubungan antara variable x dan variable y, secara sederhana dapat dipakai nilai koefisien korelasi table pada Guilford Emperical Rules.
IBM LENOVO | FE-UWP-STATISTIKA
11
LATIHAN
1. Berikut adalah skor yang diperoleh dari 10 mahasiswa untuk antara kemampuan bertanya (x) dengan prestasi belajar(y) Nama mahasiswa A B C D E F Skor variable x 78 48 66 62 76 58 Skor variable y 58 64 44 32 68 72
mengetahui hubungan G 78 52
H 32 41
I 74 70
J 41 60
Hitung : a. Koefisien korelasi product moment, kemudian konsultasikan dengan table r b. Koefisien determinasi untuk mengetahui kontribusi variable x terhadap variable y c. Ujilah keberartian koefisien korelasinya 2. Skor tentang keaktifan berorganisasi (x) dan skor tentang prestasi studi (y) dari 10 mahasiswa. Nama mahasiswa A B C D E F G H I J Skor variable x 37 41 38 44 35 43 40 42 36 39 Skor variable y 63 45 60 50 65 52 55 47 64 59 Berdasarkan data di atas ( = 0,05 ) a. Hitunglah besar koefisien korelasi yang didapat b. Ujilah keberartian koefisien korelasi c. Carilah koefisien determinasinya
IBM LENOVO | FE-UWP-STATISTIKA
12