BAB II TABEL KATEGORIK 2 x 2
1. Pengantar Data kategorik termasuk data kelas, tingkat, golongan sering dimanfaatkan dalam penghitungan frekuensinya. Dalam inferensi sederhana juga telah dikenal analisis data kategorik dalam uji proporsi baik satu populasi maupun dua populasi. Pada topik kali ini kita akan mempelajari analisis data kategonk berupa dua data kategorik yang dikiasifikasikan silang dalam bentuk tabel silang 2 x 2 atau ukuran yang lebih besar. Dipunyai n observasi yang dikiasifikasikan silang dalam dua variabel kategorik dan dihasilkan empat sell observasi seperti dalam desain di bawah ini :
Ada dua macam uji hipotesis dalam analisis data kategorik tabulasi silang: 1. Uji Homogenitas (dua sampel) 2. Uji Independensi (satu sampel)
Universitas Gadjah Mada
1
2. Uji Homogenitas Pada uji homogenitas sampel berasal dan dua populasi baris. Jadi ditentukan terlebih dahulu besarnya sampel n1 dan n2 , sedangkan n sebagai akibat dan jumlah n1 + n2.
2.1 Contoh Dua sampel random dan 100 orang mahasiswa dan 100 orang, mahasiswi. Dan kepada mereka ditanyakan, Apakah mereka setuju atau tidak setuju dengan Lurah wanita.
Universitas Gadjah Mada
2
3. Uji Independensi Pada uji independensi sampel berasal dari satu populasi. Jadi ditentukan terlebih dahulu besarnya n sampel, sedangkan n1 dan n2 diperoleh dari observasi sebagai bagian dari sampel.
Universitas Gadjah Mada
3
3.1 Contoh Suatu sampel random dengan 200 laki-laki berumur 50 sampai 65 tahun menunjukkan banyak yang berpenyakit gula dan berpenyakit jantung sbb:
Universitas Gadjah Mada
4
4. Soal-soal 1. Suatu sampel random dan 137 ikan yang mensurvey tentang kadar merkuri dan panjang ikan menghasilkan sebaran sebagai berikut:
Lakukan uji independensi antara kadar merkuri dan panjang ikan berdasarkan data di atas dengan α = 0.05
Universitas Gadjah Mada
5
REPRESENTASI CROSSTAB DALAM SPSS Yang dimaksud dengan data kategorik atau data faktor adalah data berupa kategori (tingkatan) atau kelompok. Misalnya ukuran baju : Big, Medium, Small. Tingkat pendidikan seseorang : SMP, SMA, PT., Dan lain sebagainya. Salah satu analisis data kategorik adalah Crosstab atau Tabel silang, yaitu tabel silang antara variabel baris dan variabel kolom. Analisis data Crosstab dalam SPSS tidaklah sesederhana seperti dalam Pogram Microstat yang bekerja pada DOS. Jika dalam microstat kita dapat langsung membuat tabel silang dan langsung memasukkan data-datanya pada masing-masing cell maka dalam SPSS tidak demikian halnya. Untuk lebih memahami maka perhatikan tabel 2 x 2 berikut :
Dapat anda lihat bahwa ada dua variabel faktor untuk baris maupun kolom. Maka dalam SPSS kita buat dua variabel faktor. Kombinasi variabel faktornya ini yang dimasukkan dalam variabel sesuai banyaknya data observasi yang ada.
Disamping memakai kode angka 1,2,3 seperti di atas anda dapat juga memasukkan data faktor seperti data ash. Misalkan untuk data kategorik jenis kelamin anda masukkan laki-laki dan perempuan (type character) untuk data tingkat intelegensi anda masukkan rendah, tinggi, dan sedang. Karena analisis tabel kontingensi ini biasanya berhubungan dengan data yang jumlahnya tidak sedikit maka kelihatan tidak efisien dalam memasukkan data. Akan tetapi biasanya analisis tabel kontingensi ini memanfaatkan data asli yang sudah diinput, jadi memasukkan data sesuai aslinya tanpa pengkodean bukan merupakan masalah.
Contoh : Dipunyai data tentang orang yang merokok dan sekaligus mempunyai penyakit batuk-batuk pada orang umur di atas 35 th. Diambil sampel 160 orang dan kepada mereka ditanya apakah mereka merokok dan punya penyakit batuk. Uji apa yang cocok dan bagaimana kesimpulannya.
Universitas Gadjah Mada
6
Langkah-langkah Praktikum dengan SPSS 1. Buka file data baru dalam SPSS. Ini dapat dilakukan dengan menggunakan menu File kemudian pilih New, kemudian Data 2. Buat tiga variabel baru bernama Data, kemudian Faktor 1 (untuk kebiasaan merokok) dan Faktor 2 (untuk status penyakit) 3. Isikan data ke dalam kolom bersesuaian. Lihat gambar berikut.
4. Selanjutnya, data akan kita boboti. Gunakan menu Data, kemudian Weigth Cases, kemudian klik button Weight Cases by, dan pilih variabel Data sebagai Frequency variable. Lalu OK 5. Kemudian, pilih menu Statistics, kemudian Summarize, kemudian CrossTabs. Maka akan terbuka window dialog berikut:
Universitas Gadjah Mada
7
Untuk keperluan analisa bagi data kita diatas, pilih sebagai variabel pada baris (rows) adalah faktor 1 dan sebagai variabel kolom adalah faktor 2. Statistik (dari dialog menu Statistics) yang ditampilkan/ dipilih hanyalah ChiSquare. Kemudian kita pilih pada dialog menu Cells untuk menampilkan count Observed dan Expected. Jika semua telah anda kerjakan, tekan OK, maka akan ditampilkan hasil berikut di layar output
Crosstabs
Universitas Gadjah Mada
8
Analisa output. Uji yang baik untuk data ini tentunya adalah untuk melihat apakah ada pengaruh kebiasaan merokok terhadap penyakit batuk-batuk. Dari perhitungan diatas diperoleh tingkat signifikan 0.87 untuk statistik ChiSquare bagi data, yang berarti bahwa Ho diterima. Dapat diinterpretasikan bahwa penyakit batuk independen dengan kebiasaan merokok.
Catatan. Untuk analisis data kategorik ukuran b x k prinsip yang kita gunakan sama seperti prinsip di atas. SPSS tidak membedakan antara uji independensi dan homogenitas, maka kita dituntut untuk membedakannya sendiri.
Contoh data kategorik diatas dalam data entry dapat di tulis dengan cara lain, yakni kita tidak menuliskan suatu data menurut frekuensinya, namun kita tulis berulang sebanyak frekuensinya, seperti tabel berikut
Universitas Gadjah Mada
9
Bentuk seperti ini lebih umum digunakan sebenarnya dalam entry data asli hasil suatu penelitian/ eksperimen. Namun perlu diingat bahwa jika anda menggunakan metode entri data seperti ini anda tidak perlu melakukan pembobotan data (lihat langkah 4 diatas, yakni tidak melakukan Weight Cases) UKURAN HUBUNGAN TABEL KATEGORIK Dari hasil analisis statistik kita dapat mengukur seberapa kuat hubungan statistik itu acara numerik. Keeratan hubungan antara dua faktor, dapat dilihat dan ukuran hubungan, dimana makin besar angka ukuran tersebut, makin erat hubungan kedua faktor itu.
Koefisien Hubungan Cramer :
Koefisisen hubungan pearson:
Koefisien hubungan phi pearson dalam tabel 2 x 2
Keterangan : q
: menunjukkan banyak bans atau kolom, mana yang lebih kecil
n
: menunjukkan ukuran sampel
w
: menunjukkan statistik penguji
Ukuran-ukuran hubungan itu pada dasarnya berbeda satu dengan yang lain. Hargaharga koefisien yang besar jelas menunjukkan kuatnya hubungan, tetapi harga-harga yang sedang ataupun kecil sulit untuk diinterpretasi. Ini disebabkan ukuran sampel n yang besar cenderung menyebabkan harga koefisien hubungan menjadi kecil meskipun harga statistik w sangat signifikan (yakni jauh lebih besar harga batas daerah kritik dengan α kecil).
Universitas Gadjah Mada
10
4. TABEL KATEGORIK B x K Analisis data kategorik tabel silang antara dua variabel kategorik dapat diperluas menjadi lebih dan dua kategon pada masing-masing variabelnya dengan disain data seperti tampak di bawah :
4. Uji Independensi
Universitas Gadjah Mada
11
CONTOH UJI INDEPENDENSI Suatu sampel random dengan 1000 orang dikiasifikasi - silang menurut kebiasaan merokok (berat, sedang, tidak merokok) dan tinggi badannya (tinggi, sedang, pendek). Apakah hasil dibawah menunjukkan dependensi antara kebiasaan merokok dan tinggi badan pada tingkat signifikansi α = 0,01. Tabel Klasifikasi Silang Kebiasaan Merokok Dan Tinggi Badan 1000 orang
Diperoleh output software SPSS sebagai berikut:
Universitas Gadjah Mada
12
SOAL UJI HOMOGENITAS Suatu sampel random dengan 100 mahasiswa akademi MPH diambil dari masing ke empat jurusan mahasiswa (A,B,C,D) pada akademi itu. Tiap-tiap pendapatnya mahasiswa dalam sampel itu diminta pendapatnya tentang suatu pernyataan.
Universitas Gadjah Mada
13
BAB III ANALISIS VARIASI SATU ARAH
Analisis Variansi adalah suatu prosedur untuk uji perbedaan mean beberapa populasi (lebih dari dua). Diketahui bahwa apabila mean diantara populasi sangat berbeda satu dengan yang lainnya maka variansi kumpulan antar mean jauh lebih besar daripada variansi masing-masing populasi. Prosedur anova mendasarkan analisisnya berdasarkan fakta tersebut. Keadaan ini dapat digambarkan seperti di bawah :
Rancangan data untuk anova satu arah dapat dilihat seperti gambar di bawah ini dengan ketentuan bahwa banyaknya sampel tiap populasi tidak harus sama.
Universitas Gadjah Mada
14
Universitas Gadjah Mada
15
UJI LEVENE UNTUK KESAMAAN VARIANSI
•
Asumsi Dalam Anova Kesamaan Variansi, Jika Variansi tidak sama maka diadakan transformasi data Kenormalan Data Keindependenan Data
•
CONTOH Tiga merk Genteng akan diuji ketahanannya. Masing-masing tujuh sampel diambil dipilih secara random. Hasil pengamatannya ditabelkan di bawah ini:
Universitas Gadjah Mada
16
SOLUSI Akan dilakukan Anova One-Way, sebelumnya kita lakukan uji Levene.
Analisis : Diperoleh nilai Statistik Levene .018 dengan nilai p-value .983 sehingga dapat disimpulkan bahwa terdapat kesamaan variansi untuk data di atas.
Setelah diketahui bahwa kesamaan variansi dipenuhi maka analisis dilanjutkan ke analisis utama, yaitu analisis variansi untuk uji rata-rata.
Universitas Gadjah Mada
17
Analisa : Karena nilai F-hit > F-tabel maka dapat disimpulkan bahwa H0 ditolak yang berarti ada minimal dua rata-rata yang berbeda. Akan dilakukan analisis lebih lanjut yaitu MCA.
ANALISIS PEMBANDINGAN GANDA
Jika dalam ANOVA H0 Ditenma maka pekerjaan selesai dengan kesimpulan semua rata-rata relatif sama.
Jika dalam ANOVA H0 Ditolak maka masih ada pekerjaan untuk melihat rata-rata populasi mana yang benar-benar berbeda.
Universitas Gadjah Mada
18
CONTOH Karena dalam uji Anova di atas H0 ditolak maka dilakukan analisis pembandingan ganda dan dipunyai
seperti yang dapat dilihat di bawah:
LATIHAN SOAL-SOAL: 1. Diadakan penelitian untuk menentukan pengaruh nutrisi pada perhatian anak SD. Diambil 15 anak yang dirandom path 3 pola sarapan pagi tanpa sarapan, sarapan ringan, dan full sarapan. Perhatian mereka terhadap pelajaran dalam menit dicatat dalam tabel berikut:
Lakukan Anova- OneWay untuk data di atas dengan a = 0.05 Universitas Gadjah Mada
19
2. Sampel air diambil di empat lokasi sungai untuk menentukan kualitas kebersihannya. Diperoleh data kandungan oksigen sbb:
Lakukan Anova-OneWay untuk data di atas dengan α = 0.05 3. Seorang mahasiswa ingin menguji kekuatan 4 jenis Conblock . Diperoleh data dan Laboratorium sbb: Apakah dapat disimpulkan bahwa keempatnya mempunyai kekuatan yang sama? Α ≈ 0.05. Lakukan uji Anava
4. Seorang mahasiswa ingin menguji hasil panen 4 jenis padi . Diperoleh data dan Laboratorium sbb:
Apakah dapat disimpulkan bahwa keempat jenis padi di atas mempunyai hasil yang sama? α = 0.05. Lakukan MCA. Universitas Gadjah Mada
20