ANALISIS DESKRIPTIF
1.0
Distribusi Frekuensi dan Tabel Silang 1.1 Pengantar Statistik deskriptif Statistika deskriptif adalah bidang statistika yang mempelajari tatacara penyusunan dan penyajian data yang dikumpulkan dalam suatu kegiatan penelitian Data statistik dapat berupa : 1. Kategori (besar, kecil, kaya, miskin dsb) 2. Angka atau bilangan (data kuantitatif) Dua macam variabel dalam data kuantitatif : 1. Nilai variabel diskrit (nilai yang terpisah) 2. Nilai variabel kontinu (nilai yang bersambung)
Data diskrit Data kontinu
Hasil menghitung Hasil pengukuran
Manakah kalimat yang menunjukkan data diskrit dan mana yang merupakan data kontinu 1. Keluarga Pak Amir mempunyai 35 ekor ayam, 10 ekor sapi dan 0 0,75 75 hektar sawah sawah. 2. Tinggi badan Didit adalah 167 cm dan berat badannya 72 kg g dan dia memiliki dua tahi lalat di keningnya. g y 3. Tiap kamar di Asrama Melati luasnya 16 m2 dan ditempati oleh empat orang siswa. Dalam menganalisis suatu masalah sosial, tidak jarang kita harus menyelidiki beberapa variabel sekaligus, misalkan tingkat pendapatan keluarga di pedesaan perlu dilihat menurut tingkat pendidikan kepala keluarga
Dua ukuran yang digunakan untuk membandingkan beberapa kelompok data, yaitu : 1. Ukuran pemusatan (rata-rata hitung, median, modus, kwartil, desil atau persentil). 2. Ukuran penyebaran (jangkauan, rata-rata penyebaran, atau deviasi standar) 1.2 Distribusi Frekuensi Tunggal Distribusi frekuensi tunggal adalah penyajian data hasil penelitian dengan cara mengelompokkan data yang sama nilainya secara apa adanya.
Contoh Tabel Distribusi Frekuensi Tunggal Tabel 1. Distribusi Pendapatan per Bulan 30 Keluarga di Desa X Pendapatan per Bulan Rp. 135.000,Rp. 150.000,Rp 159 Rp. 159.000,000 Rp. 176.000,Rp. 200.000,Rp 250 Rp. 250.000,000 Rp. 275.000,Rp. 300.000,Rp 325 Rp. 325.000,000 Rp. 340.000,Rp. 400.000,Rp 425 Rp. 425.000, 000 Rp. 450.000,-
Jumlah 1 1 1 1 1 1 2 3 3 1 1 1 1
Pendapatan per Bulan Rp. 470.000,Rp. 476.000,Rp 500 Rp. 500.000,000 Rp. 550.000,Rp. 600.000,Rp 630 Rp. 630.000,000 Rp. 670.000,Rp. 750.000,Rp 780 Rp. 780.000,000 Rp. 800.000,Rp. 820.000,Jumlah
Jumlah 1 1 1 2 1 1 1 1 1 1 1 30
1.3 Distribusi Frekuensi Bergolong Menurut Sudjana (1984) untuk menyusun suatu daftar distribusi frekuensi dengan panjang kelas yang sama dapat d t dilakukan dil k k sebagai b ib berikut ik t : Tentukan rentang, ialah data terbesar dikurangi data terkecil. terkecil Tentukan banyaknya kelas interval yang diperlukan Tentukan panjang kelas interval p Sebagai Sebaga uju ujung g ba bawah a kelas e as interval te a pe pertama ta a dapat diambil sama dengan data terkecil atau dari data terkecil tetapi selisihnya harus kurang dari panjang kelas yang telah ditentukan
Contoh Tabel Distribusi Frekuensi Bergolong g g Tabel 2. Distribusi Pendapatan per Bulan 30 Keluarga di Desa X Kelompok Pendapatan
Jumlah
Rp. 135.000,- - Rp. 272.000,-
6
Rp. 273.000,- - Rp. 409.000,-
10
R 410 Rp. 410.000,000 - Rp. R 546 546.000,000
5
Rp. 547.000,- - Rp. 683.000,-
5
Rp. 684.000,- - Rp. 822.000,-
4
Jumlah
30
1.4 Distribusi Frekuensi Kumulatif Cara penyusunan tabel frekuensi kumulatif adalah sama dengan cara penyusunan tabel frekuensi t tunggal l dan d b bergolong. l Tabel 3. Distribusi Pendapatan per Bulan 30 K Keluarga l di D Desa X Kelompok Pendapatan
F
Rp. 135.000,- - Rp. 272.000,-
6
cf 6
Rp. 273.000,- - Rp. 409.000,-
10
16
Rp. 410.000,410.000, - Rp. 546.000,546.000,
5
21
Rp. 547.000,- - Rp. 683.000,-
5
26
Rp. 684.000,- - Rp. 822.000,-
4
30
Jumlah
30
1.5 Tabel Silang g Umumnya analisis sosial dilakukan dengan menghubungkan h b k d dua atau t llebih bih variabel, i b l sehingga hi data statistiknya disajikan dalam distribusi frekuensi berdimensi g ganda atau tabel silang g Contoh Tabel 4 yang menunjukkan matriks data untuk ke 30 responden, responden yang terdiri dari tiga variabel, yaitu nomor responden (01 sampai dengan 30) yang terletak pada kolom 1 dan 2, pendidikan responden (1< SMP, 2 = SMP dan SMA, 3 = Sarjana), dan pendapatan per bulan (dalam ribuan rupiah)
Tabel 4. Matriks Data 30 Responden di Desa X Kolom
1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 1 1 3 2 2 1 1 1 2 2 2 3 3 1 1
3 135 150 450 159 176 200 250 275 325 325 340 500 550 275 300
Kolom
1 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
2 1 1 3 3 3 2 2 3 2 2 3 2 1 1 1
3 300 300 800 780 670 400 470 820 476 750 630 600 325 425 550
Setelah kita mempunyai tabel matriks (seperti Tabel 4) tersebut kita dapat menyusun suatu tabel silang, misalnya i l pendapatan d t kkeluarga l per b bulan l akan k di diselidiki lidiki dalam hubungannya dengan tingkat pendidikan kepala keluarga Tabel 5. Tabel Dummy Hubungan Pendapatan per Bulan dengan Pendidikan Kepala Keluarga di Desa X (n=30) Pendapatan Keluarga Rp. 135.000,- - Rp. 272.000,Rp. 273.000,- - Rp. 409.000,Rp. 410.000,410.000, - Rp. 546.000,546.000, Rp. 547.000,- - Rp. 683.000,Rp. 684.000,- - Rp. 822.000,J l h Jumlah
Tingkat Penidikan KK 1 2 3 Total
Selanjutnya (setelah Tabel 5) kita isikan frekuensi yang tepat pada kolom kolom-kolom kolom yang ada Tabel 6. 6 Hubungan Pendapatan per Bulan dengan Pendidikan Kepala Keluarga di Desa X (n=30)
Rp. 135.000,- - Rp. 272.000,-
Tingkat Pendidikan KK 1 2 3 Total 4 2 0 6
R 2 Rp. 273.000,3 000 - Rp. R 409 409.000,000
6
4
0
10
Rp. 410.000,- - Rp. 546.000,-
1
2
2
5
Rp. 547.000,- - Rp. 683.000,-
1
1
3
5
Rp. 684.000,- - Rp. 822.000,-
0
1
3
4
Jumlah
12
10
8
30
Pendapatan Keluarga
1.6 Angka Mutlak dan Angka Relatif Proporsi adalah perbandingan antara suatu angka dengan angka totalnya Jika c a b, b
a b maka atau c c
Angka proporsi
Misanya jumlah penduduk Kabupaten Bengkalis hasil SUSENAS 1998 adalah 1 1.139.694 139 694 orang orang, yang terdiri dari 576.417 laki-laki dan 563.277 perempuan, maka proporsi penduduk perempuan adalah :
563.277 0,49 1 139 694 1.139.694
Persentase adalah angka proporsi dikalikan 100 % 0,49 x 100% = 49 % Perbandingan junlah penduduk perempuan di antara jumlah laki-laki
Rasio
Rasio penduduk perempuan terhadap laki-laki adalah:
563.277 563 277 0,977 576.417 Untuk memudahkan analisis maka angka rasio dikalikan 100, jadi rasio penduduk perempuan terhadap laki-laki adalah 97,7
2.0 Membuat dan Menyajikan Grafik 2 1 Diagram Batang dan Piramida 2.1 Tabel silang yang komplek secara relatif akan lebih mudah dibaca dengan jika divisualisasikan dengan grafik grafik, dalam hal ini yang cocok untuk tujuan tersebut adalah grafik batang Gambar 1. Distribusi Penduduk berumur 10 Tahun ke At Menurut Atas M t Status St t Perkawinan P k i dan d Jenis J i Kelamin, Jawa Barat, 1990 (Persen)
Sumber: BPS 1992
Gambar 2. Piramida Penduduk Sulawesi Selatan dan Kalimantan Barat Barat, 1990
Sumber : BPS 1992
2.2 Diagram Garis Kurva atau grafik garis akan sangat bermakna untuk menggambarkan data kontinu atau mengambarkan data serial Gambar 3. Produksi Padi Ladang di Setiap Provinsi di Jawa, 1994 -1998 1000 900 800 700 600 500 400 300 200 100 0 1994
1995
1996
1997
1998
Jawa Barat
Jawa Tengah
D.I. Yogyakarta
Jawa Tim ur
Sumber : BPS, 1999, Tebl 5.1.8, halaman 164
2 3 Diagram Lingkaran 2.3 Grafik ini menggunakan lingkaran sebagai alat geometris untuk menunjukkan jumlah keseluruhan sampel G Grafik fik lingkaran li k cocok k untuk k mengambarkan b k sebaran satu variabel atau satu dimensi dari tabel silang. g Perbandingan beberapa kelompok dalam variabel yang sama dapat dilakukan dengan membuat beberapa diagram bundar yang memiliki kategorisasi identik satu sama lain
Gambar 4.
Distribusi Penduduk Berumur 10 tahun Ke Atas Menurut Status Kawin dan Jenis Kelamin, Jawa Barat 1990
Sumber: BPS (1992)
2.4 Piktogram Piktogram adalah grafik yang dibuat dengan memberikan simbol (gambar) untuk mewakili informasi statistik yang ingin disampaikan Misalnya : Jumlah penduduk suatu wilayah, satwa, rumah dan sebagainya.
Pulau
SambunganTelpon
Jumlah
1. Pekanbaru
43065
2. TanjungPinang
20791
3. Tembilahan
2689
4. Dumai
14634
5. Batam
25016
JumlahTotal
106195
2.5 Kartogram Penyajian data statistik dalam peta dikenal dengan istilah Kartogram Data yang diperinci menurut lokasi geografis, akan lebih efektif jika divisualisasikan lewat peta Misalnya arus migrasi, kepadatan penduduk antar wilayah, atau ciri-ciri khas suatu wilayah
Gambar 6. Migrasi Netto Dalam Provinsi Menurut DATI II, J Jawa T Tengah, h 1995
2.6 Diagram Pencar Grafik dengan pencar (scattered diagram) adalah untuk melukiskan informasi statistik yang merupakan gabungan dua variabel Gambar 7. Grafik Hubungan Antara Tinggi dan Berat Badan Perempuan p Dewasa 90 80
Berat (kg) B
70 60 50 40 30 20 10 0
140
145
150
155
160
Tinggi (cm)
165
170
175
3.0 Ukuran Pemusatan dan Penyebaran Ukuran pemusatan (measure of location atau measure of central tendency) menunjukkan tempat atau letak distribusi frekuensi Ukuran pemusatan Mean Median Mode Kwartil Desil Persentil
3.1 Mean, Median, dan Mode Mean adalah angka rata-rata rata rata dengan definisi : “Jumlah nilai-nilai dibagi dengan jumlah individu “ dan dihitung dengan rumus X M N
Untuk distribusi frekuensi tunggal, di mana nilai X adalah mewakili nilai variabel individu
R Rumus untuk k di distribusi ib i b bergolong, l menggunakan k rumus sebagai berikut fX M N
Di mana X mewakili titik tengah interval, sedangkan f menunjukkan j kk ffrekuensi k i di setiap kelas atau interval
Median didefinisikan sebagai “suatu nilai yang membatasi 50 p persen frekuensi distribusi bagian g bawah dengan g 50 persen frekuensi distribusi bagian atas ”(Hadi 1974:44) Rumus untuk menghitung median dari distribusi b bergolong l adalah d l h sebagai b ib berikut ik t :
1/2N - cfb Median Bb i fd
di mana :
Bb = adalah batas bawah (nyata) dari interval yang mengandung median cfb = frekuensi kumulatif (frekuensi meningkat) di bawah interval yang mengandung median fd = frekuensi dalam interval yang mengandung median i
= lebar l b iinterval, t l d dan
N = jumlah frekuensi dalam distribusi
Mode dibatasi sebagai : a) Dalam Distribusi Tunggal : nilai variabel yang mempunyai frekuensi tertinggi dalam distribusi. b)) Dalam distribusi bergolong g g : titik tengah g interval kelas yang mempunyai frekuensi tertinggi dalam distribusi 3.2 Kwartil, Persentil, dan Desil Kwartil akan membagi nilai suatu distribusi menjadi empat, t yaitu it memisahkan i hk setiap ti 25 persen frekuensi dalam distribusi. Desil akan memisahkan setiap 10 persen dalam distribusi. Persentil akan membagi frekuensi distribusi menjadi 100 kelas
Kwartil adalah bilangan pembagi yang memisahkan suatu kumpulan data menjadi 4 bagian. bagian Terdapat tiga buah kwartil :
1. Kwartil pertama (K1) 2. Kwartil kedua (K2) 3. Kwartil ketiga (K3)
1 Susun data menu 1. Langkah menentukan nilai kwartil :
2 Tentukan letak kwartil 2.
3 Tentukan nilai kwartil 3.
Rumus untuk menghitung kwartil pertama adalah :
1 / 4 N - cfb K 1 Bb i fd Desil adalah bilangan pembagi sekumpulan data menjadi 10 bagian, g , sehingga gg terdapat p 9 desil,, yyaitu D1, D2, D3, D4, D5, D6, D7, D8, D9.
Rumus R D Desilil
1/10N cf b D1 B b i fd
(a)
D5 = K2 = Median M di
(b)
9/10N cf b D9 Bb i fd
(c)
Persentil Pertama (P1) adalah suatu titik dalam distribusi yang menjadi batas satu persen dari frekuensi yang terbawah P2 Adalah suatu titik yang membatasi dua persen frekuensi yang terbawah dalam distribusi n/100N cf b Rumus Persentil Pn B b i fd
(a)
3.3 Tempat kedudukan mean, median, mode dan desil/persentil dalam distribusi Tempat kedudukan mean, median, dan mode dalam satu distribusi sangat tergantung kepada bentuk distribusinya, distribusinya apakah distribusinya simetri atau miring
Jika distribusinya simetri normal, maka ketiga ukuran ketiga ukuran tersebut akan saling berhimpitan. berhimpitan Gambar 10. Tempat Kedudukan Mean, Median, dan Mode
Nilai Mean Median Mode
Pada distribusi trapesium, dwimode, dan bentuk bel yang tidak normal,, nilai mean,, median dan modenya y berhimpitan. Pada distribusi bentuk tabel yang tidak normal, nilai mean, median dan modenya berhimpitan Gambar 11. Distribusi Normal yang lain
Nilai Mean Median Mode
Nilai Mean Median Mode
Pada distribusi bentuk trapesium dan dwimode, mean dan median berhimpitan sedangkan modenya berada dalam kedudukan lain. G b 12. Gambar 12 Distribusi Di t ib i Trapesium T i dan d D Dwii M Mode d
Mean Median
Mean Median
Median
Pada distribusi miring miring, maka kedudukan ketiga tendensi sentralnya terpisah satu sama lain Bilamana distribusinya miring ke kiri (positif), maka meannya ada di sebelah kanan dan modenya ada di sebelah kiri kiri. Jika distribusinya miring ke kanan (negatif), maka meannya ada disebelah kiri dan modenya ada disebelah kanan.
Gambar 13. Nilai Mean, Median dan Mode pada Distribusi Miring
Mode
Mean
Mean
Mode
Median Median
Nilai desil adalah terletak pada absis atau sumbu X, sedangkan ordinatnya diletakkan pada tiap-tiap tiap tiap desil Gambar 14. Tempat Masing-masing Desil Dalam Distribusi Normal
D1 D2 D3
D4
D5 D6 D7 D8
D9
Perlu dicatat bahwa jarak antara titik-titik desil yang satu ke desil yang lain adalah tidak sama sama. Jarak antara desil yang sama banyaknya hanya j p p pada g grafik segi g empat. p dijumpai Gambar 15. Tempat Kedudukan Masing-masing Desil Dalam Grafik Segi Empat
D1
D2
D3
D4
D5
D6
D7 D8
D9
3.4 Bilamana menggunakan mean, median, mode dan desil/persentil Jika waktu terbatas maka yang digunakan adalah Mode Suatu kejadian khusus yang membutuhkan Mode Nilai Mean sangat diperlukan dalam perhitungan statistik, sementara Mean dan Mode adalah ukuran statistik terbatas Jika ada terdapat informasi yang hilang, maka Mean tidak dapat digunakan, dan ukuran yang dapat membantu untuk situasi seperti itu adalah Median dan Mode Untuk kasus distribusi yang sangat miring, maka tidaklah cukup akurat untuk menggunakan hanya salah satu ukuran pemusatan, karena dapat memberi gambaran yang salah
Ukuran yang paling stabil adalah mean, diikuti median dan mode Berdasarkan beberapa faktor yang mempengaruhi pemilihan ukuran tendensi sentral di atas, maka dapat ditarik kesimpulan: Mean biasanya dipilih sebagai ukuran pemusatan jik di jika distribusi t ib i mendekati d k ti normal, l kkarena mean mempunyai stabilitas terbesar dan dapat digunakan sebagai g dasar p perhitungan g statistik selanjutnya j y Median adalah nilai variabel yang ditengah-tengah dan umumnya paling tepat untuk menggambarkan tendensi sentral bila distribusinya tidak normal, seperti sangat miring, atau karena ada informasi yang tidak lengkap
Mode adalah ukuran yang paling sederhana yang dapat p dipakai p untuk menaksir tendensi sentral dalam keadaan tergesa-gesa, atau dalam situasi khusus. 3.5 Rentang dan standar deviasi Variabilitas adalah derajat j p penyebaran y nilai-nilai variabel dari suatu tendensi sentral dalam suatu distribusi. dispersi Range Beberapa p cara menghitung variabilitas
M Mean Deviation D i ti Standard Deviation
Mean Deviation (deviasi rata-rata) adalah rata-rata deviasi nilai-nilai nilai nilai dari Mean dalam suatu distribusi dan diambil nilainya yang absolut (nilai positif). Secara deviasi rata-rata didefinisikan sebagai “mean aritmatika dari harga mutlak dari deviasi nilai-nilai individual” individual Rumus deviasi rata-rata
MD
X
N
MD = adalah Mean Deviation lxl = jumlah deviasi dalam harga mutlaknya N
= jjumlah individu/Kasus
Deviasi Standar (standard deviation) adalah alat statistik yang dihitung berdasarkan akar dari jumlah deviasi kuadrat dibagi banyaknya individu“ yang dimati. Menurut Hadi (1987) (1987), standar deviasi dapat dibatasi sebagai “akar dari jumlah deviasi kuadrat dibagi banyaknya individu“dalam distribusi. Rumus Deviasi Standar (SD)
SD
2 X
N
Di mana : SD(s) = Standard Deviation X2 = Jumlah deviasi kuadrat N
j dalam = Jumlah individu/kejadian distribusi
Jumlah kuadrat dari deviasi standar disebut dengan varians Varians adalah mean dari jumlah deviasi kuadrat atau dinyatakan dengan rumus : V SD 2
2 X
N
3.6 Angka baku dan koefisien variasi Nilai standar atau angka baku mempunyai keistimewaan yaitu bahwa nilai standard tidak lagi tergantung kepada satuan pengukuran tersebut sebelumnya. Angka g standar yyang gp paling g asli adalah yyang g dikenal dengan istilah z-score
Z-score didefinisikan sebagai suatu bilangan yang menunjukkan seberapa jauh suatu nilai (angka kasar) menyimpang dari mean dalam satuan SD atau secara singkat i k t dik dikatakan t k sebagai b i iindeks d k d deviasi i i sesuatu t nilai il i Rumus z-score adalah sebagai g berikut :
X-M z SD
Di mana : z = X = M= SD =
angka standar sesuatu angka kasar M Mean di t ib i distribusi Deviasi Standar distribusi
Pengukuran dengan z-score memiliki fungsi-fungsi t t t misalnya tertentu, i l sebagai b i sumber b d darii weighted i ht d score atau scale score yang selalu digunakan dalam proses penilaian hasil-hasil test secara ilmiah. p Dengan z-score memungkinkan seorang guru untuk membandingkan e ba d g a kecakapan eca apa seo seorang a ga anak a da dalam a bermacam-macam pelajaran. Di Dispersi i relatif l tif Untuk mengukur pengaruh dan untuk membandingkan variasi antara nilainilai besar dan nilai-nilai kecil. Dispersi absolut Dispersi relatif p R t - rata Rata t
Jika untuk dispersi absolut diambil simpangan baku ((SD), ), maka didapat p koefisien variasi,, yang y g didapat p dipakai untuk membandingkan variasi relatif beberapa kumpulan data dengan satuan yang berbeda. Rumus koefisien variasi (KV) adalah :
Deviasi D i i standar t d KV 100% Rata - rata 3.7 Momen kemiringan dan kurtosis Perhitungan P hit momen, kkemiringan ii d dan kkurtosis t i digunakan untuk menilai apakah suatu kelompok data terdistribusi secara normal atau tidak.