PENGUKURAN DATA DALAM DISTRIBUSI TUNGGAL DAN BERGOLONG
Dalam proses pengolahan data, statistik memberikan metode yang beragam dan aplkatif sesuai dengan kebutuhan dan karakter data itu sendiri. Dalam proses pengolahan data, seorang analisis sangat mungkin menghadapi data yang sederhana sampai yang kompleks, dari sedikit sampai yang banyak. Dari hanya 1 variabel, sampai bivariabel bahkan multi variabel. Untuk mengolah persebaran data tersebut maka statistik memberikan ruang pengolahan dalam bentuk distribusi tunggal maupun bergolong. Distribusi tunggal merupakan bentuk persebaran data yang sederhana, di mana hanya melibatkan unsur atau nilai (skor) yang terbatas. Dalam konteks ini data langsung bisa diproses secara manual, dan hanya mengandalkan logika saja. Misal untuk menghitung mean dari data berikut maka cukup kita menggunakan distribusi tunggal saja. Dalam distribusi tunggal score mewakili dirinya sendiri. Kalaupun ada score yang sama maka nanti tinggal dikelola dengan berapa banyak score tersebut muncul, sehingga akan mempergunakan kolom frekuensi.
Data (fiktif) Perolehan Nilai Statistik Di Kelas D dari 75 Mahasiswa Skor
Frekuensi
1
3
2
7
3
6
4
4
5
6
6
14
7
20
8
8
9
4
10
3
Dengan variabel nilai/skor
antara 1 sampai 10 maka kita bisa langsung
menghitungnya secara sederhana, bahkan hanya dengan menggunakan kalkulator sederhana maka kita langsung bisa menghitungnya. Kita tidak perlu membuat pengkelasan dari skor, karena secara kebutuhan memang tidak banyak dibutuhkan. Demikian pula ketika kita hendak mencari mediannya maka kita secara manual juga sudah bisa mengerjakannya dengan cepat. Marilah kita proses untuk mencari Mean dan Median. Untuk mean maka kita harus mengkalikan setiap skor/nilai dengan frekuensinya. Hasil pengkalian antara skor dengan frekuensi tersebut kita jumlahkan lalu kita bagai dengan banyak data, yakni 75. Demikian pula dalam mencari median (titik tengah dengan melihat posisi persebaran data), maka kita bisa secara manual melihat kujulatif frekuensi dari kolom frekuensi, maka titik tengahnya berada pada setengah 75 yakni 37,5. Maka kita jumlahkan frekuensi per frekuensi, sampai ketemu di frekuensi 37,5. Mari kita buktikan dengan cepat: Data (fiktif) Perolehan Nilai Statistik Di Kelas D dari 75 Mahasiswa Skor
Frekuensi
Skor x Frekuensi
Kumulatif Frekuensi
1
3
3
3
2
7
14
10
3
6
18
16
4
4
16
20
5
6
30
26
6
14
84
40
7
20
140
60
8
8
64
68
9
4
36
72
10
3
30
75
∑=435
Untuk mencari mean maka kita tinggal membagi 435 dengan 75, dan kita dapatkan angka 12,4. Sedangkan untuk mencari median kita langsung bisa menemukan pada skore 6, di mana dalam kumulatif frekuensi terdapat titik 37,5. Dan untuk mencari modus kita tinggal mencari skore dengan frekuensi terbanyak yakni skore 7.
Distribusi Bergolong Dalam perbincangan sebelumnya kita mengukur tendensi sentral dalam bentuk data yang masih sederhana, dan dengan jumlah yang belum banyak dan kompleks. Bagaimana jika kita menghadapi jumlah data yang sangat banyak variabilitasnya, apakah bisa dikerjakan dengan distribusi tunggal ? Pada prinsipnya bisa, akan tetapi seorang analis akan mengalami banyak kesulitan teknis. Untuk itu statistik memperkenalkan konsep distribusi berkelas atau sering dikenal dengan distribusi bergolong. Apa itu distribusi bergolong, dan apa perbedaannya dengan distribusi tunggal ?. Distribusi bergolong merupakan tabel yang akan memetakan data dengan cara meringkas data melalui pembentukan golongan-golongan atau kelas-kelas. Agar data yang komplek tersebut tidak perlu ditulis semua, maka diperlukan kelas yang tetap mengkover data yang tersedia. Perbedaan dengan distribusi tunggal lebih terletak kepada pemaknaan kelas, kalau distribusi tunggal setiap score atau nilai akan langsung menjadi kelas, akan tetapi dalam distribusi bergolong kelas akan mewakili score atau nilai tertentu. Dalam aplikasinya nanti, agar kelas tetap konsisten mewakili data maka akan dipergunakan suatu konsep titik tengah kelas. Titik tengah ini yang nantinya akan dipakai dalam prose pengolahan data berikut, baik dalam mencari mean, median, maupun modusnya.
Untuk lebih praktisnya marilah kita simak persoalan berikut: Dalam Sidang Umum PBB terdapat usulan untuk membahas tindakan dan serangan membabi buta AS keAfghanistan. Dari berbagai lobi dan pertemuan antar negara-negara dunia terdapat indeks sikap negara-negara dunia terhadap serangan AS tersebut. Misal jumlah negara yang berhasil di index mencapai 200 data berikut, kita akan coba mencari tendensi sentralnya.
Data (fiktif) tentang Pandangan Sidang Umum Terhadap Serangan AS ke Afghanistan 10
12
11
8
10
12
17
20
30
32
11
2
11
6
13
19
17
22
29
32
10
14
10
18
12
12
17
20
30
32
11
5
11
8
13
29
27
12
29
22
15
12
12
10
12
12
27
20
30
18
11
8
14
6
13
19
18
22
29
17
10
12
11
5
10
12
17
21
30
12
11
9
14
6
13
19
27
22
29
22
13
12
11
4
10
12
27
28
30
30
11
7
17
2
13
19
17
22
29
30
10
12
21
7
10
12
14
20
30
32
13
2
11
6
13
19
16
22
29
22
18
22
21
8
10
12
16
20
30
32
11
2
22
8
13
19
18
22
29
22
10
12
11
8
10
12
17
20
30
12
11
2
11
6
13
19
17
22
29
32
10
12
11
8
10
12
17
20
30
32
11
2
11
6
13
19
17
22
29
32
10
12
11
8
10
12
17
20
30
12
15
12
12
10
12
12
27
20
30
18
Dari data ini akan diolah dalam bentuk Distribusi bergolong. Langkah-langkah yang harus dilakukan adalah sebagai berikut: a. Menentukan jangkauan dari data Untuk mencari jangkauan (range) dari data adalah dengan mencari titik (nilai) tertinggi, dan nilai terendah. Agar akurasi mencapai titik yang tinggi, maka disarankan untuk mempergunakan batas nyata, baik batas atas maupun bawah. Dalam konteks data di atas, batas atas (nyata) adalah 32,5 sedangkan batas bawah (nyatanya) adalah 1,5. Tetapi jika dengan ukuran semu batas atasnya adalah 32, dan batas bawahnya 2. Dari pengukuran ini akan akan mendapatkan range atau jangkauan data 31. Dari hasil ini kemudian kita bisa mengolah untuk menentukan banyak kelas. Bagaimana menentukan banyak kelas ? Pada prinsipnya banyak kelas bisa dibuat menurut kebutuhan analis data. Akan tetapi agar kelas tersebut proporsional dianjurkan untuk membuat kelas tidak lebih dari 9 kelas. Sebab dengan sedikit kelas, maka range tiap kelas akan menjadi besar, demikian pula jika kelas terlalu banyak maka range kelasnya menjadi kecil. Juga banyak kelas sangat ditentukan range data, jika range data sampai 1000 maka mau tidak mau harus membuat range kelas yang proporsional, atau jika rangenya hanya 10, maka mau tidak mau harus membuat range kelas yang proporsional. Jika dari data di atas, kemudian kita buat menjadi
8 kelas maka kita akan
menemukan range/interval setiap kelasnya adalah 31: 8 =3, 8, dan untuk memudahkan kita bulatkan saja menjadi 4. Sehingga dari interval ini kita akan bisa menyusun tabel distribusi frekuensi sebagai berikut: Data (fiktif) tentang Pandangan Sidang Umum Terhadap Serangan AS ke Afghanistan
Kelas
Frekuensi
2 - 5
9
6 - 9
17
10-13
75
14-17
20
18-21
25
22-25
14
26-29
15
30-33
21
Dari persebaran data tersebut maka kita akan mengalikan antara titik tengah kelas dengan frekuensi. Apa titik tengah kelas ? Titik tengah kelas merupakan titik yang membagi dua suatu kelas secara persis. Dengan mengunakan titik ini diharapkan mampu merepresentasi score dalam suatu kelas. Baru kemudian kita menjumlahkan seluruh perkalian titik tengah dan frekuensi tersebut dan dibagi dengan banyak data di mana secara otomatis dapat dilihat di penjumlahan frekuensi. Dari sini kita mendapatkan suatu rumus untuk mencari Mean dalam Distribusi bergolong yakni:
Σ F.x M = --------n
M melambangkan Mean f melambangkan frekuensi x melambangkan titik tengah n melambangkan banyak data Dari proses penghitungan di atas kita menemukan angka-angka yang besar dan rumit. Sehingga sering membuat analis data secara manual akan menemui banyak kesulitan. Untuk mensikapi masalah ini maka Statistik memberikan formula rumus baru untuk menemukan Mean, dengan mengunakan Mean Terkaan. Apa yang dimaksud
dengan Mean Terkaan ? Mean terkaan merupakan Mean yang kita buat secara acak dari Mean yang akan kita cari. Misal kita menerka Mean dari Ditribusi di atas dengan Terkaan A dengan Basis terkaan itu sendiri diambil dari titik tengah suatu kelas. Bagaimana mekanisme menggunakan formula mean terkaan: Pertama, menentukan basis Mean terka dengan menggunakan titik tengah suatu kelas. Pada prinsipnya kita bisa menentukan Mean terkaan secara acak, akan tetai demi pemenuhan tujuan untuk menyederhanakan perhitsungan maka disarankan Mean terka diambil dari kelas yang memiliki frekuensi tertinggi, atau Mean terka dari kelas yang posisinya di tengah. Misal jika dalam distribusi frekuensi terdapat 9 kelas, maka kita bisa mengambil kelas yang kelima. Kedua, Membuat kolom dari tabel distribusi frekuensi dengan berbasis simpangan dari kelas terkaan. Jika dalam contoh kita mengambil Mean terka dari kelas 10-13 maka Mean terkanya adalah 11,5, sehingga kita harus membuat simpangan 11,5 dengan titik tengah semua kelas. Dari kelas yang pertama 2-5 simpangan Mean terkanya adalah -8, mengapa diberi tanda (-) ? Ini setidaknya untuk mengambarkan bahwa simpangan titik tengah kelas 2-5 adalah 3,5 sehingga 3,5 dikurangi 11,5 akan mendapatkan simpangan -8. Atau dalam logika yang sederhana kelas 2-5 dikaitkan dengan kelas 10--13 adalah berada dibawah kelas mean terkaan. Demikian pula dengan kelas 6-9 simpangannya adalah -4. Bagaimana dengan kelas mean terkaan sendiri, secara matematis kita akan menemukan simpangan 0, karena 11,5 dikurangi 11,5 adalah 0. Dan untuk kelas dengan titik tengah yang lebih besar dari Mean terkaan secara otomatis bersimbolkan positif. (lihat Tabel). Ketiga, dari langkah kedua tersebut kita masih mendapati angka-angka hitungan yang besar pula. Untuk kita bisa menyederhanakan lagi dengan membuat simpangan bukan berbasis pada angka simpangan sesungguhnya. Bagaimana caranya ? Ini bisa dilakukan dengan membuat angka simpangan yang berbasis satuan. Jadi untuk kelas 2-5 maka simpangan adalah -2, untuk kelas 6-9 adalah -1, untuk kelas 10-13 adalah 0, untuk kelas 14-17 adalah +1, kelas 18-21 adalah +2 dan untuk kelas berikutnya adalah +3, dan +4. (Lihat tabel). Keempat, kita menjumlahkan semua simpangan tersebut dan dibagi dengan banyak data. Jika kita menggunakan simpangan sesungguhnya, setelah dijumlahkan seluruh simpangan dibagi dengan banyak data lalu kita tambahkan dengan Mean terkaan,
sehingga kita menemukan rumus Mean dengan basis Mean terka dengan simpangan sesungguhnya adalah sebagai berikut:
Σ f x X’ M = Mt + --------n
M= Mean Mt= Mean terka F = Frekuensi X’= Selisih titik tengah kelas dari mean terka dalam bentuk selisih nominal (sesungguhnya) N = Banyak data
Atau jika kita menggunakan simpangan yang berbasis satuan maka kita akan dapatkan rumus sebagai berikut:
Σ f x X” M = Mt +
-------------
xi
n
M= Mean Mt= Mean terka F = Frekuensi X”= Selisih titik tengah kelas dari mean terka dalam bentuk satuan N = Banyak data I = Interval Mengapa kita menambahkan simbol I sebagai simbol interval ? Proses pengkalian dengan interval adalah untuk tetap menjadikan simpangan satuan dari kelas adalah sama dengan
simpangan sesungguhnya. Dari sini bisa dipastikan bahwa hasil akhirnya adalah sama dari dua rumus mencari Mean dengan basis Mean terkaan.
Data (fiktif) tentang Pandangan Sidang Umum Terhadap Serangan AS ke Afghanistan Kelas
Tiik Tengah
Simpangan
Simpangan Satuan
Sesungguhnya 2 - 5
3,5
-8
-2
6 - 9
7,5
-4
-1
10-13
11,5
0
0
14-17
15,5
+4
+1
18-21
19,5
+8
+2
22-25
23,5
+12
+3
26-29
27,5
+16
+4
30-33
31,5
+20
+5
48
12
Dengan asumsi bahwa mean terka diambil dari kelas 10-13. Dari tabel ini mean terkaan sebesar 11,5 maka kita akan mendapatkan mean sebagai berikut:
Mean dengan Mean terkaan berbasis simpangan sesungguhnya M = 11,5 + Σ 48 ------200 = 11,5 + 0,24 = 11,74
Atau dengan mean terkaan berbasis simpangan satuan
M = 11,5 + 12
x 4
-----200 = 11,5 + 48 --------200 = 11,5 + 0,24 = 11,74