Nama
: Purnomo Satria
NIM
: 1133467162
PENDISKRIPSIAN DATA 1. Pendahuluan Dalam suatu penelitian kadang-kadang seorang peneliti menemui kesulitan dalam menyajikan sejumlah besar data statistik dalam bentuk yang ringkas dan jelas, meskipun ukuran numerik bagi rata-rata dan ragam (variansi) diberikan. Meskipun kedua ukuran tersebut merupakan diskripsi yang kompak dan bermanfaat bagi sekumpulan data pengamatan. Ukuran-ukuran tersebut tidak dapat mengidentifikasi semua ciri atau sifat yang penting bagi sejumlah informasi yang nantinya dapat diperoleh kembali untuk kepentingan analisis, bila data asal yang banyak tersebut diringkas dan disajikan dalam bentuk tabel, diagram, atau grafik yang layak. 2. Penyajian Data Dalam Bentuk Distribusi Frekwensi Sifat atau ciri penting dari sejumlah besar data statistik dengan cepat dapat diketahui melalui pengelompokan data tersebut kedalam beberapa selang kelas (kelas), dan kemudian dihitung banyaknya pengamatan yang masuk dalam setiap kelas. Susunan seperti ini biasanya disajikan dalam bentuk tabel yang biasanya disebut tabel distribusi frekwensi. Data statistik yang disajikan dalam bentuk distribusi frekwensi biasanya dikatakan sebagai data yang telah dikelompokan, dimana pengelompokan data yang diperoleh dari sampel disusun dalam bentuk selang-selang agar diperoleh gambaran yang lebih jelas mengenai populasi yang belum diketahui sifat atau cirinya. Namun demikian cara seperti ini bagi seorang peneliti atau penyaji data kehilangan identitas dari masing-masing pengamatan dalam sampel. Untuk lebih jelasnya penyajian data dalam bentuk distribusi frekwensi perhatikanlah tabel yang ada dihalaman berikut ini:
Tabel. 1 Distribusi Frekwensi Nilai Ujian Statistika Dasar
Nilai Ujian
Banyaknya Mahasiswa Yang Memperoleh Nilai Tertentu
10 - 14
3
15 - 19
4
20 - 24
6
25 - 29
12
30 - 34
21
35 - 39
8
40 - 44
4
45 - 49
2
Hal-hal yang perlu diperhatikan pada tabel distribusi frekwensi adalah limit kelas dan batas kelas untuk masing-masing selang kelas. Limit kelas dimaksud meliputi limit atas kelas dan limit bawah kelas. Limit atas kelas nilainya sama dengan nilai terbesar dari selang kelas yang dimaksud sedangkan limit bawah kelas nilainya sama dengan nilai terkecil dari selang kelas dimaksud. Misalkan data pada tabel 1 diatas untuk selang kelas 15 - 19, nilai limit bawah kelasnya adalh 15, sedangkan limit atas kelasnya adalah 19. Sedangkan batas kelas dimaksud meliputi batas atas kelas dan batas bawah kelas. Batas atas kelas nilainya sama dengan limit atas kelas ditambah dengan 0,5 bila nilai dalam tabel distribusi frekwensi merupakan bilangan bulat, ditambah dengan 0.05 satu desimal, 0,005 bila dua desimal dan seterusnya. Untuk batas bawah kelasnya proses penentuan nilainya sama dengan batas atas kelas, hanya perbedaannya untuk batas atas kelas menggunakan jumlah (+), sedangkan batas bawah kelas menggunakan kurang (-).Jadi batas bawah kelas sama dengan limit bawah kelas dikurangi dengan 0,5 untuk isi tabel distribusi frekwensi bilangan bulat, 0,05 untuk satu desimal, 0,005 untuk dua desimal dst.
Dengan menggunakan pengurangan dan penjumlahan seperti tersebut diatas berarti batas atas selang kelas sebelumnya sama dengan batas bawah kelas berikutnya, ini tidak berarti bawha ada data pengamatan yang dihitung dua kali. Batas kelas selalu dinyatakan satu desimal lebih banyak daripada data pengamatannya, hal kini dimaksudkan agar tidak ada pengamatan yang persis jatuh pada batas kelas dimaksud, sehingga tidak ada kemungkinan ada data pengamatan yang dihitung dua kali pada selang kelas yang berbeda.Untuk lebih jelasnya perhatikan tabel frekwseni berikut ini. Tabel. 2 Distribusi Frekwensi Skor Ujian Statistika Dasar
Skor Ujian
Batas Kelas
Titik Tengah
Frekwensi
10 - 14
9.5 - 14.5
12
3
15 - 19
14.5 - 19.5
17
4
20 - 24
19.5 - 24.5
22
6
25 - 29
24.5 - 29.5
27
12
30 - 34
29.5 - 34.5
32
21
35 - 39
34.5 - 39.5
37
8
40 - 44
39.5 - 44.5
42
4
45 - 49
44.5 - 49.5
47
2
Penyajian data seperti pada tabel 2 diatas lebih baik bila dibandingkan dengan penyajian data yang ada pada tabel 1, perbedaannya adalah untuk penyajian data seperti pada tabel 2 mengandung informasi yang nantinya sangat bermanfaat dalam menghitung sifat atau ciri deskriptif yang lain dari data pengamatan. Banyaknya pengamatan yang masuk dalam suatu selang kelas tertentu dinamakan frekwensi kelas yang biasanya dilambangkan dengan huruf f.
Untuk memudahkan pembuatan tabel distribusi frekwensi bagi sekumpulan data yang besar ikutilah langkah-langkah berikut ini; 1. Tentukan banyaknya selang kelas yang diperlukan (dalam prakteknya penyaji sendiri yang menentukan banyaknya selang kelas). 2. Tentukan wilayah dari data pengamatan tersebut dengan cara data pengamatan terbesar dikurangi dengan data pengamatan terkecil. 3. Bagilah wilayah tersebut dengan banyaknya selang kelas (poin nomor 2 dibagi dengan poin nomor 1 untuk menduga lebar kelas. 4. Tentukan limit bawah kelas bagi selang yang pertama dan kemudian tentukan batas bawah kelasnya, tambahkan lebar kelas pada batas bawah kelas untuk memperoleh batas atas kelasnya. 5. Daftarkan semua limit kelas dan batas kelas dengan cara menambahkan lebar kelas pada limit dan batas kelas pada selang kelas sebelumnya. 6. Tentukan nilai titik tengah kelas bagi masing-masing selang kelas dengan cara merata-ratakan limit kelas atau batas kelasnya. 7. Tentukan frekwensi bagi masing-masing kelas. 8. Jumlahkan kolom frekwensi dan periksa apakah hasilnya sama dengan banyaknya data pengamatan. Variasi bagi distribusi frekwensi dapat diperoleh dengan menentukan frekwensi relatif atau persentase bagi masing-masing selang. Frekwensi relatif masing-masing kelas diperoleh dengan cara membagi frekwensi kelas dengan frekwensi total. Tabel yang memuat frekwensui relatif disebut distribusi frekwensi relatif. Bila setiap frekwensi relatif digandakan dengan 100% maka kita memperoleh apa yang disebut distribusi persentase. Untuk lebih jelasnya baik distribusi frekwensi relatif maupun distribusi persentase perhatikanlah kedua tabel pada halaman berikut.
Tabel. 3 Distribusi Frekwensi Relatif Skor Ujian Statistika Dasar
Skor Ujian
Batas Kelas
Titik Tengah
Frekwensi Relatif
10 - 14
9.5 - 14.5
12
0.05
15 - 19
14.5 - 19.5
17
0.07
20 - 24
19.5 - 24.5
22
0.10
25 - 29
24.5 - 29.5
27
0.20
30 - 34
29.5 - 34.5
32
0.35
35 - 39
34.5 - 39.5
37
0.13
40 - 44
39.5 - 44.5
42
0.07
45 - 49
44.5 - 49.5
47
0.03
Tabel. 4 Distribusi Frekwensi Persentase Skor Ujian Statistika Dasar
Skor Ujian
Batas Kelas
Titik Tengah
Frekwensi Persentase
10 - 14
9.5 - 14.5
12
5
15 - 19
14.5 - 19.5
17
7
20 - 24
19.5 - 24.5
22
10
25 - 29
24.5 - 29.5
27
20
30 - 34
29.5 - 34.5
32
35
35 - 39
34.5 - 39.5
37
13
40 - 44
39.5 - 44.5
42
7
45 - 49
44.5 - 49.5
47
3
Dalam banyak keadaan penyaji data lebih tertarik bukan pada bagian pengamatan dalam suatu kelas tertentu, melainkan banyaknya pengamatan yang jatuh diatas atau dibawah nilai tertentu. Frekwensi total dari semua nilai yang lebih kecil daripada batas atas kelas suatu selang kelas tertentu disebut tabel frekwensi kumulatif. Tabel berikut ini memperlihatkan tabel distribusi kumulatif bagi nilai ujian statistika dasar.
Tabel. 5 Distribusi Frekwensi Kumulatif Nilai Ujian Statistika Dasar
Batas Kelas
Frekwensi Kumulatif
Kurang Dari 9.5
0
Kurang Dari 14.5
3
Kurang Dari 19.5
7
Kurang Dari 24.5
13
Kurang Dari 29.5
25
Kurang Dari 34.5
46
Kurang Dari 39.5
54
Kurang Dari 44.5
58
Kurang Dari 49.5
60
3. Diagram Batang Informasi yang dikandung suatu distribusi frekwensi dalam bentuk tabel biasanya menjadi lebih mudah ditangkap bila disajikan secara grafik. Kebanyakan orang gambar visual sangat membantu dalam memahami ciri-ciri penting yang ada pada suatu distribusi freweknsi. Dewasa ini sajian grafik yang paling banyak digunakan bagi data numerik (bentuk data kategori atau atribut) adalah dengan menampilkan dalam bentuk diagram batang. Diagram batang disajikan pada salip sumbu yang saling berpotongan dan saling tegak lurus satu sama lain. Bila diagram batang dibuat tegak, maka sumbu datar dibagi menjadi beberapa bagian yang sama (sesuai kebutuhan), demikian juga sumbu tegaknya. Antara sumbu datar dan sumbu tegak tidak selamanya menggunakan skala yang sama, untuk sumbu datar digunakan untuk menyatakan atribut atau waktu, sedangkan sumbu tegak digunakan untuk menuyatakan kuantum atau nilai.
Untuk lebih jelasnya perhatikanlah penyajian data hasil ujian statistika dasar bagai mahasiswa PMIPA FKIP Unhalu Kendari (data dari tabel 1 diatas).
Data berikut ini menunjukan banyaknya mahasiswa jurusan PMIPA FKIP Unhalu Kendari yang terdaftar pada tahun ajaran 1997/1998. Jumlah Mahasiswa
Program Studi
Total
Laki-laki
Perempuan
Pendidikan Matematika
180
132
312
Pendidikan Biologi
144
214
358
Pendidikan Fisika
157
64
221
Pendidikan Kimia
110
95
205
(Data Karangan Saja Sebagai Latihan).
Data diatas bila disajikan dalam bentuk diagram batang hanya berdasarkan program studi tanpa memperhitungkan jenis kelamin, maka diagram batangnya sebagai mana disajikan pada bagian berikut ini.
Gambar 1. Jika diagram batang yang akan dijaikan didasarkan pada program studi dan jenis kelamin, maka diagram batang dari data diatas adalah sebagai berikut:
Gambar 2.
Dengan menggunakan diagram batang dalam menyajikan data diatas, maka orang lain dengan cepat mengetahui banyaknya mahasiswa PMIPA berdasarkan program studi saja(gbr 1), serta berdasarkan program Studi dan jenis kelamin(gbr 2). Penyajian data dengan menggunakan diagram batang dapat juga diterapkan dalam bidang-bidang lain seperti pertanian, industri dan lain-lain. Diagram Garis. Data yang sifatnya kontinu bila disajikan dalam bentuk diagram, penyajiannya yang tepat adalah disajikan dalam bentuk diagram garis, dimana penggunaan diagram garis dimaksudkan untuk menggambarkan keadaan data yang berkesinambungan, misalnya produksi minyak tiap tahun, pertumbuhan balita selama satu tahun, keadaan temperatur disuatu tempat pada setiap jam dan lain sebagainya. Penyajian data dengan menggunakan diagram garis pada dasarnya sama saja dengan proses pembuatan diagram batang tetap menggunakan salib sumbu untuk membuat diagram garis. Sumbu datar biasanya menyatakan waktu, sedangkan sumbu tegaknya biasanya menyatakan kuantum atau nilai tiap waktu. Untuk lebih jelasnya perhatikanlah ilustrasi berikut ini yang menampilkan perkembangan bobot badan bayi selama 2 bulan pertama yang dicacat tiap minggu. Minggu
I
II
III
IV
V
VI
VII
VIII
Bobot badan
3.01
3.00
3.50
2.75
3.25
4.20
4.50
4.00
Diagram garis dari data diatas adal sebagai mana disajikan pada halaman berikut:
Dengan memperhatikan gerak garis, maka seseorang dapat mengetahui bagaimana perkembangan bobo badan bayi pada kurun wamtu tertentu, apakah naik atau turun. Konsep penggunaan diagram garis seperti tersebut diatas banyak diterapkan dimasyarakat khususnya dipos-pos yandu yang menggambarkan pertumbuhan bayi selama periode tertentu.
Diagram Lingkaran Cara lain untuk menyajikan data kategori adalah penyajian dengan menggunakan diagram lingkaran. Penyajian data dengan menggunakan diagram lingkaran terlebih dahulu lingkara yang akan digunakan dalam menyajikan data dibagi menjadi beberapa sektor atau juring (sesuai dengan banyaknya kategori data yang akan disajikan). Data yang akan disajikan dalam bentuk diagram lingkaran terlebih dahulu tada tersebut ditransformasi kedalam satuan derajat. Proses perubahan data kedalam bentuk derajat dilakukan dengan cara membagi banyaknya data pada kategori tertentu dengan total data keseluruhan kemudian digandakan denagn 360o , (besar sudut pusat lingkaran). Untuk lebih jelasnya perhatikanlah penyajian data berikut ini dengan menggunakan diagram lingkaran. (Data Tentang Banyaknya Mahasiswa PMIPA Unhalu Berdasarkan Program Studi) Program Studi
Total
Pend. Matematika
312
Pend. Biologi
205
Pend. Fisika
221
Pend.Kimia
358
total
1096
Data diatas dirobah kedalam bentuk derajat sehingga diperoleh hasil berikut ini: Untuk program studi pend. matematika persentase diperoleh
Untuk program studi pend. Biologi
atau dalam bentuk
atau dalam bentuk persentase diperoleh
Untuk program studi Pend. Fisika
atau
atau dalam bentuk persentase diperoleh
Untuk program studi pend. Kimia
atau
atau dalam bentuk persentase diperoleh Diagram lingkaran dari data tersebut di atas diperlihatkan pada halaman berikut:
Ukuran Pemusatan Untuk menyelidiki sekumpulan data kuantitatif, akan sangat membantu bila kita mendefinisikan ukuran-ukuran numerik yang menjelaskan ciri atau sifat dari data yang disajikan. Cara yang ditempuh untuk menjelaskan ciri atau sifat tersebut adalah penggunaan nilai rata-rata (nilai tengah) baik untuk rata-rata dari populasi bila memungkinkan maupun rata-rata contoh (sampel), median, dan modus.
Rata-rata (nilai tengah) Data kuantitatif yang dinyatakan denagn X1, X2, . . Xn, artinya data diatas berukuran sebanyak n. Untuk menghitung nilai rata-rata (nilai tengah) dari gugus data diatas yang berukuran n (banyaknya data sama dengan n) adalah jumlah semua nilai pengamatan dibagi dengan ukuran data (banyaknya data). Jiika data pengamatan dilambangkan dengan Xi i = 1, 2, 3, . . . . n, sedangkan ukuran (banyaknya) data pengamatan sama dengan n, dan nilai rata-rata dilambangkan denagn , maka nilai rata-rata dari segugus data pengamatan dihitung dengan menggunakan rumus: .
Jika data pengamatan telah disajikan dalam bentuk tabel frekwensi maka proses untuk menghitung nilai rata-rata (nilai tengah) menggunakan rumus:
Contoh; 1. Dari 10 orang mahasiswa mengikuti ujian statistika dasar nilai yang mereka peroleh adalah sebagai berikut: 65 50 70 75 45 65 75 81 61, rata-rata dari nilai tersebut adalah:
2. Dari 16 orang mahasiswa mengikuti ujian statistiak matematika diperoleh nilai sebagai berikut; 5 orang nilai 70, 6 orang nilai 69, 3 orang nilai 45, 1 orang nilai 80, dan 1 orang lagi nilai 56. Rata-rata yang dicapai ke-16 orang mahasiswa tersebut adalah:
Median. Median dari segugus data merupakan nilai tengah dari data tersebut setelah diurutkan baik dari data yang kecil ke data yang terbesar atau sebaliknya. Dengan demikian median dari segugus data membagi data tersebut menjadi dua bagian yang sama banyaknya. Contoh; Tentukanlah median dari gugus data berikut ini: 7 6 8 9 4 3 8 9 10 12 6, sebelum kita memberikan jawaban berapa median dari gugus data tersebut, maka terlebih datanya diurutkan menjadi; 3 4 6 6 7 8 8 9 9 10 12, karena banyaknya data diatas ganjal berarti mediannya langsung diambil nilai yang persis ditengah, dengan cara; Me = 11/2 = 5,5 dibulatkan sama dengan 6. Jadi yang merupakan median dari data diatas adalah data pada pengamatan yang ke-6, yaitu 8. Jika hasil pembagian dengan 2 menghasilkan bilangan bulat kataknlah hasil pembagian tersebut sama dengan k, maka mediannya (Me) sama dengan
Contoh; Tentukanlah median dari data berikut ini; 7 6 8 9 4 3 8 9 10 12, setelah datanya diurutkan diperoleh gugus data berikut; 3 4 6 6 7 8 8 9 9 10 banyaknya data 10, jadi mediannya (Me) = 10/2 = 5, k = 5 dan k + 1 = 6, jadi median (Me) dari data diatas =
Median (Me) =
Modus. Modus dari segugus data merupakan nilai yang munculnya paling banyak (sering) atau nilai yang mempunyai frekwensi pengamatan tertinggi. Modus dari segugus data tidak selamanya ada, demikian juga dari segugus data bisa saja lebih dari satu. Hal ini terjadi bila semua amatan munculnya hanya sekali saja untuk setiap amatan berarti data tersebut tidak mempunyai nilai modus, tetapi data yang muncul mempunyai frekwensi sama lebih dari satu pengamatan berarti modusnya juga lebih satu. Contoh; 1. Tentukanlah modus dari gugus data berikut ini; 4 6 8 7 8 9 8 6 5 9 8 7 4 Karena yang mempunyai frekwensi terbanyak muncul adalah 8 maka modus dari data diatas sama dengan 8. 2. Tentukanlah modus dari gugus data berikut ini; 4 6 8 7 8 9 8 6 5 9 9 7 4 Karena yang mempunyai frekwensi terbanyak muncul adalah 8 dan 9 maka modus dari data diatas sama dengan 8 dan 9. Ukuran Penyebaran Dari ketiga ukuran pemusatan (rata-rata, median, modus) belum memberikan deskripsi yang mencukupi bagi sebaran, sebab dari dari segugus data kita harus mengetahui seberapa jauh penyimpangan-penyimpangan nilai rata-rata dari data pengamatan. Bisa saja dari dua gugus data yang mempunyai rata-rata (nilai tengah) atau medianya sama tetapi keragaman dari data tersebut berbeda. Statistika yang berhubungan dengan ukuran keragaman dari segugus data atau lebih adalah wilayah (range) dan ragam (varian). Wilayah dari segugus data merupakan selisih antara nilai amatan terbesar dengan amatan terkecil. Namun demikian wilayah bukanlah merupakan ukuran keragaman yang baik, terutama bila ukuran contoh yang digunakan atau populasi yang ada cukup besar. Wilayah dari segugus data hanya memperlihatkan kedua nilai ekstrim yaitu amatan terbesar dan amatan terkecil, tidak memberikan informasi apa-apa mengenai sebaran data yang letaknya diantara kedua nilai ekstrim tersebut. Namun demikian walayah tetap juga digunakan sehubungan dengan informasi yang diinginkan oleh penyaji data. Wilayah banyak digunakan dikalangan industri, khususnya dalam meproduksi suatu barang tertentu, dengan menentukan wilayah bagi produksinya, berarti hasil produksinya tetap berada diantara kedua nilai ekstrim tersebut dalam produksinya konsisten dengan informasi yang diberikan. Contoh; Jika diberikan segugus data 3 4 5 7 7 8 10 15 15, wilayah dari gugus data tersebut adalah 12, nilai terbesar 15 sedangkan nilai terkecil 3, berarti wilayahnya sama dengan 15 - 3 = 12.
Untuk mengatasi kekurangan yang dimiliki wilayah, maka ada ukuran keragaman lain yang sering digunakan yaitu ragam (varian), yang memperlihatkan posisi relatif dari setiap nilai amatan terhadap nilai rata-ratanya (nilai tengah), ini dapat dicapai dengan memeriksa simpangan dari nilai tengahnya. Simpangan sebuah pengamatan dari nilai tengahnya diperoleh dengan mengurangkan setiap nilai amatan dengan nilai rata-rata (nilai tengah). Bila kita memiliki segugus data yang diperoleh dari contoh acak, x1, x2, . . . . xn, maka maka simpangan untuk setiap amatan adalah x1 - 1 , x2 - 2, . . . . . xn - n . Dalam prakteknya simpangan tengah tersebut jarang digunakan, sebab penggunaan nilai mutlak membuatnya sulit dimanipulasi secara matematika. Sebagai pengganti dari simpangan tersebut adalah mengkuadratkan semua simpangan untuk menghitung ragam dari gugus data yang ada. Nilai kuadrat yang positip dari ragam dinamakan simpangan baku. Bila populasinya terhingga X1, X2, . . . . Xn, maka ragam populasi didefinisikan sebagai: ; dimana
m
=
Rataan populasi
Xi
=
Nilai pengamatan
N
=
Banyaknya nilai amatan
Contoh; Nilai-nilai berikut ini merupakan hasil ujian dari 6 orangmahasiswa program studi pendidikan matematika semester 3. Nilainya adalah sebagai berikut;7 5 9 7 6 8 Hitunglah ragam dan simpangan baku dari data diatas bilamana data tersebut merupakan ukuran populasi.
Simpangan baku (s) = Ragam dari suatu contoh yang dilambangkan dengan S2 merupakan suatu statistik. Dalam hal-hal tertentu parameter populasi tidak bisa dijangkau, olehnya iru ragam bagi populasi diduga dengan menggunakan ragam dari contoh (S2). Agar diperoleh nilai duga yang baik, maka nilai duga tersebut harus dihitung berdasarkan rumus yang secara rata-rata mengahsilkan parameter populasi. Hasil perhitungan statistik dengan menggunakan rumus secara rata-rata menduga parameter populasi yang hasil duga tersebut tidak berbias, dengan mengganti N dengan n - 1 dari penyebutnya. Dengan demikian ragam contoh acak x1, x2, . . . . xn dari segugus data didefinisikan sebagai : S2 =
Bila nilai merupakan bilangan desimal yang telah dibulatkan maka nilai ragam duga yang diperoleh dengan menggunakan rumus diatas akan berbias. Untuk itu bila nilai rata-rata (nilai tengah) yang diperoleh merupakan bilangan desimal yang harus dibulatkan, maka sebaiknya dalam menghitung S2 gunakanlah rumus berikut ini:
S2 =
.
Simpangan baku dari contoh dilambangkan dengan S didefinisikan sebagai akar pangkat dua dari ragam contoh (S2).
Contoh; Hitunglah ragam dan simpangan baku dari data contoh (sampel) berikut ini; 3 4 5 6 6 7.
S2 =
Simpangan baku dari contoh =
= 1.472