STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
I. PENGANTAR STATISTIKA
1.1 Jenis-jenis Statistik Secara umum, ilmu statistika dapat terbagi menjadi dua jenis, yaitu: 1. Statistika Deskriptif 2. Statistika Inferensial Dalam sub bab ini akan dijelaskan mengenai pengertian dari kedua jenis statistika tersebut. a. Statistika Deskriptif Statistika deskriptif dapat disebut juga sebagai statistika deduktif atau statistika sederhana. Staistika deskriptif adalah statistika yang tingkat pengerjaanya mencakup caracara menghitung, menyusun atau mengatur, mengolah, menyajikan data agar dapat memberikan gambaran yang ringkas mengenai suatu keadaan, seperti teknik umum mencari rata-rata, median, modus, kuartil dan lain sebagainya. b. Statistika Inferensial Statistika inferensial adalah statistika yang berhubungan dengan analisis data untuk penarikan kesimpulan dari data. Misalnya, teknik uji hipotesa, analisis varians, teknik korelasi, regresi dan lain-lain.
1.2 Jenis-jenis Data Secara garis besar, data-data olahan dibagi menjadi 3 jenis data, yaitu: 1. Data Kuantitatif, yaitu data yang berupa angka-angka. Informasi yang dikandung data berupa data angka. Contoh: data jumlah penduduk, jumlah pendapatan nasional, dan lain sebagainya. Data kuantitatif dapat berupa: a. Data Kontinu adalah data yang angka-angkanya merupakan deretan angka yang sambung-menyambung atau berkelanjutan. Contoh: tinggi badan, berat badan, dan lain-lain. b. Data diskrit adalah data statistik yang tidak berkelanjutan. Contoh: Jumlah penduduk, Jumlah anak dan lain-lain. 2. Data Kualitatif, yaitu data non-angka. Informasi yang dikandung bukan berupa angka. Contoh: data jenis kelamin penduduk, tingkat pendidikan dan sebagainya. Data jenis ini harus diubah terlebih dahulu menjadi data kuantitatif sebelum diolah.
1
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
1.3 Jenis-jenis Skala Pengukuran Skala pengukuran yang dapat digunakan dalam pengolahan data statistik adalah sebagai berikut: 1. Data Nominal Data nominal adalah data statistik yang cara menyusunnya atas golongan atau klasifikasi tertentu. Contoh: Jumlah mahasiswa dari segi tingkat kelas dan kelamin. 2. Data Ordinal Data ordinal adalah data statistik yang cara menyusunnya didasarkan pada urutan, kedudukan dan rangking/tingkatan data. Contoh: Pandai, kurang pandai dan tidak pandai. 3. Data Interval Data interval adalah data statistik dimana terdapat jarak yang sama. Dari satu data ke data yang lain intervalnya sama. Contoh: Mahasiswa yang mendapat nilai 1 sampai 10, petani yang mempunya hasil panen antara 2 sampai 15 kwintal, dan sebagainya. 4. Data Rasio Data rasio adalah data yang tergolong dalam data kontinum tapi mempunyai ciri (syarat) tertentu. Contoh: Berat badan Paman 60 Kg, Berat badan Sagung 15 Kg. Dengan demikian, berat badan Ibu adalah 4 kali berat badan Ani.
1.4 Populasi dan Sampel Populasi adalah sekumpulan objek yang akan dijadikan sebagai bahan penelitian dengan ciri mempunyai karakteristik yang sama. Populasi selalu memiliki sifat-sifat yang serupa. Beberapa macam populasi didasarkan pada jumlah anggotanya adalah sebagai berikut: a. Populasi berhingga Populasi berhingga adalah sekumpulan objek yang akan dijadikan sebagai kajian yang jumlahnya tertentu. Contoh: Populasi mahasiswa fakultas ekonomi, jumlah kendaraan bermotor dari merk tertentu yang beredar di jalan, jumlah siswa kelas III dari suatu Sekolah Dasar, dan lain sebagainya.
2
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
b. Populasi tak berihingga Populasi tak berhingga adalah sekumpulan objek yang akan diteliti berjumlah tidak terhingga banyak. Contoh: Populasi amoeba dalam suatu parit, jumlah pelanggan supermarket, jumlah partikel di udara, dan lain-lain.
3
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
II. STATISTIKA DESKRIPTIF
2.1 Daftar Distribusi Frekuensi Dafatr distribusi frekuensi adalah penyusunan urutan data ke dalam kelas-kelas interval, untuk kemudian ditentukan jumlah frekuensinya berdasarkan data yang sesuai dengan batas-batas interval kelasnya. Tahap penyusunan data menjadi daftar distribusi frekuensi antara lain adalah: 1. Menghitung jumlah data 2. Mencari data tertinggi dan terendah 3. Menetapkan range Range ( R) X max X min
4.
Merencanakan jumlah kelas Jumlah kelas dihitung dengan menggunakan kaedah Sturges: b 1 3,3 log n , dimana n adalah jumlah data
5. Menentukan panjang kelas Panjang kelas ditentukan dengan persamaan berikut: p
xmax xmin R b b
6. Menentukan ujung bawah pada kelas interval Ujung bawah kelas interval ditentukan dengan cara menjumlahkan data terkecil yang ditetapkan sebagai ujung bawah kelas interval pertama dengan nilai panjang kelas (p). Contoh 2.1: Jumlah kelas: 8 P=9 Data terkecil=22 Maka ujung bawah interval adalah: 22, 31, 40, ….dan seterusnya. 7. Menetapkan nilai ujung atas kelas interval Ujung atas kelas interval dimulai dengan interval kelas pertama sampai dengan kelas terakhir.
4
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
5
a. Jika ujung-ujung bawah adalah bilangan bulat, maka nilai-nilai dari ujung atas pada interval kelas pertama, kedua dan seterusnya mempunyai selisih 1 dengan nilai ujung bawah berikutnya. Contoh 2.2: Perhatikan kembali Contoh 2.1, maka ujung atas intervalnya adalah: 30, 39, 48, …..dan seterusnya. b. Jika ujung-ujung bawah adalah bilangan 1 desimal, maka nilai ujung-ujung atas pada interval kelas pertama, kedua dan seterusnya mempunyai seliisih 0,1 dengan nilai ujung bawah berikutnya. Contoh 2.3: Misalkan ujung atas interval kelas data adalah: 25,0 31,5 38,0 44,5 dan seterusnya. Sehingga diperoleh ujung atas intervalnya adalah: 31,4 37,9 44,4 dan seterusnya. Begitu seterusnya untuk bilangan 2 desimal , 3 desimal dan selanjutnya. 8. Menetukan batas bawah dan batas atas kelas interval Batas bawah interval dapat dihitung dengan persamaan berikut: Batas bawah interval ujung bawah - 0.5 (untuk ujung yang berupa bilangan bulat) Batas bawah interval ujung bawah - 0.05 (untuk ujung yang berupa bilangan 1 desimal) Batas bawah interval ujung bawah - 0.005 (untuk ujung yang berupa bilangan 2 desimal) dan seterusnya sedangkan batas atas dapat dihitung dengan persamaan berikut:
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
6
Batas atas interval ujung atas 0.5 (untuk ujung yang berupa bilangan bulat) Batas atas interval ujung atas 0.05 (untuk ujung yang berupa bilangan 1 desimal) Batas atas interval ujung atas 0.005 (untuk ujung yang berupa bilangan 2 desimal) dan seterusnya
9. Menentukan nilai tengah Nilai tengah dapat ditentuan sebagai berikut:
xi
ujung bawah ujung atas 2
10. Frekuensi Banyak data dalam setiap interval kelas yang diperoleh dari himpunan data disesuaikan dengan batas-batas interval kelas. Adapun macam-macam distribusi frekuensi adalah: a. Distribusi frekuensi relatif Distribusi frekuensi relatif dapat dinyatakan dalam bentuk relatif (persentase). Frekuensi relatif kadang-kadang dinyatakan dalam bentuk perbandingan ataupun desimal. Contoh 2.4: Misalkan jumlah seluruh data adalah 125, maka diperoleh: 21 – 30
12
12 100% 9,6% 125
31 – 40
10
10 100% 8% 125
dan seterusnya. Sehingga diperoleh tabel distribusi berikut ini: Tabel 2.1 Distribusi frekuensi relatif dari Contoh 2.4 No.
Interval
Frekuensi
Frekuensi relatif
1.
21 – 30
12
9,6%
2.
31 – 40
10
8%
dan seterusnya
dan seterusnya
b. Distribusi frekuensi kumulatif Distribusi frekuensi kumulatif adalah distribusi yang berisikan frekuensi kumulatif. Frekuensi kumulatif adalah frekuensi yang dijumlahkan. Ada dua macam distribusi frekuensi kumulatif, yaitu distribusi frekuensi kumulatif kurang dari dan lebih dari.
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
a. Distribusi Frekuensi Kumulatif kurang dari, adalah distribusi frekuensi yang memuat jumlah frekuensi yang memiliki nilai kurang dari nilai batas kelas suatu interval tertentu. b. Distribusi Frekuensi Kumulatif lebih dari, adalah distribusi frekuensi yang memuat jumlah frekuensi yang memiliki nilai lebih dari nilai batas kelas suatu interval tertentu. Contoh 2.5: Berikut ini adalah data 50 mahasiswa dalam perolehan nilai statistik pada Pendidikan Matematika Universitas “T” semester II tahun 2010: 70
91
93
82
78
70
71
92
38
56
79
49
48
74
81
95
87
80
80
84
35
83
73
74
43
86
68
92
93
76
81
70
74
97
95
80
53
71
77
63
74
73
68
72
85
57
65
93
83
86
Nyatakan data-data tersebut ke dalam bentuk tabel distribusi frekuensi kurang dari dan lebih dari! Penyelesaian: Tabel 3.2 Tabel distribusi frekuensi kurang dari dan lebih dari Frekuensi kumulatif ( f k ) No.
Interval
Frekuensi Nilai
f k Kurang dari
<35
0
1.
35 – 43
3
< 44
3
2.
44 – 52
2
< 53
5
3.
53 – 61
3
< 62
8
4.
62 – 70
7
< 71
15
5.
71 – 79
13
< 80
28
6.
80 – 88
13
< 89
41
7.
89 – 97
9
< 98
50
(a) Tabel distribusi frekuensi kumulatif kurang dari
Frekuensi kumulatif ( f k ) No.
1.
Interval
35 – 43
Frekuensi
3
Nilai
f k Kurang dari
> 35
50
> 44
41
7
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
2.
44 – 52
2
> 53
28
3.
53 – 61
3
> 62
15
4.
62 – 70
7
> 71
8
5.
71 – 79
13
> 80
5
6.
80 – 88
13
> 89
3
7.
89 – 97
9
> 98
0
(b) Tabel distribusi frekuensi kumulatif lebih dari
Contoh Soal 2.1: Misalkan terdapat sekelompok data berikut ini: 10
20
14
15
21
25
27
15
13
12
17
14
16
28
22
21
22
23
25
20
Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi! Penyelesaian: 1. Jumlah data = 20 2. xmax 28 dan xmin 10 3. Range ( R) xmax xmin 28 10 18 4. Jumlah kelas: b 1 3,3 log n 1 3,3 log 20 1 3,3 1,301 5,29
Pembulatan dilakukan ke bawah sehingga diperoleh: b 5,29 5
5. Panjang interval
p
R 18 3,6667 b 5
Pembulatan dilakukan ke atas sehingga diperoleh: p 3,6667 4
Dari informasi-informasi yang diperoleh tersebut, maka didapatkan daftar distribusi sebagai berikut: Tabel 2.3 Daftar distribusi frekuensi dari Contoh Soal 2.1 No.
Interval Kelas
Frekuensi
1.
10 – 13
3
2.
14 – 17
6
8
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
3.
18 – 21
4
4.
22 – 25
5
5.
26 – 29
2
20
Latihan Soal 2.1 1. Misalkan terdapat sekelompok data berikut ini: 20
22
25
32
18
24
15
30
29
28
30
26
31
23
30
34
27
20
32
34
Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi, distribusi frekuensi relatif, distribusi frekuensi kumulatif kurang dari dan lebih dari! 2. Misalkan terdapat sekelompok data berikut ini: 25
32
40
33
26
34
45
58
97
68
65
70
98
55
58
53
86
97
64
34
29
30
45
54
66
76
75
88
48
38
44
48
74
43
42
58
55
30
31
51
87
67
68
75
54
65
89
93
94
76
66
69
70
79
37
38
66
87
50
25
36
39
64
60
69
70
71
72
75
80
86
83
82
98
61
73
82
86
44
42
35
38
42
49
44
75
77
79
81
52
28
43
55
83
66
69
70
73
52
39
Kelompokkan data-data tersebut ke dalam suatu tabel distribusi frekuensi, distribusi frekuensi relatif, distribusi frekuensi kumulatif kurang dari dan lebih dari!
2.2 Ukuran Kepusatan Ukuran kepusatan suatu kelompok data terdiri atas: 1. Bagaimana tingkat penyimpangan data terhadap rata-rata datanya 2. Bagaimana variasi data yang dimiliki 3. Seberapa besar kemiringan kurvanya terhadap nilai rata-rata 4. Bagaimana ukuran keruncingan kurva (menunjukkan kondisi penyebaran data terhadap nilai rata-rata) Terdapat beberapa ukuran kepusatan yang akan dibahas dalam sub bab ini, yaitu: 1. Rata-rata data baik yang belum maupun yang sudah dikelompokkan
9
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
2. Modus dari data baik yang belum maupun yang sudah dikelompokkan 3. Median dari data yang belum maupun yang sudah dikelompokkan 4. Kuartil dari data yang belum maupun yang sudah dikelompokkan 5. Desil dari data yang belum maupun yang sudah dikelompokkan
2.2.1 Rata-rata Dalam sub bab ini terdapat beberapa macam rata-rata yang akan dijelaskan, diantaranya adalah: a. Rata-rata Hitung Rata-rata hitung sesungguhnya merupakan hasil jumlah semua data dibagi dengan banyak data. Rata-rata hitung biasa dilambangkan dengan x . Misalkan suatu kelompok data dapat dinyatakan dalam barisan x1 , x2 ,, xn . Maka ratarata hitung dari data yang belum dikelompokkan (data tunggal) tersebut dapat dinyatakan dengan persamaan: n
x
x i 1
i
n
x1 x 2 x n . n
Sedangkan untuk data yang sudah dikelompokkan ke dalam suatu tabel distribusi frekuensi, rata-rata hitungnya dapat dinyatakan ke dalam persamaan berikut:
x
f x f i
i
……………………….(2.1)
i
atau dapat juga digunakan persamaan:
f i Ci x x 0 p f i
……………………….(2.2)
dimana: x Rata - rata data x0 Mid Point (nilai tengah) interval kelas yang dijadikan dasar xi Mid Point (nilai tengah) kelas ke - i tertentu dan bukan yang dijadikan dasar f i Frekuensi kelas ke - i p panjang kelas interval pada kelas dasar Ci skala (coding) kelas ke - i, Ci
xi x0 p
10
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Penentuan kelas dasar dalam mencari rata-rata hitung dapat dilakukan secara random. Setiap orang dapat menentukan nilai x0 yang berbeda-beda. Contoh soal 2.2 Perhatikan kembali Contoh 2.1. Carilah rata-rata hitung data tersebut baik sebelum maupun sesudah dikelompokkan ke dalam tabel distribusi frekuensi seperti tampak pada Tabel 2.3. Penyelesaian: Diketahui: n 20 n
x
xi i 1
20
x i 1
i
n 20 10 20 14 15 21 25 27 23 25 20 20 380 19 20
Selanjutnya, perhatikan Tabel 2.3 data-data tersebut dinyatakan ke dalam suatu tabel distribusi frekuensi. Dari Tabel 2.3 diperoleh beberapa informasi yang dapat disajikan dalam Tabel 2.4.
Tabel 2.4. Informasi dari data berkelompok Contoh Soal 2.1 (a) Frekuensi No.
Interval Kelas
fi
xi
f i xi
1.
10 – 13
3
11,5
34,5
2.
14 – 17
6
15,5
93
3.
18 – 21
4
19,5
78
4.
22 – 25
5
23,5
117,5
5.
26 – 29
2
27,5
55
20
378
Sehingga jika rata-rata hitung ditentukan dengan menggunakan Persamaan 2.1, maka diperoleh:
x
f x f i
i
i
380 18,9 20
11
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Kemudian, jika rata-rata hitung dicari dengan menggunakan Persmaan (2.2) dan jika diambil nilai x0 15,5 maka diperlukan pula beberapa informasi seperti yang tampak pada Tabel 2.5 berikut: Tabel 2.5. Informasi dari data berkelompok Contoh Soal 2.1(b) Frekuensi No.
Interval Kelas
fi
xi
Ci
f i Ci
1.
10 – 13
3
11,5
-1
-3
2.
14 – 17
6
15,5
0
0
3.
18 – 21
4
19,5
1
4
4.
22 – 25
5
23,5
2
10
5.
26 – 29
2
27,5
3
6
20
17
Sehingga diperoleh rata-rata hitung:
f i Ci x x 0 p f i 17 15,5 4 20 15,5 3,4
18,9
b. Rata-rata Ukur Rata-rata ukur biasa digunakan pada kumpulan data yang mempunyai sifat berurutan tetap arau hampir tetap. Dengan kata lain, rata-rata ukur dapat digunakan untuk menghitung rata-rata data yang bersifat kelipatan tetap (hampir tetap. Misalkan terdapat sekumpulan data yang memenuhi sifat-sifat di atas, yaitu
x1 , x2 ,, xn . Maka rata-rata ukur dapat dihitung dengan menggunakan persamaan berikut: U n x1 x2 xn
……………………..(2.3)
dengan n adalah jumlah data. Persamaan (2.3) dapat diturunkan sebagai berikut: U x1 x 2 x n n 1
log U log x1 x 2 x n n 1
1 log U log x1 x2 xn n
…………………………………….(2.4)
12
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Sehingga untuk data yang telah dikelompokkan dapat digunakan persamaan berikut: log U
f log x f i
i
………………………….(2.5)
i
Contoh 2.3 Misalkan sekelompok data: 85
75
70
80
90
45
50
65
35
40
Data tersebut dapat dinyatakan ke dalam tabel distribusi frekuensi berikut:
Tabel 2.6 Tabel distribusi frekuensi Contoh 2.3 No.
Interval
Frekuensi
xi
log xi
f i log xi
1
35 – 48
3
41,5
1,61805
4,85414
2
49 – 62
1
55,5
1,74429
1,74429
3
63 – 76
3
69,5
1,84199
5,52595
4
77 – 90
3
83,5
1,92165
5,76506
10
17,88945
Cari rata-rata ukurnya! Penyelesaian: U 10 85.75.70.80.90.45.50.65.35.40 10 6,5786 1017 60,51
Atau dapat dihitung dengan menggunakan Persamaan (2.4) seperti tampak di bawah ini:
1 log 85.75.70.80.90.45.50.65.35.40 10 1 17,818 10 1,7818
log U
U log 1 1,7818 60,51 Untuk data yang telah dikelompokkan dalam Tabel 2.3 dapat diperleh rata-rata ukur berikut:
log U
f log x f i
i
i
17,88945 1,78895 10
U log 1,78895 61,5 1
13
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
c. Rata-rata Untuk Suatu Data Yang Bersifat Tumbuh Nilai rerata untuk suatu data yang bersifat tumbuh dapat diperoleh dengan menggunakan persamaan: x Pt P0 1 100
t
Keterangan: Pt Data akhir P0 Data awal x Rata - rata data t Selang waktu
Contoh data yang bersifat tumbuh adalah perkembangan modal usaha selama kurun waktu tertentu atau perkembangan jumlah penduduk suatu daerah dalam kurun waktu tertentu.
Contoh 2.4 Jumlah penduduk suatu daerah pada tahun 1998 adalah 3,2 juta dan pada tahun 2011 jumlahnya bertambah menjadi 132,5 juta. Berapakah pertambahan rata-rata penduduk setiap tahunnya? Penyelesaian: x Pt P0 1 100
t
14
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si t x log Pt log P0 1 100
x log P0 log 1 100
t
x log P0 t log 1 100 x log 132500000 log 3200000 13 log 1 100 x 8,1222 6,50515 1,6170659 log 1 100 x 1 100 1,331649 x 0,331649 100 x 33,16 34
Jadi, rata-rata pertambahan penduduk per tahunnya adalah 34 jiwa.
2.2.2 Modus Modus adalah besaran yang menyatakan keterpusatan data didasarkan pada frekuensi paling sering munculnya data. Selanjutnya, data yang mempunyai lebih dari satu nilai modus disebut data multimodal. Untuk data yang telah dikelompokkan menjadi tabel distribusi frekuensi, modus dapat dihitung dengan menggunakan persamaan berikut: b1 M o b p b1 b2
Keterangan: M o Nilai modus b Batas bawah dimana modus terdapat p panjang interval b1 selisih antara frekuensi modus dengan frekuensi sebelumnya b2 selisih antara frekuensi modus dengan frekuensi sesudahnya
Contoh 2.5 1. Misalkan sekelompok data: 12, 24, 23, 12, 31, 42 Maka modus dari data tersebut adalah 12 (muncul 2 kali).
15
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
2. Lihat kembali data dalam Contoh 2.1. Tampak bahwa frekuensi tertinggi ada pada kelas kedua. Sehingga diperoleh informasi sebagai berikut:
b 13,5 b1 3 b2 2 3 M o 13,5 15,9 3 2 Hal ini mengandung arti bahwa nilai-nilai data terletak paling banyak di sekitar nilai 15,9.
2.2.3 Median Median adalah nilai data tengah (sekelompok data dibagi menjadi 2 bagian yang sama). Ingat bahwa median dicari setelah data diurutkan terlebih dahulu. Untuk data yang belum dikelompokkan, penghitungan median dapat dilakukan dengan 2 cara, yaitu: a. Untuk data ganjil Contoh 2.6 Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8 Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16 Sehingga diperoleh median data adalah: M e 7 b. Untuk data genap Contoh 2.7 Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8, 17 Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16, 17 Sehingga diperoleh median data adalah: M e
78 7,5 . 2
Selanjutnya, untuk kumpulan data yang telah dikelompokkan ke dalam distribusi frekuensi, median data tersebut dapat ditentukan dengan persamaan di bawah ini: n F M e b p 2 f
Keterangan:
16
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
b Batas bawah kelas median (dimana median berada) p panjang kelas kelas median (dimana median berada) n jumlah data F frekuensi kumulatif sebelum kelas median f frekuensi kelas median Contoh 2.8 Misalkan terdapat sekelompok data yang telah disajikan dalam tabel distribusi frekuensi berikut ini: Tabel 2.7. Tabel distribusi frekuensi data Contoh 2.8 No.
Interval
Frekuensi (f)
1
31 – 40
4
frekuensi kumulatif (F) 4
2
41 – 50
6
10
3
51 – 60
8
18
4
61 – 70
14
32
5
71 – 80
26
58
6
81 – 90
12
70
7
91 – 100
20
90
90
Median terletak pada data ke:
90 45 2 Karena data ke 45 terletak pada kelas ke-5, maka diperoleh informasi berikut:
b 71 0,5 70,5 p 10 F 32 f 26
45 32 M e 70,5 10 75,5 26
2.2.4 Kuartil Kuartil adalah nilai sekumpulan data yang dibagi 4 bagian yang sama. Oleh sebab itu, terdapat 3 kuartil, yaitu: K1 , K 2 , K 3 . Untuk data yang belum dikelompokkan ke dalam tabel distribusi frekuensi, maka kuartil data dapat dihitung sesuai dengan langkah-langkah berikut:
17
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
1. Urutkan data dari data terkecil ke data terbesar 2. Tentukan letak kuartil dengan persamaan:
Ki
i(n 1) , n banyak data 4
3. Tentukan nilai kuartil yang diminta tersebut Contoh 2.9 1. Misalkan diketahui data ganjil sebagai berikut: 12,8, 10, 22, 18, 4, 9 Sehingga diperoleh data setelah diurutkan: 4, 8, 9, 10, 12, 18, 22 Letak kuartil:
K1
1(7 1) 2 maka, kuartil pertama ( K1 ) terletak pada data ke-2, yaitu: 8 4
K2
2(7 1) 4 maka, kuartil pertama ( K 2 ) terletak pada data ke-4, yaitu: 10 4
K3
3(7 1) 6 maka, kuartil pertama ( K1 ) terletak pada data ke-6, yaitu: 18 4
2. Misalkan diketahui data genap: 8, 12, 5, 3, 7, 2, 3, 8 Sehingga data terurut: 2, 3, 3, 5, 7, 8, 8, 12 Letak kuartil:
K1
1(8 1) 2,25 4
Nilai K1 Data ke-2+(0,25(data ke-3 – data ke-2))
3+(0,25(3-3)) 3 K2
2(8 1) 4,5 4
Nilai K1 Data ke-4+(0,5(data ke-5 – data ke-4))
5+(0,5(7-5)) 6 K3
3(8 1) 6,25 4
Nilai K 3 Data ke-6+(0,25(data ke-7 – data ke-6))
8+(0,25(8-8)) 8
18
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Sedangkan untuk data yang telah dikelompokkan ke dalam tabel distribusi frekuensi, kuartil data dapat dihitung dengan menggunakan langkah-langkah berikut: 1. Tentukan letak kuartil dengan persamaan:
Ki
in , n banyak data 4
2. Menentukan nilai kuartil dengan persamaan berikut: in F Nilai K i b p 4 f
Keterangan:
b batas bawah kelas kuartil p panjang interval n jumlah data F frekuensi kumulatif sebelum kelas kuartil f frekuensi kelas kuartil
Contoh 2.10 Perhatikan Tabel 2.7. Tentukan nilai kuartil ketiganya ( K 3 )! Letak kuartil kedua ( K 3 ):
K3
3 90 67,5 , maka kuartil ketiga terletak pada kelas ke-6 4
Sehingga diperoleh informasi berikut:
b 81 0,5 80,5 p 10 F 58 f 12 3 90 58 88,42 Nilai K 3 80,5 10 4 12
Latihan Soal Misalkan terdapat sekumpulan data berikut: 10
20
14
15
21
25
27
15
13
12
19
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
17
14
16
28
22
21
22
23
25
20
Carilah modus, median dan ketiga kuartil dari data tersebut baik sebelum maupun sesudah dikelompokkan ke dalam tabel distribusi frekuensi!
20
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
III. ANALISA KORELASI LINEAR SEDERHANA
Analisis korelasi adalah metode statistik yang digunakan untuk menentukan kuat tidaknya (derajat) hubungan linier antara 2 variabel atau lebih. Analisa korelasi sederhana, meneliti hubungan dan bagaimana eratnya itu, tanpa melihat bentuk hubungan. Jika kenaikan didalam suatu variabel diikuti dengan kenaikan variabel yang lain, maka dapat dikatakan bahwa kedua variabel tersebut mempunyai “korelasi”yang positif. Tetapi jika kenaikan didalam suatu variabel diikuti penurunan variabel yang lain maka kedua variabel tersebut mempunyai korelasi negatif. Jika tidak ada perubahan pada suatu variabel ,meskipun variabel yang lain mengalami perubahan, maka kedua variabel tersebut, tidak mempunyai hubungan (uncorrelated). Ilmu ekonomi dan pendidikan banyak mempelajari hubungan antar berbagai variabel. Dari adanya hubungan tersebut digunakan untuk memprediksi pengaruh satu variabel terhadap variabel lainnya. Misalnya, hubungan antara jumlah permintaan suatu barang terhadap besarnya harga yang dapat dinyatakan dengan (f(p)). Fungsi tersebut menunjukkan fakta yang muncul sebagai akibat atau disebabkan munculnya suatu yang lain. Hal ini menghadapkan kita pada fakta kausalitas. Dari contoh tersebut dapat dijelaskan bahwa jumlah barang yang diminta akan berubah sebagai akibat adanya perubahan harga. Hubungan-hubungan fungsional tersebut menjelaskan ketergantungan variabel terikat (dependent variable) pada variabel-variabel bebas (independent variable) dalam bentuk yang spesifik. Hubungan fungsional ini bisa jadi merupakan hubungan yang sederhana antar variabel. Pada kenyataannya, lebih sering dijumpai hubungan fungsional yang rumit dan sulit untuk dijelaskan. Alat yang sering digunakan untuk mendekati kejadian tersebut adalah regresi, baik regresi linear sederhana maupun regresi berganda. Langkah awal yang harus dilakukan (sebelum menganalisis regresi) adalah mengetahui bahwa dua variabel yang akan dianalisis memiliki hubungan yang kuat. Hal ini dapat dilakukan dengan melakukan analisis korelasi. Analisis korelasi adalah sekumpulan teknik statistika yang dapat digunakan untuk mengukur keeratan hubungan (korelasi) antara dua variabel. Misalkan suatu perusahaan berpendapat bahwa dengan mendemonstrasikan cara pemakaian produk akan dapat meningkatkan angka penjualan. Dari contoh tersebut, maka dapat dikatakan bahwa demonstrasi pemakaian produk disebut variabel bebas, sedangkan angka penjualan disebut variabel terikat.
21
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Hubungan antara dua variabel jika ditinjau dari segi arahnya dapat dibedakan menjadi 2 jenis, yaitu: 1. Hubungan searah (korelasi positif) Dua variabel (atau lebih) dikatakan memunyai hubungan searah jika dua variabel (atau lebih) berjalan secara paralel. Hal ini mengandung makna bahwa hubungan antara dua variabel (atau lebih) menunjukkan arah yang sama. Jadi apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami peningkatan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga menurun. Contoh 3.1 Berikut ini adalah beberapa contoh hubungan searah antara dua variabel: 1. Kenaikan harga BBM akan diikuti dengan kenaikan harga sembako 2. Naiknya frekuensi pemberian tugas akan menyebabkan naiknya hasil belajar 3. Naiknya kedisiplinan anak didik diikuti dengan meningkatnya hasil belajar anak didik bersangkutan. Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1 berikut:
X
Y
(a)
X Y (b)
Gambar 3.1 Arah Korelasi positif
2. Hubungan berlawanan arah (korelasi negatif) Dua variabel (atau lebih) dikatakan mempunyai hubungan yang berlawanan arah jika kedua variabel (atau lebih) tersebut bergerak dengan arah yang berlawanan. Hal ini mengandung makna bahwa hubungan antara dua variabel (atau lebih) menunjukkan arah yang berkebalikan. Jadi, apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami penurunan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga menigkat.
22
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Contoh 3.2 Berikut ini adalah beberapa contoh hubungan antara dua variabel yang berlawanan arah: 1. Semakin
meningkatnya
kedisiplinan
dalam
berkendara
akan
diikuti
dengan
berkurang/menurunnya angka kecelakaan lalu lintas. 2. Semakin menurunnya harga buku pelajaran akan meningkatkan tingkat pengetahuan siswa.
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1 berikut:
X
Y
(a)
X Y (b)
Gambar 3.1 Arah Korelasi positif Positif atau negatifnya korelasi antara dua variabel dapat juga dilihat dari angka korelasinya. Angka korelasi (koefisien korelasi) adalah koefisien yang dapat digunakan untuk melihat besar-kecilnya, tinggi-rendah atau kuat-lemahnya suatu korelasi. Jadi, koefisien korelasi adalah sebuah angka yang dapat dijadikan petunjuk untuk mengetahui seberapa besar kekuatan korelasi di antara variabel yang sedang diselidiki korelasinya. Lambang koefisien korelasi berbeda-beda sesuai dengan teknik korelasi yang digunakan, yaitu:
rxy koefisien korelasi product moment
koefisien korelasi spearmann koefisien korelasi phi rpbi koefisien korelasi point biserial Besarnya nilai mutlak angka korelasi berada dalam interval 0,1. “0” menandakan tidak ada korelasi di antara variabel-variabel yang diselidiki dan angka “1” menunjukkan adanya korelasi yang maksimal. Jika diperoleh angka korelasi yang lebih dari 1 atau kurang dari -1, maka dalam perhitungan pasti terjadi kesalahan.
23
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Jika tanda koefisien korelasi adalah positif („plus‟) maka korelasi yang terjadi adalah korelasi positif. Sedangkan jika tanda angka/koefisien korelasi adalah negatif („minus‟) maka korelasi antara variabel-variabel yang diselidiki adalah korelasi negatif. Terdapat beberapa teknik korelasi yang dapat digunakan untuk mencari angka/koefisien korelasi antar variabel, diantaranya adalah: 1. Teknik korelasi product moment (pearson) Teknik korelasi product moment digunakan untuk mencari koefisien korelasi untuk data kontinu, populasinya bersifat homogen atau mendekati homogen dan regresinya adalah regresi linear. 2. Teknik korelasi tata jenjang (rank spearman) Teknik korelasi rank spearmann digunakan untuk mencari koefisien korelasi untuk data ordinal (berjenjang). 3. Teknik korelasi phi Teknik korelasi phi digunakan untuk mencari koefisien korelasi untuk data diskrit. 4. Teknik korelasi point biserial Teknik korelasi point biserial digunakan untuk mencari koefisien korelasi untuk data kontinu dan diskrit. Dalam bab ini hanya akan dibahas mengenai teknik korelasi product moment. Seperti yang telah disebutkan sebelumnya bahwa lambang untuk angka korelasi product moment adalah rxy , yang dapat ditentukan dengan persamaan berikut: r xy
n XY X Y n X 2 X 2 n Y 2 Y 2
………..(3.1)
Keterangan: X Variabel bebas Y Variabel terikat n Jumlah data rxy koefisien korelasi product moment
Koefisien ini dapat diinterpretasi dengan 2 cara, yaitu: 1. Dengan cara kasar menggunakan tabel penentu Jika koefisien yang diperoleh dari Persmaan (3.1) diinterpretasikan dengan menggunakan cara kasar (tabel penentu) maka digunakan Tabel 3.1 berikut:
24
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
Tabel 3.1 Tabel interpretasi koefisien korelasi dengan cara kasar Nilai koefisien
Interpretasi
korelasi
Antara variabel X dan Y terdapat korelasi yang sangat lemah sehingga 0 – 0,2
korelasi tersebut dapat diabaikan (dianggap tidak ada korelasi antara variabel X dan Y)
0,2 – 0,4
Antara variabel X dan Y terdapat korelasi yang lemah
0,4 – 0,7
Antara variabel X dan Y terdapat korelasi yang sedang
0,7 – 0,9
Antara variabel X dan Y terdapat korelasi yang kuat
0,9 – 1
Antara variabel X dan Y terdapat korelasi yang sangat kuat
Interpretasi dari koefisien korelasi dapat diambil dengan menggunakan Tabel 3.1 sesuai dengan nilai yang diperoleh dan disesuaikan dengan interval yang ada di dalam tabel.
2. Dengan menggunakan uji-r Jika interpretasi dilakukan dengan menggunakan uji-r, maka terdapat beberapa langkah yang harus ditempuh, yakni: a). Membuat hipotesa nol H 0 dan hipotesa alternatif ( H a ) H a = Terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y H 0 = Tidak terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
b). Menguji kebenaran hipotesa Dengan menggunakan tabel r product moment dengan menggunakan ketentuan sebagai berikut: df derajat kebebasan n k n jumlah data k banyaknya variabel yang dikorelasi kan
taraf signifikan si 5% atau 1% dimana kriteria ujinya adalah:
Jika rxy rt maka H 0 ditolak dan H a diterima Jika rxy rt maka H 0 diterima dan H a ditolak
25
STATISTIKA DASAR ZUMROTUS SYA’DIYAH,S.Si, M.Si
3. Dengan menggunakan uji-t Seperti pada interpretasi dengan uji-r, dalam interpretasi uji-t juga diperlukan beberapa langkah berikut: a). Membuat hipotesa nol H 0 dan hipotesa alternatif ( H a ) H a = Terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y H 0 = Tidak terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
b). Menguji kebenaran hipotesa Dengan menggunakan tabel t dengan menggunakan ketentuan sebagai berikut: df derajat kebebasan n k n jumlah data k banyaknya variabel yang dikorelasi kan
taraf signifikan si 5% atau 1% Dan t hitung ditentukan dengan persamaan berikut:
t hit
rxy n 2 1 rxy
dimana kriteria ujinya adalah: Jika t hit t t maka H 0 ditolak dan H a diterima Jika t hit t t maka H 0 diterima dan H a ditolak
2
26