STATISTIKA DASAR Oleh Suryo Guritno
• cara penyajian data - tabel - grafik • menghitung harga-harga penting : - ukuran lokasi - ukuran sebaran/penyimpangan • apabila data mempunyai observasinya cukup banyak perlu disusun secara sistematik Susunan data secara sistematik disebut distribusi atau deretan (runtun)
data disusun menurut :
hasilnya disebut :
a. besarnya (kuantitasnya)
a. distribusi frek. kuanti.
b. kategorinya (kualitasnya)
b. distribusi frek. kualit.
c. waktu (terjadinya)
c. runtun waktu (time series)
d. letak geografisnya
d. distribusi spasial
Penyusunan distribusi frekuensi kuantitatif - data dibagi menjadi kelompok yang biasa disebut kelas interval - banyaknya kelompok dipilih antara 5 dan 15 - syarat : antara satu kelompok dengan kelompok yang lain tidak saling overlap artinya : satu observasi hanya menjadi anggota satu kelompok saja
HARGA-HARGA TENGAH Suatu harga yang dapat menggambarkan distribusi khusunya ukuran letak (lokasi) a) rata-rata (= mean) b) median c) modus d) geometrik mean e) Harmonic mean
UKURAN LETAK a) Median b) Kuartil c) Desil d) Persentil e) Kuantil
67
44
35
48
22
51
52
56
61
47
37
61
72
48
44
41
66
26
42
44
51
62
49
73
21
69
52
72
69
33
55
56
77
85
42
71
47
27
82
25
54
64
66
34
57
72
59
57
54
47
63
54
58
55
37
59
73
52
75
56
37
20
49
108
61
47
34
51
67
28
66
87
59
42
33
93
99
68
51
78
78
37
97
97
Distribusi Frekuensi Penghasilan 84 keluarga di ABC Penghasilan (dalam ribuan rupiah)
Banyak keluarga
20,0 – 29,9 30,0 – 39,9 40,0 – 49,9
7 9 16 21 14 9 4 3 1
50,0 – 59,9 60,0 – 69,9 70,0 – 79,9 80,0 – 89,9 90,0 – 99,9 100,0 – 109,9
84
Distribusi Frekuensi Penghasilan 84 keluarga di ABC Penghasilan (dalam ribuan rupiah)
Banyak keluarga
19,5 – 29,5 29,5 – 39,5 39,5 – 49,5
7 9 16 21 14 9 4 3 1
49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5 99,5 – 109,5
84
3
8
4
.
.
.
5
6
4
8
5
3
.
.
.
3
5
6
5
8
7
.
.
.
6
8
7
9
5
4
.
.
.
5
7
6
6
5
6
.
.
.
6
3
5
Nilai Ujian Statistik 2 3 4 5 6 7 8 9
Banyaknya Mahasiswa 1 6 11 16 18 9 7 2 10
K K G S
171531
.
.
.
D D
D Ks Ks D .
.
.
B S
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B B
D Ks G K G K S
Distribusi Frekuensi Kualitatif Jenis Plombir Kendaraan Kereta Gerobag Sepeda Becak Dwico Keseran
Banyak Terjual 1585 873 161206 3456 4057 354 171531
a) Mean : Jumlah data dibagi banyak data
n angka, X1 , X 2 ,..., X n X1 + X 2 + ... + X n X= n n 1 = Xi n i =1
∑
notasi untuk mean sampel
μ atau μ x notasi untuk mean populasi
Contoh : Ada 5 macam beras harganya per kilogram Rp. 340, Rp. 525, Rp. 450, Rp. 210, Rp. 275 => Mean harga beras per kilogram
340 + 525 + 450 + 210 + 275 X= 5 = 360 Suatu sifat mean yang baik : Dapat digunakan untuk menghitung mean kelompok gabungan, jika mean masing-masing kelompok diketahui.
n
f2 , X2
f1 , X1
f 3 , X3 f4 , X4
f 6 , X6
f 5 , X5
f1X1 + f 2 X 2 + ... + f 6 X 6 X= f1 + f 2 + ...f 6 6
∑f X i
=
i =1 6
∑
fi
i =1
6
i
∑f X i
=
=> n
i =1
n
i
Seharusnya mudah dimengerti, sebab f1 , X1 = jumlah data dalam kelompok 1 f 2 , X 2 = jumlah data dalam kelompok 2 . . .
dst ⇒ f1 , X1 + f 2 , X 2 + ... + f 6 , X 6 = jumlah data dalam kelompok gabungan
Penghasilan 19,5 – 29,5 29,5 – 39,5 39,5 – 49,5 49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5 99,5 – 109,5 JUMLAH
fi 7 9 16 21 14 9 4 3 1 84
xi 24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5 104,5
fi = frekuensi interval ke-i xi = titik tengah interval ke-i
fixi 171,5 310,5 712,5 1144,5 903,5 670,5 338,0 283,5 104,5 4638,0
fixi2
9
∑f x i
X=
i =1 9
∑f
i
4638,0 = 84
i
i =1
= 55,21 ribu rupiah kalau dihitung dari data asli (= raw data = data kasar)
67 + 52 + 72 + ... + 42 + 51 X= 84
= 55,21 ribu rupiah
b) Median : angka yang letaknya ditengah setelah data diurutkan contoh : - banyaknya data ganjil : 270, 210, 450, 340, 525 urutkan 210, 270, 340, 450, 525 median
- banyaknya data genap : 210, 275, 340, 450, 485, 525 median =
340 + 450 = 395 2
Median untuk distribusi frekuensi dapat dicari dengan 2 cara - menggunakan gambar (histogram)
- cara interpolasi - menggunakan histogram :
a = jarak antara 49,5 ke median =
luas daerah diarsir 100 = = 4,76 frekuensi int. median 21
=> median = 49,5 + 4,76 = 54,26
- menggunakan cara interpolasi : rumus : Median = L md
n −F + 2 .c f md
- Lmd = batas bawah interval median - n = banyaknya data -F
= nomor urut data tertinggi sebelum interval median
(= jumlah frekuensi interval – interval sebelum interval median - fmd = frekuensi interval median - c = lebar interval median
interval median adalah interval yang memuat median untuk contoh 1, hal 8, modul 2 interval median adalah 49,5 – 59,5 => Lmd = 49,5 =>
n = 84
=>
F = 7+9+16 = 32
=> fmd = 21 => c = 10
84 − 32 => Median = 49,5 + 2 .10 21 = 49,5 +
100 = 54,26 21
c) Modus : anggota data yang paling sering muncul (mempunyai frekuensi tertinggi - data boleh kualitatif contoh * 4, 8, 5, 6, 8, 7, 6, 7, 9, 7, 6, 7,5
=> modus = 7 * 63, 65, 65, 65, 70, 72, 74, 79, 79, 79, 82, 82, 85
=> modus = 65 dan 79
Untuk distribusi frekuensi Modus = L mo +
a .c a+b
- Lmo = batas bawah interval modus - a = beda antara interval modus dengan interval sebelumnya - b = beda antara interval modus dengan interval sesudahnya - c = lebar interval modul Interval modus adalah interval dengan frekuensi tertinggi
interval modus adalah 49,5 – 59,5 => Lmo = 49,5 a = 21 – 16 = 5 b = 21 – 14 = 7 c = 10
5 − 32 .10 5+7 50 = 49,5 + = 52,67 12
=> Modus = 49,5 +
Catatan : interval modus dan interval median tidak harus sama
UKURAN LOKASI Setelah data diurutkan a) Median : membagi data menjadi dua bagian yang sama b) Kuartil : membagi data menjadi empat bagian yang sama c) Desil : membagi data menjadi sepuluh bagian yang sama d) Persentil : membagi data menjadi seratus bagian yang sama e) Kuantil/N-til : membagi data menjadi n bagian yang sama
=> Suatu data akan mempunyai • 1 Median • 3 Kuartil • 9 Desil • 99 Persentil • (n-1) Kuantil/N-til Menghitung Kuartil, Desil, Persentil atau Kuantil suatu distribusi frekuensi sesuai dengan cara menghitung median
i.n −F rumus : Kuantil = L ki + N .c f ki ke-i - i = 1, 2, …, (N-1) - N = banyaknya kelompok
jika akan dihitung kuartil
(Q1, Q2, Q3) dicari dulu interval yang memuat masing-masing Kuartil untuk Q1 adalah interval yang memuat observasi bernomor
1.n 84 = = 21 4 4
untuk Q3 adalah interval yang memuat observasi bernomor
3.n 3.84 = = 63 4 4
=> Interval yang memuat Q1 adalah : 39,5 – 49,5 sehingga
21 − 16 Q1 = 39,5 + .10 16 = 39,5 + 3,13 = 42,63
HARGA-HARGA DEVIASI Adalah ukuran yang menunjukkan sebaran/penyimpangan tiap observasi data terhadap suatu harga tengah a) Rentang/Range b) Deviasi rata-rata c) Variansi dan Deviasi Standar d) Deviasi kuartil a) Rentang/Range beda antara maksimum data dengan minimum data
R = max. – min. Contoh : * 60, 60, 61, 63, 65, 65, 66, 67, 68, 90 => R = 90 – 60 = 30 * 60, 65, 70, 72, 75, 78, 80, 85, 88, 90 => R = 90 – 60 = 30
b) Deviasi rata-rata : adalah harga rata-rata sebaran tiap observasi data terhadap meannya
n data ; x1 , x 2 ,..., x n 1 mean : X = n 1 d.r. = n
n
∑X
i
i =1
n
∑X
i
−X
i =1
Contoh 340, 525, 450, 210, 275 1 X = (340 + 525 + 450 + 210 + 275) 5 = 360
(X i − X)
Xi − X
210
-150
150
275
-85
85
340
-20
20
450
90
90
525
165
165
0
510
Xi
510 => d.r = = 102 5
Penghasilan
fi
Xi
|Xi –X|
fi |Xi –X|
19,5 – 29,5
7
24,5
30,71
214,97
29,5 – 39,5
9
34,5
20,71
186,39
39,5 – 49,5
16
44,5
10,71
171,36
49,5 – 59,5
21
54,5
0,71
14,91
59,5 – 69,5
14
64,5
9,29
130,06
69,5 – 79,5
9
74,5
19,29
173,61
79,5 – 89,5
4
84,5
29,29
117,16
89,5 – 99,5
3
94,5
39,29
117,87
99,5 – 109,5
1
104,5
49,29
49,29
JUMLAh
84
1175,62
fi = frekuensi interval ke-i Xi = titik tengah interval ke-i
9
∑f X i
X=
i =1 9
∑f i =1
i
i
=
4638,0 = 55,21 84
c) Variansi dan standar Deviasi n angka, X1, X2, … , Xn 2 2 2 ( ) ( ) ( ) X − X + X − X + ... + X − X 2 n S2 = 1
n −1
n
=
2 ( ) X − X ∑ i i =1
n −1
notasi untuk variansi sampel n
σ 2 atau σ 2x =
2 ( ) X − μ ∑ i x i =1
N
notasi untuk variansi populasi
Standar deviasi = akar positif variansi Notasi :
s
dan
untuk sampel
σ
untuk populasi
Contoh : 210, 340, 525, 450, 275 1 X = (340 + 525 + 450 + 210 + 275) 5 = 360
(X i − X)
(X i − X) 2
210
-150
22500
275
-85
7225
340
-20
400
450
90
8100
525
165
37225
0
65450
Xi
=> Variansi : s 2 =
65450 = 16362,5 4
deviasi standar : s = 16362,5 = 127,916
untuk distribusi frekuensi
1 2 s = n
k
∑f ( X i
i
i =1
− X)
2
k
∑f X i
X=
i =1
n
i
n=
,
k
∑f i =1
n f i X i − f i X i i =1 s 2 = i =1 n (n - 1) k
∑
2
k
∑
fi = frekuensi interval ke-i Xi = titik tengah interval ke-i
2
i
2 84 x 283441,00 (4638,0) => s 2 = 83 x 84
= 329,6041 => s = 329,6041 = 18,155
d) Deviasi kuartil :
Q 3 − Q1 d.k. = 2 d.k. = deviasi kuartil Q1 = kuartil 1 Q3 = kuartil 3 Contoh :
66,64 − 42,625 d.k. = = 12,0075 2 karena Q1 = 42,625 Q2 = 66,64