Metode Statistika (STK211) Statistika Deskriptif (2)
Dr. Ir. Kusman Sadik Dept. Statistika IPB, 2015 1
Pertanyaan Jika kita punya data mengenai daya hidup dari baterai Laptop merk “XXX”
• Dimana “lokasi” atau “pusat” dari data? ukuran pemusatan (measures of center) • Seberapa besar variasi dari data ukuran penyebaran (measures of variation)
2
Ukuran Pemusatan Data • Modus (Mode): Nilai pengamatan yang paling sering muncul • Median: Pengamatan yang ada di tengahtengah dari data terurut • Quartil: Nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama
• Mean / Rata-rata: merupakan pusat massa (centroid) sehingga simpangan kiri dan simpangan kanan sama besar 3
Modus (Mode) • Merupakan nilai pengamatan yang paling sering muncul • Dalam satu gugus data dapat mengandung lebih dari satu modus
• Dapat digunakan untuk semua jenis data, tapi paling banyak digunakan untuk data kategorik atau data diskret dengan hanya sedikit nilai yang mungkin muncul
Modus 4
Median • Pengamatan yang ditengah-tengah dari data terurut • Nama lain dari percentil ke-50 • Nama lain dari kuartil 2 (Q2) • Digunakan untuk menggambarkan lokasi dari data numerik • Kekar (robust) terhadap adanya pencilan
5
Cara menghitung median contoh Urutkan data terlebih dahulu dari terkecil sampai terbesar Jika jumlah data ganjil, nilai median merupakan nilai di tengah
Data I: 2
8
Data terurut: 1
3
4
2
1
3
Median
4
8
6
Cara menghitung median contoh Urutkan data dari terkecil sampai terbesar Jika jumlah data genap, nilai median merupakan rataan dari dua nilai di tengah Data II: 2 8 3 4 1 8 Data terurut: 1
2
3
4
8
8
Median=(3+4)/2 = 3.5
7
Perhatikan data I dan data III Data I terurut: 1
2
3
4
8
4
100
Median Data III terurut: 1
2
3
Median Median bersifat lebih kekar (robust) terhadap pencilan (data ekstrim) dibandingkan dengan nilai rata-rata. Coba Anda hitung nilai rata-rata untuk kedua data di atas. 8
Kuartil • Nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama • Q0 (dibaca kuartil 0) merupakan nilai minimum dari data • Q1(dibaca kuartil 1) merupakan nilai yang membagi data 25% data di kiri dan 75% data di kanan
• Q2 (dibaca kuartil 2) merupakan median, membagi data menjadi 50% • Q3 (dibaca kuartil 3) merupakan nilai yang membagi data 75% data di kiri dan 25% data di sebelah kanan
• Q4 (dibaca kuartil 4) merupakan nilai maksimum dari data • Nilai Q1, Q2, dan Q3 kekar (robust) terhadap pencilan
9
Cara Memperoleh Kuartil (Quartile) Metode Interpolasi Urutkan data dari kecil ke besar Cari posisi kuartil • nq1=(1/4)(n+1) • nq2=(2/4)(n+1) • nq3=(3/4)(n+1) Nilai kuartil dihitung sebagai berikut: • Xqi=Xa,i + hi (Xb,i-Xa,i) • Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i = pengamatan setelah posisi kuartil ke-i dan • hi adalah nilai pecahan dari posisi kuartil 10
Perhatikan ilustrasi data I • Posisi Q2 = nQ2 = (5+1) / 2 =3 • Posisi Q1 = ¼(5+1) = 1.5 • Posisi Q3 = ¾(5+1) = 4.5
Data terurut: 1
2
3
4
8
Median Q1= 1 + 0.5(2-1) = 1.5
Q3=4+ 0.5(8-4)=6 11
Perhatikan ilustrasi data II • Posisi Q2 = nQ2 = (6+1) / 2 =3.5 • Posisi Q1 = ¼(6+1) = 1.75 • Posisi Q3 = ¾(6+1) = 5.25
Data terurut: 1
2
4
7
8
10
Median = 4 + 0.5(7-4) = 5.5 Q1= 1 + 0.75(2-1) = 1.75 Q3=8+ 0.25(10-8)=8.50 12
Statistik 5 serangkai Q2 Q1
Q3
Q0
Q4
Berdasarkan metode Interpolasi Data I
Data II 3.5
3
1.5
6
1.75
5.5
1
8
1
10
13
Mean (rataan) • Merupakan pusat massa (centroid) • Jika menggambarkan populasi di tuliskan sebagai , huruf yunani “mu” • Jika menggambarkan contoh dituliskan sebagai x , disebut “xbar” • Digunakan untuk tipe data numerik • Tidak bisa digunakan untuk tipe data kategorik dan diskret • Sangat resisten (sensitif) terhadap pencilan
14
Langkah Teknis memperoleh mean • Rata-rata (Mean) N
Populasi:
x i 1
i
N n
Sampel:
x
x i 1
i
n
Data I (merupakan data contoh) : 2 x
8
3
4
1
2 8 3 4 1 3.6 5
Jangan dibulatkan!!!! 15
Perhatikan data I dan data III Data I terurut: 1
2
1 2 3 4 8 x 3.6 5
Data III terurut: 1
3
4
8
Median 2
3
4
100
Median 1 2 3 4 100 x 22 5
16
Kaitan antar bentuk sebaran dengan ukuran pemusatan
skewed to the right (mean > median)
symmetric
Mean = Median = Mode
skewed to the left (mean < median)
Catatan : nilai mean (rata-rata) mengikuti arah ekor, sedangkan modus dan median tetap
17
Ukuran Penyebaran •
Menggambarkan suatu UKURAN KUANTITATIF tingkat penyebaran atau pengelompokan dari data
•
Keragaman biasanya didefinisikan dalam bentuk jarak : •
Seberapa jauh jarak antar titik-titik tersebut satu sama lain
•
Seberapa jauh jarak antara titik-titik tersebut terhadap rataannya
•
Bagaimana tingkat keterwakilan nilai tersebut terhadap kondisi data keseluruhan
18
Wilayah (Range) • Merupakan selisih dari nilai terbesar – nilai terkecil R=Xmax – Xmin • Hanya memperhitungkan nilai terkecil dan terbesar, sedangkan sebaran nilai antara dua nilai tersebut tidak diperhitungkan
• Resisten terhadap nilai yang ekstrim
Data I terurut: 1 2 R = 8-1 = 7 Data III terurut: 1
3 2
4 3
8 4
100
R = 100-1 = 99 19
Jangkauan antar Kuartil (Interquartile Range) • Merupakan selisih antara kuartil 3 dengan kuartil 1, IQR = Q3 - Q1 • Memperhitungkan sebaran antara nilai minimum dan nilai maksimum • Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan)
20
Simpangan/Deviasi • Ukuran penyebaran yang lebih kompleks adalah bagaimana data tersebut mengelompok di sekitar rataannya • Deviasi merupakan selisih dari data terhadap rataannya.
• Ukuran keragaman dari deviasi adalah rataan deviasi = (x - ) / n Contoh Data • (x - ) / n 0
Data
Rataan
Deviasi 1
-2.6
2
-1.6
3
-0.6
4
0.4
8
4.4
3.6
0.000000000000000178
21
Ragam Data 1 Data
Rataan
(X-)
(X-)2
1
-2.6
6.76
2
-1.6
2.56
3
-0.6
0.36
4
0.4
0.16
8
4.4
19.36
3.6
• Untuk menghilangan +/- maka deviasi dikuadratkan terlebih dahulu sebelum dirataratakan. • Ukuran semacam ini disebut ragam = (x - )2 / n • (x - )2 merupakan jumlah kuadrat dari deviasi disekitar rataannya
22
Menghitung Ragam • Ragam (Variance) N
2
Populasi
x
2
i 1
i
N n
s2
Contoh
2 x x i i 1
n 1
(n-1) disebut derajat bebas = db
Untuk menghitung ragam contoh maka perlu dihitung rataan contoh, maka data terakhir tergantung dari datadata sebelumnya. Hanya 1 yang tidak bebas, sedangkan n-1 data lainnya bebas variasinya n
Data 1
s 2
2 x x i i 1
n 1
29.2 7.3 4
23
Simpangan baku (standard deviation) Ragam merupakan ukuran jarak kuadrat, sehingga untuk mendapatkan jarak yang sebenarnya adalah dengan mengakarkan ragam simpangan baku simpangan baku populasi dan s simpangan baku sampel
24
Notasi Penulisan
Lihat : Mendenhall (Example 2.5), hal. 63 25
Ilustrasi tentang derajat bebas (db) Banu mengajak Anda main tebak-tebakan. Banu mempunyai tiga kaleng. Salah satu dari kaleng tersebut berisi bola. Yang manakah yang berisi bola? Jika bola tersebut dianggap sebagai rataan sampel maka ada sebanyak 3-1 = 2 kaleng yang ditebak bebas db = n-1 Jika kaleng I dan II Anda angkat namun tidak terdapat bola maka sudah pasti kaleng ke-3 yang berisi bola 26
Latihan :
a. 3 9 7 4 10 3 b. 4 9 3 8 6 Tentukan nilai : Mean, Median, Q1, Q3, Ragam, Simpangan Baku, Range, dan IQR untuk kedua gugus data di atas
27
Demo MINITAB
28
Ilustrasi Data No
Sex
Tinggi
Berat
Agama
1
1
167
63
Islam
2
1
172
74
Islam
3
0
161
53
Kristen
4
0
157
47
Hindu
5
1
165
58
Islam
6
0
167
60
Islam
7
1
162
52
Budha
8
0
151
45
Katholik
9
0
158
54
Kristen
10
1
162
63
Islam
11
1
176
82
Islam
12
1
167
69
Islam
13
0
163
57
Kristen
14
0
158
60
Islam
15
1
164
58
Katholik
16
0
161
50
Islam
17
1
159
61
Kristen
18
1
163
65
Islam
19
1
165
62
Islam
20
0
169
59
Islam
21
1
173
70
Islam 29
Data pada ilustrasi tersebut diolah menggunakan MINITAB
Descriptive Statistics: Tinggi, Berat Variable Tinggi Berat
N 21 21
Mean 163.81 60.10
Variable Tinggi Berat
Range 25.00 37.00
StDev 5.85 8.86
Variance 34.26 78.49
Minimum 151.00 45.00
Q1 160.00 53.50
Median 163.00 60.00
Q3 167.00 64.00
Maximum 176.00 82.00
IQR 7.00 10.50
30
Diagram Kotak Garis (boxplot)
31
Informasi yang diperoleh dari diagram kotak garis Melihat ukuran penyebaran dan ukuran pemusatan data Melihat adanya data pencilan Sebagai alat pembandingan sebaran dua kelompok data atau lebih
32
Penyajian Dengan Box-plot(1) Boxplot of data 1
Q1
Q2
Q3
Min
Max
Interquartli Range
40
45
50 data 1
55
60 33
Cara Membuat Box-plot • Hitung Statistik lima serangkai : Nilai terkecil, Q1, Median, Q3, Nilai terbesar • Hitung Pagar Dalam Atas (PAD) / Upper Fence : Q3 +1.5(Q3-Q1) • Hitung Pagar Dalam Bawah (PBD) / Lower Fence: Q1-1.5(Q3-Q1) • Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan outlier • Gambar kotak dengan batas Q1 dan Q3 • Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan •
tarik garis dari Q3 sampai data terbesar
• Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum pencilan • Pencilan digambarkan dengan asterik
34
Cara Membuat Box-plot (Mendenhall)
35
Cara membuat Box-plot dan interpretasinya • Lihat : Mendenhall (Example 2.14), hal. 81
36
Ilustrasi (1) • Statistik 5 serangkai dari data sbb: Me
48
Q1
Q3
43
55
Min
Max 40
59
• PDA = 55 + 1.5 (55 – 43) = 73 • PDB = 43 – 1.5 (55 - 43) = 25 • Tidak ada pencilan (mengapa?)
37
Boxplot of data 1
40
45
50 data 1
55
60
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan
Tidak ada pencilan 38
Ilustrasi (4)
Stem-and-leaf of data 1 N = 23 Leaf Unit = 1.0
9 (5) 9 7 1 1 1 1 1
4 4 5 5 6 6 7 7 8
002233344 68899 02 556788
Me
48
Q1
Q3
43
55
Min
Max
40
80
PDA = 55 + 1.5 (55 – 43) = 73 PDB = 43 – 1.5 (55 - 43) = 25 Pencilan : 80
0 39
Boxplot of data 1
40
50
60 data 1
70
80
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan
Terdpat nilai pencilan (80) 40
Contoh data:
Jawa Barat No. Kota/Kab 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Pandenglang Lebak Bogor Sukabumi Cianjur Bandung Garut Tasikmalaya Ciamis Kuningan Cirebon Majalengka Sumedang Indramayu Subang Purwakarta Karawang Bekasi Tangerang Serang Kota Bogor Kota Sukabumi Kota Bandung Kota Cirebon Rata-Rata: Jabar Jateng Minimum : Jabar Jateng Maksimum: Jabar Jateng
Jawa Tengah
Pert. Pend. 2.15 2.48 4.52 2.51 2.33 3.31 2.35 2.15 1.21 1.97 2.73 2.01 1.41 2.53 1.89 2.32 2.31 3.57 4.04 2.85 2.60 1.48 2.20 2.51
2.48 1.68 1.00 1.00 23.00 34.00
No. Kota/Kab 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
Cilacap Banyumas Prubalingga Banjarnegara Kebumen Purworejo Wonosobo Magelang Boyolali Klaten Sukoharjo Wonogiri Karanganyar Sragen Grobogan Blora Rembang Pati Kudus Jepara Demak Semarang Temanggung Kendal Batang Pekalongan Pemalang Tegal Brebes Kota Magelang Kota Surakarta Kota Slatiga Kota Semarang Kota Pekalongan Kota Tegal
Pert. Pend. 1.28 1.78 1.42 1.49 1.09 0.62 1.64 1.31 1.08 1.19 2.10 0.51 2.07 1.85 1.52 1.27 2.08 1.62 2.03 1.87 1.38 0.46 1.83 0.83 1.70 1.80 1.79 2.67 2.09 1.25 1.39 2.30 5.21 1.95 41 2.44
Boxplot of pertumbuhan pendd vs prop Kota Semarang
5
pertumbuhan pendd
Bogor
4
Tangerang
3
2
1
0 Jawa Barat
Jawa Tengah prop
Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi dibandingkan dengan pertumbuhan penduduk di Jawa Tengah. Secara umum, tingkat keragaman pertumbuhan penduduk antar kabupaten, di Jawa Tengah sedikit lebih besar dibanding dengan Jawa Barat. Kab Bogor dan Tangerang merupakan daerah yang tingkat pertumbuhan pendudukya cukup tinggi. Di Jawa Tengah Kota Semarang yang pertumbuhan penduduknya paling tinggi. 42
PR/Tugas (1) Dikumpulkan di Dept Statistika, pada hari Selasa minggu depan sebelum jam 10.00 Perhatian : m adalah dua digit terakhir dari NIM Anda
1. Mendenhall (Exercise 2.42), hal. 84 terlebih dahulu setiap data pada soal tersebut ditambah dengan 0.m 2. Mendenhall (Exercise 2.45), hal. 84 terlebih dahulu setiap data pada soal tersebut ditambah dengan 0.m 3. Mendenhall (Exercise 2.47), hal. 84 terlebih dahulu setiap data pada soal tersebut ditambah dengan 0.m 43
Terima Kasih
Materi ini bisa di-download di: kusmans.staff.ipb.ac.id 44