Metode Statistika STK211/ 3(2-3) Pertemuan III Statistika Deskripsi dan Eksplorasi (2)
Septian Rahardiantoro - STK IPB
1
Misalkan diketahui data sebagai berikut Data 1
No
Jenis Kelamin
Tinggi
Berat
Agama
1
1
167
57
Islam
2
1
172
50
Islam
3
0
161
56
Kristen
4
0
157
44
Hindu
5
1
165
43
Islam
6
0
167
52
Islam
7
1
162
55
Budha
8
0
151
49
Katholik
9
0
158
43
Kristen
10
1
162
43
Islam
11
1
176
49
Islam
12
1
167
55
Islam
13
0
163
58
Kristen
14
0
158
48
Islam
15
1
164
46
Katholik
16
0
161
42
Islam
17
1
159
44
Kristen
18
1
163
48
Islam
19
1
165
40
Islam
20
0
169
40
21
1
173
Dapat disajikan dalam tabel berikut Peubah JK N Mean Tinggi
Berat
Sd
Min
Med
Max
P
9
160.6 5.43
151
161
169
L
12 166.3 5.07
159
165
176
P
9
48. 0 6.34
40
48
58
L
12 47. 7 5.66
40
47
57
Lalu bagaimana menghitung ringkasan statistik tersebut?
Islam - STK IPB Islam 42 Septian Rahardiantoro
2
Statistika Deskripsi dan Eksplorasi Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Tabel Teknik Penyajian Grafik Ukuran Pemusatan Peringkasan Data Ukuran Penyebaran
Septian Rahardiantoro - STK IPB
3
Peringkasan Data • Ukuran Pemusatan Suatu gambaran / informasi yang memberikan penjelasan bahwa data memiliki satu / lebih titik dimana dia memusat / terkumpul
• Jenis ukuran pemusatan 1. 2. 3. 4.
Modus Median Kuartil Mean (Rataan, Rata-rata)
Septian Rahardiantoro - STK IPB
4
Modus Nilai data yang paling sering terjadi (frekuensi paling tinggi) • Dalam satu gugus data dapat mengandung lebih dari satu modus • Dapat digunakan untuk semua jenis data, tapi paling banyak digunakan untuk data kategorik atau data diskret dengan hanya sedikit nilai yang mungkin muncul
Modus
Septian Rahardiantoro - STK IPB
5
Median Nilai data yang membagi dua sama banyak kumpulan yang diurutkan • Nama lain : percentil ke-50, kuartil 2 (Q2) • Digunakan untuk menggambarkan lokasi dari data numerik • Kekar terhadap adanya pencilan
Langkah menghitung median 1. 2.
Urutkan data dari kecil ke besar Nilai median • Jika banyak data ganjil, maka Median=X(n+1)/2 • Jika banyak data genap, maka Median=(X(n)/2+ X[(n)/2]+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median) Septian Rahardiantoro - STK IPB
6
Ilustrasi Data II:
2 8 3 4 1 8
Data terurut:
1 2 3 4 8 8 Median=(3+4)/2 = 3.5
Data III:
2 3 4 1 8
Data terurut:
1 2 3 4 8 Median= 3
Data IV:
2 3 4 1 100
Data terurut:
1 2 3 4 100 Median= 3 Septian Rahardiantoro - STK IPB
7
Kuartil Nilai-nilai yang menyekat gugus data menjadi 4 kelompok data yang masing-masing terdiri dari 25% muatan • Terdiri dari Q1, Q2, Q3 • Q1(dibaca kuartil 1) merupakan nilai yang membagi data 25% data di kiri dan 75% data di kanan • Q2 (dibaca kuartil 2) merupakan median, membagi data menjadi 50% • Q3 (dibaca kuartil 3) merupakan nilai yang membagi data 75% data di kiri dan 25% data di sebelah kanan
Q1
Q2 Septian Rahardiantoro - STK IPB
Q3 8
Langkah Teknis memperoleh Kuartil (Quartile) Metode Belah dua
• Urutkan data dari kecil ke besar • Cari posisi kuartil nQ2=(n+1)/2 nQ1=(nQ2*+1)/2= nQ3, nQ2 * posisi kuartil dua terpangkas (pecahan dibuang) • Nilai kuartil 2 ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
Data II:
2 8 3 4 1 8
Data terurut: 1 2 3 4 8 8 Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
1
2
3
4
8
8
Q2
Q1 Septian Rahardiantoro - STK IPB
Q3 9
Langkah Teknis memperoleh Kuartil (Quartile) Metode Interpolasi
• Urutkan data dari kecil ke besar • Cari posisi kuartil ke-i
nQi= i(n+1)/4 = a,b Qi = Xa + 0,b (Xa+1- Xa)
Data II: Data terurut:
2 8 3 4 1 8 1 2 3 4 8 8
Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = ¼(6+1) = 1.75 Posisi Q3 = ¾(6+1) = 5.25
1
2
3 4 8 Median
Q1= 1 + 0.75(2-1) = 1.75 Septian Rahardiantoro - STK IPB
8
Q3=8+ 0.25(8-8)=8 10
Statistik 5 Serangkai Q2 Q1
Q3
Q0
Q4
Q0 = nilai minimum data Q1 = nilai maksimum data Berdasarkan metode Interpolasi Data I
Data II 3.5
3 1.5
6
1.75
6
1
8
1
8
Septian Rahardiantoro - STK IPB
11
Mean (Rata-rata) Merupakan pusat massa (centroid) • Digunakan untuk tipe data numerik • Tidak bisa digunakan untuk tipe data kategorik dan diskret • Sangat resisten terhadap pencilan
Rata-rata populasi 𝜇=
Rata-rata contoh
𝑁 𝑖=1 𝑥𝑖
𝑥=
𝑁
parameter
𝑛 𝑖=1 𝑥𝑖
𝑛
statistik
Data III (merupakan data contoh): 2 8 3 4 1 2 8 3 4 1 x 3.6 5
Jangan dibulatkan!!!!
Septian Rahardiantoro - STK IPB
12
Perhatikan Data III:
2 3 4 1 8
Data terurut:
1 2 3 4 8
x
1 2 3 4 8 3.6 5
x
1 2 3 4 100 22 5
Median= 3 Data IV:
2 3 4 1 100
Data terurut:
1 2 3 4 100 Median= 3
Rata-rata tidak kekar terhadap pencilan Septian Rahardiantoro - STK IPB
13
Kaitan antar bentuk sebaran dengan ukuran pemusatan Simetri
Mean = Median = Modus
Miring ke kanan
Modus < Median < Mean
Miring ke kiri
Septian Rahardiantoro - STK IPB
Mean < Median < Modus
14
Peringkasan Data • Ukuran Penyebaran Gambaran seberapa besar data menyebar dalam kumpulannya
• Jenis ukuran penyebaran – – – –
Wilayah (range) Jangkauan Antar Kuartil (interquartile range) Ragam (variance) Simpangan Baku (standard deviation)
Septian Rahardiantoro - STK IPB
15
Wilayah (range) Selisih pengamatan terbesar dengan pengamatan terkecil 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 • Hanya memperhitungkan nilai terkecil dan terbesar, sedangkan sebaran nilai antara dua nilai tersebut tidak diperhitungkan • Resisten terhadap nilai yang ekstrim
Data III terurut:
1 2 3 4 8
Data IV terurut:
1 2 3 4 100
Septian Rahardiantoro - STK IPB
R = 8-1 = 7 R = 100-1 = 99
16
Jangkauan Antar Kuartil (interquartile range)
Selisih antara kuartil 3 dengan kuartil 1 𝐽𝐴𝐾 = 𝑄3 − 𝑄1 • Memperhitungkan sebaran antara nilai minimum dan nilai maksimum • Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan) Statistik 5 serangkai dari data III (metode belah dua)
Statistik 5 serangkai dari data IV (metode belah dua)
3
3
2
4
2
4
1
8
1
100
JAK = 4-2 = 2
JAK = 4-2 = 2 Septian Rahardiantoro - STK IPB
17
Ragam (variance) Jumlah kuadrat selisih antara pengamatan dengan pusatnya (rata-rata) Data III Data
Rataan
(X-)2
(X-) 1
-2.6
6.76
2
-1.6
2.56
3
-0.6
0.36
4
0.4
0.16
8
4.4
19.36
3.6
0
5.84
Deviasi : selisih dari data terhadap rataannya Ragam : jumlah kuadrat dari deviasi disekitar rataannya
Septian Rahardiantoro - STK IPB
18
Ragam populasi 𝜎2 =
𝑁 𝑖=1
𝑥𝑖 − 𝜇 𝑁
Ragam contoh 2
𝑛 𝑖=1
𝑥𝑖 − 𝑥 𝑛−1
𝑠2 =
parameter
2
statistik
Derajat bebas = db Untuk menghitung ragam contoh maka perlu dihitung rataan contoh, maka data terakhir tergantung dari datadata sebelumnya. Hanya 1 yang tidak bebas, sedangkan n-1 data lainnya bebas variasinya
N
Data III
2
x i 1
n
2
i
N
29.2 5.84 5
Septian Rahardiantoro - STK IPB
s2
x x i 1
2
i
n 1
29.2 7.3 4
19
Simpangan Baku (standard deviation)
Akar kuadrat dari ragam Ragam merupakan ukuran jarak kuadrat, sehingga untuk mendapatkan jarak yang sebenarnya adalah dengan mengakarkan ragam simpangan baku
Ragam populasi 𝜎2 =
𝑁 𝑖=1
𝑥𝑖 − 𝜇 𝑁
Ragam contoh 2
𝑠2 =
parameter
𝜎2 =
𝑥𝑖 − 𝑥 𝑛−1
2
statistik
Simpangan baku populasi 𝜎=
𝑛 𝑖=1
𝑁 𝑖=1
𝑥𝑖 − 𝜇 𝑁
2
Simpangan baku contoh 𝑠=
Septian Rahardiantoro - STK IPB
𝑠2 =
𝑛 𝑖=1
𝑥𝑖 − 𝑥 𝑛−1
2
20
Penyajian data: Boxplot • Boxplot / Diagram kotak garis, untuk – Melihat ukuran penyebaran dan ukuran pemusatan data – Melihat adanya data pencilan – Sebagai alat pembandingan sebaran dua kelompok data atau lebih
Ilustrasi
Septian Rahardiantoro - STK IPB
21
Langkah pembuatan boxplot • • • • • • • • •
Hitung Statistik lima serangkai Hitung Pagar Dalam Atas (PAD) : Q3 +1.5(Q3-Q1) Hitung Pagar Dalam Bawah (PBD): Q1-1.5(Q3-Q1) Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan outlier Gambar kotak dengan batas Q1 dan Q3 Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan tarik garis dari Q3 sampai data terbesar Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum pencilan Pencilan digambarkan dengan asterik
Septian Rahardiantoro - STK IPB
22
Contoh 1 Misalkan diketahui statistik 5 serangkai dari data sbb: Q2 = 48 Q1 = 43
Q3 = 55
Min = 40
Max = 59
• PDA = 55 + 1.5 (55 – 43) = 73 • PDB = 43 – 1.5 (55 - 43) = 25 • Tidak ada pencilan
Boxplot of data 1
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan Tidak ada pencilan
40
45
Septian Rahardiantoro - STK IPB
50 data 1
55
60
23
Contoh 2 Stem-and-leaf of data 1 N = 23 Leaf Unit = 1.0 9 (5) 9 7 1 1 1 1 1
4 4 5 5 6 6 7 7 8
002233344 68899 02 556788
Q2 = 48 Q1 = 43
Q3 = 55
Min = 40
Max = 80
PDA = 55 + 1.5 (55 – 43) = 73 PDB = 43 – 1.5 (55 - 43) = 25 Pencilan : 80 Boxplot of data 1
0
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan Terdpat nilai pencilan (80)
40
50
Septian Rahardiantoro - STK IPB
60 data 1
70
80
24
Jawa Barat
Contoh 3
No. Kota/Kab 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Pandenglang Lebak Bogor Sukabumi Cianjur Bandung Garut Tasikmalaya Ciamis Kuningan Cirebon Majalengka Sumedang Indramayu Subang Purwakarta Karawang Bekasi Tangerang Serang Kota Bogor Kota Sukabumi Kota Bandung Kota Cirebon
Jawa Tengah
Pert. Pend. 2.15 2.48 4.52 2.51 2.33 3.31 2.35 2.15 1.21 1.97 2.73 2.01 1.41 2.53 1.89 2.32 2.31 3.57 4.04 2.85 2.60 1.48 2.20 2.51
No. Kota/Kab
1 Cilacap 2 Banyumas 3 Prubalingga 4 Banjarnegara 5 Kebumen 6 Purworejo 7 Wonosobo 8 Magelang 9 Boyolali 10 Klaten 11 Sukoharjo 12 Wonogiri 13 Karanganyar 14 Sragen 15 Grobogan 16 Blora 17 Rembang 18 Pati 19 Kudus 20 Jepara 21 Demak 22 Semarang 23 Temanggung 24 Kendal 25 Batang Rata-Rata: 26 Pekalongan Jabar 2.48 27 Pemalang Jateng 1.68 28 Tegal Minimum : 29 Brebes Jabar 1.00 30 Kota Magelang Jateng 1.00 31 Kota Surakarta Maksimum: 32 Kota Slatiga Jabar 23.00 33 Kota Semarang Jateng 34.00 34 Kota Pekalongan Septian Rahardiantoro - STK IPB 35 Kota Tegal
Pert. Pend. 1.28 1.78 1.42 1.49 1.09 0.62 1.64 1.31 1.08 1.19 2.10 0.51 2.07 1.85 1.52 1.27 2.08 1.62 2.03 1.87 1.38 0.46 1.83 0.83 1.70 1.80 1.79 2.67 2.09 1.25 1.39 2.30 5.21 1.95 2.44
25
Boxplot of pertumbuhan pendd vs prop Kota Semarang
5
pertumbuhan pendd
Bogor
4
Tangerang
3
2
1
0 Jawa Barat
Jawa Tengah prop
Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi dibandingkan dengan pertumbuhan penduduk di Jawa Tengah. Secara umum, tingkat keragaman pertumbuhan penduduk antar kabupaten, di Jawa Tengah sedikit lebih besar dibanding dengan Jawa Barat. Kab Bogor dan Tangerang merupakan daerah yang tingkat pertumbuhan pendudukya cukup tinggi. Di Jawa Tengah Kota Semarang yang pertumbuhan penduduknya paling tinggi.
Septian Rahardiantoro - STK IPB
26
Thank you, see you next week
Septian Rahardiantoro - STK IPB
27