Pertemuan III
Statistika Dasar (Basic Statistics)
Jika
punya data mengenai daya
hidup dari baterai HP merk “XXX” Dimana “lokasi” atau “pusat” dari data? ukuran pemusatan Seberapa besar variasi dari data ukuran penyebaran
Modus (Mode): Nilai pengamatan yang paling
Median: Pengamatan yang ditengah-tengah dari
Quartil: Nilai-nilai yang membagi data terurut
Mean: merupakan pusat massa (centroid) sehingga
sering muncul data terurut
menjadi 4 bagian yang sama
simpangan kiri dan simpangan kanan sama besar
Merupakan nilai pengamatan yang paling sering muncul
Dalam satu gugus data dapat mengandung lebih dari satu
modus
Dapat digunakan untuk semua jenis data, tapi paling banyak
digunakan untuk data kategorik atau data diskret dengan hanya sedikit nilai yang mungkin muncul
Modus
Pengamatan yang ditengah-tengah dari data terurut Nama lain dari percentil ke-50 Nama lain dari kuartil 2 (Q2)
Digunakan untuk menggambarkan lokasi dari data numerik Kekar terhadap adanya pencilan
Urutkan data dari terkecil sampai terbesar
Jika jumlah data ganjil, nilai median merupakan nilai di tengah
Data I: 2
8
Data terurut: 1
3
2
4
3
1
Median
4
8
Urutkan data dari terkecil sampai terbesar
Jika jumlah data genap, nilai median merupakan rataan dari dua nilai di tengah
Data II: 2 8 3 4 1 8 Data terurut: 1
2
3
4
8
8
Median=(3+4)/2 = 3.5
Data I terurut: 1
2
3
4
8
4
100
Median Data III terurut: 1
2
3
Median
Urutkan data dari kecil ke besar
Cari posisi median (nmed=(n+1)/2) Nilai median
Jika nmed bulat, maka Median=X(n+1)/2
Jika nmed pecahan, maka Median=(X(n)/2+
X(n)/2+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median)
Nilai-nilai yang membagi data terurut menjadi 4 bagian yang
sama
Q0 (dibaca kuartil 0) merupakan nilai minimum dari data
Q1(dibaca kuartil 1) merupakan nilai yang membagi data 25%
data di kiri dan 75% data di kanan
Q2 (dibaca kuartil 2) merupakan median, membagi data
menjadi 50%
Q3 (dibaca kuartil 3) merupakan nilai yang membagi data 75%
data di kiri dan 25% data di sebelah kanan
Q4 (dibaca kuartil 4) merupakan nilai maksimum dari data Nilai Q1, Q2, dan Q3 kekar terhadap pencilan
Metode Belah dua
Urutkan data dari kecil ke besar Cari posisi kuartil nQ2=(n+1)/2
nQ1=(nQ2*+1)/2= nQ3, nQ2* posisi kuartil dua terpangkas (pecahan
dibuang)
Nilai kuartil 2 ditentukan sama seperti
mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
Posisi Q2 = nQ2 = (5+1) / 2 =3
Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
Data terurut: 1
2
3
4
Median
Q1
Q3
8
Posisi Q2 = nQ2 = (6+1) / 2 =3.5
Posisi Q1 = Posisi Q3 = (3+1)/2 = 2
Data terurut: 1
2
Q1
3
4
8
Median Q3
8
Metode Interpolasi
Urutkan data dari kecil ke besar Cari posisi kuartil nq1=(1/4)(n+1) nq2=(2/4)(n+1) nq3=(3/4)(n+1)
Nilai kuartil dihitung sebagai berikut: Xqi=Xa,i + hi (Xb,i-Xa,i)
Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i = pengamatan
setelah posisi kuartil ke-i dan hi adalah nilai pecahan dari posisi kuartil
Posisi Q2 = nQ2 = (5+1) / 2 =3 Posisi Q1 = ¼(5+1) = 1.5
Data terurut: 1
Posisi Q3 = ¾(5+1) = 4.5
2
3
4
8
Median Q1= 1 + 0.5(2-1) = 1.5
Q3=4+ 0.5(8-4)=6
Posisi Q2 = nQ2 = (6+1) / 2 =3.5 Posisi Q1 = ¼(6+1) = 1.75 Posisi Q3 = ¾(6+1) = 5.25
Data terurut: 1
2
3
4
8
8
Median Q1= 1 + 0.75(2-1) = 1.75
Q3=8+ 0.25(8-8)=8
Q1
Q2
Q3
Q0
Q4
Berdasarkan metode Interpolasi Data I 1.5 1
3
Data II 6 8
1.75 1
3.5
6 8
Merupakan pusat massa (centroid)
Jika menggambarkan populasi di tuliskan sebagai ,
huruf yunani “mu”
Jika menggambarkan contoh dituliskan sebagai
disebut “xbar”
Digunakan untuk tipe data numerik x
,
Tidak bisa digunakan untuk tipe data kategorik dan
diskret
Sangat resisten terhadap pencilan
Rata-rata (Mean) Populasi:
Sampel:
x N
i 1
x n
x
N
i
i 1
n
i
Data I
(merupakan data contoh):
2
x
8
3
4
1
2 8 3 4 1 3.6 5
Jangan dibulatkan!!!!
Data I terurut: 1 x
1 2 3 4 8 3.6 5
Data III terurut: 1 x
1 2 3 4 100 22 5
2
3
4
8
4
100
Median 2
3
Median
Mean = Median = Mode
•Menggambarkan suatu UKURAN KUANTITATIF tingkat penyebaran atau pengelompokan dari data •Keragaman biasanya didefinisikan dalam bentuk jarak :
•Seberapa jauh jarak antar titik-titik tersebut satu sama lain •Seberapa jauh jarak antara titik-titik tersebut terhadap rataannya
•Bagaimana tingkat keterwakilan nilai tersebut terhadap kondisi data keseluruhan
Merupaka selisih dari nilai terbesar – nilai terkecil
R=Xmax – Xmin
Hanya memperhitungkan nilai terkecil dan terbesar, sedangkan
sebaran nilai antara dua nilai tersebut tidak diperhitungkan
Resisten terhadap nilai yang ekstrim
Data I terurut: 1 2 R = 8-1 = 7 Data III terurut: 1
3 2
R = 100-1 = 99
4 3
8 4
100
Merupakan selisih antara kuartil 3 dengan kuartil 1
IQR = Q3 - Q1
Memperhitungkan sebaran antara nilai minimum dan nilai
maksimum
Kekar terhadap adanya nilai-nilai yang ekstrim (pencilan)
Statistik 5 serangkai dari data I (metode belah dua)
2
3
1
4 8
IQR = 4-2 = 2
Statistik 5 serangkai dari data III (metode belah dua)
2 1
3
4
100
IQR = 4-2 = 2
Ukuran penyebaran yang lebih kompleks adalah
bagaimana data tersebut mengelompok di sekitar rataannya
Deviasi merupakan selisih dari data terhadap
rataannya.
Ukuran keragaman dari deviasi adalah rataan deviasi
= (x - ) / n
(x - ) / n 0
Data 1
Data
Rataan
Deviasi 1
-2.6
2
-1.6
3
-0.6
4
0.4
8
4.4
3.6
0.000000000000000178
Data 1 Data
1 2 3 4
Rataan
8
3.6
(X-)
-2.6 -1.6 -0.6 0.4 4.4
(X-)2
6.76 2.56 0.36 0.16
19.36
5.84
Untuk menghilangan +/-
maka deviasi dikuadratkan terlebih dahulu sebelum dirataratakan.
Ukuran semacam ini
disebut ragam = (x )2 / n
(x - )2 merupakan
jumlah kuadrat dari deviasi disekitar rataannya
Ragam (Variance) Populasi
2
Contoh
x N
2
i
i 1
N
x x n
s2
i 1
i
2
n 1
Derajat bebas = db
Untuk menghitung ragam contoh maka perlu dihitung rataan contoh, maka data terakhir tergantung dari datadata sebelumnya. Hanya 1 yang tidak bebas, sedangkan n-1 data lainnya bebas variasinya Data 1
x N
2 i1
i
N
2
29.2 5.84 5
x x n
s2 i1
i
n1
2
29.2 7.3 4
Banu mengajak Anda main tebak-tebakan. Banu mempunyai tiga kaleng. Salah satu dari kaleng tersebut berisi bola. Yang manakah yang berisi bola?
Jika bola tersebut dianggap sebagai rataan sampel maka ada sebanyak 3-1 = 2 kaleng yang ditebak bebas db = n-1
Jika kaleng I dan II Anda angkat namun tidak terdapat bola maka sudah pasti kaleng ke-3 yang berisi bola
Simpangan baku (standard deviation)
Ragam merupakan ukuran jarak kuadrat, sehingga untuk
mendapatkan jarak yang sebenarnya adalah dengan mengakarkan ragam simpangan baku
simpangan baku populasi dan s simpangan baku sampel
a. 3 9 7 4 10 3 b. 4 9 3 8 6 Tentukan nilai :
Mean, Median, Q1, Q3, Ragam, Simpangan Baku, Range, dan IQR untuk kedua gugus data di atas
Ilustrasi Data No
Sex
Tinggi
Berat
Agama
2
1
172
74
Islam
1 3 4 5 6 7 8 9
10
1 0 0 1 0 1 0 0
1
167 161 157 165 167 162 151 158
162
63
Islam
53
Kristen
58
Islam
47 60 52
Hindu Islam
Budha
45
Katholik
63
Islam
54
Kristen
11
1
176
82
Islam
13
0
163
57
Kristen
58
Katholik
61
Kristen
62
Islam
12 14 15 16 17 18 19 20 21
1 0 1 0 1 1 1 0 1
167 158 164 161 159 163 165 169 173
69 60 50 65 59 70
Islam Islam Islam Islam Islam Islam
Data pada ilustrasi data diolah menggunakan MINITAB
Descriptive Statistics: Tinggi, Berat Variable Tinggi Berat
N 21 21
Mean 163.81 60.10
Variable Tinggi Berat
Range 25.00 37.00
IQR 7.00 10.50
StDev 5.85 8.86
Variance 34.26 78.49
Minimum 151.00 45.00
Q1 160.00 53.50
Median 163.00 60.00
Q3 167.00 64.00
Maximum 176.00 82.00
Melihat ukuran penyebaran dan ukuran
pemusatan data Melihat adanya data pencilan Sebagai alat pembandingan sebaran dua kelompok data atau lebih
Penyajian Dengan Box-plot(1) Boxplot of data 1
Q1
Q2
Q3
Min
Max
Interquartli Range 40
45
50 data 1
55
60
CARA MEMBUAT BOX PLOT
Hitung Statistik lima serangkai
Hitung Pagar Dalam Atas (PAD1) : Q3 +1.5(Q3-Q1)
Me
Q1 Q0
Q3
Q4
Hitung Pagar Dalam Atas (PAD2) : Q3 +3(Q3-Q1)
Hitung Pagar Dalam Bawah (PBD1): Q1-1.5(Q3-Q1) Hitung Pagar Dalam Bawah (PBD)2: Q1-3(Q3-Q1)
Identifikasi data. Jika data < PBD atau data > PAD maka data dikatakan outlier Gambar kotak dengan batas Q1 dan Q3
Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan tarik garis dari Q3 sampai data terbesar
Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum pencilan Pencilan digambarkan dengan asterik
ILUSTRASI (1)
Statistik 5 serangkai dari data sbb:
Q1
Me
Min
Q3
43
48
Max 40
55
59
PDA = 55 + 1.5 (55 – 43) = 73 PDB = 43 – 1.5 (55 - 43) = 25 Tidak ada pencilan
Boxplot of data 1
40
45
50 data 1
55
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan Tidak ada pencilan
60
Stem-and-leaf of data 1 N = 23 Leaf Unit = 1.0 9 (5) 9 7 1 1 1 1 1
4 4 5 5 6 6 7 7 8
002233344 68899 02 556788
Q1
Me
Min
Q3
Max
40
55
80
PDA = 55 + 1.5 (55 – 43) = 73 PDB = 43 – 1.5 (55 - 43) = 25 Pencilan : 80
0
43
48
Boxplot of data 1
40
50
60 data 1
70
80
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan Terdpat nilai pencilan (80)
Jawa Barat
No. Kota/Kab 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Pandenglang Lebak Bogor Sukabumi Cianjur Bandung Garut Tasikmalaya Ciamis Kuningan Cirebon Majalengka Sumedang Indramayu Subang Purwakarta Karawang Bekasi Tangerang Serang Kota Bogor Kota Sukabumi Kota Bandung Kota Cirebon Rata-Rata: Jabar Jateng Minimum : Jabar Jateng Maksimum: Jabar Jateng
Pert. Pend. 2.15 2.48 4.52 2.51 2.33 3.31 2.35 2.15 1.21 1.97 2.73 2.01 1.41 2.53 1.89 2.32 2.31 3.57 4.04 2.85 2.60 1.48 2.20 2.51
2.48 1.68 1.00 1.00 23.00 34.00
Jawa Tengah
No. Kota/Kab 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
Cilacap Banyumas Prubalingga Banjarnegara Kebumen Purworejo Wonosobo Magelang Boyolali Klaten Sukoharjo Wonogiri Karanganyar Sragen Grobogan Blora Rembang Pati Kudus Jepara Demak Semarang Temanggung Kendal Batang Pekalongan Pemalang Tegal Brebes Kota Magelang Kota Surakarta Kota Slatiga Kota Semarang Kota Pekalongan Kota Tegal
Pert. Pend. 1.28 1.78 1.42 1.49 1.09 0.62 1.64 1.31 1.08 1.19 2.10 0.51 2.07 1.85 1.52 1.27 2.08 1.62 2.03 1.87 1.38 0.46 1.83 0.83 1.70 1.80 1.79 2.67 2.09 1.25 1.39 2.30 5.21 1.95 2.44
Boxplot of pertumbuhan pendd vs prop
pertumbuhan pendd
5 4
Kota Semarang Bogor
Tangerang
3 2 1 0
Jawa Barat
prop
Jawa Tengah
Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi dibandingkan dengan pertumbuhan penduduk di Jawa Tengah. Secara umum, tingkat keragaman pertumbuhan penduduk antar kabupaten, di Jawa Tengah sedikit lebih besar dibanding dengan Jawa Barat. Kab Bogor dan Tangerang merupakan daerah yang tingkat pertumbuhan pendudukya cukup tinggi. Di Jawa Tengah Kota Semarang yang pertumbuhan penduduknya paling tinggi.
Nomor Skor Aritmatika
1
2
4
5
6
7
8
9
10
11
11
14
8
19
17
15
13
11
8
0
0
1
0
5
3
4
2
0
2
Skor Aljabar Nomor
3
11
12
13
14
15
16
17
18
19
20
Skor Aritmatika
9
19
19
18
19
14
14
16
20
16
Skor Aljabar
2
5
7
9
7
0
4
1
9
4