Bab I Pendahuluan & Statistika Deskriptif •Pengertian Statistika •Distribusi Frekuensi •Central Tendency •Measure of Dispersion
Pengertian Statistika • Statistik (statistic) vs statistika (statistics) • Statistik: angka-angka • Statistika: penggunaan data numerik untuk membantu membuat keputusan dalam ketidakpastian
1
Deskriptif vs Inferensial • Statistika deskriptif: perhitungan rangkuman dan tampilan grafis • Statistika inferensial: pembuatan kesimpulan umum mengenai keseluruhan (populasi) dengan melakukan pangamatan atas suatu bagian (sampel) • Tidak ada sampel yang dijamin sangat sesuai menggambarkan populasi sasaran, tapi galat pengambilan sampel (sampling error) harus dijaga agar dalam batas wajar.
Deduktif vs Induktif • Statistika deduktif: sifat-sifat dari kasuskasus khusus dapat diduga dari keadaan umum. Mis: kita dapat menetapkan 0,04 sebagai probabilitas bahwa seorang mahasiswa Teknik Sipil terpilih secara acak jika kita tahu bahwa 4% mahasiswa di kampus mengambil jurusan tersebut • Statistika induktif = statistika inferensial
2
Populasi vs Sampel • Populasi statistika adalah kumpulan seluruh pengamatan yang mungkin dari karakteristik tertentu yang diteliti • Sampel adalah suatu kumpulan pengamatan yang berasal dari suatu bagian dari populasi tertentu • Galat (error) antara lain dipengaruhi oleh jumlah sampel
Unsur dasar (elementary unit) Suatu pengelompokan tunggal dari unsurunsur dasar dapat menimbulkan beberapa buah populasi. Mis: para mahasiswa yang terdaftar pada sebuah universitas dapat menjadi unsur-unsur dasar populasi indeks prestasi, populasi penghasilan, populasi jenis kelamin, populasi jurusan, populasi tinggi badan, populasi usia dll. Bedakan dengan pengertian populasi yang berarti kelompok demografis sejumlah makhluk hidup.
3
Jenis Populasi • Populasi kuantitatif: numerik • Populasi kualitatif: atribut (mis: jenis kelamin, pekerjaan dll) • Populasi: telah ada, masa mendatang, imajiner
• Sampel diambil karena keterbatasan biaya, waktu dan tenaga • Data mentah: titik-titik data yang belum disusun dalam bentuk yang bermakna jelas • Statistik deskriptif menyusun dan memanipulasi data mentah agar dapat dengan mudah diterjemahkan maknanya, misalnya dalam bentuk tabel dan grafik distribusi frekuensi, kecenderungan pemusatan dan variabilitas
4
Distribusi Frekuensi Merupakan cara penyajian data ke dalam kelas-kelas. Banyaknya data di dalam tiap kelas dihitung sehingga diperoleh frekuensi kelas
Contoh Berat (kg) Frekuensi 7-9 2 10-12 8 13-15 14 16-18 19 19-21 7
ada 5 kelas tepi bawah kelas tepi atas kelas
• Tabel di sebelah kiri adalah distribusi frekuensi berat 50 kopor yang ditimbang secara acak di bandara • Pencatatan dibulatkan ke kg terdekat sehingga misalnya kelas 19-21 meliputi semua kopor dengan berat >18,5 kg (batas bawah kelas) tapi <21,5 kg (batas atas kelas) • Batas kelas dibuat 1 desimal lebih banyak dari data asli • Lebar kelas=batas atas kelas-batas bawah kelas • Titik tengah kelas 19-21 misalnya adalah 20
5
Panduan Membuat Tabel Distribusi Frekuensi • Hitung range, r=nilai maks.-nilai min. • Perkiraan banyak kelas (Sturgess), k=1+3,3log(n) bila n adalah banyaknya data • Lebar kelas, c=r/k, umumnya dibuat seragam dan mudah diinterpertasikan • Tentukan tepi bawah kelas pertama, a1=nilai min-(kc-r)/2. Lalu a2=a1+c • Batas atas kelas pertama: b1=a2-(satu unit pengukuran terkecil/2)
Contoh: Data tinggi 100 mahasiswa (cm) 156 168 161 157 164 166 162 160 165 167
170 161 166 152 163 160 167 162 171 157
165 169 173 159 164 169 163 156 162 168
170 153 163 168 162 172 161 164 158 161
158 165 173 156 164 167 163 154 162 169
164 169 162 163 157 167 162 158 165 163
160 164 166 155 161 164 167 162 174 159
162 158 161 164 167 163 156 162 164 168
167 164 163 156 164 168 174 163 169 159
171 157 169 165 167 156 170 164 153 168
6
Jawab: • • • • • •
r=174-152=22 k=1+3,3log100=7,6 c=r/k=22/7,6=2,89≈ 3 Bila k=7, a1=152-(7x3-22)/2=152,5>152 Bila k=8, a1=152-(8x3-22)/2=151 Tepi bawah kelas berikutnya: 154, 157, 160, 163, 166, 169, 172 • Selanjutnya dapat ditentukan batas-batas bawah & atas kelas dan tepi atas kelas dengan memperhatikan c=3
Tabel Distribusi Frekuensi Tepi Kelas
Batas Kelas
Titik Tengah (X)
151-153
150,5-153,5
152
3 0,03
154-156
153,5-156,5
155
7 0,07
157-159
156,5-159,5
158
12 0,12
160-162
159,5-161,5
161
18 0,18
163-165
162,5-164,5
164
27 0,27
166-168
165,5-168,5
167
17 0,17
169-171
168,5-171,5
170
11 0,11
172-174
171,5-174,5
173
5 0,05
Total
Frekuensi (f)
Frekuensi Relatif
100 1,00(100%)
7
Tabel Distribusi Frekuensi Kumulatif Tepi Kelas
Batas Kelas Frekuensi Kumulatif < Batas Atas Kelas
Frekuensi Kumulatif > Batas Bawah Kelas
151-153
150,5-153,5
3
100
154-156
153,5-156,5
10
97
157-159
156,5-159,5
22
90
160-162
159,5-161,5
40
78
163-165
162,5-164,5
67
60
166-168
165,5-168,5
84
33
169-171
168,5-171,5
95
16
172-174
171,5-174,5
100
5
Histogram & Poligon Frekuensi 30
20
10
0 147,5 - 150,5
159,5 - 162,5
153,5 - 156,5
171,5 - 174,5
165,5 - 168,5
Tinggi Badan Mahasiswa (cm)
8
Poligon Frekuensi Kumulatif 1 00
Frekuensi Kum ulatif
90 80
Frekuensi Kumulatif Kurang Dari Frekuensi Kumulatif
70 60 50 40 30 20 10 0 150 ,5
15 3,5
15 6,5
1 59,5
162,5
16 5,5
16 8,5
1 71,5
174,5
Tinggi Badan Mahasisw a (cm )
Dampak dari Pilihan k dan c 30
20
10
0 147,5 - 150,5
159,5 - 162,5
153,5 - 156,5
171,5 - 174,5
165,5 - 168,5
Tinggi Badan Mahasiswa (cm) 50
20
40
30 10
20
10 0 147,5 - 153,5
171,5 - 177,5 159,5 - 165,5
Tinggi Badan Mahasiswa (cm)
,0 76 -1 5 0 4, 3, 17 - 17 5 1, 0 ,0 17 - 17 5 ,0 8, 67 16 -1 5 0 5, 4, 16 - 16 0 5 1, 2, 16 - 16 5 ,0 9, 8 15 - 15 5 6, 55 ,0 15 -1 0 5 2, 3, 15 - 15 5 0, 49,0 15 -1 5 7, 14
0
Tinggi Badan Mahasiswa (cm)
9
Central Tendency • Untuk mendapatkan gambaran mengenai karakteristik data, selain dengan analisis distribusi frekuensi, perlu pula analisis central tendency. • Central tendency meliputi rataan hitung/ukur/harmonis (arithmetic/ geometric/harmonic mean), median dan modus (mode)
Rataan Hitung (Arithmetic Mean) • Untuk sampel:
n
X i 1
Xi n
N
• Untuk populasi: i 1
Xi N
• Untuk data dikelompokkan bila k k adalah banyaknya kelas: X f i X i i 1
n
10
Contoh: • Gunakan data 100 tinggi badan mhsw • Bila belum dikelompokkan maka mean adalah 163,40 • Bila telah dikelompokkan (misalnya dalam pembagian kelas yang telah dilakukan pada contoh sebelumnya) maka mean adalah 163,37 • Nilai mean yang hampir sama menunjukkan pengelompokan yang baik.
Mean Untuk Data Berkelompok Tepi Kelas
Batas Kelas
Titik Tengah (Xi)
151-153
150,5-153,5
152
3
456
154-156
153,5-156,5
155
7
1085
157-159
156,5-159,5
158
12
1896
160-162
159,5-161,5
161
18
1288
163-165
162,5-164,5
164
27
4428
166-168
165,5-168,5
167
17
2839
169-171
168,5-171,5
170
11
1870
172-174
171,5-174,5
173
5
865
100
16337
Total
Frekuensi (fi)
Xifi
11
Metode Transformasi Tepi Kelas
Titik Tengah (Xi)
Frekuensi (fi)
151-153
152
3
-4
-12
154-156
155
7
-3
-21
157-159
158
12
-2
-24
160-162
161
18
-1
-18
163-165
164
27
0
0
166-168
167
17
1
17
169-171
170
11
2
22
172-174
173
5
3
15
Total
Ui
100
Uifi
-21
Metode Transformasi k
fU i
X X sementara c
i 1
n
i
164 3
21 163,37 100
12
Median • Merupakan nilai tengah dari data yang telah diurutkan dari kecil ke besar atau sebaliknya. • Untuk data ganjil median adalah nilai tengah. • Untuk data genap median adalah rataan dua nilai tengah.
Contoh: • Median dari 3,4,4,5,6,8,8,9,10 adalah data ke 5 dari 9 data yaitu 6. • Median dari data 3,4,4,5,6,8,8,8,9,10 adalah rataan dari data ke 5 dan ke 6 yaitu (6+8)/2=7
13
Median untuk Data Berkelompok Bila Lo batas bawah kelas median, c lebar kelas, (∑fi)0 frekuensi kelaskelas di bawah kelas median, fm frekuensi kelas median, n banyaknya data maka median adalah: n ( f i ) 0 Med L0 c 2 fm
Sehingga median untuk contoh sebelumnya adalah: 100 40 2 Med 162,5 3 163,61 27
Modus • Merupakan data yang paling banyak muncul atau data yang frekuensinya terbesar. • Data dapat memiliki 1 modus, lebih dari 1 modus atau tanpa modus. • Modus dari 3,4,4,5,6,8,8,8,9,10 adalah 8 • Modus dari 3,4,4,5,6,8,8,9,10 adalah 4 & 8 • Modus dari 3,4,5,6,7,8, 9,10 tidak ada • Modus dari 8,8,8,8,8,8 tidak ada
14
Modus untuk Data Berkelompok Bila: Lo batas bawah kelas modus c lebar kelas fmod frekuensi kelas medus fi-1 fmod-frekuensi kelas sebelum fmod fi+1 fmod-frekuensi kelas sesudah fmod f maka median adalah: Mod L c f f Sehingga median untuk contoh sebelumnya adalah: Mod 162,5 3 9 910 164,04 1
0
1
1
Skewness vs Posisi Nilai Sentral
Simetris: Mean=Median=Modus
Positively Skewed: Mean>Median>Modus
Negatively Skewed: Mean<Median<Modus
15
Mean vs Median vs Modus • Mean baik dipakai untuk data yang tidak terlalu bervariasi. • Median baik dipakai untuk data yang sangat bervariasi atau ada nilai ekstrim. • Modus baik untuk data yang terkonsentrasi • Tingkat variasi ini dapat ditunjukkan oleh nilai simpangan baku
Hubungan Simetris Mean, Modus dan Median • Bila kurva distribusi frekuensi tidak terlalu menceng maka berlaku hubungan Modus=3Median-2Mean • Pada contoh tinggi badan mahasiswa Modus=(3)(163,61)-(2)(163,37)=164,09 tidak jauh berbeda dengan hasil perhitungan sebelumnya (164,04). Hal ini menunjukkan kurva relatif simetris.
16
Measure of Dispersion • Dispersi adalah tingkat penyebaran suatu data, yaitu perbedaan antar nilai, dan antara nilai dengan nilai sentralnya. • Jenis dispersi meliputi range (jangkauan), mean deviation, variance (variansi), standard deviation (simpangan baku), coefficient of variation (koefisien variasi). • 4 jenis pertama merupakan ukuran dispersi mutlak, sedang jenis terakhir merupakan ukuran dispersi relatif.
Range • Merupakan selisih nilai terbesar dan terkecil dari data. • Pada contoh tinggi badan mahasiswa nilai range r=174-152=22 • R terlalu kasar dan sangat dipengaruhi nilai ekstrim sehingga jarang dipakai untuk ukuran dispersi.
17
Mean Deviation • Merupakan jumlah mutlak dari selisih setiap nilai dengan mean. X X • Untuk data tidak berkelompok: MD n • Untuk data berkelompok: MD f X X n
i
i 1
n
i
i
i 1
n
• Mean dapat diganti dengan median atau modus.
Variance (Variansi) Sampel • Untuk data tidak berkelompok: n
2
s
X
i
X
2
i 1
n 1
n
n n X X i i 1 i 1 n(n 1)
2
2 i
• Untuk data berkelompok: n
f X i
2
s
i
X
i 1
n 1
n
2
n
i 1
n fi X fi X i i 1 n(n 1)
2
2 i
18
Standard Deviation (Simpangan Baku) • Walaupun variansi adalah ukuran dispersi yang baik karena mencerminkan selisih nilai dengan mean, namun bentuknya kuadrat padahal dispersi lebih mudah diinterpertasikan secara linier. • Oleh sebab itu akar dari variansi yaitu simpangan baku juga digunakan.
Koefisien Variasi • Simpangan baku dan variansi adalah ukuran variasi dari suatu set data atau biasa disebut variabi absolut • Untuk membandingkan variasi atau dispersi dari beberapa set data dipakai dispersi atau variasi relatif yaitu koefisien variasi (KV) • KV= Simpangan baku/mean
19
Skewnes dan Kurtosis
X Mod S
3( X Med ) S n
X 3
i
X
3
i 1
nS 3 n
X 4
i
X
4
i 1
nS 4
20