Kursus Statistika Dasar
Bagian 1
Bambang Suryoatmono
Statistika Deskriptif
Pengelompokan Statistika
Statistika Deskriptif: statistika yang menggunakan data pada suatu kelompok untuk menjelaskan atau menarik kesimpulan mengenai kelompok itu saja
Ukuran Lokasi: mode, mean, median, dll Ukuran Variabilitas: varians, deviasi standar, range, dll Ukuran Bentuk: skewness, kurtosis, plot boks
Statistika Inferensi (Statistika Induksi): statistika yang menggunakan data dari suatu sampel untuk menarik kesimpulan mengenai populasi dari mana sampel tersebut diambil
Istilah-istilah Dasar
Populasi: sekumpulan orang atau objek yang sedang diteliti Sensus: pengumpulan data pada seluruh populasi Sampel: sebagian dari populasi yang, apabila diambil dengan benar, merupakan representasi dari populasi Parameter: ukuran deskriptif dari populasi Statistik: ukuran deskriptif dari sampel
Pengelompokan Statistika lainnya
Statistika Parametrik:
Menggunakan
asumsi mengenai populasi pengukuran kuantitatif dengan level data interval atau rasio
Membutuhkan
Statistika Nonparametrik (distribution-free statistics for use with nominal / ordinal data):
Menggunakan
lebih sedikit asumsi mengenai populasi (atau bahkan tidak ada sama sekali)
Membutuhkan data dengan level serendahrendahnya ordinal (ada beberapa metode untuk nominal)
Jenis Data Bilangan menunjukkan perbedaan Pengukuran dapat digunakan untuk membuat peringkat atau mengurutkan objek Perbedaan bilangan mempunyai arti Mempuyai nol mutlak dan rasio antara dua bilangan mempunyai arti
Nominal
Ordinal
Interval
Rasio
√
√
√
√
√
√
√
√
√
√
1
Distribusi Frekuensi
Histogram (contoh MINITAB)
Ungrouped Data vs Grouped data Range Class midpoint Frekuensi Relatif Frekuensi Kumulatif
Data: 60, 65, 70, 73, ……… , (tulis di C1) MINITAB: Stat -> Basic Statistics -> Display Descriptive Statistics
Histogram of Nilai
Boxplot of Nilai
7 6
Frequency
5 4 3 2 1 0 30
40
50
60
70
80
90
100
Nilai
Descriptive Statistics: Nilai 30
Variable Nilai
N 40
Mean 72.83
Median 74.50
TrMean 73.39
Variable Nilai
Minimum 35.00
Maximum 100.00
Q1 59.25
Q3 89.50
StDev 18.37
SE Mean 2.90
40
50
60
70
80
90
100
Nilai
Informasi di dalam Boxplot: Minimum, Q1, Median (Q2), Q3, dan Maksimum
2
Ogive (Poligon Frekuensi Kumulatif) MINITAB: Graph -> Histogram
Pie Chart MINITAB: Graph -> Pie Chart
Cumulative Frequency
40
30
20
10
0 30
40
50
60
70
80
90
100
Nilai
Ogive
Pie Chart Pemilih
Bar Chart C (1500, 35.5%)
B ( 500, 11.8%)
A ( 350, 8.3%)
MINITAB: Graph -> Chart
E ( 680, 16.1%)
D (1200, 28.4%)
3
Stem-and-leaf
Sum of Pemilih
1500
MINITAB: Graph -> Character Graph -> Stem-and-leaf
1000
500
A
B
C
D
E
Calon
Character Stem-and-Leaf Display
Stem-and-leaf of HrgTanah Leaf Unit = 10
N
= 50
Ukuran Lokasi pada data tak terkelompok
1 2 3 7 20 (18) 12 8 4 3 1 1
4 5 6 7 8 9 10 11 12 13 14 15
5 5 5 2699 0012455555669 000000345555556779 0000 0000 0 00
Mean = rata-rata hitung = rata-rata µ = rata-rata populasi, X = rata-rata sampel Median = nilai tengah dari data yang diurutkan Mode = nilai yang paling sering terjadi pada suatu data Persentil = ukuran lokasi yang membagi sekelompok data menjadi 100 bagian Quartil = ukuran lokasi yang membagi sekelompok data menjadi 4 bagian atau subkelompok
0
Ukuran Lokasi pada data tak terkelompok (lanjutan)
Ukuran Variabilitas pada data tak terkelompok
Mencari persentil ke p: - Urutkan n data dari kecil ke besar - Hitung lokasi persentil i = (p/100) * n - Jika i = bil bulat, maka persentil ke p adalah (bil ke i + bil ke i+1) / 2 - Jika i bukan bil bulat, maka persentil ke p adalah bil ke int(i) + 1
Range = maksimum – minimum Interquartile range = Q3 – Q1 Q3 = persentil ke 75, Q1 = persentil ke 25
Deviasi absolut rata-rata
Varians populasi
σ2 = ∑
( X − µ )2 N
MAD =
=
∑X
2
∑ X −µ N
− ( ΣXN )
2
N
4
Ukuran Variabilitas pada data tak terkelompok (lanjutan)
Varians sampel:
S
Ukuran Variabilitas pada data tak terkelompok (lanjutan)
2
∑(X − X ) =
2
n −1
∑X =
2
−
σ=
n −1
Ukuran Lokasi pada data terkelompok Rata-rata
µ grouped = ∑
fM
∑f
=
∑
S=
N
Varians populasi dan deviasi standar populasi f (M − µ )2 N
=
∑ fM
2
) − ( ΣfM N
N
2
; σ = σ2
Varians sampel dan deviasi standar sampel S2 =
∑ f (M − X ) n −1
2
=
∑ fM
2
− ( ΣfMn )
2
n −1
; S = S2
Ukuran Bentuk (lanjutan)
Skewness
simetris
σ 100% µ
CV =
Note: Koefisien Variasi
σ2 = ∑
fM
Ukuran Bentuk
Mean Median Mode
( X − X )2 n −1
Ukuran Variabilitas pada data terkelompok
f = frekuensi kelas N = frekuensi total
( X − µ )2 N
Deviasi Standar Sampel
Catatan: N = ukuran populasi, n = ukuran sampel
Deviasi Standar Populasi
( ΣX ) 2 n
Mode Median Mean Negatively skewed
Kurtosis (peakedness of a distribution)
Mean Median Mode Positively skewed
Distr. Platikurtis (datar dan menyebar)
Distr. Mesokurtis (normal)
Distr. Leptokurtis (tinggi dan tipis)
5