Nama: Analisis Statistika (STK511) SKS : 3 (2-2) Referensi: 1. Mattjik, A.A dan I M Sumertajaya. 2002. Perancangan Percobaan dengan Aplikasi SAS dan Minitab, Jilid I. IPB Press. Bogor. 2.
Montgomery, D.C. 1991. Design and Analysis of Experiments, 3rd ed. John Wiley & Sons, Inc. Singapore.
3.
Steel, R.G.D., J.H. Torrie and D.A Dickey. 1997. Principles and Procedures of Statistics a Biometrical Approach, 3nd ed. McGraw-Hill, Inc. Singapore.
4.
Aunuddin. 2005. STATISTIKA: Perancangan dan Analisis Data. IPB Press. Bogor
Penilaian : UTS, UAS, Tugas, Praktikum
PENDAHULUAN • Apa itu statistika? • Statistika berasal dari kata statistik Î penduga parameter • Ilmu yang mempelajari dan mengusahakan agar data menjadi informasi yang bermakna
Statistika Populasi Sampling
Pendugaan Contoh Deskriptif
Statistika Deskriptif vs Statistika Inferensia
Tingkat Keyakinan
Ilmu Peluang
Statistika Populasi : Keseluruhan pengamatan yang menjadi pusat perhatian kita Contoh :
Himpunan bagian dari populasi (mewakili)
Parameter : Karakteristik numerik dari populasi Statistik : Karakteristik numerik dari contoh Peubah / Variabel : Ciri dari objek yang diamati Data : ? Skala pengukuran : Nominal, Ordinal, Interval, Rasio Peubah: Kualitatif vs Kuantitatif, Diskret vs Kontinu Pengumpulan Data: Harus dibangkitkan dulu Æ Percobaan Langsung dikumpulkan Æ Survei/Observasi
Analisis Eksplorasi Data Eksplorasi Æ Upaya untuk melihat ke dalam data guna mengungkap informasi yang terkandung dalam data tersebut Æ manipulasi, penyarian/perangkuman, peragaan
Peragaan : tabel & grafik (histogram, diagram batang, diagram lingkaran/pie chart, plot, dll.) Penyarian: ukuran pemusatan (mean, median, modus, quartil), ukuran 90 80 70 60 50 40 30 20 10 0
21%
Jabar Jatim
79%
Lampung
E m is i H c (p p m )
penyebaran (ragam, standard deviasi, range, jarak antar kuartil) 1000 900 800 700 600 500 400 20
Laki-Laki Perempuan Tw-1
Tw-2
Tw-3
Tw-4
40
60
80
Jarak (1000 Km)
100
120
Analisis Eksplorasi Data Mean Æ rataan atau rata-rata
Populasi μ =
N
∑
i=1
xi N
n
Contoh x = ∑ i =1
xi n
Median Æ nilai yang membagi pengamatan menjadi dua bagian yang sama besar (50% < median, 50% > median)
~ x = x ⎡ n +1 ⎤ ⎢⎣ 2 ⎥⎦
Quartil Æ nilai yang membagi pengamatan menjadi empat bagian yang sama besar (Q1 : 25% < Q1 & 75% > Q1, Q2=median, Q3 : 75% < Q3 & 25% > Q3)
Q1 = x⎡ 1
⎤ ( n 1 ) + ⎥⎦ ⎢⎣ 4
Q3 = x⎡ 3
⎤ ( n 1 ) + ⎥⎦ ⎢⎣ 4
Modus Æ nilai yang paling sering muncul Contoh: a. 3 9 7 4 10 3
b. 4 9 3 8 6
Analisis Eksplorasi Data (xi − μ )2 2 Ragam : Populasi σ = ∑ N i =1 N
2 (x − x ) Contoh s 2 = ∑ i n −1 i =1 n
Standard Deviasi Æ akar kuadrat dari ragam: Pop=σ , Contoh=s
σ= σ
2
s= s
2
Range atau Wilayah Æ Selisih nilai terbesar dengan terkecil R = X[n] – X[1] Jarak Antar Kuartil Æ Selisih antara Q3 dengan Q1 (JAK=Q3-Q1)
Contoh Data Karyawan
No
Sex
Tinggi
Berat
Agama
1
1
167
63
Islam
2
1
172
74
Islam
3
0
161
53
Kristen
4
0
157
47
Hindu
5
1
165
58
Islam
Rekapitulasi menurut Agama
Laki-laki
6
0
167
60
Islam
Agama
Perempuan
7
1
162
52
Budha
8
0
151
45
Katholik
9
0
158
54
Kristen
10
1
162
63
11
1
176
12
1
13
Penyajian Tabel
Rekapitulasi menurut Sex Sex
Frekuensi
Persen
13
61.90
Kristen
4
19.05
Katholik
2
9.52
Islam
Hindu
1
82
Islam
Budha
1
167
69
Islam
0
163
57
Kristen
14
0
158
60
Islam
15
1
164
58
Katholik
16
0
161
50
Islam
17
1
159
61
Kristen
18
1
163
65
Islam
19
1
165
62
Islam
20
0
169
59
Islam
21
1
173
70
Islam
Islam
Frek.
Persen
12
57.14
9
42.86
Rata-rata Tinggi & Berat Tinggi
Berat
Laki-laki
166.25
64.75
4.76
Perempuan
160.56
53.89
4.76
Gabungan
163.81
60.10
43%
Penyajian Grafik
57%
Laki-laki Perempuan 10%
5%
5%
Laki-laki
200.00
Perempuan
150.00 100.00
19%
Islam
61%
Kristen
Katholik
Hindu
Budha
50.00 0.00 Tinggi
Berat
Analisis Eksplorasi Data Penyajian dengan: - Diagram Dahan Daun (Stem-and-Leaf Display) - Diagram Kotak Garis (Box-Plot)
Contoh data:
Analisis Eksplorasi Data Stem-and-Leaf Display Stem-and-leaf of Contoh1 N = 20
Stem-and-leaf of Contoh2 N = 24
Stem-and-leaf of Contoh3 N = 23
Leaf Unit = 1.0
Leaf Unit = 1.0
Leaf Unit = 1.0
1 4 7 (4) 9 5 3 1
2 3 4 5 6 7 8 9
5 579 138 0445 5569 36 12 3
3 7 (6) 11 6 3 2 1 1 1
0 1 1 2 2 3 3 4 4 5
899 0223 566779 01344 689 1 8
3
1 3 5 8 (4) 11 8 4 2 1 1 1 1
0 0 0 0 1 1 1 1 1 2 2 2 2
3 45 77 899 0011 223 4455 67 8
7
Analisis Eksplorasi Data Boxplot
Langkah Pembuatan Boxp-Plot: 1.
Tentukan: nilai terkecil, nilai terbesar, Q1, Median, Q3
2.
Lakukan identifikasi pencilan: dekat: x < Q1 – 3/2 d atau x > Q3 + 3/2 d & jauh: x < Q1 – 3d atau x > Q3 + 3d
3.
Gambar !
Peluang • Bagaimana membuktikan bahwa sebuah dadu setimbang? • Empiris Æ Peluang = frekuensi relatif • Contoh: • Satu mata uang setimbang dilempar sekali RC = {M, B} P({M})=1/2 dan P({B})=1/2
• Satu mata uang setimbang dilempar 3 kali RC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM} P({MMM})=1/8 ; P({BBB})=1/8 ; P({BMB})=1/8 X = Jumlah sisi muka yang muncul (X disebut peubah acak)
Peluang
Peubah Acak Æ fungsi yang memetakan anggota gugus RC ke gugus bilangan nyata
P(X=0) = P({BBB}) = 1/8 P(X=1) = P({BBM,BMB,MBB}) = 3/8 P(X=2) = P({BMM,MBM,MMB}) = 3/8 P(X=3) = P({MMM}) = 1/8
⎛n⎞ x P ( X = x ) = ⎜⎜ ⎟⎟ p (1 − p ) n − x ; x = 0,1,2,..., n ⎝ x⎠ Sebaran Binom(n,p) Æ sebaran Binom dengan parameter n dan p (sebaran peluang diskret)
Nilai Harapan & Ragam Peubah Acak X Nilai Harapan & Ragam : Sebaran Binom(n,p) n
E ( X ) = μ x = ∑ xi P( xi ) ; i = 0 ,...,n i =0
σ x2 = E ( X 2 ) − E ( X ) 2 n
E ( X 2 ) = ∑ xi2 P( xi ) ; i = 0,...,n i =0
Contoh: n=3 & p=0.5 X P(X)
0
1
2
3
E(X) = 1.5
0.125
0.375
0.375
0.125
σ2 = 0.75
Khusus pada sebaran Binom(n,p) : E(X) = μ = np dan σ2 = np(1-p)
Peluang Kontinu Sebaran Seragam Æ kontinu
1 f ( x) = ; 0 ≤ x ≤ 4 4 P(X=3) = 0 Æ pada sebaran kontinu, peluang pada satu titik =0 3
3
1 x3 3 0 3 P( X < 3) = ∫ f ( x)dx = ∫ dx = | = − = 4 40 4 4 4 0 −∞ 3
P (2 < X ≤ 3) = ∫ 2
3
x3 3 2 1 1 f ( x)dx = ∫ dx = | = − = 4 42 4 4 4 2
Nilai harapan Æ E ( X ) = μ x =
∞
∫ xf ( x)dx
−∞
Peluang Normal Sebaran Normal
1 f ( x; μ , σ ) = e 2π σ 2
X ~ N(μ, σ ) 2
(fungsi peluang kontinu)
x −μ ⎞ ⎟ ⎝ σ ⎠
⎛ − 12 ⎜
2
Z =
; -∞< x<∞ X-μ
σ
Z ~ N(0, 1) Tabel-Z
Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan 400g dan standard deviasi 100g. Jika diambil satu ikan secara acak, berapa peluang mendapatkan ikan yang beratnya lebih dari 500g? 500 − 400 ⎞ ⎛ P ( X > 500 ) = P ⎜ Z > ⎟ = P ( Z > 1 ) = 0 . 1587 100 ⎝ ⎠
Peluang Normal, Z, t, χ2, F Jika X~N(μ, σ2) Æ
x ~N(μ, σ2/n)
Bagaimana jika sebaran pop tdk normal Æ Dalil Limit Pusat Æ Apapun sebaran populasinya,
x ~N(μ, σ2/n) dengan n Æ∞
Jika σ2 tidak diketahui, maka sebaran Normal (Z) Æ sebaran t Peubah acak Z2 Æ sebaran χ2 (Khi-kuadrat) Rasio dari p.a. sebaran χ2 Æ sebaran F Penggunaan: Sebaran Z Æ menguji μ jika σ2 diketahui Sebaran t Æ menguji μ jika σ2 tidak diketahui Sebaran χ2 Æ menguji ragam (σ2) Sebaran F Æ Rasio dua ragam
Metode Sampling Tujuan Utama: Mendapatkan sampel yang mencerminkan populasi Æ dapat digunakan untuk menduga populasi Metode Sampling Æ Probability vs Non Probability Sampling
Masalah utama dalam sampling: 1. Menentukan metode sampling yang sesuai 2. Menentukan ukuran sampel yang mewakili populasi (dengan tingkat ketelitian yang diinginkan dan segala kendala yang ada)
Metode Sampling Probability Sampling Metode Sampling yang berbasis pada pemilihan secara acak Acak Æ setiap unit memiliki peluang yang sama untuk terpilih
Î Butuh kerangka contoh (daftar seluruh unit atau anggota populasi) Beberapa definisi: N = banyaknya objek dalam kerangka contoh (sampling frame) n = banyaknya objek dalam contoh f = n/N = fraksi contoh
Metode Sampling Beberapa Metode (Probability Sampling) • Penarikan Contoh Acak Sederhana (Simple Random Sampling) • Penarikan Contoh Acak Berlapis (Stratified Random Sampling) • Penarikan Contoh Sistematis (Systematic Random Sampling) • Penarikan Contoh Gerombol (Cluster Random Sampling) • Penarikan Contoh Bertahap (Multi-Stage Sampling)
Error Î Sampling Error vs Non Sampling Error
Metode Sampling Ukuran contoh optimum (n) Æ n = f(ragam, ukuran populasi, ketelitian yang diinginkan, biaya, waktu, resiko)
Æ Ukuran contoh yang diperlukan untuk menduga μ dengan batas error pendugaan sebesar B adalah: z 2 NV 2 n=
Nσ B , dengan D = ( N − 1) D + σ 2 4 2
2
n=
z 2V 2 + ( N − 1)ε 2
Z=1.96 dengan SK 95%, V=Std relatif thd mean, ε=batas kesalahan yang diinginkan (% thd mean)
Æ Ukuran contoh yang diperlukan untuk menduga P dengan batas error pendugaan sebesar B adalah: z 2 Np (1 − p ) Np (1 − p ) n= ( N − 1) D + p (1 − p )
n=
z 2 p (1 − p ) + ( N − 1)ε 2 p 2
Metode Sampling Contoh Penentuan ukuran contoh optimum (n) Tentukan ukuran contoh optimum untuk menduga rata-rata produksi petambak jika diketahui N=10000 dan range produksi petambak antara 10-20 ton, dan batas error yang diinginkan B=1 ton.
range 10 σ ≈ = = 2 .5 4 4
10000 * 2 . 5 2 n = = 24 . 94 ≅ 25 2 1 (10000 − 1) * + 2 .5 2 4
Tentukan ukuran contoh optimum untuk menduga proporsi (p) indukan udang yang baik jika diketahui N=2000 dan diinginkan batas error B=0.05. Asumsikan proporsi awal tidak diketahui.
n =
Np (1 − p ) = ( N − 1 ) D + p (1 − p )
2000 * . 5 * . 5 = 333 . 47 ≅ 334 . 05 2 ( 2000 − 1 ) * + .5 * .5 4
Metode Sampling Non Probability Sampling •
Pemilihan tidak dilakukan secara acak
•
Generalisasi terhadap populasi agak sulit dilakukan
•
Sering digunakan dalam penelitian sosial, marketing research, dll., krn Probability Sampling tidak praktis atau bahkan tidak dapat diterapkan
•
Accidental/Haphazard/Convenience vs Purposive
•
Purposive Î Model Instance Sampling, Expert Sampling, Quota Sampling, Heterogenety Sampling, Snowball Sampling
Pendugaan Parameter Dugaan Titik
x
untuk menduga μ
s2 untuk menduga σ2 Dugaan Selang Selang kepercayaan (1-α)100% bagi μ Jika Jika
σ2
σ2
diketahui:
x − zα 2
tdk diketahui:
σ n
< μ < x + zα 2
x − tα 2(n−1)
s n
σ n
< μ < x + tα 2(n−1)
s n
Pendugaan Parameter (lanjutan) Dugaan Selang Selang kepercayaan (1-α)100% bagi μ1-μ2 Æ dua contoh bebas ( x1 − x2 ) − zα 2
σ 12 n1
+
σ 22 n2
< μ1 − μ 2 < ( x1 − x2 ) + zα 2
σ 12 n1
+
σ 22 n2
Jika σ1 dan σ2 tdk diketahui dan diasumsikan sama: ( x1 − x2 ) − tα 2 ( v ) s
s
2 gab
2 gab
⎛1 1⎞ 1⎞ 2 ⎛ 1 ⎜⎜ + ⎟⎟ < μ1 − μ 2 < ( x1 − x2 ) + tα 2 ( v ) s gab ⎜⎜ + ⎟⎟ ⎝ n1 n2 ⎠ ⎝ n1 n2 ⎠
( n1 − 1) s12 + ( n 2 − 1) s 22 = dan v = n1 + n 2 − 2 n1 + n 2 − 2
Pendugaan Parameter (lanjutan) Dugaan Selang Selang kepercayaan (1-α)100% bagi μ1-μ2 Æ dua contoh bebas Jika σ1 dan σ2 tdk diketahui dan diasumsikan tidak sama: ( x1 − x2 ) − tα 2 ( v )
⎛ s12 s22 ⎞ ⎜⎜ + ⎟⎟ < μ1 − μ 2 < ( x1 − x2 ) + tα 2 ( v ) ⎝ n1 n2 ⎠ 2
v=
⎡⎛ s 2 ⎞ 2 ⎢⎜ 1 n ⎟ 1⎠ ⎢⎣ ⎝
2 ⎛ s12 ⎞ s 2 + ⎜ n ⎟ n 1 2 ⎝ ⎠ ⎤ ⎡⎛ s 2 ⎞ 2 (n1 − 1)⎥ + ⎢⎜ 2 n ⎟ 2 ⎠ ⎥⎦ ⎢⎣ ⎝
⎤ (n 2 − 1)⎥ ⎥⎦
⎛ s12 s22 ⎞ ⎜⎜ + ⎟⎟ ⎝ n1 n2 ⎠
Pendugaan Parameter (lanjutan) Dugaan Selang Beda nilai tengah bagi contoh berpasangan: μd Selang kepercayaan (1-α)100% bagi μd d − tα 2(n−1)
sd s < μD < d + tα 2(n−1) d n n
s d2 =
Dugaan selang bagi proporsi: P Ragam proporsi Æ
σ p2 =
p (1 − P ) n
Selang kepercayaan (1-α)100% bagi P p − zα 2
p(1 − p) < P < p + zα 2 n
p(1 − p) n
2 ( d − d ) ∑ i i
n−i
dan d i = x1i − x 2 i
Pengujian Hipotesis
Pengujian Hipotesis Hipotesis Statistik: Pernyataan/dugaan mengenai parameter populasi yang ingin dibuktikan kebenarannya H0 Æ hipotesis nol H1 atau Ha Æ hipotesis satu atau hipotesis alternatif Misalnya: H0: μ=100 vs H1: μ=120 Æ tunggal H0: μ=60
vs H1: μ≠60
Æ uji dwi arah
H0: μ=160 vs H1: μ>160 Æ uji eka arah
majemuk
H0: μ=500 vs H1: μ<500 Æ uji eka arah Berdasarkan data yang dikumpulkan, H1 atau H0 yang benar ?
Pengujian Hipotesis (lanjutan) Hasil Pengujian
Keadaan Sebenarnya
H0 benar
H1 benar
H0 benar
Benar
Salah Jenis 1 ( α)
H1 benar
Salah Jenis 2 ( β)
Benar
α = Peluang menolak H0 padahal H0 benar β = Peluang menerima H0 padahal H1 yang benar
Contoh : Suatu contoh acak berukuran 30 diambil dari populasi A. Nilai rata-rata dari 30 contoh tersebut adalah 123. Manakah yang lebih Anda percayai, ke-30 contoh tersebut berasal dari populasi A yang menyebar N(120,100) ataukah sebenarnya dari populasi B yang menyebar N(127,100)? H0: μ = 120
vs
Peluang menyatakan H0 benar padahal H1 yang benar = ⎛ ⎜ x − μ H1 P⎜ z < σ ⎜ ⎜ n ⎝
⎞ ⎛ ⎞ ⎟ ⎜ ⎟ ⎟ = P⎜ z < 123 − 127 ⎟ = P( z < -2.1909) 10 ⎟ ⎜ ⎟ ⎟ ⎜ ⎟ 30 ⎠ ⎠ ⎝ = 0.014
H1: μ = 127 Peluang menyatakan H1 benar padahal H0 yang benar = ⎛ ⎜ x − μH0 P⎜ z > σ ⎜ ⎜ n ⎝
⎞ ⎛ ⎞ ⎟ ⎜ ⎟ 123 120 − ⎟ = P⎜ z > ⎟ = P( z > 1.6432 ) 10 ⎟ ⎜ ⎟ ⎟ ⎜ ⎟ 30 ⎠ ⎠ ⎝ = 0.051
Pengujian Hipotesis (lanjutan) Kaidah Keputusan: Jika p-value < α Æ H1 benar Jika p-value ≥ α Æ H0 dianggap benar α Æ taraf nyata pengujian (kesalahan maksimum yang diperbolehkan jika memutuskan H1 benar)
P-value Æ peluang salah jenis 1 berdasarkan data Teladan 1: Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 25 dan diperoleh rataan sebesar 164 cm. Ujilah apakah dugaan tersebut benar. Gunakan α=5%. (Catatan: Tinggi rata-rata tahun 70-an=161 cm, dan σ2=81 cm2).
Pengujian Hipotesis (lanjutan) Diketahui: n=25, x =164 cm ; σ2=81 cm2 ; α =5%=0.05. H0: μ=161 cm vs H1: μ>161cm Z =
164 - 161 x - μ = σ / n 81 / 25
= 1 . 67 Z > Ztab Æ Tolak H0
Z tabel = Z0.05 = 1.65 P-value = P(x>x0 / μ =161) = P(Z>1.67) = 0.0475 P-value < α Æ Tolak H0 (Memang benar sekarang ada kenaikan rata-rata tinggi orang Indonesia dibandingkan dengan tahun 70-an)
Pengujian Hipotesis (lanjutan) Secara Umum: Satu Nilai Tengah Populasi:
H0: μ = μ0 vs H1: μ ≠ μ0 H0: μ ≤ μ0 vs H1: μ > μ0 H0: μ ≥ μ0 vs H1: μ < μ0
Dua Nilai Tengah Populasi: Saling Bebas
Berpasangan
H0: μ1= μ2 vs H1: μ1 ≠ μ2
H0: μD = 0 vs H1: μD ≠ 0
H0: μ1 ≤ μ2 vs H1: μ1> μ2
H0: μD ≤ 0 vs H1: μD > 0
H0: μ1 ≥ μ2 vs H1: μ1< μ2
H0: μD ≥ 0 vs H1: μD < 0
Pengujian Hipotesis (lanjutan) Teladan-2: Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih 22 petambak contoh secara acak, dimana 11 orang berlatar belakang petambak dan 11 orang sisanya berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan petambak, dan produksi terakhir dari ke-22 petambak tersebut seperti tabel di bawah ini, ujilah apakah dugaan tersebut di atas benar? (Gunakan α=5% dan asumsikan ragam produksi kedua populasi sama). Produksi dari 11 Petambak yang Berlatar Belakang Petambak
11.7
9.6 12.2
8.6
9.3 10.1
8.9
9.5 10.4
8.3
9.4
Produksi dari 11 Petambak yang Berlatar Belakang Bukan Petambak
7.4
8.5
9.2
Bentuk Hipotesis ?
8.7
7.8
6.9 10.2
Statistik Uji ?
H0: μ1 ≤ μ2 vs H1: μ1> μ2
9.4
t hit =
8.1
8.3
( x1 − x 2 ) = s x1 − x 2
9.0 ( x1 − x 2 ) ⎛ 1 1 ⎞ 2 ⎜⎜ ⎟⎟ + s gab n n 2 ⎠ ⎝ 1
Data •
Data adalah bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra.
•
Data in everyday language is a synonym for information.[1] In the exact sciences there is a clear distinction between data and information, where data is a measurement that can be disorganized and when the data becomes organized it becomes information. Data may relate to reality, or to fiction as in a fictional movie. Data about reality consists of propositions. A large class of practically important propositions are measurements or observations of a variable. Such propositions may comprise numbers, words or images.