STK511 Analisis Statistika Pertemuan - 1
PERKULIAHAN
1.
Dosen : Anang Kurnia (
[email protected])
2.
Asisten : Septian Rahardiantoro
3.
Waktu : Rabu –> 08.00 – 09.40 Jumat –> 08.00 – 10.00
4.
Office Hours : Rabu -> 11.00-12.00 (STK Darmaga) atau dengan perjanjian
5.
Berpakaian dan berperilaku sopan
5.
Selama perkuliahan tidak terdengar bunyi HP
6.
Penilaian : NA = UTS (40%) + UAS (40%) + Tugas/Kuis (20%)
anang kurnia :
[email protected]
MATERI PERKULIAHAN
No. Pokok Bahasan
#Pertemuan
1
Pendahuluan
1
2
Review Statistika Dasar
1
3
Sebaran Peluang
1
4
Sebaran Penarikan Contoh
1
5
Statistika Inferensia (Pendugaan dan Pengujian)
2
6
Analisis Data Perancangan Percobaan
3
7
Analisis Korelasi dan Regresi
2
8
Analisis Data Kategorik
1
9
Analisis Peubah Ganda
2
anang kurnia :
[email protected]
1. Pendahuluan Apa itu Statistika ? – Statistika berasal dari kata statistik penduga parameter – Ilmu yang mempelajari dan mengusahakan agar data menjadi informasi yang bermakna – Ilmu yang mempelajari teknik-teknik yang diperlukan dalam pengumpulan data, analisis dan penarikan kesimpulan berdasarkan data contoh mencerminkan ciri populasi – Statistics vs Statistic
anang kurnia :
[email protected]
1. Pendahuluan
Statistika Populasi
Sampling
Pendugaan
Contoh
Deskriptif
Statistika Deskriptif vs Statistika Inferensia
Tingkat Keyakinan
Ilmu Peluang anang kurnia :
[email protected]
1. Pendahuluan Cakupan Statistika ? • Tata cara pengumpulan data baik melalui percobaan, survey, dan observasi • Tata cara analisis data untuk menyarikan keterangan dari data yang terkumpul, numerik maupun grafik, untuk memudahkan pembahasan dan penarikan kesimpulan Statistika deskriptif • Tata cara pengukuran kepercayaan dalam penarikan kesimpulan untuk ruang lingkup yang lebih luas Statistika inferensia
anang kurnia :
[email protected]
1. Pendahuluan Proses Analisis Statistika Kesimpulan
Pendugaan
Pengujian Hipotesis
Penyarian Keterangan
Pembandingan Keterangan
Pengumpulan Data
anang kurnia :
[email protected]
1. Pendahuluan Analisis vs Tujuan/Ruang Lingkup • Enumeratif Menduga nilai agregat dari populasi. • Analitik Membahas perilaku hubungan antar berbagai faktor, menjelaskan hubungan sebab akibat.
Metode Pengumpulan Data anang kurnia :
[email protected]
1. Pendahuluan Metode Pengumpulan Data Metode Percobaan Memiliki keleluasaan untuk melakukan pengawasaan terhadap sumber-sumber keragaman data
Metode observasi (pasif) Tidak memiliki kendali dalam pengumpulan data (kecuali menentukan faktor yang diamati dan memeriksa ketelitian data)
Dapat menciptakan jenis Perubahan pada respon perlakuan yang sulit diketahui diinginkan dan penyebabnya mengamati perubahan pada respon
anang kurnia :
[email protected]
Metode survey Contoh data diambil dengan teknik tertentu dari populasi mewakili populasi
Nilai dugaan populasi dapat ditentukan dengan tingkat kepercayaan tertentu namun tidak cukup kuat menggambarkan hubungan sebab akibat
1. Pendahuluan Metode Pengumpulan Data
Metode Percobaan Kelebihan
Kelemahan
Kuat dalam pengendalian keragaman
Representasi hasil
Metode Observasi Kelebihan
Kelemahan
Metode Survey Kelebihan
Kelemahan
Mudah, murah, Pengendalian Represen- Pengendalian mengamati keragaman keragaman tasi hasil masalah dalam dan kondisi yang Representasi sebenarnya Hasil
anang kurnia :
[email protected]
1. Pendahuluan Sumber Keragaman • Dapat diidentifikasi dan diperkirakan pengaruhnya => Pengelompokan • Dapat diidentifikasi tetapi tidak dapat diperkirakan pengaruhnya => Pengacakan • Sulit diidentifikasi => Pengulangan
anang kurnia :
[email protected]
1. Pendahuluan Keterbatasan Hasil Analisis Statistika • Permasalahan : – – – –
Model kuantitatif yang sempurna belum tentu diketahui Faktor penyebab bisa banyak sekali Adanya keragaman alami -> pengulangan tidak bisa persis Penelitian yang “sempurna” tidak mungkin dilakukan
• Hasil Penelitian Bersifat Kondisional, tergantung pada : – Kerangka contoh atau populasi percobaan yang diamati – Metode pelaksanaannya (alat dan metode pengukuran, jenis dan definisi peubah yang diamati, dll) – Pelaksana penelitian (enumerator, petugas lab, responden, dll)
anang kurnia :
[email protected]
1. Pendahuluan Keterbatasan Hasil Analisis Statistika
Statistika adalah tongkat ke daerah ketidaktahuan.
Semua model adalah salah, namun paling tidak ada satu yang bisa digunakan (mendekati kondisi sebenarnya).
anang kurnia :
[email protected]
1. Pendahuluan Gambaran Analisis Statistika : Statistika Deskriptif Stem-and-Leaf Display: Volume Stem-and-leaf of Volume N = 31 Leaf Unit = 1.0
Matrix Plot of Diameter, Height, Volume 60
70
80
20 15
Diameter
10
10 (9) 12 7 6 1 1
1 2 3 4 5 6 7
0005688999 111224457 13468 2 11558
80 Height
70 60
70 45
Volume
20 10
15
20
20
45
70
7 14
400
12 10
Frequency
300
8 200
6 4
100
0
0
5 M-GREG
400000
800000
1200000 1600000 Data asal
2000000 2400000
2800000
anang kurnia :
[email protected]
10
15 MKT-GREG
20
1. Pendahuluan Gambaran Analisis Statistika : Statistika Deskriptif 322.3
350.0
272.3
300.0 237.5
250.0
198.1
200.0 150.0 100.0 50.0
51.6 33.2
30.1
44.1
0.0 Negeri Skor Evaluasi Diri Program Studi
Swasta Skor Borang Unit Pengelola
Skor Borang Program Studi
Nilai Total
anang kurnia :
[email protected]
1. Pendahuluan Gambaran Analisis Statistika : Statistika Inferensia Statistika Inferensia • Perbandingan Rataan Populasi – Satu populasi Uji t atau uji z – Dua populasi Uji t atau uji z – Lebih dari dua populasi anova
• Hubungan antar variabel – Hubungan dua arah Analisis Korelasi – Hubungan satu arah (sebab akibat) Analisis Regresi
anang kurnia :
[email protected]
1. Pendahuluan Gambaran Analisis Statistika : Statistika Inferensia • Suatu Penelitian dilakukan untuk mengetahui pengaruh kecepatan pengisian cat (X1) dan ketebalan cat (X2) terhadap kualitas hasil pengecatan (Y) Surface Plot of Y vs X1, X2
120
Duga Persamaan Regresi-nya !!!
100 Y 80 0.30
60
0.25
0.15 X2
0.20
0.25
X1
0.20
anang kurnia :
[email protected]
1. Pendahuluan Gambaran Analisis Statistika : Statistika Inferensia Regression Analysis: Y versus X1, X2
Surface Plot of FITS3 vs X1, X2
The regression equation is Y = 15.0 + 183 X1 + 171 X2
110
FITS3
Predictor Constant X1 X2
100 90 0.30
80 0.25
0.15 X2
0.20
0.25
Coef 15.02 182.75 170.65
Contour Plot of FITS3 vs X1, X2
R-Sq = 72.6%
FITS3 < 80 85 90 95 - 100 - 105 - 110 > 110
0.28
Source Regression Residual Error Total
X1
0.26
0.24
0.22
0.225
R-Sq(adj) = 70.4%
Analysis of Variance 80 85 90 95 100 105
0.200 X2
P 0.155 0.000 0.000
X1
0.30
0.175
T 1.47 5.53 4.82
0.20
S = 7.41471
0.20 0.150
SE Coef 10.24 33.02 35.38
0.250
anang kurnia :
[email protected]
DF 2 24 26
SS 3503.9 1319.5 4823.4
MS 1752.0 55.0
F 31.87
P 0.000
1. Pendahuluan Analisis Lebih Lanjut : Regresi Logistik Binary Logistic Regression: Y2 versus x1, x2 Link Function: Logit Response Information Variable Y2
Value 1 0 Total
Count 12 8 20
(Event)
Logistic Regression Table
Predictor Constant x1 x2
Coef 3.87448 -0.516801 0.396576
SE Coef 3.38365 0.357665 0.211489
Z 1.15 -1.44 1.88
P 0.252 0.148 0.061
anang kurnia :
[email protected]
Odds Ratio 0.60 1.49
95% CI Lower Upper 0.30 0.98
1.20 2.25
1. Pendahuluan Analisis Lebih Lanjut : Peubah Ganda • Menggambarkan suatu objek tidak cukup menggunakan satu peubah saja • Kasus pengamatan peubah ganda dijumpai di seluruh bidang terapan • Perlu analisis lebih “canggih” dibandingkan analisis pada peubah tunggal (univariate) • Peubah yang diamati tidak saling bebas (ada overlapping informasi antar peubah), sehingga diperlukan teknik-teknik penyusunan peubah baru seperti komponen utama dan peubah kanonik
anang kurnia :
[email protected]
1. Pendahuluan Analisis Lebih Lanjut : Peubah Ganda • • • • • • •
Manova Analisis Komponen Utama Analisis Faktor Analisis Cluster Analisis Diskriminan Analisis Korelasi Kanonik Analisis Biplot
Ilustrasi : Biplot
anang kurnia :
[email protected]
1. Pendahuluan Analisis Lebih Lanjut : Time Series • Data time series (deret waktu) merupakan data yang dikumpulkan secara sequensial menurut periode waktu tertentu. • Peranan ramalan (forecasting) data ke depan memegang peranan penting dalam menyusun kebijakan strategis perusahaan/lembaga • Metode Forecasting yang berkembang saat ini, antara lain: – Metode Rataan Kumulatif – Metode Pemulusan (Smoothing) – ARIMA (AutoRegressive Integrated Moving Average) – Fungsi Transfer (Bivariate ARIMA) – MARIMA (Multivariate ARIMA) anang kurnia :
[email protected]
1. Pendahuluan Analisis Lebih Lanjut : Time Series
Time Series Plot of x 1400 1200 1000
x
800 600
Winters' Method Plot for x
400
Additive Method
200
Variable Actual Smoothed
1400
0 1
5
10
15
20
25 Index
30
35
40
45
1200
Smoothing Constants Alpha (level) 0.2 Gamma (trend) 0.2 Delta (seasonal) 0.2
1000 800
x
Accuracy Measures MAPE 60 MAD 267 MSD 101122
600
Ilustrasi Metode Winter (Kasus data musiman)
400 200 0 1
5
10
15
anang kurnia :
[email protected]
20
25 Index
30
35
40
45
1. Pendahuluan Analisis Lebih Lanjut : Small Area Estimation perlu informasi yang lebih rinci, cepat, dan handal, tidak saja untuk lingkup superpopulasi tetapi pada lingkup yang lebih kecil
Pada level nasional, data tersedia baik melalui BPS “DESAIN SURVEY PADA LEVEL NASIONAL”
Masalah : tingkat akurasi dan presisi pendugaan langsung untuk Solusi Alternatif : area kecil akan rendah karena ukuran contoh sedikit atau bahkan Small Area Estimation (SAE) tidak terwakili dalam surveyanang kurnia :
[email protected]
1. Pendahuluan Analisis Lebih Lanjut : Small Area Estimation • Suatu metode untuk menduga parameter pada suatu area (sub-domain) yang relatif kecil dalam percontohan survey dengan memanfaatkan informasi dari luar area, dari dalam area itu sendiri dan dari luar survey.
• Menambah informasi pada data contoh tanpa menambah ukuran contoh. • => Generalized Linear Mixed Model anang kurnia :
[email protected]
Bersambung …….
anang kurnia :
[email protected]