Selamat Datang .. Dalam zona
ANALISIS PEUBAH GANDA 334H1203 (oleh M. Saleh AF)
DEPARTEMEN MATEMATIKA PRODI STATISTIKA FMIPA UNHAS
2014
Deskripsi Matakuliah APG :
Konsep dasar analisis multivariate, vektor, matriks, Partisi matriks dekomposisi, Jarak statistic, distribusi multinormal, pendugaan vektor mean dan matriks varian-kovarians, probabilitas Kontur, Interval kepercayaan, uji hipotesis vektor mean satu dan beberapa populasi, Manova, Manacova,Regresi ganda multivariat , Analisis Komponen Utama, Analisis Faktor, Analisis Profil, Analisis Diskriinan , Analisis Kluster dan interpretasi geometrik.
POKOK-POKOK BAHASAN APG 1. Aspek-aspek & konsep Dasar pada Analisis Multivariat 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
1. 2.
Aljabar Matriks & Vektor random Geometri sampel, Sampling random & Generalisasi varians Distribusi Normal Multivariat Inverensi tentang vektor mean Perbandingan mean multivariat dan Analisis Profil Model regresi linier multivariat Analisis faktor dan inferensi untuk struktur matriks Covarians Analisis Korelasi Kanonik Analisis Diskriminan dan Klasifikasi Analisis Kluster dan Metode Jarak Statistik
Referensi
Morison DF, 1976, Multivariat Statistical Method, McGraw-Hall Inc, Tokyo Richard and Johnson, 2002, Applied Multivariat Statistical Analysis, Prentice Hall, Inc. USA
POKOK DAN SUB POKOK BAHASAN APG No 1
2
POKOK BAHASAN
SUB POKO BAHASAN
Aspek & Konsep Dasar pada Analisis Multivariat
1.1 1.2 1.3 1.4
Pendahuluan : Aplikasi dari teknik-teknik multivariat Pengorganisasian data (array, deskripsi statistik & teknik2 grafik/plot Jarak Euklit dan Jarak Statistik Contoh soal dan soal latihan
Aljabar matriks dan vektor random
2.1 2.2 2.3 2.4 2.5
Vektor & matriks, nilai eigen, vektor eigen, vektor uniter, ortogonalitas Vektor random, Matriks random, matriks definit positif dan matriks akar kuadrat Dekomposisi spektral dan dekomposisi nilai singular Partisi matriks varians-covarians dan vektor mean Vektor mean & matriks covarians untuk kombinasi linier var.random Contoh soal dan soal-soal latihan
3
Geometri Sampel, Sampling random dan Generalisasi varians
3.1 3.2 3.3 3.4 3.5
Geometri dari sampel & Generalisasi Varians Sampel random dan Nilai Ekspektasi pada mean sampel dan Covarians Mean Sampel, Covarians dan Korelasi Nilai sampel pada kombinasi linier dari variabel-variabel random Contoh dan Soal-soal latihan
4
Distribusi normal multivariat
4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8
Distribusi Normal Multivariat dan sifat-sifatnya Densitas Normal Multivariat dan sifat-sifatnya Fungsi Pembangkit Momen & Probabilitas Kontur Likelihood Normal Multivariat dan Penaksiran Maksimum Likelihood Distribusi sampling untuk dan S dan sifat2 Distribusi Wishart Mendeteksi Data Pencilan dan Pembersihan Data Transformasi untuk mendekati Normalitas Contoh dan Soal-soal Latihan
5
Inferensi tentang vektor random
5.1 5.2 5.3
Penentuan Nilai awal vektor Mean pada populasi normal Statistik Hostelling’s dan Uji Perbandingan Likelihood Diagram Kontrol Kualitas pada multivariate (Diagram monitoring Statbilitas, Control Region, Control Ellips, ) Contoh dan Soal-soal latihan
5.4
No
POKOK BAHASAN
SUB POKO BAHASAN
Perbandingan mean multivariat dan Analisis Profil
6.1 6.2 6.3 6.4 6.5
Uji Hipotesis vektor-vektor mean dua populasi (kecil dan kasus ) Uji Hipotesis vektor-vektor mean pada beberapa populasi multivariate (Oneway Manova; and Two-way Manova) Analisis Profil (Uji kesejajaran, keberhimpitan dan kesamaan) Model-model Multivariat Contoh soal dan Soal-soal latihan
7
Model regresi linier multivariat
7.1 7.2 7.3 7.4 7.5 7.6
Model Regresi Klasik dan Pendugaan Least squares Inferensi tentang Model Regresi dan penaksiran fungsi regresi Regresi Ganda Multivariat (Multivariat multiple Regression) Uji Perbandingan Likelihood untuk parameter regresi Penaksiran dengan regresi ganda multivariate Contoh soal dan Soal-soal latihan
8
Analisis faktor dan inferensi untuk struktur matriks Covarians
8.1 8.2 8.3 8.4 8.5
Model Faktor Ortogonal Metode Estimasi (Metode Komponen Utama , Faktor Utama, dan Maksimum Likelihood) Rotasi Faktor dan Factor Scores (Metode WLS dan metode Regresi) SEM (Structural Equation Models) Contoh soal dan soal-soal Latihan
9
Analisis Korelasi Kanonik
9.1 9.2 9.3 9.4
Variat Kanonik dan Korelasi Kanonik Interpretasi variabel kanonik populasi, dan korelasi kanonik Variat kanonik dan corelasi kanonik pada sampel Contoh soal dan Soal-soal latihan
10
Analisis Diskriminan dan Klasifikasi
10.1 10.2 10.3 10.4 10.5
Pemisahan dan Klasifikasi untuk dua populasi Klasifikasi untuk dua populasi normal multivariate (kasus ) Fungsi Diskriminan Fisher’s Metode Fisher’s untuk diskriminasi /Pemisahan objek-objek Contoh soal dan soal-soal Latihan
11
Analisi Kluster & Metode Jarak
11.1 11.2 11.3
Keseragaman ukuran Metode Kluster berhirarki dan Non-hirarki Penskalaan Multidimensi dan Analisis Korespondensi
6
Keterampilan kerja khusus
Penguasaan pengetahuan
Sikap
Keterampilan kerja umum
Deskripsi Capaian Pembelajaran dalam SNPT 2014
KEMAMPUAN KERJA khusus PRODI STATISTIKA (level 6) Mampu melakukan perancangan percobaan, pengumpulan dan pembangkitan data (dalam bentuk survei, percobaan, atau simulasi), pengorganisasian data, analisis data menggunakan teknik-teknik statistika, dan penarikan kesimpulan secara sahih, dengan memanfaatkan minimal satu perangkat lunak statistika. Mampu menyelesaikan masalah penaksiran (estimation), pengujian hipotesis, prediksi dan prakiraan (forecasting) pada beberapa bidang, dengan menggunakan data dan beberapa metodologi statistika (metode dan model) dan menyajikannya dalam bentuk deskripsi yang mudah dipahami oleh pengguna. Mampu melakukan analisis terhadap beberapa alternatif solusi yang tersedia di bidang statistika untuk menyelesaikan masalah dan mampu menyajikan kesimpulan analisis untuk pengambilan keputusan yang tepat, (Draf SNPT 2014)
PENGUASAAN PENGETAHUAN PRODI STATISTIKA (level 6) Menguasai konsep teori peluang dan statistika, matematika, kalkulus, aljabar linear elementer, metode-metode analisis statistika, dan pemograman komputer elementer. Menguasai beberapa metodologi (metode dan model) statistika untuk digunakan dalam menyelesaikan masalah di beberapa bidang. Menguasai minimal dua perangkat lunak statistika, termasuk perangkat lunak yang berbasis open source ,(SNPT 2014)
Ketrampilan kerja Umum Lulusan SARJANA SNPT (LEVEL 6) 1.Mampu menerapkan pemikiran logis, kritis, sistematis, dan inovatif dalam konteks pengembangan atau implementasi ilmu pengetahuan dan teknologi yang memperhatikan dan menerapkan nilai humaniora yang sesuai dengan bidang keahliannya; 2.Mampu menunjukkan kinerja mandiri, bermutu, dan terukur; 3.Mampu mengkaji implikasi pengembangan atau implementasi ilmu pengetahuan dan teknologi yang memperhatikan dan menerapkan nilai humaniora sesuai dengan keahliannya berdasarkan kaidah, tata cara dan etika ilmiah dalam rangka menghasilkan solusi, gagasan, desain atau kritik seni; 4.Mampu menyusun deskripsi saintifik hasil kajian tersebut di atas dalam bentuk skripsi atau laporan tugas akhir, dan mengunggahnya dalam laman perguruan tinggi; 5.Mampu mengambil keputusan secara tepat dalam konteks penyelesaian masalah di bidang keahliannya, berdasarkan hasil analisis informasi dan data; 6.Mampu memelihara dan mengembangkan jaringan kerja dengan pembimbing, kolega, sejawat baik di dalam maupun di luar lembaganya. 7.Mampu bertanggung jawab atas pencapaian hasil kerja kelompok dan melakukan supervisi serta evaluasi terhadap penyelesaian pekerjaan yang ditugaskan kepada pekerja yang berada di bawah tanggung jawabnya; 8.Mampu melakukan proses evaluasi diri terhadap kelompok kerja yang berada di bawah tanggung jawabnya, dan mampu mengelola pembelajaran secara mandiri; 9.Mampu mendokumentasikan, menyimpan, mengamankan, dan menemukan kembali data untuk menjamin kesahihan dan mencegah plagiasi; (Tim Belmawa DIKTI 2014)
RUMUSAN CAPAIAN PEMBELAJARAN PRODI STATISTIKA (Learning Outcome) Parameter Kemampuan kerja
Deskripsi Capaian Pembelajaran KK1
Khusus
menyusun
dan
atau
memilih
rancangan
pengumpulan/
pembangkitan data yang efisien dan menerapkannya dalam bentuk survei,
(Kemampuan bidang Kerja)
Mampu
percobaan, atau simulasi. KK2
Mampu melakukan manajemen dan analisis data menggunakan teknikteknik statistika dengan bantuan perangkat lunak. (+ interpretasi)
KK3
Mampu menyelesaikan permasalahan nyata secara statistika dan mampu menyajikan serta mengkomunikasikan dalam bentuk yang mudah dipahami baik secara tertulis maupun lisan. (analisys & reporting data)
Penguasaan
PP1
Pengetahuan
Menguasai konsep dasar keilmuan statistika dan metode-metode analisis statistika yang dapat diaplikasikan pada berbagai bidang terapan.
PP2
Menguasai minimal dua perangkat lunak statistika, termasuk perangkat lunak yang berbasis open source
Kemampuan
KM1
Managerial
Mampu
bekerjasama
dan
berkomunikasi
bertanggungjawab terhadap pekerjaan.
(Sikap dan
KM2
Memiliki etika profesi dalam penerapan statistika.
Kemampuan Kerja
KM3
Bertakwa Kepada Tuhan Yang Maha Esa
Umum) Sumber : FORSTAT , YOGYA, DESEMBER 2013
dalam
tim
serta
PERTEMUAN 1 Kontrak Pembelajaran 1. Aspek & Struktur Data Multivariat • • • •
Aspek dan Konsep Dasar pada Analisis Multivariat Struktur Data Multivariat Array pada basik Deskriptif Statistik Teknik grafik dan plot data Multivariat
Struktur data multivariate Sebuah observasi multivariat adalah koleksi pengukuran pada p variabel yang berbeda dalam suatu trial/item yang sama Jika pada tiap-tiap variabel (1,2...p ), dilakukan masing-masing sebanyak n kali pengukuran maka entri data dapat dinyatakan dalam bentuk sebuah matriks berukuran n x p , sebagai berikut varb 1
varb 2
varb k
varb p
item 1 item 2
item j
item n atau dapat dinyatakan dalam benrtuk data array persegi panjang, katakanlah X yang terdiri dari n baris dan p kolom, yaitu
...... (1)
: nilai pengukuran/trial ke j pada variabel ke k
Setiap baris dari X merupakan sebuah observasi/pengukuran multivariat, sehingga diperoleh sebuah sampel berukuran n dari populasi p variat. Dengan kata lain, sampel merupakan n pengukuran pada tiap-tiap komponen variabel.
Deskripsi Statistik Untuk suatu data diperlukan ringkasan angka yang disebut statistik deskriptip • Mean (rata-rata) adalah statistik deskriptip yang merupakan salah satu ukuran pusat dari suatu himpunan data • Variansi adalah statistik deskriptip yang merupakan salah satu ukuran penyebaran data • Koefisien korelasi adalah statistik deskriptip yang merupakan ukuran keeratan hubungan linier antara dua (atau lebih) variabel . Keofisien korelasi tidak tergantung pada satuan (unit) pengukuran
Array of basic Descriptive Statistics Vektor mean sampel dengan
Matriks varians-covarians sampel dengan
Matriks korelasi sampel dengan
Ilustrasi 1 Dari empat mahasiswa pembeli pada sebuah toko buku dicatat total pembelian masingmasing mahasiswa (dalam puluhan ribu rupiah) beserta jumlah buku yang di beli. Tentukan a. Deskripsi statistik data ( ) untuk data bivariat b. Plot data X atas 4 buah titik dalam ruang dua dimensi dan tentukan pusat data
Solusi
Misalkan variabel 1 adalah total pembelian dan varibel 2 adalah jumlah buku yang dibeli. Jadi terdapat empat pengukuran pada dua variabel. Dalam bentuk tabel data (data array) dapat disajikan dalam bentuk matriks data sebagai berikut Variabel 1 : (total penjualan dlm puluhan ribu Rp ) : 42 Variabel 2 : (jumlah buku yang terjual )
: 4
52
48
58
5
4
3
Dalam hal ini
Atau data di tuliskan dalam bentuk matriks sebagai (data bivariat)
a. Jadi vektor mean sampel adalah
Jadi matriks varian-covarians sampel adalah (untuk pembagi n-1) adalah
, , ,
Jadi matriks korelasi sampel adalah
Varians dan covarians sampel (dengan pembagi n)
dengan
Untuk matriks
X2
b. 5 (50,4)
4 3 2 1 O
X1 10
20
30
40
50
60
Plot Data Plot dari observasi sebenarnya penting dan dapat membantu analisis data. Plot untuk semua pengukuran pada semua variabel tidak mungkin dilakukan, (khususnya jika dimensnya lebih besar tiga) walaupun demikian plot pantul individual variabel dan pasangan variabel masih banyak memberi informasi. Ilustrasi 2 Misalkan diberikan 7 pasang pengukurn pada dua variabel sebagai berikut :
Dia gram titik
x2
Variabel 1 : x1
3
4
2
6
8
2
5
Variabel 2 : x2
5
5.5
4
7
10
5
7.5
10
10
Koordinat titik-titik adalah :
8
8
(3,5) ; (4,5.5); (2,4) ; (6,7) ; (8,10) ; (2,5) ; (5,7.5)
6
6
4
4
2
2
Plot data dalam dua dimensi ini disebut scatter plot (diagram pencar)
Diagram pencar
x1 2
4
6
8
10
2
4
6
8
10
Diagram titik
Gbr-3: Diagram pencar dan diagram titik
JARAK STATISTIK
Jarak euclid Jarak euclid secara umum untuk dua titik
Jarak euclid (jarak garis lurus) antara titik
dan
ke titik asal
Jarak statistik Jarak statistik antara titik
dimana
dan
Perbandingan jarak euclid dan jarak statistik terletak pada pembobot dan
pada
dan
Jarak euclidien ini umumnya tidak cocok digunakan untuk statistik. Hal ini disebabkan oleh pada jarak euclid, setiap koordinat mempunyai konstribusi sama untuk perhitungan jarak. Bila koordinat merupakan pengukuran yang mempunyai fluktuasi random dari magnitude berbeda, dibutuhkan memberikan bobot pada tiap-tiap koordinat dengan bobot besar untuk variabilitas kecil dan sebaliknya Hal ini akan memberikan ukuran jarak yang berbeda dengan jarak euclidian. Jarak yang digunakan dalam statistik diberi nama “jarak statistik”. dan yang saling bebas (independen) seperti pada gambar berikut
Sebagai ilustrasi, diambil n titik pada dua variabel
Dari diagram pencar tersebut , tampak bahwa variansi lebih besar dari variansi Salah satu cara untuk memberikan bobot adalah dengan menggunakan standar deviasi sampel. Membagi koordinat dengan standar deviasinya, didapat standarisasi koordinat,
dan
x2
x1
Perluasan jarak statistik untuk p variabel antara titik dan
adalah
1. Jarak P ke O , 2. Bila
maka
Jarak Euclidian = Jarak statistik
Catatan Untuk dua variabel yang tidak independen (misalnya korelasinya positif) seperti tampak pada diagram pencar berikut, maka jarak statistik harus di modifikasi (rotasi) sebesar sudut
dimana
, dengan matriks transformasi rotasi :
Sehingga didapat sumbu-sumbu koordinat baru (lihat gambar) x2
x1
Dengan sumbu baru ini, jarak statistik dari
Dengan perhitungan secara aljabar diperoleh
dimana
ke titik asal O(0,0) adalah
Secara umum jarak
terhadap titik tetap
bila kedua variabel berkorelasi adalah
x2
x1
Terima kasih..Merci