Pertemuan 3 & 4 INTERPRETASI GEOMETRI DAN GENERALISASI VARIANS •
Interpretasi Geometri pada Sampel • Generalisasi varians
,
Interpretasi Geometri pada Sampel Sample Geometry and Random Sampling Data sampel (multivariat) observation
(multivariat) observation
dimana
Setiap baris dari matriks X merepresentasikan sebuah pengukuran multivariat
Perhatikan bahwa matriks data dua cara yang berbeda : 1.
dapat di plot dengan
Plot n buah titik dalam ruang p dimensi. Vektor baris merepresentasikan observasi ke j yang memuat koordinat sebuah titik
observasi (multivariate) ke j
Dalam hal ini vektor mean sampel
merupakan pusat titik keseimbangan data
2. Plot data X atas p buah vektor d dalam ruang n dimensi. Kolom-kolom matriks dipandang sebagi vektor-vektor dengan n komponen .
,
Interpretasi Geometri (i)
Ilustrasi 2.1 Data sampel Titik yang pertama
mempunyai koordinat
Titik yang kedua
mempunyai koordinat
Titik yang ketiga
mempunyai koordinat
Rata-rata
=
x2 5 4
Plot data untuk n=3 titik dalam p=2 dimensi
3 2 1 -2 -1
1 2
3
4 5
x1
Tampak bahwa mean sampsl merupakan titik kesetimbangan atau pusat gravitasi dari plot data
Interpretasi Geometri (ii)
Kolom-kolom data dipandang sebagai koordinatkoordinat vektor. Dari data sampel diperoleh vektor
5 3
dan
5 3
3
Plot data atas p=2 vektor dalam ruang dimensi n=3 4
,
Hubungan Interpretasi Geometri (i) dan (ii) Pertama-tama konstruksi vektor 1 berukuran (nx1) : Vektor
membentuk sudut yang sama besar terhadap sumbu-sumbu koordinat
sehingga vctor
mempunyai panjang 1 (uniter) pada arah sudut yang sama.
Misalkan vector unit vektor pada unit vektor
dimana mean sampel
maka proyeksi vector adalah
pada
Dari uraian tersebut, setiap vektor
, dapat dekomposisi sebagai berikut
dimana vektor Vektor deviasi atau men terkoreksi (mean corrected)
Dari contoh sebelumnya diketahui bahwa
dan
tegak lurus pada vektor diberikan oleh vektor
sehingga diperoleh
Selanjutnya hitung vektor-vektor deviasi
Tampak bahwa
tegak lurus pada
, karena
demikian pula
tegak lurus pada
, karena
Jadi dekomposisi vektor-vektor
adalah
dan
Plot dekomposisi vektor kedalam komponen mean dan vektor deviasi
0
Translasi vektor-vektor d ke titik asal 0
Z
Vektor
1
membentuk sudut yang sama besar terhadap sumbu-sumbu koordinat X, Y dan Z
0
1
Y Untuk n dimensi:
X
1 dan vektor
mempunyai panjang =1
Hasil yang diperoleh 1
2
Perkalian titik
sama dengan
Ini berarti matriks varians-covarian sampel dapat di peroleh melalui vektor-vektor deviasi 3
Koefisien korelasi sampel adalah coinus sudut apit antara vektor
dengan
*) tergantung dari pembagi n atau (n-1) untuk rumus varians dan kovarians
Rangkuman dari contoh soal
atau dimana
Matriks varians-covarian sampel dapat pula di peroleh melalui vektorvektor deviasi sebagai berikut
diperoleh atau Hubungan antara
dan
Unbiased sample variance-covariance Matrix
GENERALISASI VARIANS
Pandang matriks varians-covarians sampel dari p peubah
Martriks S ini mengandung p varians dan
kovarians yang berpotensi berbeda
Determinan dari matriks varians-covarians sampel S , merupakan ringkasan sebuah angka dari matriks tersebut dan dinamakan generalisasi varian sampel dan dinotasikan sebagai
untuk untuk
;
Luas jajaran genjang yang dibentuk oleh vektor-vektor deviasi dan adalah
tetapi
dan
maka
Juga
Jadi untuk
Atau secara aljabar , luas jajaran genjang yang dibentuk oleh vektor2
dan
dimana
Untuk
“Large” generalized sample variance, for p=3
“Small” generalized sample variance, for p=3
KASUS DIMANA GENERALIZED VARIANS BERNILAI NOL Generalized varians bernilai nol berarti paling sedikit satu baris dari matriks deviasi dapat di tulis sebagai kombinasi linier dari kolom-kolom yang lain. Secara geometris, hal ini berarti suatu vector deviasi , katakanlah terletak pada hyperplane yang dihasilkan oleh dimana
yang dapat diekspresikan atas kombinas linier dari kolom-kolom lainnya
Ilustrasi 2.2 Diberikan matriks data Tunjukan bahwa generalisasi varians = 0 , dan tentukan vektor deviasi yang tergenerasi
Solusi vektor mean adalah vektor vektor deviasi adalah
diperoleh
Tampak bahwa d3 merupakan kombinasi linier dari d1 dan d2 , yaitu Jadi d3 yang tereduksi, atau terletak pada bidang yang dibentuk oleh d1 dan d2. Akibatnya, volume benda yang terbentuk dalam ruang dimensi tiga adalah nol, yang disebabkan oleh , hal ini dapat diperiksa sebagai berikut :
Diperoleh matriks varians-covarians sampel dan
Matrik S ini juga dapat diperoleh dengan menggunakan rumus
Secara aljabar, dapat di periksa bahwa volume paralel epipedum yang dibentuk oleh vektor-vektor deviasi d1, d2 dan d3 adalah V =0, yaitu
Paralel epipedum Dalam hal ini d3 terletak pada bidang yang dibentuk d1 dan d2
Generalisasi Varians yang lainnya • Generalisasi varians sampel untuk variabel yang di standarisasi dihitunng melalui Hubungan antara dan diberikan oleh Vektor deviasi di, terkadang memiliki panjang bervariasi (sangat panjang / sangat pendek). Sehingga mempengaruhi perhitungan volume. Oleh karena itu sering diperlukan pemberian skala untuk semua vektor deviasi agar memiliki panjang yang sama. Penberian skala terhadap vektor-vektor deviasi, ekivalen dengan mengganti setiap observasi awal (origine) dengan nilai standar
Akibatnya, matriks varians-covarian sampel adalah matriks R mendekati nol akan membesar jika koefisien korelasi Nilai dari dan akan mengecil jika satu atau beberapa koefisien korelasi mendekati 1 atau -1 dimana sama dengan cosinus sudut apit antara vektor2 deviasi (terstandar) dan
• Generalisasi varians sampel yang di hitung melali total varians sampel
Total varian sampel
Ilustrasi 3 ,
Diperoleh
Jadi
Sedangkan total varians sampel adalah Total varian sampel
dan