DISCRIMINANT ANALYSIS
STATISTIK LANJUT MAGISTER PROFESI F.PSI.UI Liche Seniati 1
Discriminant Analysis Merupakan teknik parametrik yang digunakan untuk menentukan bobot dari prediktor yg paling baik untuk membedakan dua atau lebih kelompok kasus, yang tidak terjadi secara kebetulan (Cramer, 2004). DA dipakai untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan beberapa variabel. DA adalah metode untuk mencari dasar pengelompokan individu berdasarkan lebih dari 1 IV.
2
Discriminant Analysis Persamaan fungsi diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi individu ke dalam kelompok berdasarkan skor IV. DA juga merupakan salah satu bentuk Multiple Regression Analysis, dimana DV berupa kategori Jumlah fungsi diskriminan tergantung dari jumlah prediktor (IV) atau jumlah kelompok dikurang 1 (yang paling kecil) 3
Tahap-tahap Perhitungan Analisis Diskriminan 1. Menghitung Nilai Rata-rata IV pada setiap kelompok (deskriptif). 2. Menghitung Nilai Uji-F untuk melihat perbedaan skor IV (prediktor) pada setiap kelompok. 3. Menghitung Nilai Homogenitas Kovarians Dalam Kelompok (dengan Box’s M). 4. Mencari Eigenvalue untuk setiap Discriminant
Function => rasio yg dpt dijelaskan dgn fungsi. 4
Tahap-tahap Perhitungan Analisis Diskriminan 5. Mencari Nilai Canonical Discriminant Function Coefficients utk setiap fungsi => utk mendptkan bobot dari setiap IV. 6. Mencari Nilai Signifikansi dari Discriminant Function (Wilks’ lambda) => sign. fungsi 7. Menentukan klasifikasi (persentase kasus yang dapat diidentifikasi dengan benar)
5
Contoh Contoh (dalam Cramer, 2004): VB: skor anxious, restless, depressed, and hopeless VT: kelompok pasien (normal, cemas, depresi) Analisis diskriminan pada penelitian ini dilakukan untuk melihat prediktor yang paling baik untuk mengelompokkan pasien berdasarkan jenis gangguan Pada penelitian ini ada 3 kelompok pasien sehingga akan diperoleh dua fungsi diskriminan. 6
Output SPSS untuk Analisis Diskriminan Group Statistics KELP Normal
Cemas
Depresi
Total
ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS
Mean 2.20 2.40 2.00 2.00 4.00 3.60 2.20 2.60 2.60 2.60 4.20 3.80 2.93 2.87 2.80 2.80
Std. Deviation 1.30 .55 1.00 .71 .71 1.14 .84 .89 .89 1.14 .84 .84 1.22 1.06 1.32 1.08
Kesimpulan: • Kelompok Pasien Normal memiliki skor yang paling rendah dalam semua VB • Kelompok Pasien Cemas memiliki skor Anxious dan Restless yang paling tinggi • Kelompok Pasien Depresi memiliki skor Depressed dan Hopeless yang paling tinggi
7
Tests of Equality of Group Means
ANXIOUS RESTLESS DEPRESSE HOPELESS
Wilks' Lambda .573 .737 .393 .488
F 4.467 2.138 9.250 6.300
df1
df2 2 2 2 2
12 12 12 12
Sig. .035 .161 .004 .013
Kesimpulan: Ada perbedaan Skor VB yang signifikan pada setiap kelompok pasien.
8
Test Results Box's M 37.535 F Approx. .907 df1 20 df2 516.896 Sig. .578
Box's Test of Equality of Covariance Matrices
Tests null hypothesis of equal population covariance matrices.
Kesimpulan: F tidak signifikan berarti kovarians dalam setiap kelompok adalah homogen, sehingga perhitungan selanjutnya dapat dilakukan (asumsi terpenuhi)
9
Summary of Canonical Discriminant Functions Eigenvalues
Function 1 2
Eigenvalue 2.809a .820a
% of Variance 77.4 22.6
Cumulative % 77.4 100.0
Canonical Correlation .859 .671
a. First 2 canonical discriminant functions were used in the analysis.
Nilai Eigenvalue menunjukkan perbandingan varians antar kelompok dengan varians dalam kelompok. Semakin besar nilai Eigenvalue berarti semakin besar fungsi diskriminan (pengaruh masing-masing VB). Output di atas menunjukkan bahwa fungsi diskriminan pertama lebih besar daripada fungsi diskriminan kedua. Selain itu, terlihat bahwa fungsi diskriminan pertama menjelaskan 77,4% dari total varians VB dan 22,6% utk fungsi kedua. 10
Wilks' Lambda
Test of Function(s) 1 through 2 2
Wilks' Lambda .144 .549
Chi-square 20.330 6.289
df 8 3
Sig. .009 .098
Output ini menunjukkan signifikansi dari fungsi diskriminan (yang dilihat dari nilai Wilks’ Lambda dan χ2) Pada output di atas, fungsi diskriminan pertama dan kedua (secara bersama) adalah signifikan. Namun jika hanya fungsi diskriminan kedua yang diperhitungkan (dengan menghilangkan fungsi diskriminan pertama) maka fungsi kedua tidak signifikan.
11
Standardized Canonical Discriminant Function Coefficients Interpretasi:
Function ANXIOUS RESTLESS DEPRESSE HOPELESS
1 -,421 -,391 ,646 ,681
2 ,753 ,299 ,101 ,292
Structure Matrix Function DEPRESSE HOPELESS ANXIOUS RESTLESS
1 ,719* ,538* -,234 -,180
2 ,330 ,537 ,849* ,569*
*. Largest absolute correlation between each variable and any discriminant function
Tabel pertama dan tabel kedua menunjukkan bahwa depressed dan hopeless merupakan fungsi diskriminan pertama, sedangkan anxious dan restless merupakan fungsi diskriminan kedua. Secara lebih khusus, tabel kedua menunjukkan korelasi antara setiap variabel dengan setiap fungsi diskriminan. (menunjukkan variabel yg dpt menjadi diskriminan)
12
Canonical Discriminant Function Coefficient Function ANXIOUS RESTLESS DEPRESSE HOPELESS (Constant)
1 -,421 -,397 ,723 ,834 -1,986
2 ,753 ,304 ,113 ,358 -4,401
Unstandardized coefficients
Output ini digunakan untuk membuat persamaan fungsi diskriminan Fungsi diskriminan I = -1,986 + -0,421(anxious) + -0,397(restless) + 0,723(depressed) + 0,834(hopeless) Fungsi diskriminan II = -4,401 + 0,753(anxious) + 0,304(restless) + 0,113(depressed) + 0,358(hopeless) 13
Interpretasi Analisis diskriminan dilakukan untuk mengetahui apakah dari 4 prediktor, yaitu feeling anxious, restless, depressed, dan hopeless, dapat menentukan apakah individu akan didiagnosis normal, anxious, dan depressed. Dari dua fungsi diskriminan yang diperoleh, fungsi pertama memberikan sumbangan sebesar 77% terhadap varians DV, fungsi kedua menjelaskan 23% terhadap varians DV.
14
Latihan: Seorang peneliti ingin melihat apakah skor tes kemampuan verbal dan skor tes kemampuan numerik dapat membedakan seorang mahasiswa memiliki IPK tinggi atau rendah. Group Statistics
IPK Rendah Tinggi Total
VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK
Mean 67.067 65.917 84.250 82.333 75.658 74.125
Std. Deviation 12.8745 13.7110 10.6355 11.3184 14.5051 14.8823
Valid N (listwise) Unweighted Weighted 12 12.000 12 12.000 12 12.000 12 12.000 24 24.000 24 24.000
15
Tests of Equality of Group Means
VERBAL NUMERIK
Wilks' Lambda .634 .683
F 12.706 10.231
df1
df2 1 1
22 22
Sig. .002 .004
Kesimpulan: Berdasarkan Nilai Wilks’ Lambda, Nilai F, dan Signifikansi : Ada perbedaan Skor Tes Kemampuan Verbal dan Skor Tes Kemampuan Numerik yang signifikan antara kelompok dengan IPK Tinggi dan IPK Rendah
16
Pooled Within-Groups Matrices Covariance Correlation
VERBAL NUMERIK VERBAL NUMERIK
VERBAL 139.433 -6.502 1.000 -.044
a
NUMERIK -6.502 158.049 -.044 1.000
a. The covariance matrix has 22 degrees of freedom.
Kesimpulan: • Berdasarkan Covarince: matriks kovarians antara variabel verbal dan numerik berbeda untuk masing-masing perbandingan • Berdasarkan Correlation: tidak ada korelasi antara variabel verbal dan numerik (variabel bebas tidak saling berkorelasi)
17
Covariance Matricesa IPK Rendah Tinggi Total
VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK
VERBAL 165.753 15.292 113.114 -28.295 210.397 67.371
NUMERIK 15.292 187.992 -28.295 128.106 67.371 221.484
a. The total covariance matrix has 23 degrees of freedom.
Kesimpulan: • Hasil analisis matriks kovarians menunjukkan bahwa nilai kovarians cukup besar untuk masingmasing kelompok status dengan dua variabel diskriminan.
Test Results Box's M F Approx. df1 df2 Sig.
1.467 .441 3 87120.000 .724
Tests null hypothesis of equal population covariance matrices.
• Hasil Box’s M menunjukkan kovarians pada kedua kelompok adalah sama, sehingga memenuhi asumsi kovarians dalam analisis diskriminan 18
Variables Entered/Removeda,b,c,d Wilks' Lambda Exact F Step 1 2
Entered VERBAL NUMERIK
Statistic .634
df1
.478
df2 1
1
df3 22.000
2
1
22.000
Statistic 12.706 11.446
df1 1
df2 22.000
Sig. .002
2
21.000
.000
At each step, the variable that minimizes the overall Wilks' Lambda is entered. a. Maximum number of steps is 4. b. Minimum partial F to enter is 3.84. c. Maximum partial F to remove is 2.71. d. F level, tolerance, or VIN insufficient for further computation.
Kesimpulan: • Hasil Analisis Diskriminan dengan Metode Stepwise, Nilai Statistik F dan Signifikansinya menunjukkan bahwa Skor Rata-rata Tes Kemampuan Verbal maupun Skor Tes Kemampuan Numerik adalah berbeda pada kelompok IPK Tinggi dan kelompok IPK Rendah.
19
Variables in the Analysis
Step 1 2
VERBAL VERBAL NUMERIK
Tolerance 1.000 .998 .998
Wilks' Lambda
F to Remove 12.706 8.959 6.823
.683 .634
Variables Not in the Analysis Step 0 1
VERBAL NUMERIK NUMERIK
Tolerance 1.000 1.000 .998
Min. Tolerance 1.000 1.000 .998
F to Enter 12.706 10.231 6.823
Wilks' Lambda .634 .683 .478
Wilks' Lambda
Step 1 2
Number of Variables 1 2
Exact F Lambda .634 .478
df1
df2 1 2
df3 1 1
22 22
Statistic 12.706 11.446
df1 1 2
df2 22.000 21.000
Sig. 1.733E-03 4.348E-04
20
Summary of Canonical Discriminant Functions Eigenvalues Function 1
Eigenvalue 1.090a
% of Variance 100.0
Canonical Correlation .722
Cumulative % 100.0
a. First 1 canonical discriminant functions were used in the analysis.
Wilks' Lambda
Test of Function(s) 1
Wilks' Lambda .478
Chi-square 15.481
df 2
Sig. .000
Kesimpulan: Dari Tabel Wilks’ Lambda terlihat bahwa skor tes kemampuan verbal dan skor tes kemampuan numerik pada kedua kelompok (IPK tinggi dan rendah) adalah berbeda secara signifikan. Dari Tabel Eigenvalues dan Wilks’ Lambda Fungsi Diskriminan Kanonikal terlihat bahwa variabel diskriminator (tes verbal dan tes numerikal) memiliki hubungan yang erat dengan IPK. 21