DISCRIMINANT ANALYSIS

DISCRIMINANT ANALYSIS

STATISTIK LANJUT MAGISTER PROFESI F.PSI.UI Liche Seniati 1

Discriminant Analysis Merupakan teknik parametrik yang digunakan untuk menentukan bobot dari prediktor yg paling baik untuk membedakan dua atau lebih kelompok kasus, yang tidak terjadi secara kebetulan (Cramer, 2004). DA dipakai untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan beberapa variabel. DA adalah metode untuk mencari dasar pengelompokan individu berdasarkan lebih dari 1 IV.

2

Discriminant Analysis Persamaan fungsi diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi individu ke dalam kelompok berdasarkan skor IV. DA juga merupakan salah satu bentuk Multiple Regression Analysis, dimana DV berupa kategori Jumlah fungsi diskriminan tergantung dari jumlah prediktor (IV) atau jumlah kelompok dikurang 1 (yang paling kecil) 3

Tahap-tahap Perhitungan Analisis Diskriminan 1. Menghitung Nilai Rata-rata IV pada setiap kelompok (deskriptif). 2. Menghitung Nilai Uji-F untuk melihat perbedaan skor IV (prediktor) pada setiap kelompok. 3. Menghitung Nilai Homogenitas Kovarians Dalam Kelompok (dengan Box’s M). 4. Mencari Eigenvalue untuk setiap Discriminant

Function => rasio yg dpt dijelaskan dgn fungsi. 4

Tahap-tahap Perhitungan Analisis Diskriminan 5. Mencari Nilai Canonical Discriminant Function Coefficients utk setiap fungsi => utk mendptkan bobot dari setiap IV. 6. Mencari Nilai Signifikansi dari Discriminant Function (Wilks’ lambda) => sign. fungsi 7. Menentukan klasifikasi (persentase kasus yang dapat diidentifikasi dengan benar)

5

Contoh Contoh (dalam Cramer, 2004): VB: skor anxious, restless, depressed, and hopeless VT: kelompok pasien (normal, cemas, depresi) Analisis diskriminan pada penelitian ini dilakukan untuk melihat prediktor yang paling baik untuk mengelompokkan pasien berdasarkan jenis gangguan Pada penelitian ini ada 3 kelompok pasien sehingga akan diperoleh dua fungsi diskriminan. 6

Output SPSS untuk Analisis Diskriminan Group Statistics KELP Normal

Cemas

Depresi

Total

ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS

Mean 2.20 2.40 2.00 2.00 4.00 3.60 2.20 2.60 2.60 2.60 4.20 3.80 2.93 2.87 2.80 2.80

Std. Deviation 1.30 .55 1.00 .71 .71 1.14 .84 .89 .89 1.14 .84 .84 1.22 1.06 1.32 1.08

Kesimpulan: • Kelompok Pasien Normal memiliki skor yang paling rendah dalam semua VB • Kelompok Pasien Cemas memiliki skor Anxious dan Restless yang paling tinggi • Kelompok Pasien Depresi memiliki skor Depressed dan Hopeless yang paling tinggi

7

Tests of Equality of Group Means

ANXIOUS RESTLESS DEPRESSE HOPELESS

Wilks' Lambda .573 .737 .393 .488

F 4.467 2.138 9.250 6.300

df1

df2 2 2 2 2

12 12 12 12

Sig. .035 .161 .004 .013

Kesimpulan: Ada perbedaan Skor VB yang signifikan pada setiap kelompok pasien.

8

Test Results Box's M 37.535 F Approx. .907 df1 20 df2 516.896 Sig. .578

Box's Test of Equality of Covariance Matrices

Tests null hypothesis of equal population covariance matrices.

Kesimpulan: F tidak signifikan berarti kovarians dalam setiap kelompok adalah homogen, sehingga perhitungan selanjutnya dapat dilakukan (asumsi terpenuhi)

9

Summary of Canonical Discriminant Functions Eigenvalues

Function 1 2

Eigenvalue 2.809a .820a

% of Variance 77.4 22.6

Cumulative % 77.4 100.0

Canonical Correlation .859 .671

a. First 2 canonical discriminant functions were used in the analysis.

Nilai Eigenvalue menunjukkan perbandingan varians antar kelompok dengan varians dalam kelompok. Semakin besar nilai Eigenvalue berarti semakin besar fungsi diskriminan (pengaruh masing-masing VB). Output di atas menunjukkan bahwa fungsi diskriminan pertama lebih besar daripada fungsi diskriminan kedua. Selain itu, terlihat bahwa fungsi diskriminan pertama menjelaskan 77,4% dari total varians VB dan 22,6% utk fungsi kedua. 10

Wilks' Lambda

Test of Function(s) 1 through 2 2

Wilks' Lambda .144 .549

Chi-square 20.330 6.289

df 8 3

Sig. .009 .098

Output ini menunjukkan signifikansi dari fungsi diskriminan (yang dilihat dari nilai Wilks’ Lambda dan χ2) Pada output di atas, fungsi diskriminan pertama dan kedua (secara bersama) adalah signifikan. Namun jika hanya fungsi diskriminan kedua yang diperhitungkan (dengan menghilangkan fungsi diskriminan pertama) maka fungsi kedua tidak signifikan.

11

Standardized Canonical Discriminant Function Coefficients Interpretasi:

Function ANXIOUS RESTLESS DEPRESSE HOPELESS

1 -,421 -,391 ,646 ,681

2 ,753 ,299 ,101 ,292

Structure Matrix Function DEPRESSE HOPELESS ANXIOUS RESTLESS

1 ,719* ,538* -,234 -,180

2 ,330 ,537 ,849* ,569*

*. Largest absolute correlation between each variable and any discriminant function

Tabel pertama dan tabel kedua menunjukkan bahwa depressed dan hopeless merupakan fungsi diskriminan pertama, sedangkan anxious dan restless merupakan fungsi diskriminan kedua. Secara lebih khusus, tabel kedua menunjukkan korelasi antara setiap variabel dengan setiap fungsi diskriminan. (menunjukkan variabel yg dpt menjadi diskriminan)

12

Canonical Discriminant Function Coefficient Function ANXIOUS RESTLESS DEPRESSE HOPELESS (Constant)

1 -,421 -,397 ,723 ,834 -1,986

2 ,753 ,304 ,113 ,358 -4,401

Unstandardized coefficients

Output ini digunakan untuk membuat persamaan fungsi diskriminan Fungsi diskriminan I = -1,986 + -0,421(anxious) + -0,397(restless) + 0,723(depressed) + 0,834(hopeless) Fungsi diskriminan II = -4,401 + 0,753(anxious) + 0,304(restless) + 0,113(depressed) + 0,358(hopeless) 13

Interpretasi Analisis diskriminan dilakukan untuk mengetahui apakah dari 4 prediktor, yaitu feeling anxious, restless, depressed, dan hopeless, dapat menentukan apakah individu akan didiagnosis normal, anxious, dan depressed. Dari dua fungsi diskriminan yang diperoleh, fungsi pertama memberikan sumbangan sebesar 77% terhadap varians DV, fungsi kedua menjelaskan 23% terhadap varians DV.

14

Latihan: Seorang peneliti ingin melihat apakah skor tes kemampuan verbal dan skor tes kemampuan numerik dapat membedakan seorang mahasiswa memiliki IPK tinggi atau rendah. Group Statistics

IPK Rendah Tinggi Total

VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK

Mean 67.067 65.917 84.250 82.333 75.658 74.125

Std. Deviation 12.8745 13.7110 10.6355 11.3184 14.5051 14.8823

Valid N (listwise) Unweighted Weighted 12 12.000 12 12.000 12 12.000 12 12.000 24 24.000 24 24.000

15

Tests of Equality of Group Means

VERBAL NUMERIK

Wilks' Lambda .634 .683

F 12.706 10.231

df1

df2 1 1

22 22

Sig. .002 .004

Kesimpulan: Berdasarkan Nilai Wilks’ Lambda, Nilai F, dan Signifikansi : Ada perbedaan Skor Tes Kemampuan Verbal dan Skor Tes Kemampuan Numerik yang signifikan antara kelompok dengan IPK Tinggi dan IPK Rendah

16

Pooled Within-Groups Matrices Covariance Correlation

VERBAL NUMERIK VERBAL NUMERIK

VERBAL 139.433 -6.502 1.000 -.044

a

NUMERIK -6.502 158.049 -.044 1.000

a. The covariance matrix has 22 degrees of freedom.

Kesimpulan: • Berdasarkan Covarince: matriks kovarians antara variabel verbal dan numerik berbeda untuk masing-masing perbandingan • Berdasarkan Correlation: tidak ada korelasi antara variabel verbal dan numerik (variabel bebas tidak saling berkorelasi)

17

Covariance Matricesa IPK Rendah Tinggi Total

VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK

VERBAL 165.753 15.292 113.114 -28.295 210.397 67.371

NUMERIK 15.292 187.992 -28.295 128.106 67.371 221.484

a. The total covariance matrix has 23 degrees of freedom.

Kesimpulan: • Hasil analisis matriks kovarians menunjukkan bahwa nilai kovarians cukup besar untuk masingmasing kelompok status dengan dua variabel diskriminan.

Test Results Box's M F Approx. df1 df2 Sig.

1.467 .441 3 87120.000 .724

Tests null hypothesis of equal population covariance matrices.

• Hasil Box’s M menunjukkan kovarians pada kedua kelompok adalah sama, sehingga memenuhi asumsi kovarians dalam analisis diskriminan 18

Variables Entered/Removeda,b,c,d Wilks' Lambda Exact F Step 1 2

Entered VERBAL NUMERIK

Statistic .634

df1

.478

df2 1

1

df3 22.000

2

1

22.000

Statistic 12.706 11.446

df1 1

df2 22.000

Sig. .002

2

21.000

.000

At each step, the variable that minimizes the overall Wilks' Lambda is entered. a. Maximum number of steps is 4. b. Minimum partial F to enter is 3.84. c. Maximum partial F to remove is 2.71. d. F level, tolerance, or VIN insufficient for further computation.

Kesimpulan: • Hasil Analisis Diskriminan dengan Metode Stepwise, Nilai Statistik F dan Signifikansinya menunjukkan bahwa Skor Rata-rata Tes Kemampuan Verbal maupun Skor Tes Kemampuan Numerik adalah berbeda pada kelompok IPK Tinggi dan kelompok IPK Rendah.

19

Variables in the Analysis

Step 1 2

VERBAL VERBAL NUMERIK

Tolerance 1.000 .998 .998

Wilks' Lambda

F to Remove 12.706 8.959 6.823

.683 .634

Variables Not in the Analysis Step 0 1

VERBAL NUMERIK NUMERIK

Tolerance 1.000 1.000 .998

Min. Tolerance 1.000 1.000 .998

F to Enter 12.706 10.231 6.823

Wilks' Lambda .634 .683 .478

Wilks' Lambda

Step 1 2

Number of Variables 1 2

Exact F Lambda .634 .478

df1

df2 1 2

df3 1 1

22 22

Statistic 12.706 11.446

df1 1 2

df2 22.000 21.000

Sig. 1.733E-03 4.348E-04

20

Summary of Canonical Discriminant Functions Eigenvalues Function 1

Eigenvalue 1.090a

% of Variance 100.0

Canonical Correlation .722

Cumulative % 100.0

a. First 1 canonical discriminant functions were used in the analysis.

Wilks' Lambda

Test of Function(s) 1

Wilks' Lambda .478

Chi-square 15.481

df 2

Sig. .000

Kesimpulan: Dari Tabel Wilks’ Lambda terlihat bahwa skor tes kemampuan verbal dan skor tes kemampuan numerik pada kedua kelompok (IPK tinggi dan rendah) adalah berbeda secara signifikan. Dari Tabel Eigenvalues dan Wilks’ Lambda Fungsi Diskriminan Kanonikal terlihat bahwa variabel diskriminator (tes verbal dan tes numerikal) memiliki hubungan yang erat dengan IPK. 21

DISCRIMINANT ANALYSIS

Recommend Documents