SELEKSI PEUBAH DENGAN ANALISIS KOMPONEN UTAMA DAN PROCRUSTES
ACHMAD MUSLIM
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2011
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa tesis berjudul Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2011
Achmad Muslim NIM G551090121
ABSTRACT
ACHMAD MUSLIM. Variable Selection Using Principal Component and Procrustes Analysis. Supervised by SISWADI and TONI BAKHTIAR.
Principal component analysis (PCA) is a dimension-reducing tool that replaces the variables in a multivariate dataset by a smaller number of derived variables. Dimension reduction is often undertaken to help in interpreting the data set but, as each principal component usually involves all the original variables, interpretation of a PCA can still be difficult. One way to overcome this difficulty is to select a subset of the original variables and use this subset to approximate the data. Procrustes analysis as a measure of similarity, is used to measure the efficiencies of the alternative variable selection methods in extracting representative variables Because of its unavailability in statistical software, a package program, using Mathematica 8.0, is composed for variable selection. There are four variable selection methods, based on PCA and procrustes analysis, which have been described and examined along with different criteria levels for deciding on the number of variables to retain in the analysis. The methods are B2, B4, procrustes analysis in the principal component score, and procrustes analysis method. The result show that variable selection programs B2 as the best variable selection method followed by procrustes analysis method. Moreover, it is found that all of the methods considered give the measure of efficiency of more than 99.04%.
Keywords: variable selection, principal component analysis, procrustes analysis
RINGKASAN ACHMAD MUSLIM. Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes. Dibimbing oleh SISWADI dan TONI BAKHTIAR.
Pada umumnya penelitian-penelitian yang berkaitan dengan dunia nyata melibatkan banyak peubah. Setiap peubah diukur secara individual untuk menelusuri pengaruh antarpeubah. Masalah yang kemudian dihadapi adalah kesulitan untuk menginterpretasikan himpunan data yang besar. Oleh karena itu diperlukan sebuah metode untuk mengidentifikasi peubahpeubah yang dipandang memiliki kontribusi yang besar pada variasi data sebelum dilakukan analisis hasil penelitian. Pendekatan yang dapat dilakukan adalah mengurangi peubah-peubah yang mungkin tidak memiliki kaitan dengan masalah yang ingin diteliti ataupun dengan mengurangi peubah-peubah yang memberikan kontribusi informasi yang sedikit pada variasi data dengan seleksi peubah. Analisis komponen utama merupakan salah satu teknik analisis peubah ganda yang berkaitan dengan penjelasan struktur varians-kovarians peubah dengan cara mentransformasi peubah-peubah awal menjadi peubah-peubah baru yang tidak saling berkorelasi dengan tujuan mereduksi dimensi matriks data sehingga lebih mudah dalam menginterpretasi hasil yang diperoleh. Peubahpeubah baru yang terbentuk disebut komponen utama (principal components). Analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik melalui serangkaian transformasi linear (Bakhtiar & Siswadi 2011). Untuk melihat kesamaan bentuk dan ukuran dari dua konfigurasi maka salah satu konfigurasi dibuat tetap sementara konfigurasi yang lainnya ditransformasi sehingga sesuai dengan konfigurasi pertama. Data penelitian yang digunakan adalah data yang diperoleh dari Direktorat Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor (TPB IPB), yang terdiri atas data nilai mutu 14 mata kuliah yang diikuti 3223 mahasiswa TPB IPB tahun akademik 2008/2009 dan 3053 mahasiswa pada tahun akademik 2009/2010 baik pada semester ganjil maupun semester genap. Peubah yang digunakan dalam penelitian ini merupakan mata kuliah di TPB IPB yang terdiri dari Agama (AG), Bahasa Indonesia (ID), Bahasa Inggris (IG), Biologi (BI), Ekonomi Umum (EU), Fisika (FI), Kalkulus (KA), Kimia (KI), Olahraga dan Seni (OS), Pendidikan Kewarganegaraan (KN), Pengantar Ilmu Pertanian (PI), Pengantar Kewirausahaan (PK), Pengantar Matematika (PM), dan Sosiologi Umum (SU). Metode B2 menyeleksi peubah-peubah yang bersesuaian dengan nilai mutlak terbesar dari koefisien setiap komponen utama terakhir pada matriks data yang mengandung objek dan peubah, dengan asumsi peubah yang dipertahankan. Metode B4 mempertahankan peubah-peubah yang bersesuaian dengan nilai mutlak terbesar dari koefisien setiap komponen utama pertama pada matriks data yang mengandung objek dan peubah, dengan asumsi peubah yang dipertahankan.
Metode analisis procrustes pada skor komponen utama membentuk matriks skor komponen utama dan membandingkannya dengan matriks skor yang dibentuk dengan menghilangkan setiap kolom matriks data secara berurutan. Peubah yang bersesuaian dengan hasil analisis procrustes yang memberikan nilai jarak antarkonfigurasi terkecil dalam setiap iterasi dihilangkan. Metode analisis procrustes membandingkan matriks data dengan matriks data yang telah direduksi dengan menghilangkan setiap kolomnya secara berurutan. Untuk mendapatkan dimensi yang sama, ditambahkan sebuah kolom nol. Peubah yang bersesuaian dengan nilai jarak procrustes terkecil dalam setiap iterasi dihilangkan. Untuk menentukan kesesuaian konfigurasi yang dihasilkan metode-metode seleksi peubah dengan data sebenarnya, dilakukan pengukuran berdasarkan ukuran kesesuaian analisis procrustes. Hasil seleksi yang memiliki nilai ukuran efisiensi terbesar dipandang sebagai hasil seleksi peubah terbaik. Algoritma implementasi metode-metode seleksi peubah disusun menggunakan software Mathematica versi 8.0. Berkaitan dengan data yang digunakan, nilai didasarkan pada proporsi varians komponen utama dengan menentukan nilai 0 = 0.80 (Jolliffe 1972). Dengan demikian dalam penelitian ini dipilih = 7 dan = 8. Untuk kemudahan dalam penulisan dalam tabel, metode seleksi peubah dengan analisis procrustes pada skor komponen utama akan disebut dengan APSKU dan metode seleksi peubah dengan analisis procrustes akan disebut dengan AP. Hasil pengukuran ukuran kesesuaian, 2 , hasil seleksi peubah dengan konfigurasi data awal diberikan pada tabel 1. Pada data TPB IPB tahun akademik 2008/2009 metode seleksi peubah yang dipandang paling mewakili data yang sebenarnya adalah metode B2, dengan nilai kesesuaian 99.36% untuk = 7 dan 99.60% untuk = 8 . Metode seleksi terbaik kedua adalah metode analisis procrustes pada skor komponen utama dengan = 3 dan B4 dengan nilai kesesuaian 99.27% dan 99.45% berturut-turut. Tabel 1 Urutan metode seleksi peubah yang mempertahankan berdasarkan ukuran efisiensi Ukuran Efisiensi
Urutan Metode Seleksi Terbaik Tahun Akademik 2008/2009 Tahun Akademik 2009-2010 = 7 = 8 = 7 =8
B2 APSKU 2
peubah
=3
AP
B2
B2
B4
AP
AP
APSKU
B4 APSKU
B2
=3
AP =2
APSKU
=2
APSKU
=3
APSKU
=3
APSKU
=2
APSKU
=2
B4
B4
Hasil pengukuran ukuran efisiensi pada data TPB IPB tahun akademik 2009/2010 juga menyatakan metode B2 merupakan metode seleksi terbaik dengan memberikan nilai efisiensi 99.44% dan 99.61% untuk = 7 dan = 8. Metode seleksi kedua adalah metode analisis procrustes dengan nilai efisiensi 99.44% dan
99.56% untuk = 7 dan = 8 berturut-turut. Namun demikian, keempat metode yang diuji memberikan ukuran efisiensi lebih dari 99.04%. Berdasarkan pemilihan metode seleksi terbaik mata kuliah yang dipandang dapat mewakili data TPB IPB tahun akademik 2008/2009 adalah Biologi, Fisika, Bahasa Indonesia, Bahasa Inggris, Kalkulus, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan, termasuk Ekonomi Umum jika ada 8 mata kuliah yang dipertahankan. Untuk tahun akademik 2009/2010 mata kuliah yang mewakili data TPB IPB adalah Biologi, Ekonomi Umum, Fisika, Bahasa Indonesia, Pengantar Matematika, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan, termasuk Bahasa Inggris jika ada 8 mata kuliah yang dipertahankan.
Kata kunci : seleksi peubah, analisis komponen utama, analisis procrustes
© Hak Cipta milik IPB, tahun 2011 Hak Cipta dilindungi Undang-Undang
1.
2.
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan b. Pengutipan tersebut tidak merugikan kepentingan yang wajar IPB. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin IPB.
SELEKSI PEUBAH DENGAN ANALISIS KOMPONEN UTAMA DAN PROCRUSTES
ACHMAD MUSLIM
Tesis sebagai salah satu syarat untuk meraih gelar Magister Sains pada Program Studi Matematika Terapan
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2011
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Endar Hasafah Nugrahani, M.S.
Judul Tesis Nama NRP
: Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes : Achmad Muslim : G551090121
Disetujui, Komisi Pembimbing
Dr. Ir. Siswadi, M.Sc. Ketua
Dr. Toni Bakhtiar, M.Sc. Anggota
Diketahui,
Ketua Program Studi Matematika Terapan
Dekan Sekolah Pascasarjana
Dr. Ir. Endar Hasafah Nugrahani, M.S.
Dr. Ir. Dahrul Syah, M.Sc.Agr.
Tanggal Ujian: 4 Agustus 2011
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia-Nya, sehingga karya ilmiah ini berhasil diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Februaru 2011 ini ialah Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes. Penulis menyampaikan ucapan terima kasih dan penghargaan kepada Bapak Dr. Ir. Siswadi, M.Sc. dan Bapak Dr. Toni Bakhtiar, M.Sc. selaku pembimbing yang telah banyak membimbing dan mengarahkan, serta kepada Ibu Dr. Ir. Endar Hasafah Nugrahani, M.S. selaku penguji dan selaku ketua Program Studi Matematika Terapan yang telah banyak memberikan saran dalam tesis ini. Ucapan terima kasih juga penulis sampaikan kepada Kementerian Agama Republik Indonesia yang telah memberikan bantuan berupa beasiswa. Ucapan terima kasih dan penghargaan juga penulis sampaikan kepada istri, kedua orang tua, dan seluruh keluarga yang selalu memberikan motivasi, semangat, doa dan kasih sayang serta kepada semua pihak yang telah membantu dalam penyelesaian karya ilmiah ini. Semoga karya ilmiah ini bermanfaat dan berguna sebagai bahan informasi dalam kemajuan ilmu pengetahuan.
Bogor, Agustus 2011
Achmad Muslim.
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 25 Juni 1980 dari seorang Ayah H. Nasruddin Ilyas dan Ibu Hj. Sa’amah. Penulis merupakan putra kedua dari tiga bersaudara. Pendidikan sarjana ditempuh di Universitas Negeri Jakarta dengan memilih Jurusan Pendidikan Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam dan menyelesaikannya pada tahun 2004. Pada tahun 2005 penulis menjadi staf pengajar di Madrasah Aliyah Negeri (MAN) 12 Jakarta. Pada tahun 2009 penulis memperoleh kesempatan untuk melanjutkan pendidikan magister pada Sekolah Pascasarjana Institut Pertanian Bogor (SPs IPB) Program Studi Matematika Terapan melalui jalur Beasiswa Utusan Daerah Kementerian Agama Republik Indonesia.
DAFTAR ISI Halaman DAFTAR TABEL .............................................................................................. xv DAFTAR GAMBAR .......................................................................................... xvii DAFTAR LAMPIRAN ....................................................................................... xviii PENDAHULUAN ..............................................................................................
1
Latar Belakang ............................................................................................. Tujuan Penelitian ......................................................................................... Manfaat Penelitian .......................................................................................
1 4 4
TINJAUAN PUSTAKA......................................................................................
5
Peubah ......................................................................................................... Analisis Peubah Ganda ................................................................................ Analisis Komponen Utama .......................................................................... Memilih Komponen Utama ......................................................................... Seleksi Peubah dalam Analisis Komponen Utama ...................................... Metode B1 ............................................................................................. Metode B2 ............................................................................................. Metode B3 ............................................................................................. Metode B4 ............................................................................................. Masalah Procrustes ...................................................................................... Analisis Procrustes ....................................................................................... Urutan Optimal dalam Analisis Procrustes .................................................. Metode Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama ....................................................................................... Ukuran Efisiensi ..........................................................................................
5 5 6 10 12 12 13 13 14 15 16 20 21 22
METODE PENELITIAN .................................................................................... 25 Sumber Data................................................................................................. Peubah Penelitian ......................................................................................... Objek Penelitian ........................................................................................... Langkah-langkah Penelitian ......................................................................... Diagram Alir Metode Seleksi Peubah ..........................................................
25 25 26 26 27
HASIL DAN PEMBAHASAN ........................................................................... 31 Program Seleksi Peubah Menggunakan software Mathematica ................. Algoritma Program Analisis ........................................................................ Algoritma Program Seleksi Peubah ............................................................. Eksplorasi Data ............................................................................................ Analisis Hasil ............................................................................................... Seleksi Peubah dengan Analisis Procrustes ................................................. Ukuran Efisiensi ........................................................................................... Interpretasi Hasil Seleksi Peubah pada Data TPB IPB ................................
31 31 32 34 46 52 56 59
KESIMPULAN DAN SARAN ........................................................................... 61 DAFTAR PUSTAKA ......................................................................................... 63 LAMPIRAN ...................................................................................................... 67
DAFTAR TABEL 1.
Halaman Peubah penelitian ......................................................................................... 25
2.
Konversi huruf mutu .................................................................................... 26
3.
Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan rata-rata nilai mata kuliah ...................................... 34
4.
Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan simpangan baku ........... 35
5.
Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik 2008/2009..................................................................................................... 37
6.
Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009 ... 38
7.
Vektor eigen dari matriks kovarians data TPB IPB tahun akademik 2008/2009..................................................................................................... 40
8.
Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan rata-rata nilai mata kuliah ...................................... 40
9.
Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan simpangan baku .................. 41
10. Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik ........ 43 11. Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009 ... 44 12. Vektor eigen dari matriks kovarians data TPB IPB tahun akademik 2009/2010 .................................................................................... 45 13. Hasil seleksi peubah dengan metode B2 ...................................................... 48 14. Hasil seleksi peubah dengan metode B4 ...................................................... 48 15. Hasil seleksi peubah berdasarkan pada analisis komponen utama .............. 50 16. Hasil seleksi peubah dengan analisis procrustes pada komponen utama ... 51 17. Urutan peubah yang terseleksi berdasarkan metode seleksi dengan analisis procrustes pada komponen utama ................................................... 52 18. Hasil seleksi peubah dengan analisis procrustes .......................................... 55
19. Perbandingan seleksi peubah dengan analisis procrustes pada komponen utama dengan seleksi peubah dengan analisis procrustes pada data TPB IPB tahun akademik 2008/2009.......................................................... 56 20. Perbandingan seleksi peubah berdasarkan analisis procrustes pada komponen utama dengan seleksi peubah dengan analisis procrustes pada data TPB IPB tahun akademik 2009/2010 .......................................... 56 21. Hasil seleksi peubah untuk data TPB tahun akademik 2008/2009 .............. 57 22. Hasil seleksi peubah untuk data TPB tahun akademik 2009/2010 .............. 57 23. Urutan metode seleksi peubah yang mempertahankan
peubah
berdasarkan ukuran efisiensi ........................................................................ 58
DAFTAR GAMBAR Halaman 1. Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan nilai rata-rata .................................... 36 2. Scree plot dari matriks kovarians data nilai TPB IPB tahun akademik 2008/2009................................................................................................ 40 3. Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan nilai rata-rata .................................... 42 4. Scree plot dari matriks kovarians data nilai TPB IPB tahun akademik 2009/2010................................................................................................ 46 5. Diagram alir metode seleksi peubah dengan analisis procrustes ............ 53
DAFTAR LAMPIRAN 1.
Halaman Data nilai mahasiswa TPB IPB tahun akademik 2008/2009 .................. 69
2.
Data nilai mahasiswa TPB IPB tahun akademik 2009/2010 ................. 71
3.
Diagram alir metode B1 ......................................................................... 73
4.
Diagram alir metode B3 ......................................................................... 74
5.
Analisis komponen utama menggunakan software Mathematica 8.0 pada seleksi peubah ................................................................................. 75
6.
Jarak procrustes menggunakan software Mathematica 8.0 pada seleksi peubah ..................................................................................................... 77
7.
Implementasi seleksi peubah dengan metode B2 ................................... 79
8.
Implementasi seleksi peubah dengan metode B4 ................................... 81
9.
Implementasi seleksi peubah dengan analisis procrustes pada skor komponen utama ............................................................................. 83
10. Implementasi seleksi peubah dengan analisis procrustes ....................... 85 11. Implementasi ukuran efisiensi berdasarkan analisis procrustes ............. 87 12. Statistik
2 ( )
pada metode seleksi peubah dengan analisis procrustes
pada skor komponen utama tahun akademik 2008/2009, 13. Statistik
2 ( )
pada metode seleksi peubah dengan analisis procrustes
pada skor komponen utama tahun akademik 2008/2009, 14. Statistik
2 ( )
2 ( )
2 ( )
= 2 ............ 90
pada metode seleksi peubah dengan analisis procrustes
pada skor komponen utama tahun akademik 2009/2010, 16. Statistik
= 3 ............ 89
pada metode seleksi peubah dengan analisis procrustes
pada skor komponen utama tahun akademik 2009/2010, 15. Statistik
= 2 ............ 89
= 3 ............ 90
pada metode seleksi peubah dengan analisis procrustes
tahun akademik 2008/2009 .................................................................... 91 17. Statistik
2 ( )
pada metode seleksi peubah dengan analisis procrustes
tahun akademik 2009/2010 ..................................................................... 91 18. Ukuran efisiensi
2
................................................................................ 92
19. Petunjuk penggunaan implementasi software Mathematica 8.0 pada seleksi peubah ........................................................................................ 93
Ku persembahkan untuk
Istriku Silvi Nurjanah, S.Pd.I **Enya & Babeh** Suryanih, S.Pd & Patmawati, S.Kom
1
PENDAHULUAN Latar Belakang Dalam proses pengambilan keputusan diperlukan informasi yang mendukung pengambilan keputusan secara tepat berdasarkan data yang ada. Oleh karena itu dibutuhkan cara yang tepat untuk menganalisis data yang tersedia agar diperoleh informasi yang bermanfaat. Pada umumnya penelitian-penelitian yang berkaitan dengan dunia nyata melibatkan banyak peubah. Setiap peubah diukur secara individual untuk menelusuri pengaruh antarpeubah. Namun kurangnya informasi pendukung yang dapat menjadi acuan dalam menentukan peubah-peubah yang memiliki pengaruh yang besar berkaitan dengan penelitian yang dilakukan, menyebabkan pengukuran dilakukan dengan sebanyak mungkin peubah dengan harapan tidak ada peubah penting yang tertinggal. Masalah yang kemudian dihadapi adalah kesulitan untuk menginterpretasikan himpunan data yang besar. Salah satu cara untuk membantu menyelesaikan masalah ini adalah dengan pengurangan dimensi. Teknik pengurangan dimensi yang telah dikenal secara umum adalah analisis komponen utama (Principal Component Analysis). Analisis komponen utama merupakan alat untuk mengurangi dimensi yang menggantikan peubah dalam data peubah ganda dengan sejumlah peubah turunan yang lebih sedikit (Al-Kandari & Jolliffe 2005). Analisis komponen utama dilakukan untuk membantu dalam penginterpretasian data, di mana komponen utama yang diperoleh merupakan kombinasi linear dari semua peubah asli yang memiliki varians terbesar secara berurutan dan tidak berkorelasi dengan komponen utama sebelumnya. Menurut Jolliffe (2002) adalah mungkin untuk mengurangi sejumlah peubah menjadi sejumlah ,
, komponen utama agar lebih mudah untuk
diinterpretasikan, akan tetapi karena setiap komponen utama merupakan kombinasi linear dari semua peubah asli, tidak ada jaminan untuk mendapatkan interpretasi yang sederhana. Salah satu pendekatan dalam menyelesaikan masalah ini adalah dengan seleksi peubah yaitu mengurangi peubah-peubah yang mungkin tidak memiliki
2
kaitan dengan masalah yang ingin diteliti ataupun dengan mengurangi peubahpeubah yang memberikan kontribusi informasi yang sedikit pada variasi data. Alasan seleksi peubah untuk merepresentasikan varians total pada keseluruhan data dapat berdasarkan pada pertimbangan bahwa beberapa peubah mungkin sulit ataupun mahal untuk diukur pada studi berikutnya, atau meskipun peubah tersebut biasanya dapat diinterpretasikan, komponen utama yang telah ditentukan dapat menjadi sulit diinterpretasikan jika terlalu banyak peubah yang terlibat. Analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik melalui serangkaian transformasi linear (Bakhtiar & Siswadi 2011). Analisis procrustes menggunakan transformasi linear berupa translasi, rotasi, dan dilasi, dengan salah satu konfigurasi dibuat tetap dan konfigurasi yang lain ditransformasi untuk dibandingkan agar sedekat mungkin dengan konfigurasi yang dibuat tetap. Analisis procrustes mendasarkan pengukurannya pada norma kuadrat perbedaan konfigurasi matriks. Nilai numerik yang dihasilkan dapat digunakan untuk memperkirakan tingkat kesesuaian antarkonfigurasi. Analisis procrustes pertama kali dikemukakan oleh Hurley & Cattel (1962) untuk menyelesaikan masalah persamaan regresi berganda dengan mengestimasi matriks transformasi yang mengaitkan struktur faktor matriks. Namun demikian Green (1952) telah memberikan ide yang sama pada analisis faktor dengan aproksimasi ortogonal pada struktur oblique. Schönemann (1966) memberikan solusi umum untuk masalah procrustes ortogonal yang memberikan solusi langsung pada masalah kuadrat terkecil dengan menggunakan matriks transformasi yang ortogonal serta dapat diterapkan pada matriks yang memiliki rank tidak penuh. Schönemann & Carroll (1970) menguraikan prosedur dalam penyuaian dua buah matriks berdasarkan pada rotasi, translasi, dan dilasi yang belum diketahui. Solusi dari masalah procrustes ortogonal umum dari dua atau lebih matriks dilaporkan oleh Gower (1975), dengan demikian kasus dua matriks merupakan kasus khusus analisis procrustes klasik. Lissitz et al. (1976) memberikan generalisasi masalah procrustes dengan memberikan bobot pada kolom dengan
3
solusi memiliki syarat ortogonalitas pada transformasinya. Ten Berge (1977) memberikan kondisi yang dibutuhkan dalam memaksimalkan penyesuaian rotasi matriks dalam sudut pandang kuadrat terkecil dan memberikan modifikasi pada metode Gower pada analisis procrustes umum. Borg (1978) menguraikan analisis procrustes pada kasus dengan matriks yang memiliki jumlah baris berbeda sedangkan Ten Berge & Knol (1984) menguraikan rotasi procrustes ortogonal untuk memaksimalkan kesesuaian antara dua matriks yang memiliki jumlah kolom yang berbeda dan kemudian memperumum untuk kasus lebih dari dua matriks. Koschat & Swayne (1991) mendeskripsikan dan menganalisis kriteria dan algoritma rotasi pada matriks dengan kolom terboboti. Dijksterhuis & Gower (1991) merangkum masalah procrustes dalam sebuah buku. Perkembangan terakhir diberikan oleh Bakhtiar & Siswadi (2011) yang memaparkan urutan transformasi optimal pada analisis procrustes. Ide untuk seleksi peubah diawali oleh Beale et al. (1967) yang mengusulkan penghapusan atau pengurangan peubah pada analisis regresi yang tidak memberikan kontribusi secara signifikan. Jolliffe (1972) memaparkan beberapa metode penghapusan peubah berdasarkan pada koefisien korelasi, analisis komponen utama, dan berdasarkan analisis kelompok, yang dapat digunakan untuk menentukan peubah-peubah yang dapat dikeluarkan dari analisis. King & Jackson (1999) mencoba mengaplikasikan metode seleksi peubah berdasarkan analisis komponen utama, dan menyarankan metode B4 sebagai metode seleksi peubah dalam studi ekologi. George (2000) membahas masalah seleksi peubah sebagai kasus khusus dalam masalah seleksi model dalam regresi berganda. Al-Kandari & Jollife (2001) mendeskripsikan beberapa kriteria seleksi peubah berdasarkan pada kovarians terbesar pada komponen utama, dan mengusulkan penggunaan kriteria seleksi peubah yang tidak tunggal. Al-Kandari & Jolliffe (2005) meninjau ulang beberapa metode dalam seleksi peubah dan interpretasi terhadap variasi data. Institut Pertanian Bogor (IPB) merupakan salah satu perguruan tinggi yang memiliki komitmen untuk memberikan pendidikan kepada seluruh anak bangsa dengan standar mutu pendidikan yang tinggi. Mahasiswa IPB berasal dari berbagai sekolah di Indonesia yang telah mengikuti berbagai jalur seleksi yang
4
telah disediakan IPB. Karena beragamnya input yang dimiliki oleh IPB perlu diadakan standardisasi kualitas yang melibatkan seluruh mahasiswa baru melalui program pendidikan komprehensif ditahap awal melaui program Pendidikan Tingkat Persiapan Bersama (PTPB) yang diasuh oleh Direktorat Pendidikan Tingkat Persiapan Bersama. Untuk memberikan gambaran mata kuliah-mata kuliah yang memiliki pengaruh terbesar dalam mendeskripsikan standar mutu TPB IPB diperlukan analisis yang mendalam terhadap hasil belajar yang diperoleh mahasiswa TPB IPB dengan menganalisis mata kuliah-mata kuliah dominan dalam menjelaskan variasi data TPB IPB sehingga diperoleh hasil interpretasi yang lebih baik.
Tujuan dan Manfaat Penelitian Berdasarkan latar belakang masalah, tujuan dari penelitian ini (dalam studi kasus mahasiswa TPB IPB tahun akademik 2008/2009 dan 2009/2010) ialah: 1. Mengkaji dan membandingkan metode seleksi peubah berdasarkan pada analisis komponen utama dan procrustes. 2. Menyusun
program
seleksi
peubah
dengan
menggunakan
software
Mathematica 8.0. 3. Mengaplikasikan program seleksi peubah pada data TPB IPB. Adapun manfaat dari penelitian ini adalah: 1. Menghasilkan program seleksi peubah dengan menggunakan software Mathematica 8.0. 2. Memberikan sebuah cara untuk melakukan pra-analisis dalam sebuah penelitian sebelum melakukan analisis yang sebenarnya agar mendapatkan hasil yang maksimal sesuai dengan penelitian yang dilakukan. 3. Analisis hasil seleksi program seleksi peubah yang diaplikasikan pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010 dapat dijadikan sebagai acuan bagi Direktorat Pendidikan Tingkat Persiapan Bersama IPB dalam melakukan analisis hasil pembelajaran mahasiswa TPB IPB.
5
TINJAUAN PUSTAKA Peubah Peubah (variable) adalah beberapa karakteristik yang berbeda dari objek yang satu dengan objek yang lain atau berbeda dari waktu ke waktu (Everitt & Skrondal 2010). Dasar dari analisis peubah ganda adalah kombinasi linear dari peubah-peubah yang diberikan bobot secara empiris. Peubah ditentukan dan dijelaskan oleh peneliti sedangkan bobotnya ditentukan dengan teknik peubah ganda yang sesuai dengan tujuan penelitian. Sejumlah
peubah dengan bobotnya
dapat dinyatakan secara matematis = dengan
1 1
+
2 2
+
merupakan peubah yang diamati dan
+
, merupakan bobot yang
ditentukan dengan teknik peubah ganda. Analisis peubah ganda Analisis peubah ganda (multivariate analysis) merupakan istilah umum untuk metode-metode analisis yang penting dalam menganalisis data peubah ganda (Everitt & Skrondal 2010). Dengan demikian analisis data yang melibatkan lebih dari satu peubah secara serempak dapat dipandang sebagai analisis peubah ganda. Berbagai teknik analisis peubah ganda ada yang merupakan perluasan dari analisis peubah tunggal. Untuk dapat melakukan analisis peubah ganda diperlukan pemahaman konsep pada penelitian berkaitan dengan jenis skala pengukuran. Beberapa teknik analisis peubah ganda antara lain analisis komponen utama dan analisis faktor, regresi berganda dan korelasi berganda, analisis diskriminan, analisis korelasi kanonik, analisis varians dan kovarians peubah ganda, conjoint analysis, analisis gerombol, analisis korespondensi, structural equation modeling, dan confirmatory factor analysis.
6
Analisis Komponen Utama Analisis komponen utama merupakan salah satu teknik analisis peubah ganda yang berkaitan dengan penjelasan struktur varians-kovarians peubah dengan cara mentransformasi peubah-peubah awal menjadi peubah-peubah baru yang tidak saling berkorelasi dengan tujuan mereduksi dimensi matriks data sehingga lebih mudah dalam menginterpretasi data yang diperoleh. Analisis komponen utama membentuk peubah baru yang merupakan kombinasi linear dari seluruh peubah asli, yang disebut komponen utama (principal components). Meskipun dibutuhkan
komponen untuk menunjukkan
keseluruhan variasi data, seringkali variasi ini dapat diwakili oleh utama, dengan mengandung
komponen
(Jollife 2002). Dengan demikian data awal yang pengukuran dengan
pengukuran dengan
peubah dapat direduksi menjadi
komponen utama.
Secara aljabar, komponen utama merupakan kombinasi linear dari peubah 1,
2, . . . ,
linear
yang memaksimalkan varians data. Secara geometris, kombinasi
ini
menunjukkan
perubahan
koordinat 1,
memproyeksikan sistem awal pada
2, . . . ,
yang
diperoleh
dengan
sebagai sumbu koordinat.
Sumbu koordinat baru ini menyatakan arah dengan variasi maksimum dan memberikan interpretasi yang lebih sederhana pada struktur kovarians. Misalkan kombinasi linear dengan
dari vektor
1
11 ,
merupakan vektor koefisien
1
=
1
11 1
+
12 2
+
12 ,
+
1
,
memiliki varians terbesar, 1
, sehingga
=
1
.
(1)
=1
Kombinasi linear kedua,
2
, tidak berkorelasi dengan
1
. Kombinasi
linear ini memiliki varians terbesar kedua, dan seterusnya, sehingga kombinasi linear ke- , 1
,
2
diketahui
,
, memiliki varians maksimum ke- dan tidak berkorelasi dengan ,
1
=
1,
Misalkan
. Dengan demikian terdapat matriks bobot yang tidak 2,
,
.
memiliki matriks kovarians
dengan elemen
kovarians antara peubah ke-i dan peubah ke-j dari
pada saat
merupakan dan
7
merupakan varians peubah ke-j pada saat maka kovarians
=
=
.
maka =
Kovarians
memiliki nilai harapan
diberikan oleh cov
Misalkan
= . Jika
=
.
diberikan oleh cov
i
=E
cov Yi
=E
Var
=E
Var
=
Var
=
Var
=
Var
=
Var
=
E
T
E E
E[ ]
T
[
] [ ]
[ ] [ ] cov (2)
Untuk menentukan bentuk komponen utama, pandang kombinasi linear =
1
var
dapat dibuat sebesar mungkin dengan memilih nilai
1
dan vektor
yang memaksimumkan var
pertama
1
oleh karena itu dibutuhkan batasan
1
1 1
1.
Nilai
yang besar,
= 1, yaitu jumlah kuadrat elemen
1
1
sama dengan 1. Untuk memaksimumkan
1
1
dengan syarat
1
1
= 1, pendekatan
standar yang digunakan adalah menggunakan metode pengganda Lagrange. Misalkan fungsi
akan dimaksimumkan dengan syarat
= .
Didefiniskan fungsi Lagrange , dengan
=
,
(3)
adalah pengganda Lagrange. Diferensiasi fungsi Lagrange terhadap
kedua argumen dan mengaturnya sama dengan nol diperoleh =
=0
=
+ = 0.
(4)
(5)
8
Diferensiasi fungsi
pada persamaan (5) memberikan kembali syarat awal
= . Pada persamaan (4) jika nilai
= 0 maka diperoleh masalah optimasi
tanpa syarat. Dengan demikian, apabila syarat telah terpenuhi nilai fungsi objektif sama dengan nilai fungsi objektif
. Apabila terdapat lebih dari satu syarat,
cukup dengan menambahkan pengganda Lagrange yang lain. Berdasarkan uraian di atas didefinisikan fungsi Lagrange = dengan
1
1
(6)
1 ,
1
1
adalah pengganda Lagrange. Diferensiasi fungsi Lagrange terhadap
1
memberikan 1
1
=0
(7)
1
= 0,
(8)
atau
dengan
× . Dengan demikian
merupakan matriks identitas berukuran
adalah nilai eigen dari
dan
1
merupakan vektor eigen yang bersesuaian. Untuk
menentukan vektor eigen yang memberikan kombinasi linear
1
nilai varians
terbesar, kuantitas yang akan dimaksimumkan ialah 1
1
Jadi,
=
1
1
=
1
1
harus sebesar mungkin. Dengan demikian,
(9)
= . 1
adalah vektor eigen yang
terbesar dari , dan var
bersesuaian dengan nilai eigen
1
=
2
2
1
1
=
1,
yang merupakan nilai eigen yang terbesar. Komponen utama kedua, 2
cov
2
2
, memaksimumkan
= 1 dan tidak berkorelasi dengan 1
,
2
= 0, dengan cov ,
dengan syarat
, atau ekivalen dengan syarat
1
menyatakan kovarians antara peubah x
dan y. Diperoleh cov
,
1
2
= =
1
=
2
1 2
1
=
1
=
1
2 1
2
2 1
1
=0
(10)
1,
(11)
Didefinisikan kembali fungsi Lagrange = dengan
dan
2
2
2
1
2
2
adalah pengganda Lagrange. Diferensiasi
terhadap
2
dan
mengaturnya sama dengan nol memberikan 2
2
1
= 0.
(12)
9
Dengan menggandakan persamaan (12) dengan 1
2
1
2
1
diperoleh
1
1
(13)
= 0.
= 0, sehingga dari persamaan (12)
Berdasarkan (10) dan (13) memberikan 2
2
=0
(14)
2
= 0.
(15)
atau
Dengan demikian
merupakan nilai eigen =
yang bersesuaian. Oleh karena Dengan asumsi nilai eigen
dan maka
2
2
2
merupakan vektor eigen
juga harus sebesar mungkin.
tidak memiliki nilai eigen yang berulang maka
terbesar kedua dan
merupakan
merupakan vektor eigen yang bersesuaian.
2
Berdasarkan uraian di atas, dapat ditunjukkan bahwa untuk komponen utama ketiga, keempat sampai dengan ke-p, vektor koefisien merupakan vektor eigen
yang bersesuaian dengan nilai eigen
3,
4,
3, 4,
, ,
ketiga, keempat, sampai nilai eigen terkecil berturut-turut. Secara umum, komponen utama ke-k dari var dengan
adalah =
merupakan nilai eigen
dan untuk
= 1, 2,
terbesar ke-k dan
(16)
, ,
adalah vektor eigen yang
bersesuaian. Secara umum, transformasi peubah asal menjadi komponen utama dapat dinyatakan sebagai
=
, dengan
merupakan matriks bobot yang disebut
matriks koefisien komponen utama yang terdiri dari vektor eigen
. Posisi setiap
objek pada sistem koordinat komponen utama yang baru disebut skor yang diberikan oleh = dengan
,
disebut matriks skor komponen utama. Total varians yang dijelaskan oleh komponen utama adalah
sehingga proporsi dari total varians yang dijelaskan
=1
komponen utama pertama
ialah =1 =1
dengan
= 1, 2, . . . . , p.
,
(17)
10
Memilih Komponen Utama Jolliffe (2002) dan Andrade et al. (2004) memaparkan beberapa aturan dalam menentukan banyaknya komponen utama pertama yang harus dipilih untuk mewakili variasi matriks data .
Persentase Kumulatif Variasi Total 1,
Komponen utama merupakan kombinasi linear dari peubah acak 2, . . . ,
yang memaksimalkan variasi data secara berurutan, dengan varians
komponen utama ke-
adalah
dan total varians
persentase variasi yang dijelaskan oleh
=1
. Dengan demikian
komponen utama pertama adalah
= 100
=1
,
(18)
=1
dengan
. Apabila menggunakan matriks korelasi, (18) dapat direduksi
menjadi 100
=
.
(19)
=1
Pemilihan nilai
pada interval 70% hingga 90% akan memberikan aturan penentuan
komponen utama yang mempertahankan sebagian besar informasi yang
dimiliki .
Ukuran Variasi Komponen Utama Aturan ini khusus digunakan saat menggunakan matriks korelasi, meskipun dapat diadopsi untuk beberapa matriks kovarians tertentu. Pada aturan ini jika semua elemen
independen, maka komponen utama sama dengan peubah
awal dan memiliki varians pada mariks korelasi. Dengan demikian komponen utama yang memiliki varians kurang dari 1 atau
< 1 dianggap kurang memiliki
informasi sehingga dapat dihilangkan.
Metode Cross-Validatory Eastment & Krzanowski (1982) pada Andrade et al. (2004) memberikan pendekatan dalam penentuan
komponen utama dengan menggunakan
penguraian nilai singular secara langsung. Misalkan penguraian nilai singular
11
ialah
=
dan
. Jika
dan
dan
,
,
,
menyatakan elemen dari matriks
,
,
,
komponen utama pertama dipandang dapat mewakili variasi data komponen dipandang kurang memiliki informasi yang signifikan
=
maka
Prediktor dari
+
=1
dengan
merupakan residual noise.
ditentukan dengan formula =
. =1
Ukuran kesesuaian untuk
dapat diperoleh dari prediktor semua elemen
dengan menentukan jumlah kuadrat selisih antara elemen observasi dengan elemen prediksi, yaitu PRESS
=
1
2
(21)
.
=1 =1
Akan tetapi data
seharusnya tidak dipergunakan dalam memprediksi
. Untuk mencegah hal tersebut adalah dengan menghapus baris ke-i dari
,
kemudian mengoreksi kolomnya terhadap rataan dan menyatakan hasilnya sebagai
. Demikian pula menghapus kolom ke-j dari
kolomnya terhadap rataannya dan menyatakan hasilnya dengan
, mengoreksi (
).
Selanjutnya
dengan melakukan penguraian nilai singular dua matriks ini menjadi = =
dengan
,
=
= diag
dan (
dengan
=
,
=
dan
)
1,
2,
,
1,
2,
,
dan
=
= diag
1
. Dari konstruksi ini,
maka prediktor dapat dinyatakan sebagai =
(22)
. =1
Perbedaan dengan (20), prediktor (22) tidak menggunakan menentukan nilai optimum , PRESS sampai menentukan
dihitung untuk nilai
. Untuk
yang berbeda dari
1 . Eastment & Krzanowski (1982) menyarankan untuk
12
= dengan
PRESS
1
PRESS
(23)
,
PRESS
adalah derajat bebas yang dibutuhkan untuk menyesuaikan komponen
ke- dan
adalah derajat bebas yang tersisa setelah penyesuaian komponen =
ke- . Nilai
+
2 dan
diperoleh dengan pengurangan secara
berurutan yang dimulai dari derajat bebas terkoreksi
terhadap
1
+
Nilai
rataannya, 2
yaitu
1 1
dari matriks =
1
yang telah =
dan
1 .
menyatakan peningkatan kekuatan prediksi saat penambahan
komponen ke-k, dan dibandingkan dengan rataan informasi prediksi pada komponen yang tersisa. Dengan demikian nilai komponen yang signifikan, k, diberikan oleh nilai terbesar dari
yang lebih besar dari 1. Notasi PRESS
merupakan akronim dari PREdiction Sum of Square.
Seleksi Peubah dalam Analisis Komponen Utama Jolliffe (1972) menyarankan beberapa metode dalam memilih subset peubah terbaik yang tetap mempertahankan variasi data berdasarkan pada analisis komponen utama.
Metode B1 Metode B1 pertama kali dikembangkan oleh Beale et al. (1967). Metode B1 diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung 1
objek dan
peubah, dan penentuan nilai-nilai eigen. Jika terdapat
nilai eigen yang lebih kecil dari suatu nilai tertentu,
0,
maka vektor eigen
yang bersesuaian, yaitu komponen utama itu sendiri, dibandingkan secara berurutan, mulai dari komponen yang bersesuaian dengan nilai eigen terkecil pertama dilanjutkan dengan komponen utama yang bersesuaian dengan nilai eigen terkecil kedua dan seterusnya. Satu peubah kemudian dikaitkan dengan setiap
1
komponen utama, yaitu peubah yang memiliki koefisien terbesar pada komponenkomponen yang sedang dibandingkan dan belum dikaitkan dengan komponen yang dibandingkan sebelumnya. Peubah yang dikaitkan dengan utama tersebut kemudian dihilangkan.
1
komponen
13
Setelah satu peubah dihilangkan, proses dilanjutkan dengan melakukan 1 peubah.
kembali analisis komponen utama untuk matriks data dengan Jika terdapat
2
nilai eigen yang lebih kecil dari
dikaitkan dengan setiap
2
0,
maka sebuah peubah kembali
komponen utama yang bersesuaian dengan cara yang
sama dengan sebelumnya. Peubah yang dikaitkan ini kemudian dihilangkan. 2 peubah yang
Analisis komponen utama kembali dilakukan untuk
tersisa, dan prosedur ini terus dilakukan hingga semua nilai eigen pada analisis komponen terakhir lebih dari bergantung pada pemilihan
0,
sehingga tersisa
peubah. Nilai
ini akan
0.
Metode B1 melakukan analisis komponen utama dalam setiap proses penghilangan peubah. Oleh karena itu metode B1 membutuhkan waktu komputasi yang besar sehingga tidak direkomendasikan.
Metode B2 Metode B2 sama seperti metode B1, akan tetapi hanya menggunakan satu kali analisis komponen utama. Metode B2 diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung mengandung peubah. Jika telah ditentukan bahwa
objek dan
peubah akan dipertahankan maka dipilih
koefisien dengan nilai mutlak terbesar untuk setiap (
) komponen utama
terakhir dan dikaitkan dengan peubah yang bersesuaian. Setelah dibandingkan peubah ini kemudian dihilangkan mulai dari komponen utama yang terakhir.
Metode B3 Metode B3 membutuhkan satu kali analisis komponen utama dan penentuan
peubah yang akan dipertahankan seperti metode B2. Metode B3
diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung
objek dan
peubah. Proses seleksi dilanjutkan dengan
menentukan nilai dari jumlah kuadrat koefisien setiap
peubah pada (
)
komponen utama terakhir. Jumlah-jumlah ini selanjutnya diurutkan secara menurun dan peubah yang bersesuaian dengan jumlah kuadrat
pertama
14
dalam urutan tersebut dihilangkan. Dengan demikian peubah yang dipilih adalah peubah yang memiliki nilai 2
(24)
= +1
yang minimum. Dalam formula ini
adalah koefisien dari peubah ke-i pada
komponen utama ke-j. Metode yang secara komputasi serupa dengan B3 ialah menggunakan proporsi varians peubah ke-i yang dijelaskan oleh
komponen utama pertama.
Proporsi varians peubah ke-i yang dijelaskan oleh
komponen utama pertama
ialah 2
(25)
,
=1
dengan
adalah nilai eigen ke-j dan
adalah koefisien peubah ke-i pada
komponen utama ke-j. Metode ini memilih maksimum dari
2 =1
peubah yang memiliki nilai
, yaitu 2
1 =1
(26)
2
= = +1
2
minimum, sementara B3 memilih peubah di mana
= +1
minimum.
Metode B4 Metode B4 membutuhkan satu analisis komponen utama dan penentuan peubah yang akan dipertahankan. Metode B4 dapat dipandang sebagai versi backward B2. Metode B4 diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung mengandung
objek dan
peubah. Untuk
melakukan proses seleksi, dipilih koefisien dengan nilai mutlak terbesar untuk setiap
komponen utama pertama dan dibandingkan mulai dari komponen utama
pertama secara berurutan seperti halnya pada metode B1 dan metode B2. Dengan demikian,
peubah akan dipertahankan dan (
) peubah dihilangkan.
Pada metode B1 jumlah peubah yang dipertahankan, , ditentukan dengan pemilihan
0,
dan pada metode B2, B3 dan B4 nilai
dapat dipilih sama dengan
banyaknya nilai eigen dari matriks korelasi yang lebih besar dari lebih besar dari B1). Sebagai alternatif, nilai
0
(yang nilainya
dapat ditentukan sama dengan
15
jumlah komponen utama minimal dimana proporsi variasi yang dijelaskan lebih dari suatu nilai
0,
misalnya
0
= 0.80 (Jollife 1972). Krzanowski (1987)
menyarankan bahwa dapat dipilih sebarang jumlah
peubah dari
peubah yang
ada dengan perbandingan antara objek dengan peubah adalah 3:1.
Masalah Procrustes Istilah procrustes berasal dari legenda Yunani kuno, di mana Procrustes merupakan seorang bandit yang beroperasi pada daerah perbukitan Eleusis di sebelah selatan Yunani. Procrustes menawarkan penginapan bagi para pengembara yang bepergian dari Eleusis ke Athena, memberikan makanan dan minuman serta menawarkan tempat tidur untuk beristirahat. Jika tinggi pengembara tersebut melebihi panjang tempat tidur yang disediakan, maka Procrustes memotong kepala dan kaki mereka agar sesuai dengan ukuran tempat tidur. Namun apabila pengembara terlalu pendek, Procrustes meregangkannya agar sesuai dengan tempat tidur sehingga keduanya berujung pada kematian. Procrustes mengalami nasib yang sama di tangan Theseus, penguasa Ionia saat itu (Gower & Dijksterhuis 2004). Terdapat tiga elemen dalam kisah Procrustes, yaitu pengembara yang tidak beruntung, yang dapat dilabelkan dengan perlakuan, matriks
tempat tidur Procrustes,
2,
dan
. Bentuk paling sederhana dari masalah procrustes adalah mencari yang meminimumkan 1
pada
1,
1
×
2
, dengan
×
1
1
(27)
2
dan
×
2
2
yang diketahui, dengan
menyatakan norma Frobenius matriks. Norma Frobenius matriks dapat dipandang sebagai norma Euclid untuk matriks. Untuk vektor, norma Euclid dikenal sebagai norma-2,
2.
Dengan vektor
, maka kuadrat panjang
Euclidnya ialah 2 2
2
= =1
.
(28)
16
×
Untuk matriks
, norma Frobenius 2
2
=
ialah = tr
,
(29)
=1 =1
di mana
adalah matriks transpos dari .
Analisis Procrustes Menurut Awange et al. (2010) analisis procrustes adalah teknik penyesuaian sebuah konfigurasi dengan konfigurasi yang lain dengan tujuan memperoleh ukuran kesesuaian. Untuk melihat kesamaan bentuk dan ukuran dari dua konfigurasi maka salah satu konfigurasi dibuat tetap sementara konfigurasi yang lainnya ditransformasi sehingga sesuai dengan konfigurasi pertama. Sedangkan dalam Bakhtiar & Siswadi (2011) analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik melalui serangkaian transformasi linear. ×
Misalkan berdimensi
adalah konfigurasi
titik dalam ruang Euclid
dengan koordinat diberikan oleh matriks
×
berikut
1 2
= dengan
adalah vektor baris yang diberikan oleh =
untuk
= 1, 2,
,
1
,
2,
, ×
dan konfigurasi
yang merupakan konfigurasi
titik dalam ruang Euclid berdimensi . Konfigurasi konfigurasi
akan dipasangkan dengan
dalam bentuk baris, dengan setiap baris dari konfigurasi
dipasangkan dengan baris pada konfigurasi bahwa dimensi kedua konfigurasi konfigurasi memiliki jumlah
dan
yang bersesuaian. Diasumsikan
adalah sama. Dengan demikian setiap
kolom yang sama. Jika
nol dapat ditambahkan pada konfigurasi
>
maka
kolom
sehingga kedua konfigurasi berada
pada ruang dimensi yang sama (Borg 1978; Ten Berge & Knol 1984). Dengan demikian tanpa mengurangi perumuman dapat diasumsikan bahwa
= .
17
Diasumsikan pula bahwa salah satu konfigurasi,
, dibuat tetap dan konfigurasi
yang lain, , akan ditransformasi agar sesuai dengan konfigurasi . Untuk menentukan jarak antarkonfigurasi, analisis procrustes mendasarkan pengukurannya pada jumlah kuadrat jarak antartitik yang bersesuaian, yang dikenal dengan jarak procrustes, yaitu ,
2
= =1 =1
,
= tr
(30)
.
Secara geometris hal ini dilakukan dengan cara mentranslasi, merotasi dan kemudian mendilasi konfigurasi ,
jarak,
sedemikian rupa sehingga jumlah kuadrat
, antara titik-titik konfigurasi
dengan titik-titik konfigurasi
yang
bersesuaian menjadi minimum (Andrade et al. 2004)
Translasi Translasi dalam analisis procrustes merupakan proses penggeseran semua titik pada konfigurasi
dan konfigurasi
dengan jarak yang tetap dan arah yang
sama sehingga kedua konfigurasi memiliki sentroid yang sama. Proses translasi ini sering dikenal dengan istilah mean-centering. Definisikan konfigurasi ,
dan
sebagai rata-rata kolom ke-j pada konfigurasi
dan
berturut-turut. Dengan menguraikan (30) diperoleh
=
2
+ =1 =1
,
2
=
+2
=1 =1
=1 =1
2
+
.
=1
(31)
Karena bagian kedua pada ruas kanan (31) bernilai nol, diperoleh ,
2
=
2
+
=1 =1
,
=1
sehingga ,
=
,
+
.
(32)
18
Konfigurasi
dan konfigurasi
setelah mengalami proses translasi
dinyatakan dengan
dengan
,
(33)
=
,
(34)
× 1,
adalah vektor 1 berukuran
setiap konfigurasi
dengan
=
=
dan
1
dari konfigurasi
dan
menyatakan sentroid dari
yang dinyatakan sebagai =
1, 2,
,
,
(35)
=
1, 2,
,
,
(36)
=
dan
=1
dan
1
merupakan rataan dari kolom ke-j
=1
berturut-turut serta 2
=
(37)
. =1
Jarak procrustes minimum diperoleh jika sentroid
dan
saling
berhimpit (Bakhtiar & Siswadi 2011). Dengan demikian jarak minimum antara konfigurasi
dan
setelah dilakukan proses translasi ialah
,
=
,
2
=
.
(38)
=1 =1
Rotasi Rotasi adalah transformasi yang memindahkan seluruh titik dengan sudut yang tetap dengan mempertahankan jarak antartitik terhadap sentroidnya. Pada analisis procrustes rotasi dilakukan terhadap sentroid yang sama dengan cara menggandakan konfigurasi
dengan sebuah matriks ortogonal
yang
meminimumkan jarak antarkonfigurasi. Misalkan =
×
merupakan matriks ortogonal sehingga
=
. Rotasi pada analisis procrustes adalah menentukan matriks
sedemikian sehingga , minimum, dengan syarat
=
2
= =
. Masalah optimasi ini dikenal dengan
masalah procrustes ortogonal (Schönemann 1966).
19
Untuk menentukan solusi masalah tersebut berdasarkan (30) dapat ditulis ||2
||
= tr (
) (
)
||
1
2 ||
2
= tr(
)
2tr(
) + tr(
||
1
2 ||
2
= tr(
)
2 tr(
) + tr (
||
1
2 ||
2
= tr(
)
||
1
2 ||
2
= tr(
) + tr(
||
1
2 ||
2
= || ||2 + || ||2
Dengan
demikian
masalah
2 tr( )
) + tr(
)
2 tr(
)
2 tr(
minimasi
) )
(40)
).
procrustes
diselesaikan dengan memaksimumkan nilai dari tr
(39)
ortogonal
dapat
dengan menggunakan
bantuan penguraian nilai singular bentuk lengkap (Complete Form of Singular Value Decomposition). Misalkan lengkap
merupakan hasil dari penguraian nilai singular bentuk =
, yaitu
, dengan =
matriks ortogonal sehingga tr
= dan
2
1
= tr
tr
2
1
= tr
=
ortogonal. Dengan demikian
=
dan
= maka
= tr
tr
dengan mendefinisikan
1
merupakan matriks diagonal,
(41)
yang merupakan hasil perkalian matriks =
merupakan matriks ortogonal dan berlaku
1, sehingga tr
= tr
tr
=
(42)
tr =1
Jadi, tr
akan maksimum jika
=
= . Dengan demikian =
sehingga =
Dari penguraian (39), (42), dan (43) tr
= tr
bentuk lengkap
, dengan
dan
(43)
. ,
akan minimum jika
matriks ortogonal dari penguraian nilai singular
sehingga jarak optimal setelah dilakukan proses rotasi ialah ,
= tr
+ tr
2 tr
.
(44)
20
Dilasi Dilasi adalah pembesaran atau pengecilan jarak setiap titik dalam konfigurasi
terhadap
sentroid.
menggandakan matriks Misalkan skalar
Dilasi
dalam analisis
procrustes
adalah
dengan sebuah skalar . , dilasi dalam analisis procrustes adalah menentukan
sedemikian sehingga ,
2
=
minimum. Untuk menentukan solusi masalah tersebut dapat ditulis 2
= tr
2
= tr(
2
2
=
2
tr
)
2tr (
) + tr (
)
+ tr
,
2 tr
yang dapat dipandang sebagai fungsi kuadratik dalam ,
meminimumkan
dapat dipilih =
Dengan menyubstitusi nilai
(45)
, sehingga untuk
sebagai berikut:
tr tr(
)
(46)
.
pada persamaan (46) ke persamaan (45) diperoleh
jarak procrustes setelah dilakukan proses dilasi 2
,
=
tr
,
tr = tr(
,
=
,
= tr
tr 2 tr 2 (
2 tr
+ tr
2
tr
) )
2
tr tr 2 tr(
2
tr tr(
tr tr(
) )
tr
tr
+ tr + tr (47)
)
Urutan Optimal dalam Analisis Procrutes Bakhtiar & Siswadi (2011) telah menunjukkan urutan optimal transformasi linear dalam analisis procrustes, yaitu translasi, rotasi dan dilasi. Pada bagian ini akan diulas kembali jarak procrustes berdasarkan urutan translasi, rotasi dan dilasi dengan mendefinisikan
sebagai jarak procrustes berdasarkan pada translasi,
rotasi dan dilatasi. Pada bagian selanjutnya
akan dinotasikan sebagai
2
.
21
Jarak procrustes setelah dilakukan proses translasi berdasarkan (38) adalah ,
= tr
+ tr
2 tr
.
Hasil konfigurasi oleh rotasi diperoleh dengan menggandakan ortogonal
(48)
dengan matriks
sedemikian sehingga ,
Dengan memilih
=
=
, dengan
singular bentuk lengkap
,
.
merupakan hasil dari penguraian nilai
, diperoleh ,
= tr
+ tr
2 tr
Proses dilasi dilakukan dengan menggandakan , Berdasarkan (46),
,
=
dengan skalar ,
(49)
. sehingga
.
dapat diminimumkan dengan memilih =
tr tr(
)
(50)
.
Dengan demikian, diperoleh ,
= tr
tr 2 tr(
)
.
(51)
Metode Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama Analisis procrustes memiliki aplikasi yang sangat luas, antara lain aplikasi dalam shape analysis (Dryden & Mardia 1998) dan aplikasi pada seleksi peubah. Dijksterhuis et al. (2002) menguraikan seleksi peubah dengan meminimumkan jarak procrustes, Andrade et al. (2004) dan Héberger & Andrade (2004) menggunakan analisis procrustes sebagai metode seleksi peubah dalam bidang kimia dan Baxter et al. (2008) menguraikan seleksi peubah dengan analisis procrustes pada kandungan kimia beberapa jenis keramik. Misalkan matriks data
mengandung
peubah telah diukur pada setiap
objek. Proses seleksi diawali dengan melakukan analisis komponen utama pada matriks data
dan membentuk matriks skor dari
komponen utama pertama
yang mewakili struktur data dan menempatkannya pada matriks × . Matriks
berdimensi
ini dijadikan sebagai konfigurasi dasar untuk dibandingkan
dengan konfigurasi yang lain.
22
Pada proses selanjutnya, setiap kolom pada matriks data
dihilangkan
secara berurutan dan analisis komponen utama kembali dilakukan pada setiap matriks data yang telah tereduksi. Misalkan
menyatakan konfigurasi titik-titik
yang dihasilkan dari analisis komponen utama saat kolom ke-j dihilangkan. Matriks
yang berdimensi
×
kemudian dibandingkan dengan konfigurasi
menggunakan analisis procrustes sehingga memberikan nilai kolom. Kolom ke-j dari konfigurasi
2
yang memberikan nilai
untuk setiap 2
terkecil
merupakan peubah yang dianggap memiliki kontribusi yang paling sedikit pada struktur data sehingga dapat dikeluarkan dari analisis. Setelah satu peubah dihilangkan, konfigurasi ×
menjadi matriks berukuran
1 . Keseluruhan proses dilakukan kembali untuk menghilangkan satu
peubah sehingga tersisa
2 peubah pada konfigurasi awal.
Prosedur ini terus dilakukan sehingga tersisa dipandang sebagai
peubah. Peubah inilah yang
peubah terbaik yang mewakili keseluruhan struktur
peubah
dari matriks data awal.
Ukuran Efisiensi Setelah beberapa metode seleksi peubah diaplikasikan, masalah yang dihadapi adalah menentukan hasil seleksi peubah yang dipandang sebagai hasil seleksi terbaik yang dapat mewakili variasi data asli yang diperoleh dari metodemetode seleksi tersebut. Untuk menentukannya dibutuhkan sebuah ukuran kedekatan atau ukuran efisiensi yang dapat menunjukkan nilai tertinggi sebagai hasil seleksi peubah terbaik. Al-Kandari & Jolliffe (2001, 2005) dan Westad et al. (2003) memberikan ukuran efisiensi berdasarkan pada persentase total variasi yang dijelaskan oleh
komponen utama pertama baru yang berasal dari
peubah
yang dipertahankan. Ukuran kedua berdasarkan pada total jumlah variasi yang jelaskan oleh subset yang dipertahankan. Ukuran efisiensi ketiga adalah perbandingan jarak konfigurasi antartitik berdasarkan konsep analisis procrustes. Setiap konfigurasi titik yang mengandung peubah yang dipertahankan dibandingkan dengan konfigurasi awal sehingga memberikan nilai jarak antarkonfigurasi.
23
Misalkan
adalah matriks data berukuran
peubah yang diukur pada setiap berukuran
×
merupakan konfigurasi berukuran
peubah, dan
=
×
yang
merupakan matriks skor yang bersesuaian
× . Jarak procrustes digunakan untuk mengukur
berukuran
kedekatan antara konfigurasi dipilih
adalah matriks skor
, yang dipandang sebagai aproksimasi terbaik
berdimensi-k. Misalkan
dengan
objek. Misalkan
yang mengandung
yang merupakan transformasi komponen utama terhadap
konfigurasi sebenarnya,
mempertahankan
×
dan . Untuk mendapatkan dimensi yang sama,
(King & Jackson 1999).
Ukuran kesesuaian dua konfigurasi menggunakan formula 2
= 1
( , tr
)
× 100%.
Nilai R2 memiliki rentang nilai antara 0 – 100%, sehingga semakin besar nilai yang dihasilkan, maka kedua konfigurasi tersebut akan makin dekat.
24
25
METODE PENELITIAN Sumber Data Data penelitian yang digunakan adalah data yang diperoleh dari Direktorat Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor (TPB IPB), yang terdiri atas data nilai mutu mata kuliah yang diikuti mahasiswa TPB IPB tahun akademik 2008/2009 dan 2009/2010. Peubah yang diamati ialah 14 mata kuliah dengan pengamatan pada nilai mutu mata kuliah yang diikuti mahasiswa TPB IPB pada semester ganjil dan genap tahun akademik 2008/2009 dan 2009/2010.
Peubah Penelitian Peubah yang digunakan dalam penelitian ini merupakan mata kuliah selama di TPB IPB yang disajikan pada Tabel 1. Nilai mutu yang digunakan dalam konversi huruf mutu yang berlaku di IPB disajikan pada Tabel 2.
Tabel 1 Peubah penelitian No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Peubah Agama Bahasa Indonesia Bahasa Inggris Biologi Ekonomi Umum Fisika Kalkulus Kimia Olahraga dan Seni Pendidikan Kewarganegaraan Pengantar Ilmu Pertanian Pengantar Kewirausahaan Pengantar Matematika Sosiologi Umum
Kode AG ID IG BI EU FI KA KI OS KN PI PK PM SU
26
No 1 2 3 4 5
Tabel 2 Konversi huruf mutu Huruf Mutu Nilai Mutu A 4.00 B 3.00 C 2.00 D 1.00 E 0.00 Objek Penelitian
Objek penelitian adalah mahasiswa TPB IPB tahun akademik 2008/2009 sebanyak 3223 mahasiswa dan tahun akademik 2009/2010 sebanyak 3053 mahasiswa dengan pengamatan meliputi nilai mutu 14 mata kuliah yang diikuti baik semester ganjil maupun semester genap.
Langkah-Langkah Penelitian 1. Mengkaji seleksi peubah dengan menggunakan analisis komponen utama dan analisis procrustes. 2. Penyusunan program seleksi peubah dengan menggunakan software Mathematica 8.0 berdasarkan diagram alir. 3. Mengaplikasikan program seleksi peubah pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010. 4. Analisis data 5. Melakukan perbandingan hasil seleksi peubah pada metode-metode seleksi peubah
27
Diagram Alir Metode Seleksi Peubah
Diagram Alir Metode B2 Matriks data
AKU
Matriks bobot komponen utama
Tentukan
Dipilih komponen utama terakhir untuk dikaitkan dengan peubah yang bersesuaian untuk nantinya dihilangkan
+1
Dipilih koefisien dengan nilai mutlak terbesar untuk setiap ( ) komponen utama terakhir dan dikaitkan dengan peubah yang bersesuaian untuk dihilangkan
( ) peubah dihilangkan sehingga tersisa peubah pada matriks data
28
Diagram Alir Metode B4
Matriks data
AKU
Tentukan
Matriks bobot komponen utama
Dipilih komponen utama pertama untuk dikaitkan dengan peubah yang bersesuaian untuk nantinya dipertahankan
Dipilih koefisien dengan nilai mutlak terbesar untuk setiap komponen utama pertama dan dikaitkan dengan peubah yang bersesuaian untuk dipertahankan
( ) peubah dihilangkan sehingga tersisa peubah pada matriks data
29
Diagram Alir Metode Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama Matriks data
Setiap kolom dihilangkan secara berurutan
=
1,
AKU ( )
AKU Matriks Skor
Analisis Procrustes
2 ()
Matriks Skor
Peubah yang memiliki nilai 2 ( ) terkecil dihilangkan dan proses kembali diulangi
2,
,
30
31
HASIL DAN PEMBAHASAN Program Seleksi Peubah Menggunakan Software Mathematica 8.0 Untuk mengaplikasikan metode seleksi peubah yang telah dideskripsikan pada tinjauan pustaka pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010, disusun program seleksi peubah menggunakan software Mathematica 8.0. Program seleksi untuk setiap metode disusun berdasarkan kemampuan penulis terhadap software Mathematica dan disesuaikan dengan kebutuhan penyelesaian tesis. Penyusunan program seleksi peubah dengan menggunakan software Mathematica 8.0 diawali dengan mengkonstruksi program-program analisis dengan menggunakan data simulasi. Program-program analisis yang merupakan program pendukung yaitu program analisis komponen utama, dan program analisis procrustes. Program seleksi peubah menggunakan analisis komponen utama yang disusun adalah metode B2 dan B4, kemudian dilanjutkan dengan penyusunan program seleksi peubah dengan menggunakan analisis procrustes pada komponen utama. Proses selanjutnya adalah menyusun program untuk menentukan ukuran efisiensi setiap metode yang diaplikasikan pada data TPB IPB tahun akademik 2008/2009 dan tahun akademik 2009/2010. Script program-program analisis dan program seleksi peubah diberikan pada lampiran.
Algoritma Program Analisis Algoritma Analisis Komponen Utama berukuran
× .
1.
Misal konfigurasi data
2.
Membentuk sentroid setiap kolom konfigurasi data , yaitu
3.
Translasi konfigurasi
4.
Membentuk matriks kovarians
5.
Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks
dengan dengan formula
kovarians , dengan persamaan karakteristik
=
1
=
=0
32
Algoritma Analisis Procrustes : 1.
Misal
dan
2.
Menentukan konfigurasi hasil translasi dari =
dengan rumus dan 3.
=
1
× .
adalah dua konfigurasi data berukuran
dan
dan
=
, yaitu
=
matriks
dan
dari
menjadi
=
, di mana
merupakan sentroid kolom dari konfigurasi
Menentukan matriks ortogonal
dan 1
dan .
untuk transformasi rotasi, dengan
merupakan hasil penguraian nilai singular bentuk lengkap . tr
=
4.
Menentukan skalar
5.
Menentukan nilai norma kuadrat perbedaan kedua konfigurasi setelah
tr (
)
untuk transformasi dilasi.
penyesuaian dengan translasi, rotasi dan dilasi, yaitu : ,
tr 2 tr(
= tr
)
.
Algoritma Program Seleksi Peubah Metode B2 berukuran
× .
1.
Misal konfigurasi data
2.
Membentuk sentroid setiap kolom konfigurasi data , yaitu
3.
Translasi konfigurasi
4.
Membentuk matriks kovarians .
5.
Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks
dengan dengan formula
T
=
=
1
.
.
= 0.
kovarians , dengan persamaan karakreristik 6.
Menentukan , dan memilih
komponen utama terakhir.
7.
Memilih max
adalah koefisien peubah ke-i pada
, di mana
komponen utama ke-j, dan mengaitkannya dengan peubah yang bersesuaian.
Metode B4 berukuran
× .
1.
Misal konfigurasi data
2.
Membentuk sentroid setiap kolom konfigurasi data , yaitu
3.
Translasi konfigurasi
dengan dengan formula
=
= .
1
.
33
4.
Membentuk matriks kovarians .
5.
Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks = 0.
kovarians , dengan persamaan karakteristik 6.
Menentukan , dan memilih
7.
Memilih max
komponen utama pertama.
, di mana
adalah koefisien peubah ke-i pada
komponen utama ke-j, dan mengaitkannya dengan peubah yang bersesuaian.
Metode Analisis Procrustes pada Skor Komponen Utama berukuran
× .
1.
Misal konfigurasi data
2.
Membentuk sentroid setiap kolom konfigurasi data , yaitu
3.
Translasi konfigurasi
4.
Membentuk matriks kovarians .
5.
Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks
=
dengan dengan formula
Membentuk skor komponen utama,
7.
Menentukan
8.
Menghilangkan setiap kolom
=
T
=
=
1
secara berurutan, dan membentuk skor
( )
=
dan
dan
( ),
yaitu
=
dan
T
dan =
, di mana
merupakan sentroid kolom dari konfigurasi
10. Menentukan matriks ortogonal matriks
.
=
Menentukan konfigurasi hasil translasi rumus
.
komponen utama yang akan digunakan
komponen utama 9.
1
=0
kovarians , dengan persamaan karakteristik 6.
=
1
dengan dan
dan .
untuk transformasi rotasi, dengan
merupakan hasil penguraian nilai singular bentuk lengkap
dari matriks 11. Menentukan skalar
menjadi =
.
tr tr (
)
untuk transformasi dilasi.
12. Menentukan nilai norma kuadrat perbedaan kedua konfigurasi setelah penyesuaian dengan translasi, rotasi dan dilasi, yaitu : ,
= tr
tr 2 tr(
)
.
34
Eksplorasi Data Eksplorasi data diawali dengan menganalisis sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 yang terdiri dari 3223 mahasiswa dengan 14 mata kuliah yang diberikan pada Tabel 3, sedangkan untuk tahun akademik 2009/2010 yang terdiri dari 3053 mahasiswa dengan 14 mata kuliah diberikan pada Tabel 4. Sebaran nilai ini diurutkan berdasarkan nilai rata-rata tertinggi pada setiap mata kuliah, baik untuk tahun akademik 2008/2009 maupun untuk tahun akademik 2009/2010.
Tabel 3 Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan rata-rata nilai mata kuliah Kode
Peubah
Peubah
Proporsi
Ratarata
A
B
C
D
E
PK
Pengantar Kewirausahaan
3.88
88.46
11.08
0.25
0.03
0.19
OS
Olahraga dan Seni
3.65
66.58
32.73
0.00
0.00
0.68
EU
Ekonomi Umum
3.34
57.96
25.63
10.24
4.53
1.64
AG
Agama
3.33
35.93
61.40
2.14
0.31
0.22
IG
Bahasa Inggris
3.22
42.91
37.42
18.96
0.37
0.34
PI
Pengantar Ilmu Pertanian
3.21
46.70
33.01
15.08
4.69
0.53
ID
Bahasa Indonesia
3.07
39.84
31.34
25.44
2.76
0.62
SU
Sosiologi Umum
2.91
11.79
69.04
18.24
0.59
0.34
KN
Pendidikan Kewarganegaraan
2.84
10.77
64.69
23.30
0.71
0.53
FI
Fisika
2.30
8.35
31.18
43.31
16.63
0.53
KI
Kimia
2.28
10.11
28.36
42.79
16.97
1.77
BI
Biologi
2.23
11.48
27.02
37.98
20.38
3.13
PM
Pengantar Matematika
2.04
5.03
20.88
51.04
18.86
4.19
KA
Kalkulus
1.97
5.49
21.91
42.94
23.74
5.93
Tabel 3 memberikan informasi sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 untuk setiap mata kuliah. Dari Tabel tersebut dapat diketahui banyaknya mahasiswa yang memperoleh nilai mutu tertentu untuk setiap mata kuliah. Misalnya banyaknya mahasiswa yang memperoleh nilai A pada mata kuliah Kalkulus (KA) ialah 5.49%× 3223 = 177 mahasiswa. Tabel 3 juga memberikan informasi 3 mata kuliah yang memiliki nilai rata-rata tertinggi, dengan proporsi nilai mutu A lebih tinggi dari proporsi nilai mutu yang lain, yaitu
35
mata kuliah Pengantar Kewirausahaan (PK), Olahraga dan Seni (OS) dan Ekonomi Umum (EU). Mata kuliah dengan nilai rata-rata terendah adalah mata kuliah Kalkulus (KA), Pengantar Matematika (PM) dan Biologi (BI) yang menunjukkan nilai ratarata terendah pertama, kedua dan ketiga. Tabel 3 juga memberikan informasi bahwa mata kuliah Kalkulus (KA) memiliki proporsi terbesar mahasiswa yang tidak lulus mata kuliah tersebut. Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 diberikan pada Tabel 4.
Tabel 4 Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan simpangan baku Kode Peubah
Peubah
Rata-rata
Median
Simpangan Baku
BI KA EU KI ID PI OS PM FI IG KN SU AG PK
Biologi Kalkulus Ekonomi Umum Kimia Bahasa Indonesia Pengantar Ilmu Pertanian Olahraga dan Seni Pengantar Matematika Fisika Bahasa Inggris Pendidikan Kewarganegaraan Sosiologi Umum Agama Pengantar Kewirausahaan
2.23 1.97 3.34 2.28 3.07 3.21 3.65 2.04 2.30 3.22 2.84 2.91 3.33 3.88
2 2 4 2 3 3 2 2 2 3 3 3 3 4
1.00 0.96 0.95 0.92 0.90 0.90 0.87 0.87 0.86 0.78 0.63 0.59 0.55 0.37
Tabel 4 memberikan informasi keragaman peubah (mata kuliah) dengan menunjukkan mata kuliah yang memiliki keragaman terbesar sampai dengan mata kuliah yang memiliki keragaman yang terkecil. Mata kuliah dengan keragaman terbesar ditandai dengan nilai simpangan baku yang tinggi, yaitu Biologi (BI), Kalkulus (KA), Ekonomi Umum (KU), dan Kimia (KI). Sedangkan mata kuliah dengan keragaman terendah adalah Pengantar Kewirausahaan (PK), Agama (AG), dan Sosiologi Umum (SU).
36
Untuk memberikan gambaran perbandingan antarobjek digunakan diagram kotak garis (boxplot), yang diberikan pada Gambar 1.
Gambar 1 Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan nilai rata-rata
Pada diagram kotak garis tingkat penyebaran atau keragaman data setiap mata kuliah ditunjukkan oleh ukuran panjang kotak pada diagram kotak garis untuk setiap mata kuliah. Gambar 1 memberikan informasi mata kuliah yang memiliki keragaman terbesar yaitu mata kuliah Bahasa Indonesia (ID) dan Kalkulus (KA), sedangkan mata kuliah yang memiliki keragaman relatif kecil adalah Pendidikan Kewirausahaan (PK), Sosiologi Umum (SU) dan Pendidikan Kewarganegaraan (KN). Diagram kotak garis juga memberikan informasi data pencilan. Pada Gambar 1 diperoleh informasi bahwa setiap mata kuliah memiliki data pencilan kecuali mata kuliah Bahasa Indonesia (ID) dan Kalkulus (KA). Namun demikian, data pencilan tersebut tidak dapat diidentifikasi karena data yang terlalu banyak. Diagram kotak garis juga dapat menunjukkan kesimetrisan atau kemiringan data dengan memberikan letak median dan rataan untuk setiap mata kuliah. Mata kuliah yang memiliki pola sebaran yang simetris ialah mata kuliah Pendirikan Kewirausahaan (PK), Bahasa Indonesia (ID), Sosiologi Umum (SU), Pendidikan Kewarganegaraan (KN), Pengantar Matematika (PM) dan dan
37
Kalkulus (KA). Mata kuliah yang memiliki kemiringan pola sebaran positif, yaitu mata kuliah yang memiliki nilai rata-rata lebih besar dari mediannya, ialah mata kuliah Agama (AG), Bahasa Inggris (IG), Pengantar Ilmu Pertanian (PI), Fisika (FI), Kimia (KI) dan Biologi (BI). Mata kuliah Olahraga dan Seni (OS) dan Ekonomi Umum (EU) memiliki kemiringan pola sebaran negatif karena memiliki nilai rata-rata yang lebih kecil dari nilai mediannya. Untuk menyelidiki hubungan antarpeubah (mata kuliah) digunakan korelasi Pearson yang diberikan pada Tabel 5 untuk menunjukkan ada atau tidaknya hubungan antarpeubah.
Tabel 5 Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik 2008/2009 PK
OS
EU
AG
IG
PI
ID
SU
KN
FI
KI
BI
PM
PK
1.000
OS
0.117**
1.000
EU
0.119**
0.104**
1.000
AG
0.113**
0.097**
0.356**
1.000
IG
0.127**
0.157**
0.415**
0.272**
1.000
PI
0.087**
0.119**
0.593**
0.354**
0.446**
1.000
ID
0.108**
0.053*
0.590**
0.396**
0.485**
0.559**
1.000
SU
0.105**
0.163**
0.394**
0.252**
0.389**
0.439**
0.376**
1.000
KN
0.109**
0.189**
0.307**
0.230**
0.337**
0.357**
0.309**
0.346**
1.000
FI
0.073**
0.130**
0.484**
0.257**
0.366**
0.469**
0.418**
0.352**
0.258**
1.000
KI
0.091**
0.147**
0.614**
0.367**
0.482**
0.558**
0.544**
0.382**
0.338**
0.582**
1.000
BI
0.100**
0.091**
0.598**
0.386**
0.483**
0.633**
0.584**
0.455**
0.366**
0.541**
0.662**
1.000
PM
0.058**
0.106**
0.599**
0.300**
0.420**
0.506**
0.497**
0.371**
0.260**
0.595**
0.666**
0.581**
1.000
KA
0.087**
0.156**
0.615**
0.308**
0.419**
0.494**
0.503**
0.345**
0.279**
0.602**
0.682**
0.572**
0.714**
Keterangan :
** nilai-p 0.01 * 0.01 < nilai-p
0.05
Berdasarkan Tabel 5, hampir seluruh nilai
bernilai lebih kecil dari 1%.
Hal ini menunjukkan korelasi antarpeubah (mata kuliah) sangat nyata meskipun nilai yang diperoleh relatif kecil. Nilai korelasi tertinggi terdapat pada korelasi antara mata kuliah Kalkulus (KA) dengan Pengantar Matematika (PM) yang memberikan nilai korelasi 0.714, sedangkan korelasi terendah antara mata kuliah Bahasa Indonesia (ID) dengan mata kuliah Olahraga dan Seni (OS) yang memberikan nilai korelasi 0.053.
KA
1.000
38
Dalam proses penginterpretasian data, cara umum yang telah dikenal adalah dengan melakukan analisis komponen utama untuk mereduksi dimensi data. Tabel 6 menampilkan varians setiap komponen utama yang diperoleh dengan melakukan analisis komponen utama pada data TPB IPB tahun akademik 2008/2009 dan persentase total variasi untuk setiap komponen utama.
Tabel 6 Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009. Komponen Utama
Varians Komponen Utama
1 2 3 4 5 6 7 8 9 10 11 12 13 14
4.74 0.65 0.46 0.42 0.37 0.34 0.31 0.29 0.27 0.26 0.24 0.23 0.21 0.13
Persentase Varians yang dijelaskan Individual 53.18 7.34 5.16 4.66 4.19 3.80 3.47 3.23 3.01 2.89 2.68 2.54 2.38 1.46
Kumulatif 53.18 60.52 65.69 70.35 74.54 78.34 81.81 85.04 88.05 90.94 93.61 96.16 98.54 100.00
Vektor eigen yang bersesuaian dengan matriks kovarians, yang memberikan koefisien atau loading pada kombinasi linear dari peubah yang telah distandardisasi yang mendefinisikan komponen utama diberikan pada Tabel 7. Untuk melihat gambaran nilai eigen dari matriks kovarians ditampilkan scree plot pada Gambar 2.
39
Tabel 7 Vektor eigen dari matriks kovarians data TPB IPB tahun akademik 2008/2009 Komponen Utama Peubah AG BI EU FI ID IG KA KI PK PM OS PI KN SU
KU 1
KU 2
KU 3
KU 4
KU 5
KU 6
KU 7
KU 8
KU 9
KU 10
KU 11
KU 12
KU 13
KU 14
0.1173
0.1332
0.0441
0.0257
-0.0196
-0.0654
0.2734
0.1528
-0.1979
0.0783
-0.3176
0.8408
-0.0572
0.0825
0.3828
0.2186
-0.1342
-0.4756
-0.3682
-0.4455
0.0715
-0.2296
0.1058
0.3377
0.1524
-0.0497
-0.1365
0.0027
0.3489
0.0492
0.5358
0.0720
0.4613
-0.0510
-0.0354
-0.5792
-0.1497
-0.0509
0.0211
0.0055
-0.0617
0.0468
0.2831
-0.3711
-0.2906
-0.2780
-0.1474
0.6553
0.1937
-0.2893
-0.1758
-0.0966
0.0432
0.0599
-0.0481
0.0097
0.3076
0.3748
0.3598
0.3452
-0.3879
0.3291
0.3691
0.2116
0.0513
0.0596
0.0065
-0.2649
0.0067
0.0068
0.2233
0.2696
-0.4520
0.5580
-0.1414
0.0488
-0.4862
-0.2366
-0.0917
-0.0015
0.0947
0.1382
-0.0948
0.0408
0.3552
-0.4670
0.0666
0.2267
0.0979
-0.0971
0.0070
0.2676
0.2233
0.2259
0.5435
0.2113
0.2611
0.0108
0.3552
-0.1753
-0.0948
0.0366
-0.1054
-0.3877
0.0466
0.2048
-0.5206
-0.4753
-0.1548
-0.2215
0.2385
-0.0196
0.0223
0.0390
-0.0363
0.0520
0.0593
-0.0010
0.0695
-0.0388
-0.0519
0.0630
0.0012
0.0561
0.0017
-0.9870
0.3206
-0.3718
0.0557
0.0910
-0.0289
-0.0399
-0.2104
0.1232
0.4126
0.0352
-0.5891
-0.0996
-0.3932
-0.0526
0.0433
-0.0114
-0.3121
0.1447
0.4368
-0.0153
0.2799
0.1529
-0.3511
0.5584
-0.0914
-0.2954
-0.2165
0.0964
0.3142
0.3520
0.0369
-0.4147
0.3134
0.2795
-0.4300
0.4763
-0.0553
-0.0582
0.0846
0.0190
-0.0300
-0.0324
0.1267
0.2084
-0.3367
0.0507
0.3394
-0.1034
0.4376
0.0098
0.4203
-0.4953
0.1684
0.0114
-0.2369
0.0238
0.1453
0.1585
-0.2116
-0.0304
0.1729
0.0643
0.0519
-0.1533
0.2976
0.1474
-0.3928
-0.0563
0.7611
0.0271
40
Gambar 2 Scree plot dari matriks kovarians data TPB IPB tahun akademik 2008/2009
Untuk tahun akademik 2009/2010 yang terdiri dari 3053 mahasiswa, sebaran nilai 14 mata kuliah diberikan pada Tabel 8. Sebaran nilai ini juga diurutkan berdasarkan nilai rata-rata tertinggi pada setiap mata kuliah.
Tabel 8 Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan rata-rata nilai mata kuliah Kode Peubah
Peubah
Proporsi
Ratarata
A
B
C
D
E
PK OS AG IG
Pengantar Kewirausahaan Olahraga dan Seni Agama Bahasa Inggris
3.84 3.76 3.53 3.36
85.12 76.02 54.65 46.92
13.93 23.95 44.20 42.73
0.56 0.00 0.66 9.83
0.20 0.00 0.36 0.33
0.20 0.03 0.13 0.20
ID EU KN PI SU BI FI KI KA PM
Bahasa Indonesia Ekonomi Umum Pendidikan Kewarganegaraan Pengantar Ilmu Pertanian Sosiologi Umum Biologi Fisika Kimia Kalkulus Pengantar Matematika
3.21 3.11 3.04 2.98 2.81 2.52 2.29 2.26 1.95 1.92
43.15 45.97 21.99 21.10 9.83 17.10 11.50 8.52 4.42 4.55
37.16 26.31 61.40 57.57 63.20 33.98 28.70 27.62 19.50 19.07
18.02 21.40 15.73 19.50 25.16 34.14 37.65 47.94 48.17 46.13
1.28 5.21 0.66 1.77 1.47 13.40 21.63 13.40 22.18 24.41
0.39 1.11 0.23 0.07 0.33 1.38 0.52 2.52 5.73 5.83
41
Tabel 8 memberikan informasi sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 untuk setiap mata kuliah. Dari Tabel tersebut dapat diketahui banyaknya mahasiswa yang memperoleh nilai mutu tertentu untuk setiap mata kuliah. Misalnya banyaknya mahasiswa yang memperoleh nilai B pada mata kuliah Pengantar Kewirausahaan (PK) ialah 13.93%× 3053 = 426 mahasiswa. Tabel 6 juga memberikan informasi 6 mata kuliah yang memiliki nilai rata-rata tertinggi, dengan proporsi nilai mutu A lebih tinggi dari proporsi nilai mutu yang lain, yaitu mata kuliah Pengantar Kewirausahaan (PK), Olahraga dan Seni (OS), Agama (AG), Bahasa Indonesia (ID), dan Ekonomi Umum (EU). Mata kuliah dengan nilai rata-rata terendah adalah mata kuliah Kalkulus (KA) dan Pengantar Matematika (PM) yang menunjukkan nilai rata-rata terendah pertama dan terendah kedua. Tabel 8 juga memberikan informasi bahwa mata kuliah Kalkulus (KA) memiliki proporsi terbesar mahasiswa yang tidak lulus mata kuliah tersebut. Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 diberikan pada Tabel 9.
Tabel 9 Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB Tahun Akademik 2009/2010 berdasarkan simpangan baku Kode Peubah
Peubah
Rata-rata
Median
Simpangan Baku
EU BI FI PM KA KI ID PI IG KN SU AG OS PK
Ekonomi Umum Biologi Fisika Pengantar Matematika Kalkulus Kimia Bahasa Indonesia Pengantar Ilmu Pertanian Bahasa Inggris Pendidikan Kewarganegaraan Sosiologi Umum Agama Olahraga dan Seni Pengantar Kewirausahaan
3.11 2.52 2.29 1.92 1.95 2.26 3.21 2.98 3.36 3.04 2.81 3.53 3.76 3.84
3 3 2 2 2 2 3 3 3 3 3 4 4 4
0.99 0.97 0.95 0.92 0.91 0.88 0.81 0.69 0.69 0.65 0.63 0.55 0.43 0.43
42
Tabel 9 memberikan informasi keragaman peubah (mata kuliah) dengan menunjukkan mata kuliah yang memiliki keragaman terbesar sampai dengan mata kuliah yang memiliki keragaman yang terkecil. Mata kuliah dengan keragaman terbesar ditandai dengan nilai simpangan baku yang tinggi, yaitu Ekonomi Umum (EU), Biologi (BI), Fisika (FI), Pengantar Matematika (PM), dan Kalkulus (KA). Sedangkan mata kuliah dengan keragaman terendah adalah Olahraga dan Seni (OS) dan Pengantar Kewirausahaan (PK). Untuk memberikan gambaran perbandingan antarobjek digunakan diagram kotak garis (boxplot), yang diberikan pada Gambar 3. Gambar 3 memberikan informasi mata kuliah yang memiliki keragaman terbesar yaitu mata kuliah Ekonomi Umum (EU), sedangkan mata kuliah yang memiliki keragaman relatif kecil adalah Pendidikan Kewirausahaan (PK), Olahraga dan Seni (OS), Pendidikan Kewarganegaraan (KN), dan Pengantar Ilmu Pertanian (PI).
Gambar 3 Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan nilai rata-rata
Diagram kotak garis juga memberikan informasi data pencilan. Pada Gambar 3 diperoleh informasi bahwa setiap mata kuliah memiliki data pencilan.
43
Namun demikian, data pencilan tersebut tidak dapat diidentifikasi karena data yang terlalu banyak. Diagram kotak garis juga dapat menunjukkan kesimetrisan atau kemiringan data dengan memberikan letak median dan rataan untuk setiap mata kuliah. Mata kuliah yang memiliki pola sebaran yang simetris ialah mata kuliah Ekonomi Umum (EU), Pendidikan Kewarganegaraan (KN), Pengantar Ilmu Pertanian (PI), Kalkulus (KA) dan Pengantar Matematika (PM). Mata kuliah yang memiliki kemiringan pola sebaran positif ialah mata kuliah Bahasa Inggris (IG), Bahasa Indonesia (ID), Fisika (FI), dan Kimia (KI). Mata kuliah Pendidikan Kewirausahaan (PK), Olahraga dan Seni (OS), Agama (AG), Sosiologi Umum (SU) dan Biologi (BI) memiliki kemiringan pola sebaran negatif karena memiliki nilai rata-rata yang lebih kecil dari nilai mediannya. Untuk menyelidiki hubungan antarpeubah (mata kuliah) digunakan korelasi Pearson yang diberikan pada Tabel 10 untuk menunjukkan ada atau tidaknya hubungan antarpeubah. Tabel 10 Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik 2009/2010 PK
OS
AG
IG
ID
PK
1.000
OS
0.055*
1.000
AG
0.098**
0.069**
1.000
IG
0.080**
0.025
0.266**
1.000
ID
0.145**
0.014
0.410**
0.434**
1.000
EU
KN
PI
SU
BI
FI
EU
0.127**
0.064**
0.362**
0.372**
0.563**
1.000
KN
0.150**
0.066**
0.229**
0.316**
0.243**
0.211**
1.000
PI
0.058**
0.057*
0.324**
0.361**
0.398**
0.410**
0.308**
1.000
SU
0.130**
0.066**
0.311**
0.361**
0.453**
0.475**
0.250**
0.378**
1.000
BI
0.078**
0.046
0.400**
0.477**
0.579**
0.628**
0.317**
0.524**
0.482**
1.000
FI
0.079**
0.078**
0.249**
0.430**
0.432**
0.554**
0.285**
0.401**
0.409**
0.586**
1.000
KI
KA
KI
0.102**
0.056*
0.379**
0.423**
0.526**
0.621**
0.301**
0.445**
0.455**
0.656**
0.626**
1.000
KA
0.109**
0.062**
0.318**
0.402**
0.493**
0.619**
0.264**
0.364**
0.420**
0.565**
0.654**
0.676**
1.000
PM
0.066**
0.069**
0.318**
0.431**
0.476**
0.598**
0.279**
0.402**
0.419**
0.566**
0.650**
0.647**
0.735**
Keterangan :
** nilai-p 0.01 * 0.01 < nilai-p
0.05
Berdasarkan Tabel 10, hampir seluruh nilai-p bernilai lebih kecil dari 1%. Hal ini menunjukkan korelasi antarpeubah (mata kuliah) sangat nyata meskipun nilai yang diperoleh relatif kecil. Nilai korelasi tertinggi terdapat pada korelasi
PM
1.000
44
antara mata kuliah Pengantar Matematika (PM) dengan Kalkulus (KA) yang memberikan nilai korelasi 0.735, sedangkan korelasi terendah antara mata kuliah Olahraga dan Seni (OS) dengan mata kuliah Pengantar Kewirausahaan (PK) yang memberikan nilai korelasi 0.05. Untuk mata kuliah Bahasa Inggris (IG), Bahasa Indonesia, dan Biologi (BI) berkorelasi tidak nyata dengan mata kuliah Olahraga dan Seni (OS). Varians setiap komponen utama yang diperoleh dengan melakukan analisis komponen utama pada data TPB IPB tahun akademik 2009/2010 dan persentase total variasi untuk setiap komponen utama diberikan pada Tabel 11.
Tabel 11 Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009. Komponen Utama
Varians Komponen Utama
1 2 3 4 5 6 7 8 9 10 11 12 13 14
4.44 0.60 0.48 0.37 0.33 0.31 0.29 0.28 0.25 0.24 0.21 0.21 0.18 0.17
Persentase Varians yang dijelaskan Individual 53.03 7.17 5.78 4.38 3.94 3.76 3.46 3.31 3.04 2.91 2.56 2.51 2.17 1.98
Kumulatif 53.03 60.20 65.98 70.36 74.30 78.06 81.52 84.84 87.88 90.79 93.35 95.85 98.02 100.00
Vektor eigen yang bersesuaian dengan matriks kovarians diberikan pada Tabel 12, sedangkan scree plot yang bersesuaian diberikan pada Gambar 4.
45
Tabel 12 Vektor eigen dari matriks kovarians data TPB IPB tahun akademik 2009/2010 Komponen Utama Peubah KU 1
KU 2
KU 3
KU 4
KU 5
KU 6
KU 7
KU 8
KU 9
KU 10
KU 11
KU 12
KU 13
KU 14
AG
0.1210
0.2137
-0.0286
0.1669
0.1253
0.1613
0.0383
-0.1498
-0.0021
0.0125
0.7130
-0.4937
0.3018
-0.0460
BI
0.3809
0.3688
0.0688
-0.4908
-0.1003
0.2923
0.1676
0.3543
-0.2246
-0.3942
-0.0599
-0.0732
-0.0696
-0.0672
EU
0.3789
0.0797
-0.6348
-0.1060
0.2743
-0.5078
-0.0551
0.2344
-0.0317
0.1955
0.0295
0.0307
0.0489
0.0377
FI
0.3575
-0.3914
0.3035
-0.3985
-0.3289
-0.4041
0.1212
-0.3636
-0.1014
0.0666
0.1612
-0.0422
0.0835
-0.0174
ID
0.2689
0.3865
-0.2143
0.4093
-0.4474
0.0652
0.1153
-0.3996
-0.3272
0.0904
-0.1126
0.1968
-0.0912
0.1122
IG
0.1887
0.1784
0.3346
0.2552
-0.4425
-0.1945
-0.2149
0.5252
0.3119
0.2882
0.0305
-0.1318
-0.0343
-0.0073
KA
0.3543
-0.4013
-0.0691
0.2758
0.0715
0.1930
0.0275
0.0074
-0.0330
-0.0724
-0.4788
-0.5830
0.0471
0.1083
KI
0.3507
-0.0708
0.0065
-0.0709
0.1655
0.4173
0.4037
-0.0644
0.4855
0.4170
0.0421
0.2868
-0.0682
0.0110
PK
0.0276
0.0498
-0.0039
0.1352
0.0684
-0.1386
0.1466
-0.0985
0.0355
-0.0178
-0.0599
-0.1278
-0.3450
-0.8848
PM
0.3574
-0.3921
0.0455
0.2850
0.0855
0.1973
-0.3949
0.1605
-0.1997
-0.2471
0.3078
0.4345
-0.0588
-0.1389
OS
0.0164
-0.0156
0.0263
-0.0008
0.1020
-0.0776
-0.0079
-0.0610
0.0408
-0.0719
0.2457
-0.1922
-0.8573
0.3734
PI
0.1918
0.3033
0.2589
-0.2133
0.3202
0.1010
-0.6313
-0.3228
-0.0518
0.2998
-0.2108
-0.0568
-0.0305
-0.0441
KN
0.1203
0.1712
0.5164
0.3062
0.4870
-0.3135
0.3764
0.0849
-0.2396
-0.0509
-0.0787
0.1316
0.0929
0.1391
SU
0.1802
0.1836
-0.0136
0.0934
0.0168
-0.2033
-0.1088
-0.2732
0.6279
-0.6102
-0.0853
0.0860
0.1062
0.0653
46
Gambar 4 Scree plot dari matriks kovarians data TPB IPB tahun akademik 2009/2010
Analisis Hasil Berdasarkan eksplorasi data (Tabel 6 dan Tabel 11), penentuan banyaknya peubah yang akan dipertahankan
tidak dapat didasarkan pada nilai eigen
0
tertentu karena data yang digunakan dalam penelitian ini memiliki korelasi yang rendah, sehingga data yang digunakan memiliki nilai eigen yang relatif kecil. Oleh karena itu, nilai menentukan nilai
didasarkan pada proporsi varians komponen utama dengan 0
= 0.80 (Jollife 1972).
Berdasarkan pemilihan
0
tersebut, dalam penelitian ini dipilih
= 7 dan
= 8. Hal tersebut juga dapat didasarkan pada banyaknya unit pengasuh perkuliahan TPB IPB yang terdiri dari Departemen Matematika, Departemen Fisika, Departemen Kimia, Departemen Biologi, Departemen Ekonomi, Departemen Agribisnis, Departemen Komunikasi dan Pengembangan Masyarakat, dan unit MKDU.
47
Hasil Seleksi Peubah Berdasarkan pada Analisis Komponen Utama Hasil dari pengaplikasian metode seleksi peubah berdasarkan pada analisis komponen utama dengan menggunakan software Mathematica 8.0 pada data TPB IPB tahun akademik 2008/2009 ditampikan pada Tabel 13 dan Tabel 14. Tabel 13 menampilkan hasil seleksi peubah metode B2 pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010. Pada tahun akademik 2008/2009 peubah (mata kuliah) PK merupakan peubah yang terseleksi pada urutan pertama, baik untuk
= 7 maupun
= 8. Demikian pula halnya pada tahun akademik
2009/2010. Metode B2 untuk data tahun akademik 2008/2009 menyeleksi peubah dengan urutan PK, SU, AG, PM, OS, KI, EU untuk
= 7 dan untuk
=
8 dengan urutan PK, SU, AG, PM, OS, KI. Dengan demikian peubah yang dipertahankan adalah BI, FI, ID, IG, KA, PI, dan KN (EU) di mana EU merupakan peubah yang turut dipertahankan untuk
= 8.
Pada data tahun akademik 2009/2010 metode B2 memberikan hasil penyeleksian dengan urutan PK, OS, KA, AG, SU, KI, IG untuk
= 7 dan untuk
= 8 dengan urutan PK, OS, KA, AG, SU, KI. Peubah yang dipertahankan BI, EU, FI, ID, PM, PI, dan KN (IG). di mana IG merupakan peubah yang turut dipertahankan untuk
= 8.
Berdasarkan Tabel 13 dapat diperoleh informasi penentuan banyaknya peubah tidak mengubah urutan peubah yang terseleksi. Tabel 13 juga menunjukkan peubah PK merupakan peubah yang selalu terseleksi pada urutan pertama pada setiap tahun akademik. Hal tersebut tampaknya beralasan karena peubah PK memiliki rata-rata terbesar dengan simpangan baku terkecil pada kedua tahun akademik sehingga dipandang kurang memiliki kontribusi pada variasi data, sehingga peubah PK dapat diabaikan dalam analisis. Hal tersebut sesuai dengan tinjauan pustaka yang telah diuraikan sebelumnya. Peubah-peubah yang terseleksi pada kedua tahun akademik adalah AG, KI, OS, PK dan SU namun peubah-peubah yang dipertahankan untuk sedangkan untuk
= 7 adalah BI, FI, ID, KN, PI
= 8 adalah BI, EU, FI, ID, IG, KN, PI.
48
Tabel 13 Hasil seleksi peubah dengan metode B2 (a). Tahun akademik 2008/2009 Metode B2
=7
=8
Urutan peubah yang
PK, SU, AG, PM, OS,
PK, SU, AG, PM, OS, KI
dihilangkan
KI, EU
Peubah yang
BI, FI, ID, IG, KA, PI,
BI, EU, FI, ID, IG, KA,
dipertahankan
KN
PI, KN
(b). Tahun akademik 2009/2010 Metode B2
=7
=8
Urutan peubah yang
PK, OS, KA, AG, SU,
PK, OS, KA, AG, SU, KI
dihilangkan
KI, IG
Peubah yang
BI, EU, FI, ID, PM, PI,
BI, EU, FI, ID, IG, PM,
dipertahankan
KN
PI, KN
Tabel 14 Hasil seleksi peubah dengan metode B4 (a) Tahun akademik 2008/2009 Metode B4
=7
=8
Urutan peubah yang
BI, KA, EU, IG, OS, FI,
BI, KA, EU, IG, OS, FI,
dipertahankan
PI
PI, ID
Peubah yang
AG, ID, KI, PK, PM,
AG, KI, PK, PM, KN,
dihilangkan
KN, SU
SU
(b) Tahun akademik 2009/2010 Metode B4
=7
=8
Urutan peubah yang
BI, KA, EU, ID, KN,
BI, KA, EU, ID, KN,
dipertahankan
KI, PI
KI, PI, IG
Peubah yang
AG, FI, IG, PK, PM,
AG, FI, PK, PM, OS,
dihilangkan
OS, SU
SU
49
Tabel 14 menampilkan hasil pengaplikasian program seleksi peubah metode B4 pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010. Pada tahun akademik 2008/2009 peubah (mata kuliah) BI merupakan peubah yang dipertahankan pada urutan pertama, baik untuk
= 7 maupun
= 8. Demikian
pula halnya pada tahun akademik 2009/2010. Metode B4 untuk data tahun akademik 2008/2009 mempertahankan peubah dengan urutan BI, KA, EU, IG, OS, FI, dan PI untuk
= 7 dan untuk
= 8 dengan urutan BI, KA, EU, IG, OS,
FI, PI, dan ID. Dengan demikian peubah yang diseleksi adalah AG, KI, PK, PM, KN, dan SU (ID) di mana ID merupakan peubah yang turut diseleksi untuk
= 7.
Pada data tahun akademik 2009/2010 metode B4 memberikan hasil dengan urutan BI, KA, EU, ID, KN, KI, dan PI untuk
= 7 dan untuk
=8
dengan urutan BI, KA, EU, ID, KN, KI, PI, dan IG. Peubah yang terseleksi adalah AG, FI, PK, PM, OS, dan SU (IG) di mana IG merupakan peubah yang turut dipertahankan untuk
= 7.
Berdasarkan Tabel 14 dapat diperoleh informasi penentuan banyaknya peubah tidak mengubah urutan peubah yang dipertahankan. Tabel 14 juga menunjukkan peubah BI merupakan peubah yang selalu dipertahankan pada urutan pertama pada setiap tahun akademik. Hal tersebut disebabkan peubah BI merupakan peubah yang memiliki nilai simpangan baku terbesar pada kedua tahun akademik sehingga peubah BI memberikan kontribusi yang besar pada variasi data dan harus dimasukan dalam analisis. Peubah-peubah yang dipertahankan pada kedua tahun akademik adalah BI, EU, KA, dan PI untuk = 7 dan untuk
= 8 peubah-peubah yang dipertahankan adalah BI, EU, ID,
IG, KA, dan PI. Peubah-peubah yang terseleksi baik untuk
= 7 maupun
=8
adalah AG, PK, PM, dan SU. Hasil seleksi peubah dengan menggunakan analisis komponen utama dengan metode B2 dan B4 pada data TPB IPB tahun akademik 2008/2009 dan tahun akademik 2009/2010 dapat disimpulkan pada Tabel 15.
50
Tabel 15 Hasil seleksi peubah berdasarkan pada analisis komponen utama Peubah yang Dipertahankan Metode Seleksi
Tahun Akademik 2008/2009 =7
B2
B4
Tahun Akademik 2009/2010
=8
=7
=8
BI, FI, ID, IG,
BI, EU, FI, ID, BI, EU, FI,
BI, EU, FI, ID,
KA, PI, KN
IG, KA, PI,
ID, PM, PI,
IG, PM, PI,
KN
KN
KN
BI, KA, EU,
BI, KA, EU,
BI, KA, EU,
BI, KA, EU,
IG, OS, FI, PI
IG, OS, FI, PI,
ID, KN, KI, PI ID, KN, KI,
ID
PI, IG
Informasi yang dapat diperoleh dari Tabel 15 adalah perbandingan hasil seleksi peubah yang dihasilkan oleh metode B2 dengan metode B4 pada kedua tahun akademik. Banyak peubah yang dipertahankan turut mempengaruhi hasil = 7, peubah-
yang diberikan. Pada data tahun akademik 2008/2009, untuk
peubah yang dipertahankan baik oleh metode B2 maupun B4 adalah BI, FI, IG, KA, dan PI atau memiliki kesamaan 71.42%, sedangkan untuk
= 8 peubah
yang dipertahankan adalah BI, EU, FI, ID, IG, KA, dan PI atau 87.50% sama. Pada data tahun akademik 2009/2010, untuk
= 7 peubah yang dipertahankan
adalah BI, EU, ID, KN, dan PI atau memiliki kesamaan 71.42% sedangkan untuk = 8 peubah yang dipertahankan adalah BI, EU, ID, IG, KN, dan PI atau memiliki kesamaan 75%. Uraian di atas juga menunjukkan bahwa data yang digunakan dalam pengaplikasian metode seleksi peubah turut mempengaruhi hasil seleksi peubah yang diberikan.
Hasil Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama Proses seleksi dilakukan dengan memilih banyaknya komponen utama yang digunakan ( ) yaitu
= 2 dan
= 3 dengan asumsi untuk
= 2, 3 varians
yang dijelaskan oleh komponen utama lebih dari 80% varians data sebenarnya (Jollife 2002). Banyaknya peubah yang dipertahankan dipilih
= 7 dan
=8
51
agar memiliki dimensi yang sama saat hasil yang diperoleh dibandingkan dengan metode B2 dan B4. Hasil seleksi peubah dengan analisis procrustes pada komponen utama pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010 ditampilkan pada Tabel 16.
Tabel 16
Hasil seleksi peubah dengan analisis procrustes pada skor komponen utama
k
2
3
Tahun Akademik 2008/2009 =7
=8
Tahun Akademik 2009/2010 =7
=8
BI, EU, FI, ID,
BI, EU, FI, ID,
BI, EU, FI, ID,
BI, EU, FI, ID,
KA, PM, PI
KA, KI, PM, PI
KA, PM. PI
KA, KI, PM, PI
BI, EU, FI, ID,
BI, EU, FI, ID,
BI, EU, FI, ID,
BI, EU, FI, ID,
IG, KA, PI
IG, KA, PM, PI
KA, PM, KN
KA, PM, PI, KN
Tabel 16 memberikan informasi bahwa pemilihan nilai
pada proses
seleksi pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010 hanya memberikan sedikit pengaruh pada hasil seleksi baik untuk
= 7 maupun
= 8.
Demikian pula halnya pada urutan peubah yang terseleksi, pemilihan nilai hanya memberikan sedikit variasi pada urutan peubah yang terseleksi. Urutan peubah yang terseleksi pada metode analisis procrustes pada skor komponen utama ditampilkan pada Tabel 17. Untuk data TPB tahun akademik 2008/2009, Tabel 17 memberikan informasi bahwa peubah PK merupakan peubah yang terseleksi dalam urutan pertama dan dilanjutkan oleh peubah OS. Hal tersebut sesuai dengan eksplorasi data yang telah diuraikan sebelumnya yang menyatakan bahwa peubah PK merupakan peubah yang memiliki nilai simpangan baku terendah. Untuk data TPB tahun akademik 2009/2010, peubah OS merupakan peubah yang terseleksi pada urutan pertama, di mana peubah OS juga memiliki nilai simpangan baku yang kecil.
52
Tabel 17 Urutan peubah yang terseleksi berdasarkan metode seleksi dengan analisis procrustes pada skor komponen utama Tahun Akademik 2008/2009 =7
Tahun Akademik 2009/2010
=8
=7
=8
2
PK, OS, AG, SU, KN, IG, KI
PK, OS, AG, SU, KN, IG
OS, PK, AG, SU, KN, IG, KI
OS, PK, AG, SU, KN, IG
3
PK, AG, SU, OS, KN, KI, PM
PK, AG, SU, OS, KN, KI
OS, PK, AG, SU, KN, IG, PI
OS, PK, AG, SU, KN, IG
Informasi penting lainnya yang dapat diperoleh dari Tabel 16 adalah kekonsistenan peubah-peubah yang dipertahankan oleh metode ini di mana peubah-peubah yang dipertahankan pada data TPB IPB tahun akademik 2008/2009 sama dengan peubah-peubah yang dipertahankan pada data TPB IPB tahun akademik 2009/2010, meskipun ada sedikit perbedaan untuk
= 3.
Seleksi Peubah dengan Analisis Procrustes Menggunakan prinsip dasar dan pola pikir yang sama dengan metode seleksi peubah menggunakan analisis procrustes pada skor komponen utama peneliti bermaksud untuk melakukan seleksi
peubah dengan langsung
menggunakan analisis procrustes pada konfigurasi data awal dengan konfigurasi data yang telah tereduksi. Misalkan
peubah telah diukur pada setiap
konfigurasi data . Setiap kolom dari konfigurasi berurutan. Misalkan pula dari konfigurasi konfigurasi dimensi
( )
( )
objek dan ditempatkan pada kemudian dihilangkan secara
menyatakan konfigurasi titik-titik saat kolom ke-j
dihilangkan. Sebuah kolom berisi nol ditambahkan pada yang berdimensi
×
1 sehingga konfigurasi
( )
memiliki
× .
Proses selanjutnya adalah membandingkan konfigurasi konfigurasi
( )
dengan
menggunakan analisis procrustes sehingga memberikan nilai
untuk setiap kolom. Kolom ke-j dari konfigurasi
yang memberikan nilai
2 2
53
terkecil merupakan peubah yang pandang memiliki kontribusi paling sedikit pada struktur data sehingga dapat dikeluarkan dari analisis. Setelah satu peubah dikeluarkan, dimensi konfigurasi ×
menjadi
1 , dan keseluruhan proses kembali dilakukan untuk menghilangkan 2 peubah pada konfigurasi sebelumnya.
satu peubah sehingga tersisa
Prosedur ini terus dilakukan sehingga tersisa inilah yang dipandang sebagai struktur
peubah. Peubah-peubah
peubah terbaik yang mewakili keseluruhan
peubah dari konfigurasi data asli.
Diagram alir metode seleksi dengan analisis procrustes diberikan pada Gambar 5 di bawah ini.
Matriks data
Setiap kolom dihilangkan secara berurutan
=
1,
2,
Sebuah kolom nol ditambahkan Analisis procrustes
2 ()
()
Peubah yang memiliki nilai ( 2) terkecil dihilangkan dan proses kembali diulangi
Gambar 5 Diagram alir metode seleksi dengan analisis procrustes
Berdasarkan diagram alir tersebut, peneliti menyusun program seleksi peubah dengan analisis procrustes menggunakan software Mathematica 8.0.
,
54
Algoritma Program Seleksi Peubah dengan Metode Analisis Procrustes × .
1.
Misal konfigurasi data
berukuran
2.
Menghilangkan setiap kolom dari konfigurasi data dan menambahkan kolom nol membentuk
( )
secara berurutan,
,
sehingga memiliki dimensi
yang sama dengan . 3.
Menentukan hasil translasi konfigurasi =
dengan rumus =
1
dan
konfigurasi 4.
dan
dari matriks
6.
( )
=
1 ( )
( )
( ),
=
yaitu
( )
T ( )
dan
( )
, di mana
merupakan sentroid kolom dari
( ).
=
Menentukan matriks ortogonal matriks
5.
dan
dan
dan
untuk transformasi rotasi, dengan
merupakan hasil penguraian nilai singular bentuk lengkap ( )
Menentukan skalar
menjadi tr
= tr (
. ( )
( )
( )
)
untuk transformasi dilasi.
Menentukan nilai norma kuadrat perbedaan kedua konfigurasi setelah penyesuaian dengan translasi, rotasi dan dilasi, yaitu : ETRD
,
( )
= tr
tr 2 tr(
( ) ( )
( )
)
.
Hasil Seleksi Peubah dengan Metode Analisis Procrustes Hasil pengaplikasian program seleksi peubah dengan analisis procrustes pada data TPB IPB tahun akademik 2008/2009 dan tahun 2009/2010 menggunakan software Mathematica 8.0 diberikan pada Tabel 18. Pengaplikasian program seleksi peubah pada data TPB IPB tahun akademik 2008/2009 menunjukkan bahwa peubah PK merupakan peubah yang terseleksi dalam urutan pertama. Hal tersebut juga sesuai dengan tinjauan pustaka yang menyatakan peubah dengan simpangan baku yang kecil dapat diabaikan dalam analisis. Urutan peubah yang terseleksi oleh metode seleksi peubah dengan analisis procrustes adalah PK, AG, SU, OS, PM, KN, dan PI (KI) di mana KI merupakan peubah yang ikut terseleksi pada
= 7.
55
Untuk data tahun akademik 2009/2010 urutan peubah yang terseleksi adalah PK, OS, AG, SU, KA, IG, dan PI (KI) di mana KI merupakan peubah yang ikut terseleksi pada
= 7.
Tabel 18 Hasil seleksi peubah dengan analisis procrustes Tahun
=7
Akademik
=8
2008/2009
BI, EU, FI, ID, IG, KA, PI
BI, EU, FI, ID, IG, KA, KI, PI
2009/2010
BI, EU, FI, ID, PM, PI, KN
BI, EU, FI, ID, KI, PM, PI, KN
Untuk data tahun akademik 2008/2009, peubah yang dipertahankan relatif sama untuk variasi nilai . Demikan pula untuk data tahun akademik 2009/2010. Tabel 18 juga memberikan informasi kekonsistenan peubah yang dipertahankan pada metode ini. Pada tabel tersebut juga terlihat bahwa KA dan PM merupakan peubah yang berkorelasi tinggi, artinya jika KA dipertahankan maka PM akan dihilangkan. Demikian pula sebaliknya. Untuk
= 7 peubah yang dipertahankan
pada kedua tahun akademik adalah BI, EU, FI, ID, dan PI, sedangkan untuk
=8
peubah yang dipertahankan adalah BI, EU, FI, ID, KI, dan PI. Tabel 19 dan 20 menampilkan perbandingan hasil seleksi peubah dengan metode analisis procrustes pada komponen utama dengan metode analisis procrustes pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010 berturut-turut. Pada Tabel 19 diperoleh informasi bahwa kedua metode memberikan hasil seleksi peubah yang relatif sama. Untuk
= 2 hanya terdapat
satu peubah yang berbeda, yaitu peubah PM dan peubah IG untuk setiap metode. Untuk untuk
= 3 dan
= 7 kedua metode memberikan hasil yang sama, sedangkan
= 8 terdapat satu peubah yang berbeda, yaitu PM dan IG.
Pada Tabel 20 hasil seleksi juga memiliki tren yang sama. Untuk
= 2,
terdapat satu peubah yang berbeda, yaitu peubah KA dan KN untuk setiap metode. Untuk dan KI.
= 3 juga terdapat satu peubah yang berbeda, yaitu peubah KA
56
Tabel 19
Perbandingan seleksi peubah dengan analisis procrustes pada skor komponen utama dengan seleksi peubah dengan analisis procrustes pada data TPB IPB tahun akademik 2008/2009
Metode Seleksi Analisis Procrustes pada Komponen Utama Analisis Procrustes
Tabel 20
=7
=8
BI, EU, FI, ID, KA, PM, PI
BI, EU, FI, ID, KA, KI, PM, PI
2
BI, EU, FI, ID, IG, KA, PI
BI, EU, FI, ID, IG, KA, PM, PI
3
BI, EU, FI, ID, IG, KA, PI
BI, EU, FI, ID, IG, KA, KI, PI
Perbandingan seleksi peubah berdasarkan analisis procrustes pada skor komponen utama dengan seleksi peubah dengan analisis procrustes pada data TPB IPB tahun akademik 2009/2010
Metode Seleksi Analisis Procrustes pada Komponen Utama
Analisis Procrustes
=7
=8
BI, EU, FI, ID, KA, PM. PI
BI, EU, FI, ID, KA, KI, PM, PI
2
BI, EU, FI, ID, KA, PM, KN
BI, EU, FI, ID, KA, PM, PI, KN
3
BI, EU, FI, ID, PM, PI, KN
BI, EU, FI, ID, KI, PM, PI, KN
Ukuran Efisiensi Pengaplikasian berbagai metode seleksi peubah pada data, akan memberikan hasil seleksi yang bervariasi. Demikian pula pada data TPB IPB, baik data tahun akademik 2008/2009 maupun 2009/2010. Oleh karena itu dibutuhkan sebuah ukuran efisiensi yang akan memberikan gambaran hasil seleksi terbaik yang dapat mewakili informasi yang terkandung pada data asli.
57
Tabel 21 Hasil seleksi peubah untuk data TPB tahun akademik 2008/2009 Metode Seleksi
=7
=8
B2
BI, FI, ID, IG, KA, PI, KN
BI, EU, FI, ID, IG, KA, PI, KN
B4
BI, KA, EU, IG, OS, FI, PI
BI, KA, EU, IG, OS, FI, PI, ID
BI, EU, FI, ID, KA, PM, PI
BI, EU, FI, ID, KA, KI, PM, PI
BI, EU, FI, ID, IG, KA, PI
BI, EU, FI, ID, IG, KA, PM, PI
BI, EU, FI, ID, IG, KA, PI
BI, EU, FI, ID, IG, KA, KI, PI
Analisis Procrustes pada Skor Komponen Utama = 2 Analisis Procrustes pada Skor Komponen Utama = 3 Analisis Procrustes
Berdasarkan hasil seleksi peubah yang diperoleh untuk setiap metode, yang diringkas pada Tabel 21 dan 22, ukuran efisiensi berdasarkan analisis procrustes diukur pada setiap himpunan
peubah yang dipertahankan untuk
menguji efisiensi atau kedekatan himpunan peubah tersebut dengan data yang sebenarnya. Ukuran efisiensi untuk setiap metode diberikan pada Tabel 23.
Tabel 22 Hasil seleksi peubah untuk data TPB tahun akademik 2009/2010 Metode Seleksi
=7
B2
BI, EU, FI, ID, PM, PI, KN
B4
BI, KA, EU, ID, KN, KI, PI
Analisis Procrustes pada Skor Komponen Utama =2 Analisis Procrustes pada Skor Komponen Utama =3 Analisis Procrustes
=8 BI, EU, FI, ID, IG, PM, PI, KN BI, KA, EU, ID, KN, KI, PI, IG
BI, EU, FI, ID, KA, PM, PI
BI, EU, FI, ID, KA, KI, PM, PI
BI, EU, FI, ID, KA, PM, KN
BI, EU, FI, ID, KA, PM, PI, KN
BI, EU, FI, ID, PM, PI, KN
BI, EU, FI, ID, KI, PM, PI, KN
Untuk kemudahan dalam penulisan dalam tabel, metode seleksi peubah dengan analisis procrustes pada skor komponen utama akan disebut dengan APSKU dan metode seleksi peubah dengan analisis procrustes akan disebut dengan AP.
58
Hasil pengukuran kesesuaian hasil seleksi peubah dengan konfigurasi data awal diberikan pada tabel 23. Berdasarkan nilai
2
, pada data TPB IPB tahun
akademik 2008/2009 metode seleksi peubah yang dipandang paling mewakili data =7
yang sebenarnya adalah metode B2, dengan nilai kesesuaian 99.36% untuk dan 99.60% untuk
= 8. Metode seleksi terbaik kedua adalah metode analisis
procrustes pada skor komponen utama dengan
= 3 dan B4 dengan nilai
kesesuaian 99.27% dan 99.55% berturut-turut. Tabel 23 Urutan metode seleksi peubah yang mempertahankan berdasarkan ukuran efisiensi
peubah
Urutan Metode Seleksi Terbaik Ukuran Efisiensi
Tahun Akademik 2008/2009 = 7
= 8
= 7
=8
B2
B2
B2
B2
B4
AP
AP
APSKU 2
Tahun Akademik 2009-2010
=3
APSKU
AP B4 APSKU
=3
AP =2
APSKU
=2
APSKU
=3
APSKU
=3
APSKU
=2
APSKU
=2
B4
B4
Hasil pengukuran ukuran efisiensi pada data TPB IPB tahun akademik 2009/2010 juga menyatakan metode B2 merupakan metode seleksi terbaik dengan memberikan nilai efisiensi 99.44% dan 99.61% untuk
= 7 dan
= 8. Metode
seleksi kedua adalah metode analisis procrustes dengan nilai efisiensi 99.44% dan 99.56% untuk
= 7 dan
= 8 berturut-turut. Namun demikian, keempat metode
yang diuji memberikan ukuran efisiensi lebih dari 99.09%. Metode B4 tampaknya menjadi metode yang tidak direkomendasikan untuk data TPB IPB tahun akademik 2009/2010. Tabel 23 juga memberikan informasi bahwa penentuan banyaknya peubah yang dipertahankan, , juga berpengaruh pada penentuan metode seleksi terbaik, sehingga penentuan nilai
juga menjadi suatu pertimbangan yang penting. Hal
tersebut didasarkan pada makin dekatnya jarak antarkonfigurasi yang ditunjukkan oleh nilai
2
yang makin besar.
59
Uraian di atas menunjukkan bahwa metode seleksi peubah sangat bergantung pada data yang digunakan, sehingga tidak dapat dilakukan justifikasi penentuan metode seleksi terbaik. Namun demikian, peneliti merekomendasikan metode seleksi peubah dengan analisis procrustes menjadi salah satu metode seleksi yang sangat baik.
Interpretasi Hasil Seleksi Peubah Pada Data TPB IPB Berdasarkan pemilihan metode seleksi terbaik dalam penelitian ini, diperoleh hasil seleksi peubah berdasarkan ukuran efisiensi
2
. Mata kuliah yang
dipandang dapat mewakili data TPB IPB tahun akademik 2008/2009 adalah Biologi, Fisika, Bahasa Indonesia, Bahasa Inggris, Kalkulus, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan (Ekonomi Umum). Untuk tahun akademik 2009/2010 mata kuliah yang mewakili data TPB IPB adalah Biologi, Ekonomi Umum, Fisika, Bahasa Indonesia, Pengantar Matematika, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan (Bahasa Inggris). Jika dibandingkan kekonsistenan antartahun akademik mata kuliah yang memberikan variasi pada data TPB IPB adalah Biologi, Fisika, Bahasa Indonesia, Bahasa Inggris, Pendidikan Kewarganegaraan, Pengantar Ilmu Pertanian, dan Ekonomi Umum serta Pengantar Matematika atau Kalkulus. Pengantar Matematika dan Kalkulus adalah dua mata kuliah yang memiliki nilai korelasi yang paling tinggi pada kedua tahun akademik, sehingga keberadaan kedua mata kuliah tersebut dapat dipertukarkan. Hasil ini dapat digunakan untuk penelitian-penelitian ataupun pengambilan kebijakan berkaitan dengan pengelolaan TPB IPB seperti pemetaan mata kuliah maupun pengelompokan mahasiswa yang berasal dari program studi tertentu.
60
61
KESIMPULAN DAN SARAN Kesimpulan Kesimpulan dari penelitian ini adalah : 1.
Tersedianya paket program seleksi peubah menggunakan software Mathematica 8.0.
2.
Dalam penelitian ini, metode seleksi peubah terbaik adalah metode B2, dilanjutkan dengan metode analisis procrustes, metode analisis procrustes pada skor komponen utama, dan metode B4. Namun demikian keempat metode memberikan ukuran kesesuaian lebih dari 99.04%.
3.
Analisis procrustes dapat digunakan sebagai salah satu metode seleksi peubah yang baik.
4.
Dalam aplikasi metode seleksi peubah pada data TPB IPB, mata kuliah yang dipandang mampu menggambarkan keseluruhan data TPB IPB tahun akademik 2008/2009 adalah mata kuliah-mata kuliah Biologi, Ekonomi Umum, Fisika, Bahasa Indonesia, Kalkulus, dan Pengantar Ilmu Pertanian. Untuk tahun akademik 2009/2010 mata kuliah-mata kuliah Biologi, Ekonomi Umum, Fisika, Bahasa Indonesia, dan Pengantar Matematika. Kalkulus dan Pengantar Matematika adalah mata kuliah yang memiliki korelasi paling tinggi, sehingga keberadaannya dapat dipertukarkan.
Saran Seleksi peubah merupakan salah satu langkah penting dalam sebuah penelitian ilmiah. Dalam penelitian ini program seleksi peubah yang disusun menggunakan software Mathematica 8 masih sangat sederhana. Oleh karena itu perlu dikembangkan dengan Graphic User Interface (GUI) yang memberikan kemudahan operasi bagi pengguna dan lebih atraktif.
62
63
DAFTAR PUSTAKA Al-Kandari NM, Jolliffe IT. 2001. Variable selection and interpretation of covariance principal component. Journal of Statistical Computation and Simulation 30(2): 339-354. Al-Kandari NM, Jolliffe IT. 2005. Variable selection and interpretation in correlation principal component. Environmetrics 16: 659-672. Andrade JM, Maria P, Krzanowski W, Kubista M. 2004. Procrustes rotation in analytical chemistry. Chemometrics and Intellegent Laboratory 72: 123132. Awange JL, Grafarend EW, Palánch B, Zaletnyik P. 2010. Algebraic Geodesy and Geoinformatics. Ed ke-2. Berlin: Springer-Verlag. Bakhtiar T, Siswadi. 2011. Orthogonal procrustes analysis: Its transformation arrangement and minimal distance. International Journal of Applied Mathematics & Statistics 20:16-24. Baxter MJ, Beardah, Papageorgiou. 2008. On statistical approaches to the study of ceramic artifact using geochemical and petrographic data. Archaeometry 50(1): 142-157. Beale EML, Kendal MG, Mann DW. 1967. The discarding of variables in multivariate analysis. Biometrika 54: 357-366. Bilodeau M, Brenner D. 1999. Theory of Multivariate Statistics. New York: Springer-Verlag. Borg I. 1978. Procrustean analysis of matrices with different row order. Psychometrika 43: 277-278. Dijksterhuis G, Frost MB, Byrne DV. 2002. Selection of a subset of variables: minimization of procrustes loss between a subset and the full set. Food Quality and Preference 13: 89-97. Dryden II, Mardia KV. 1998. Statistical Shape Analysis. West Sussex: John Wiley & Sons. Everitt BS, Skrondal A. 2010. The Cambridge Dictionary of Statistics. Ed ke-4. New York: Cambridge University Press.
64
George EI. 2000. The variable selection problem. J Amer Statist Assoc 95: 13041308. Gower JC. 1975. Generalized procrustes analysis. Psychometrika 40: 33-51. Gower JC, Dijksterhuis GB. 2004. Procrustes Problems. New York: Oxford University Press. Green BF. 1952. The orthogonal approximation of an oblique structure in factor analysis. Psychometrika 17: 429-440 Hair JF, Anderson RE, Tatham RL. 1998. Multivariate Data Analysis. Ed ke-8 London: Prentice Hall International. Héberger K, Andrade JM. 2004. Procrustes rotation and pair-wise correlation: a parametric and a non-parametric method for variable selection. Croatia Chemica Acta 1-2: 117-125. Hurley JR, Cattell RB. 1962. The Procrustes program: producing direct rotation to test a hypothesized factor structure. Beh. Sci. 7, 258–262. Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis. Ed ke-6. London: Pearson Education. Jolliffe IT. 1972. Discarding variable in principal component analysis–I: artificial data. Applied Statistics 21: 160-173 Jolliffe IT. 2002. Principal Component Analysis. Ed ke-2. New York: SpringerVerlag. King JR, Jackson DA. 1999. Variable selection in large environmental data sets using principal component analysis. Environmetrics 10: 67-77. Koschat MA, Swayne DF. 1991. A weighted procrustes criterion. Psychometrika 56: 229-239. Krzanowski W. 2007. Statistical Principles and Techniques in Scientific and Social Investigations. New York: Oxford University Press. Lissitz RW, Schönemann PH, Lingoes JC. 1976. A solution to the weighted procrustes problem in which transformation is in agreement with the loss function. Psychometrika 41: 547-550. Schönemann PH. 1966. A generalized solution of the orthogonal procrustes problem. Psychometrika 31: 1-10.
65
Schönemann PH, Carroll RM. 1970. Fitting one matrix to another under choice of a central dilation and rigid motion. Psychometrika 35: 245-255. Ten Berge JMF. 1977. Orthogonal rotation for two or more matrices. Psychometrika 42: 267-276. Ten Berge JMF, Knol DF. 1984. Orthogonal rotation to maximal agreement for two or more matrices of different column orders. Psychometrika 49: 4955. Varmuza K, Filzmoser P. 2009. Introduction to Multivariate Statistical Analysis in Chemometrics. New York: CRC Press. Wei HL, Billings SA. 2007. Feature subset selection and ranking for data dimensionality reduction. IEEE Trans Patt Anal Mach Intel 29: 162-166. Westad F, Hersleth M, Lea P. 2003. Variable selection in PCA in sensory descriptive and consumer data. Food Quality and Preference 14: 463-472.
69
Lampiran 1 DATA NILAI TPB IPB TAHUN AKADEMIK 2008/2009 Keterangan Banyak Mata Kuliah (Peubah) Banyak Mahasiswa (Objek) AG BI EU FI ID IG KA
: 14 : 3223
: Agama : Biologi : Ekonomi Umum : Fisika : Bahasa Indonesia : Bahasa Inggris : Kalkulus
KI PK PM OS PI KN SU
: Kimia : Pengantar Kewirausahaan : Pengantar Matematika : Olahraga dan Seni : Pengantar Ilmu Pertanian : Pendidikan Kewarganegaraan : Sosiologi Umum
No
AG
BI
EU
FI
ID
IG
KA
KI
PK
PM
OS
PI
KN
SU
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
3 3 4 3 4 3 4 3 3 3 4 4 3 3 2 3 4 3 3 4 3 3 4 4 3 4 4 4
3 0 1 1 2 2 4 2 1 4 4 2 2 1 3 2 2 1 1 1 3 1 3 4 4 2 4 3
4 0 2 2 4 4 4 2 1 4 4 4 4 4 4 3 4 3 3 2 4 3 4 4 3 4 4 4
3 2 1 1 3 2 4 2 2 3 3 2 1 2 3 3 2 1 2 2 2 2 3 2 2 3 3 2
4 2 2 2 4 3 4 2 2 4 4 3 3 3 3 3 4 3 3 2 3 2 4 4 4 4 4 4
3 3 3 2 3 3 3 3 2 4 2 3 3 4 4 3 4 2 4 2 2 2 3 4 4 3 4 4
3 0 0 1 3 2 3 1 0 2 3 2 2 2 2 2 2 2 1 1 3 1 2 2 1 2 3 2
2 1 2 1 3 2 2 2 1 3 2 1 2 2 3 2 2 1 1 2 3 2 2 3 2 3 4 2
4 4 4 4 3 4 3 4 4 4 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
2 0 2 1 2 3 2 2 0 2 2 2 2 2 3 2 2 1 1 1 2 1 2 2 2 3 3 3
4 3 4 3 4 4 3 4 3 3 4 4 4 4 4 3 4 4 4 4 3 4 4 4 3 4 4 3
3 2 4 2 4 2 4 4 2 4 4 3 4 3 4 3 4 2 2 3 4 2 4 4 4 3 4 4
3 3 4 3 3 3 3 3 2 3 4 3 3 3 2 3 3 3 3 2 3 2 3 3 3 3 3 3
2 2 3 2 3 3 3 3 2 3 3 3 2 2 3 3 3 2 3 3 3 2 4 2 3 3 3 3
70
No
AG
BI
EU
FI
ID
IG KA
KI PK PM OS
PI
KN SU
29
3
3
4
2
3
3
2
3
4
2
4
4
3
2
30
3
0
1
1
2
2
0
0
4
0
4
1
2
2
31
3
2
4
2
4
4
1
2
4
1
3
3
3
3
32
3
3
4
3
4
4
2
3
4
3
3
4
4
3
33
3
2
3
2
2
3
3
3
4
3
4
3
2
3
34
3
1
3
2
2
3
2
2
4
2
4
2
3
3
35
3
1
3
1
3
3
1
2
4
2
4
3
2
3
36
4
3
4
2
4
4
1
3
4
2
3
3
3
3
37
3
2
4
1
3
3
1
2
4
2
3
3
2
3
38
3
2
3
1
2
2
1
2
4
1
3
3
2
2
39
4
3
4
2
4
4
2
3
3
2
4
3
3
3
40
3
1
1
2
2
2
1
1
4
1
3
3
2
3
3201
4
3
4
2
4
3
2
2
4
2
3
4
3
3
3202
3
2
3
2
3
2
2
2
4
2
4
4
3
4
3203
3
1
1
0
1
2
0
0
3
1
0
2
3
0
3204
4
1
4
2
2
3
1
1
4
0
4
1
2
3
3205
3
1
2
2
2
2
1
1
4
0
4
1
3
2
3206
3
1
2
2
2
2
1
1
4
1
3
1
2
2
3207
3
0
1
1
1
2
0
1
1
1
4
3
3
2
3208
3
2
4
2
3
3
2
2
3
2
3
3
3
3
3209
3
1
2
1
2
3
2
2
4
1
4
2
2
3
3210
3
2
4
2
3
4
2
2
4
2
3
4
3
3
3211
2
0
0
1
1
1
0
1
4
0
3
0
2
1
3212
3
0
4
1
1
3
1
0
4
0
3
2
2
2
3213
3
1
1
1
1
2
0
2
4
0
4
1
2
3
3214
3
1
0
1
2
4
1
1
4
0
4
2
3
3
3215
1
0
1
0
1
3
0
0
4
0
0
0
1
2
3216
1
0
0
1
0
3
0
0
4
0
3
1
2
2
3217
4
3
4
3
4
4
2
3
4
2
4
4
4
4
3218
3
2
3
1
3
2
1
1
4
2
3
3
3
2
3219
3
1
3
1
4
4
1
2
3
2
4
3
3
3
3220
3
0
0
1
0
1
0
0
3
1
4
1
0
3
3221
3
2
3
1
2
3
1
1
4
1
4
2
3
3
3222
4
3
2
2
2
3
0
1
4
3
4
1
3
3
3223
3
2
4
2
2
2
1
1
3
2
3
3
3
3
71
Lampiran 2 DATA NILAI TPB IPB TAHUN AKADEMIK 2009/2010 Keterangan Banyak Mata Kuliah (Peubah) Banyak Mahasiswa (Objek) AG BI EU FI ID IG KA
: 14 : 3053
: Agama : Biologi : Ekonomi Umum : Fisika : Bahasa Indonesia : Bahasa Inggris : Kalkulus
KI PK PM OS PI KN SU
: Kimia : Pengantar Kewirausahaan : Pengantar Matematika : Olahraga dan Seni : Pengantar Ilmu Pertanian : Pendidikan Kewarganegaraan : Sosiologi Umum
No
AG
BI
EU
FI
ID
IG
KA
KI
PK
PM
OS
PI
KN SU
1
4
2
1
1
3
3
0
1
4
1
4
3
3
2
2
4
4
4
3
3
4
3
3
4
2
4
3
4
4
3
4
3
4
2
4
4
2
3
4
3
3
3
4
3
4
4
1
2
2
3
3
2
2
3
2
4
4
3
3
5
4
4
4
4
4
4
3
3
4
3
4
4
4
3
6
4
2
4
2
4
3
2
3
4
2
4
3
3
3
7
3
2
4
3
4
4
2
2
4
3
4
3
2
3
8
4
3
3
3
4
4
2
3
3
2
3
3
3
3
9
3
2
1
1
2
2
0
1
4
1
4
3
2
1
10
3
1
1
1
1
3
0
1
4
0
4
3
3
2
11
4
3
2
1
3
3
2
3
4
2
4
3
3
2
12
4
2
1
3
2
3
1
2
4
0
4
3
4
3
13
4
4
4
4
4
4
4
3
4
3
4
4
4
3
14
3
1
2
2
2
2
2
2
4
2
3
2
3
2
15
4
2
2
2
3
2
1
1
3
1
3
3
2
3
16
3
3
4
3
4
3
3
3
4
3
3
3
3
3
17
3
2
3
3
3
3
2
3
4
2
4
3
3
3
18
3
3
2
3
2
4
3
2
4
3
3
2
4
2
19
3
3
4
2
4
3
2
2
4
2
3
3
3
3
20
3
0
1
1
2
2
0
1
4
1
4
1
2
3
21
4
3
3
2
2
3
1
2
4
1
4
3
3
3
22
3
2
4
2
3
4
2
2
4
2
4
4
3
3
23
4
3
4
3
4
3
2
3
4
2
3
4
3
3
24
4
2
4
3
3
3
2
2
4
1
4
3
3
3
25
4
2
3
4
4
3
2
2
4
2
4
3
3
3
26
4
3
4
3
4
3
2
2
4
2
4
3
3
3
27
3
2
2
1
3
3
2
1
2
2
4
2
3
2
28
4
3
4
3
3
3
2
2
4
2
4
3
3
3
72
No
AG
BI
EU
FI
ID IG KA KI PK
PM OS
PI
KN SU
29
3
2
2
2
2
2
2
2
4
2
4
3
3
3
30
4
2
4
2
2
2
2
2
4
1
4
3
2
3
31
3
3
1
3
4
4
2
3
4
3
3
3
3
3
32
4
3
2
2
3
4
2
2
3
2
3
3
3
3
33
4
3
2
1
2
4
2
1
4
2
4
3
3
3
34
4
2
2
1
3
3
1
2
4
2
4
4
3
3
35
3
1
4
2
3
3
3
1
3
2
3
3
2
3
36
4
1
2
2
4
3
1
2
4
2
4
4
3
2
37
1
0
1
2
0
3
1
1
4
1
4
3
2
3
38
3
2
3
1
3
3
2
2
4
1
3
3
4
3
39
4
2
1
1
3
2
1
2
4
1
4
2
3
3
40
4
4
4
3
4
4
3
3
4
3
4
4
3
4
3030
3
3
3
2
3
2
2
2
3
1
4
3
3
3
3031
3
1
3
1
3
3
2
1
4
1
4
3
2
3
3032
3
2
2
1
3
3
0
1
3
1
3
3
3
2
3033
3
1
1
1
2
3
1
1
3
1
3
3
4
2
3034
3
2
3
3
3
4
1
2
4
1
4
3
2
3
3035
3
2
1
1
4
2
0
1
4
0
4
3
2
3
3036
3
2
2
1
4
4
2
1
3
1
3
3
3
2
3037
3
1
1
1
2
3
0
0
3
0
4
2
4
1
3038
3
3
4
3
4
3
2
2
4
2
4
3
2
3
3039
3
3
4
2
4
4
2
3
4
1
4
3
3
3
3040
3
1
2
1
4
3
1
1
4
0
4
2
2
2
3041
4
3
3
2
3
2
2
2
4
1
3
2
2
3
3042
3
1
2
1
3
3
0
1
4
0
4
3
4
3
3043
4
2
3
2
3
3
2
2
3
2
4
3
3
3
3044
3
2
3
2
4
4
1
2
4
1
4
3
3
3
3045
4
2
3
1
4
3
1
2
4
1
4
3
3
3
3046
3
3
3
2
4
3
2
2
4
2
4
3
3
3
3047
3
2
4
1
3
4
1
2
4
1
4
3
3
3
3048
3
4
4
4
4
4
2
2
4
2
3
4
3
3
3049
4
2
4
3
4
4
2
3
4
2
4
3
2
3
3050
3
1
1
1
3
2
1
0
4
0
3
2
3
1
3051
4
0
1
1
2
2
0
0
4
0
4
1
4
2
3052
3
2
1
1
3
2
0
1
4
1
3
2
4
3
3053
4
3
4
4
4
4
4
4
4
3
4
3
4
3
73
Lampiran 3 Diagram Alir Seleksi Peubah Metode B1 Matriks data
Tentukan
AKU
Matriks Bobot Komponen Utama
0
Nilai eigen 1
2
1
Pilih sejumlah eigen < 0
1 +1
1
nilai
1 +2
nilai eigen dikaitkan dengan komponen utama terakhir yang bersesuaian dan dipilih satu peubah yang memiliki koefisien terbesar 1 1
Peubah dengan koefisien terbesar dihilangkan
1
Proses terus dilakukan dengan cara yang sama sehingga tersisa peubah
74
Lampiran 4 Diagram Alir Seleksi Peubah Metode B3 Matriks data
AKU Matriks Koefisien Komponen Utama
Tentukan
Dipilih koefisien utama terakhir
2 = +1
Urutan Menurun
( ) peubah pertama dalam urutan tersebut dihilangkan
komponen
adalah koefisien dari peubah ke-i pada komponen utama ke-j.
Lampiran 5 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Analisis Komponen Utama menggunakan software Mathematica 8.0 BeginPackage@"MyPackage`AKU`"D AKU::usage="Analisis Komponen Utama - AKU@XD memberikan hasil analisis komponen utama dari matriks data X berdasarkan matriks kovarians" Begin@"`Private`"D AKUAdata_?MatrixQE:=Module@8d,n,p,sentroid,XT,X,sigma,eig,Var, Kumulatif,TotalVar,W<, H*Input Data*L d=Dimensions@dataD; n=d@@1DD; p=d@@2DD; H*Rataan Kolom*L sentroid=Table@Mean@data¬@@iDDD,8i,p
Automatic, TableAlignments-> RightDD; Print@"4. Tabel Eigen"D; Print@" "TableForm@8Round@eig,0.01D,Round@Var,0.01D, Round@Kumulatif,0.01D<,TableHeadings->88"Nilai Eigen","Proporsi" , "Kumulatif"<<,TableDirections->Row,TableAlignments-> RightDD; Print@" Scree plot data diberikan pada gambar di bawah ini"D; Print@ListPlot@eigDD; Print@" "D; Print@"Komponen Utama"D; Print@"Setelah dilakukan analisis"D; Print@"Komponen utama diberikan pada tabel berikut "D; Print@" "TableForm@Round@W¬,0.001D,TableHeadings-> Automatic, TableAlignments-> RightDD; Print@" "D; H*Akhir Program*L D; End@D EndPackage@D
Lampiran 6 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Jarak Procrustes menggunakan software Mathematica 8.0 BeginPackage@"MyPackage`JarakProcrustes`"D JarakProcrustes::usage="JarakProcrustes@X, YD, memberikan nilai jarak antarkonfigurasi dan ukuran kesesuaian matriks X berdimensi Hn´pL dengan matriks Y berdimensi Hn´pL berdasarkan konsep analisis procrustes. Ukuran yang diberikan berupa nilai jarak antarkonfigurasi dan ukuran kesesuaian yang memiliki rentang 0 - 100%. Nilai jarak yang makin kecil atau ukuran kesesuaian yang makin besar menunjukan kedua konfigurasi makin dekat. Formula jarak procrustes antara konfigurasi X dan Y ETRD HX,YL = trHXTT XT L-
tr2 IXTT YT QM trIYTT YT M
Formula ukuran kesesuaian antara konfigurasi X dan Y ETRD L 100% R2 =H1trHX¬.XL " Begin@"`Private`"D JarakProcrustesAdataX_?MatrixQ,dataY_?MatrixQE:=Module@8X,Y,dx, nx,px,dy,ny,py,XT,YT,XTT,YTT,U,L,V,Q,JarakProcrustes,R<, H*Input Data*L X=dataX; Y=dataY; dx=Dimensions@XD; nx=dx@@1DD; px=dx@@2DD; dy=Dimensions@YD; ny=dy@@1DD; py=dy@@2DD; H*Proses Translasi dalam analisis procrustes*L XT=Table@X¬@@i,jDD-Mean@X¬@@iDDD,8i,px<,8j,nx
Lampiran 7 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Seleksi Peubah Metode B2 BeginPackage@"MyPackage`MetodeB2`"D MetodeB2::usage="MetodeB2@XD Melakukan seleksi peubah dari matriks data X berdasarkan analisis komponen utama dengan menggunakan metode B2" Begin@"`Private`"D MetodeB2Adata_?MatrixQE:=ModuleA8d,n,p,XT,X,sigma,eig,Var, Kumulatif,TotalVar,W,q,A,pos<, H*Informasi Data*L d=Dimensions@dataD; n=d@@1DD; p=d@@2DD; H*Proses Translasi*L XT=Table@data¬@@i,jDD-Mean@data¬@@iDDD,8i,p<,8j,n88"Nilai Eigen","Proporsi" , "Kumulatif"<<,TableDirections->Row, TableAlignments-> RightDD; Print@" "D; Print@" Berdasarkan kajian teoritis seleksi peubah yang telah diuraikan dengan ",q, " peubah yang dipertahankan"D; Print@" Peubah yang dihilangkan adalah peubah ke ", Flatten@Reverse@pos@1DDDD; Print@" Jika terjadi duplikasi, peubah yang dihilangkan disesuaikan dengan tabel berikut"D; Print@" "TableForm@8Reverse@pos@1DD,Reverse@pos@2DD, Reverse@pos@3DD<,TableHeadings->88"Max1","Max2" ,"Max3"<<, TableDirections->Row, TableAlignments-> RightDD; Print@" Selesai "D; E; End@D EndPackage@D
Lampiran 8 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Seleksi Peubah Metode B4 BeginPackage@"MyPackage`MetodeB4`"D MetodeB4::usage="MetodeB4@XD Melakukan seleksi peubah dari matriks data X berdasarkan analisis komponen utama dengan menggunakan metode B4" Begin@"`Private`"D MetodeB4Adata_?MatrixQE:=ModuleA8d,n,p,XT,X,sigma,eig,Var,Kumulatif, TotalVar,W,q,A,pos<, H* Informasi Data*L d=Dimensions@dataD; n=d@@1DD; p=d@@2DD; H*Proses Translasi*L XT=Table@data¬@@i,jDD-Mean@data¬@@iDDD,8i,p<,8j,n88"Nilai Eigen","Proporsi" , "Kumulatif"<<,TableDirections->Row, TableAlignments-> RightDD; Print@" "D; Print@" Hasil Program"D; Print@" Berdasarkan kajian teoritis seleksi peubah yang telah diuraikan dengan ",q, " peubah yang dipertahankan"D; Print@" Peubah yang dipertahankan adalah peubah ke ",pos@1DD; Print@" Jika terjadi duplikasi, peubah yang pertahankan disesuaikan dengan tabel berikut"D; Print@" "TableForm@8pos@1D,pos@2D,pos@3D<,TableHeadings->88"Max1", "Max2" ,"Max3"<<,TableDirections->Row,TableAlignments-> RightDD; Print@" Selesai "D; E; End@D EndPackage@D
Lampiran 9 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama BeginPackage@"MyPackage`ProcrustesAKU`"D ProcrustesAKU::usage="ProcrustesAKU@X,kD, Melakukan seleksi peubah dari matriks data X berdasarkan analisis procrustes pada k skor komponen utama. Peubah yang memiliki jarak antarkonfigurasi terkecil atau memiliki ukuran kesesuaian terbesar merupakan peubah yang dapat dikeluarkan dari analisis" Begin@"`Private`"D ProcrustesAKUAdata_?MatrixQ,k_?IntegerQE:=Module@8d,n,p,Zdata,A1,Y1, ZY,ZY1,Zbasis,dx,nx,px,Y,dy,ny,py,XT,YT,X,SVD,U,L,V,Q,M,R2,pos,X1<, H*Informasi Data*L d=Dimensions@dataD; n=d@@1DD; p=d@@2DD; H*Membentuk skor komponen utama data awal*L Zdata=PrincipalComponents@N@dataDD; H*Menghilangkan setiap kolom matriks data secara berurutan*L A1=Table@Drop@data¬,8i 88"Jarak ", " Ukuran Kesesuaian H%L"<,Automatic<, TableAlignments->RightDD; Print@" "D; Print@"Dengan demikian nilai jarak terkecil atau nilai kesesuaian terbesar terdapat pada posisi ke ",pos@@1DDD; Print@"Diperoleh konfigurasi data yang baru yaitu matriks data awal dengan kolom ke",pos@@1DD, "telah dihilangkan "D; X1¬ D; End@D EndPackage@D
Lampiran 10 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Seleksi Peubah dengan Analisis Procrustes BeginPackage@"MyPackage`SeleksiProcrustes`"D SeleksiProcrustes::usage="SeleksiProcrustes@XD memberikan hasil seleksi peubah dari matriks data X berdasarkan konsep analisis procrustes" Begin@"`Private`"D SeleksiProcrustesAdata_?MatrixQE:=Module@8dx,nx,px,A,YA,X,Y,dy,ny,py, XT,YT,SVD,U,L,V,Q,M,R2,pos,X1<, H*Informasi Data*L dx=Dimensions@dataD; nx=dx@@1DD; px=dx@@2DD; H*Membentuk konfigurasi Y dengan menghilangkan kolom matriks data secara berurutan dan menambahkan kolom 0 agar Y memiliki dimensi yang sama*L; A=Table@Drop@data¬,8i
H*Output*L Print@" "D; Print@" *****************************************************************"D; Print@" Implementasi Software Mathematica pada Seleksi Peubah "D; Print@" Seleksi Peubah dengan Analisis Procrustes "D; Print@" *****************************************************************"D; Print@" "D; Print@"Berdasarkan analisis yang telah dilakukan, diperoleh jarak antarkonfigurasi dan ukuran kesesuaian saat kolom ke-j dihilangkan"D; Print@" " TableForm@8Round@M,0.01D,Round@R2,0.01D<,TableHeadings-> 88"Jarak ", " Ukuran Kesesuaian H%L"<,Automatic<,TableAlignments->RightDD; Print@" "D; Print@"Dengan demikian nilai jarak terkecil atau nilai kesesuaian terbesar terdapat pada posisi ke ",pos@@1DDD; Print@"Diperoleh konfigurasi data yang baru yaitu matriks data awal dengan kolom ke",pos@@1DD, "telah dihilangkan "D; X1¬ D; End@D EndPackage@D
Lampiran 11 Implementasi Software Mathematica 8.0 pada Seleksi Peubah Ukuran Efisiensi berdasarkan Analisis Procrustes BeginPackage@"MyPackage`EMProcrustes`"D EMProcrustes::usage="EMProcrustes@X, YD, merupakan ukuran kesesuaian hasil seleksi peubah matriks X berdimensi Hn´pL yang telah direduksi menjadi matriks Y berdimensi Hn´qL, dengan q £ p, berdasarkan konsep analisis procrustes. Ukuran yang diberikan berupa nilai jarak antarkonfigurasi dan ukuran kesesuaian yang memiliki rentang 0 - 100%. Nilai jarak yang makin kecil atau ukuran kesesuaian yang makin besar menunjukan kedua konfigurasi makin dekat." Begin@"`Private`"D EMProcrustesAdataX_?MatrixQ,dataY_?MatrixQE:=ModuleB8ZX,ZY,k,ZXbasis, X,Y,dx,nx,px,dy,ny,py,XT,YT,XTT,YTT,U,L,V,Q,JarakProcrustes,R<, H*Input Data*L ZX=PrincipalComponents@N@dataXDD; ZY=PrincipalComponents@N@dataYDD; k=Dimensions@ZYD@@2DD; H*Membentuk konfigurasi yang akan dibandingkan*L ZXbasis=ZX¬@@;;kDD; X=ZXbasis¬; Y=ZY; dx=Dimensions@XD; nx=dx@@1DD; px=dx@@2DD; dy=Dimensions@YD; ny=dy@@1DD; py=dy@@2DD; H*Proses Translasi dalam analisis procrustes*L XT=Table@X¬@@i,jDD-Mean@X¬@@iDDD,8i,px<,8j,nx
89
Lampiran 12 Statistik (2 ) pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama Data Nilai TPB IPB tahun akademik 2008/2009 untuk = 2 Iterasi
AG
1
25.42
278.88 172.43 319.06 367.36 179.89 476.98 172.81
BI
EU
FI
ID
IG
KA
KI
PK
PM
OS
0.94
257.99
2.00
311.23 72.77
2
25.27
PI
KN
43.06
SU
280.03 172.55 319.48 368.89 178.52 478.03 172.77
257.37
2.08
312.99 71.97
42.88
3
25.31 279.39 172.53 317.42 356.30 175.70 477.70 173.00
255.60
313.01 67.87
41.59
4
289.73 176.11 313.94 359.93 188.06 480.47 174.90
254.83
329.94 70.48
43.71
5
303.44 185.06 326.61 398.97 186.21 479.72 173.94
258.60
347.28 62.89
6
316.52 196.63 337.03 444.61 175.24 493.48 176.84
255.14
368.49
7
364.15 234.19 342.35 477.61
507.94 185.37
258.17
434.97
8
407.32 253.27 428.61 478.29
636.91
313.19
437.57
Lampiran 13 Statistik (2 ) pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama Data Nilai TPB IPB tahun akademik 2008/2009 untuk = 3 Iterasi
AG
1
26.98
BI
EU
FI
ID
IG
KA
KI
2
26.91 328.17 918.16 494.87 680.37 603.01 487.94 186.51
260.63 153.11 316.80 223.79 85.53
3
335.47 1014.92 494.18 686.51 608.40 489.34 189.12
259.66 157.15 335.44 224.68 85.88
4
387.29 1943.67 507.15 644.07 771.48 504.17 195.23
267.84 146.60 351.22 214.68
5
598.41 2585.08 720.34 689.74 568.50 560.65 201.38
268.12
349.57 139.18
6
935.92 2378.70 1022.44 711.91 518.87 798.90 207.71
279.90
377.53
7
1099.42 2163.06 1971.37 782.28 438.82 903.95
328.15
8
892.37 2627.34 2389.23 686.49 617.54 1204.99
322.45 934.70 494.11 678.86 617.70 486.50 186.48
PK 1.81
PM
OS
PI
KN
SU
261.21 163.63 315.95 227.57 85.79
402.74 363.61
90
Lampiran 14 Statistik (2 ) pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama Data Nilai TPB IPB tahun akademik 2009/2010 untuk = 2 Iterasi
AG
BI
EU
FI
ID
IG
1
45.96
372.50 219.18 486.87 336.08 86.24
2 3
KA
KI
PK
PM
OS
352.38 125.47
1.93
332.14
0.30
846.04 372.21 219.13 486.10 334.07 86.23
351.68 125.54
1.94
45.92 375.36 219.09 485.59 332.45 86.87
PI
KN
SU
180.63 65.95
55.45
332.68
180.72 66.42
55.51
354.02 125.53
332.19
184.51 64.31
55.05
4
420.72 226.58 464.85 361.56 104.75 391.34 127.49
364.04
216.79 71.24
58.16
5
502.00 238.56 475.30 412.20 118.86 424.48 130.14
390.33
255.01 80.81
6
552.05 277.80 436.56 341.52 75.29 372.98 131.93
334.21
166.45
7
577.51 325.17 444.92 342.68
351.83 135.85
345.89
156.44
8
619.64 364.47 504.98 354.36
390.28
387.51
162.83
Lampiran 15 Statistik (2 ) pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama Data Nilai TPB IPB tahun akademik 2009/2010 untuk = 3 Iterasi
AG
1
46.13
2
46.22
3
BI
EU
FI
ID
IG
KA
KI
PK
PM
OS
PI
KN
SU
372.50 831.41 518.78 329.78 196.59 319.93 128.98
1.94
326.09
0.71
372.23 832.90 519.17 328.01 197.12 320.09 129.05
1.96
326.38
207.82 383.70 55.84
46.08 373.63 833.27 517.02 325.22 197.30 319.66 129.05
325.56
207.79 369.58 55.38
4
408.13 837.29 485.99 333.98 203.28 325.46 131.13
334.55
214.31 363.08 58.49
5
456.45 851.67 487.07 353.10 207.44 327.24 133.98
336.84
223.03 363.59
6
491.67 927.12 545.64 361.19 208.66 366.29
380.13
228.20 365.66
7
581.39 851.13 580.37 370.34
369.23
384.97
298.24 435.30
8
841.36 898.30 609.16 407.52
381.74
414.11
602.92
208.23 386.62 55.76
91
Lampiran 16 Statistik ( 2) pada metode seleksi peubah dengan analisis procrustes Data Nilai TPB IPB tahun akademik 2008/2009 Iterasi
AG
BI
EU
FI
ID
IG
KA
KI
PK
PM
1
775.65
1317.14 1292.05 1290.60 1330.54 1272.88 1139.38 1034.43 426.92
986.76
2
778.04
1316.58 1294.59 1290.45 1330.74 1276.24 1138.92 1034.07
3
OS
PI
KN
SU
922.95 1269.88
982.96
779.99
987.93
929.75 1270.19
984.25
780.56
1324.62 1297.17 1290.67 1358.75 1276.24 1138.25 1038.37
987.51
931.35 1273.39
986.10
781.00
4
1342.18 1300.54 1294.85 1360.14 1295.55 1138.21 1038.49
989.24
937.95 1289.57 1007.12
5
1343.85 1299.41 1295.83 1366.78 1304.71 1141.97 1038.74
989.03
1289.92 1026.02
6
1352.83 1323.09 1340.21 1368.48 1306.98 1287.20 1075.29
1291.64 1027.79
7
1361.30 1322.49 1339.71 1368.78 1332.17 1285.70 1076.87
1304.93
8
1446.62 1349.06 1376.99 1375.82 1353.16 1421.27
1312.08
Lampiran 17 Statistik ( 2) pada metode seleksi peubah dengan analisis procrustes Data Nilai TPB IPB tahun akademik 2009/2010 Iterasi
AG
1
690.35
2
690.72
BI
EU
FI
ID
IG
KA
KI
PK
PM
OS
PI
1162.18 1327.51 1243.37 1072.10 970.07
919.16
937.56
532.84
995.27
560.80
976.19
1047.90 812.21
1164.17 1330.15 1242.79 1077.36 970.03
919.62
937.08
997.26
561.82
976.87
1062.15 814.67
3
692.34 1163.70 1330.06 1243.76 1079.40 970.32
918.94
936.58
996.78
977.06
1063.75 815.47
4
1170.66 1333.03 1253.40 1106.42 970.45
918.48
942.20
996.49
984.43
1069.89 817.99
5
1178.29 1353.92 1254.50 1125.78 975.79
918.42
944.31
996.60
993.07
1073.37
6
1180.58 1391.64 1313.21 1131.53
993.94
1166.37
995.88
1073.62
7
1199.64 1391.79 1325.60 1161.50
993.77
1176.11
1001.12 1096.54
8
1267.81 1437.69 1384.04 1174.35
1247.88
1005.05 1100.78
976.00
KN
SU
92
Lampiran 18 Ukuran Efisiensi Metode Seleksi
2
2008
2009
q=7
q=8
q=7
q=8
B2
99.36%
99.6%
99.44%
99.61%
B4
99.12%
99.55%
99.17%
99.21%
APSKU k= 2
99.04%
99.09%
99.22%
99.24%
APSKU k= 3
99.27%
99.45%
99.37%
99.49%
AP
99.27%
99.41%
99.44%
99.56%
Lampiran 19 Petunjuk Penggunaan Implementasi Software Mathematica 8.0 pada Seleksi Peubah
Informasi Implementasi seleksi peubah pada software Mathematica 8.0 merupakan program paket yang disusun oleh penulis dalam rangka menyelesaikan tesis di Sekolah Pascasarjana Institut Pertanian Bogor (SPs IPB). Penggunaan implementasi program seleksi peubah membutuhkan pengetahuan dasar dalam pengoperasian software Mathematica 8.0. Oleh karena itu penulis berasumsi, pengguna telah memiliki pengetahuan dasar tentang software Mathematica 8.0.
Script program paket yang disusun, disimpan dalam root direktori instalasi software Mathematica 8.0 “C:\Program Files\Wolfram Research\Mathematica\8.0\AddOns\Applications”
Menggunakan Program Analisis Komponen Utama Memanggil paket program analisis komponen utama << AKU` Untuk mengetahui informasi tentang analisis komponen utama ? AKU Analisis Komponen Utama - AKU@XD memberikan hasil analisis komponen utama dari matriks data X berdasarkan matriks kovarians
Mengunakan program analisis komponen utama pada data (dengan contoh pada data TPB IPB) X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; AKU@ XD
Menggunakan Program Jarak Procrustes Memanggil paket program jarak procrustes << JarakProcrustes` Untuk mengetahui informasi tentang analisis komponen utama ? JarakProcrustes JarakProcrustes@X, YD, memberikan nilai jarak antarkonfigurasi dan ukuran kesesuaian matriks X berdimensi Hn´pL dengan matriks Y berdimensi Hn´pL berdasarkan konsep analisis procrustes. Ukuran yang diberikan berupa nilai jarak antarkonfigurasi dan ukuran kesesuaian yang memiliki rentang 0 - 100%. Nilai jarak yang makin kecil atau ukuran kesesuaian yang makin besar menunjukan kedua konfigurasi makin dekat. Formula jarak procrustes antara konfigurasi X dan Y JarakProcrustes=Tr@XT¬.XTD-HHTr@XT¬.YT.QDL^2LTr@YT¬.YTDL; Formula ukuran kesesuaian antara konfigurasi X dan Y R^2=100% H1-HJarakProcrustesTr@XT¬.YTDLL dengan Q=VU¬, di mana V dan U merupakan matriks ortogonal dari penguraian singular bentuk lengkap XT¬ YT=ULV¬
Mengunakan program ukuran kesesuaian (dengan contoh pada data TPB IPB) Import data yang akan dibandingkan X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; Y = Import@"E:\my c4MpuzT\The Thesis\Thesis3\hasil_seleksi08.xlsx"D@@1DD JarakProcrustes@ X, YD
Menggunakan Program Seleksi Peubah Metode B2 Memenggil paket program metode B2 << MetodeB2` Untuk mengetahui informasi tentang metode B2 ? MetodeB2 MetodeB2@XD Melakukan seleksi peubah dari matriks data X berdasarkan analisis komponen utama dengan menggunakan metode B2
Mengunakan Metode B2 pada data (dengan contoh pada data TPB IPB) X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; MetodeB2@ XD
Menggunakan Program Seleksi Peubah Metode B4 Memanggil paket program metode B4 << MetodeB4` Untuk mengetahui informasi tentang metode B2 ? MetodeB4 MetodeB4@XD Melakukan seleksi peubah dari matriks data X berdasarkan analisis komponen utama dengan menggunakan metode B4
Mengunakan Metode B4 pada data (dengan contoh pada data TPB IPB) X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; MetodeB4@ XD
Menggunakan Program Seleksi Peubah Analisis Procrustes pada Skor Komponen Utama Memanggil paket program metode Analisis Procrustes pada Skor Komponen Utama << ProcrustesAKU` Untuk mengetahui informasi tentang metode Analisis Procrustes pada Skor Komponen Utama ? ProcrustesAKU ProcrustesAKU@X,kD, Melakukan seleksi peubah dari matriks data X berdasarkan analisis procrustes pada k skor komponen utama pertama. Peubah yang memiliki jarak antarkonfigurasi terkecil atau memiliki ukuran kesesuaian terbesar merupakan peubah yang dapat dikeluarkan dari analisis
Mengunakan Metode Analisis Procrustes pada Skor Komponen Utama pada data (dengan contoh pada data TPB IPB) X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; ProcrustesAKU@ X, 2D
Untuk mendapatkan hasil dari proses iteratif dapat menggunakan perintah For@i = 1, i £ 7, i ++, XR = ProcrustesAKU@X, 2D; X = XRD
Menggunakan Program Seleksi Peubah Analisis Procrustes Memanggil paket program metode Analisis Procrustes << SeleksiProcrustes` Untuk mengetahui informasi tentang metode Analisis Procrustes ? SeleksiProcrustes SeleksiProcrustes@XD memberikan hasil seleksi peubah dari matriks data X berdasarkan konsep analisis procrustes
Mengunakan Metode Analisis Procrustes pada Skor Komponen Utama pada data (dengan contoh pada data TPB IPB) X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; SeleksiProcrustes@XD
Untuk mendapatkan hasil dari proses iteratif dapat menggunakan perintah For@i = 1, i £ 7, i ++, XR = SeleksiProcrustes@X, 2D; X = XRD
Menggunakan Ukuran Kesesuaian Hasil Seleksi Peubah Memanggil paket program Ukuran Kesesuaian << EMProcrustes` Untuk mengetahui informasi tentang metode Analisis Procrustes ? EMProcrustes EMProcrustes@X, YD, merupakan ukuran kesesuaian hasil seleksi peubah matriks X berdimensi Hn´pL yang telah direduksi menjadi matriks Y berdimensi Hn´qL, dengan q £ p, berdasarkan konsep analisis procrustes. Ukuran yang diberikan berupa nilai jarak antarkonfigurasi dan ukuran kesesuaian yang memiliki rentang 0 - 100%. Nilai jarak yang makin kecil atau ukuran kesesuaian yang makin besar menunjukan kedua konfigurasi makin dekat.
Mengunakan program ukuran kesesuaian (dengan contoh pada data TPB IPB) Import data yang akan dibandingkan X = Import@ "E:\my c4MpuzT\The Thesis\Pembahasan1\dataTPB.xlsx"DP 1T; Y = Import@"E:\my c4MpuzT\The Thesis\Thesis3\hasil_seleksi08.xlsx"D@@1DD EMProcrustes@ X, YD