PENYUSUNAN PAKET R UNTUK PENGEMBANGAN PAKAR (PAKET ANALISIS REGRESI)
KAMELIA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2011
RINGKASAN KAMELIA. Penyusunan Paket R untuk Pengembangan Pakar (Paket Analisis Regresi). Dibimbing oleh AGUS MOHAMAD SOLEH dan UTAMI DYAH SYAFITRI. R merupakan perangkat lunak statistika berbasis open source dan berbasis pemrograman, sehingga tidak semua orang terbiasa untuk menggunakannya. Sejak tahun 2009, Departemen Statistika Institut Pertanian Bogor melakukan pengembangan paket dalam R dengan ant armuka user friendly untuk memudahkan penggunaan R sebagai alat analisis statistika. Analisis statistika yang sudah dikembangkan dalam paket tersebut diantaranya analisis regresi, analisis peubah ganda, analisis deret waktu, dan analisis perancangan percob aan. Namun paket yang telah dikembangkan masih memiliki beberapa kekurangan, sehingga penelitian ini dilakukan untuk menyempurnakan beberapa kekurangan tersebut. Paket yang disusun dalam penelitian ini merupakan pe ngembangan dari Pakar (Paket Analisis Regresi) yang telah disusun sebelumnya oleh Melisa (2009). Paket ini diberi nama Pakar 2.0. Komponen analisis regresi yang ditambahkan dalam Pakar 2.0 meliputi analisis regresi komponen utama, analisis regresi gulud, analisis regresi logistik biner, analisis r egresi logistik ordinal, analisis regresi logistik multinomial, dan analisis regresi kuadrat terkecil parsial. Untuk menjalankan fungsi-fungsinya, Pakar 2.0 membutuhkan paket lain yaitu tcltk, tkrplot, RODBC, R2HTML, car, nortest, tseries, stats, foreign, MASS, nnet, dan pls. Menu utama pada Pakar 2.0 meliputi menu File, menu Edit, menu Data, menu Statistika, dan menu Bantuan. Hasil pengujian Pakar 2.0 dengan membandingkan keluaran dari perangkat lunak statistika lain secara umum sudah menunjukkan hasil yang relatif sama, kecuali pada beberapa kasus uji. Perbedaan pada beberapa kasus uji tersebut disebabkan adanya perbedaan kategori acuan pada regresi logistik dan perbedaan nilai desimal hasil iterasi. Kata kunci : Pakar, regresi komponen utama, regresi gulud, regresi logistik, regresi kuadrat terkecil parsial.
RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 23 November 1988 dari pasangan Zainal Mutakin dan Kamini. Penulis merupakan putri pertama dari dua bersaudara. Penulis menyelesaikan sekolah dasar pada tahun 2000 di SDN Kramat Pela 07 Jakarta dan menyelesaikan sekolah menengah pertama pada tahun 2003 di SLTP Negeri 19 Jakarta. Pada tahun 2006 penulis menyelesaikan sekolah menengah atasnya di SMA Negeri 74 Jakarta. Penulis diterima sebagai mahasiswa di Institut Pertanian Bogor (IPB) pada tahun 2006 melalui jalur Undangan Seleksi Masuk IPB (USMI). Tahun berikutnya penulis diterima sebagai mahasiswa Departemen Statistika Fakultas Matem atika dan Ilmu Pengetahuan Alam IPB dengan Minor Ilmu Konsumen. Selama masa kuliah penulis aktif sebagai anggota dari himpunan keprofesian Gamma Sigma Beta (GSB). Penulis juga berkesempatan menjadi asisten Metode Statistika pada tahun 2009. Penulis melaksanakan kegiatan praktik lapang di Balai Pengkajian Teknologi Pertanian Jawa Timur selama bulan Februari hingga April 2010.
KATA PENGANTAR
Segala puji dan rasa syukur penulis panjatkan kehadirat Allah SWT atas segala karunia -Nya hingga penulis dapat menyelesaikan karya ilmiah dengan judul “Penyusunan Paket R untuk Penyempurnaan Pakar (Paket Analisis Regresi)“. Terima kasih penulis ucapkan ke pada semua pihak yang telah berperan serta dalam penyusunan karya ilmiah ini terutama kepada : 1. Bapak Agus Mohamad Soleh, S.Si, MT. dan Ibu Utami Dyah Syafitri, M.Si atas bimbingan, arahan, dan perhatian kepada penulis. 2. Bapak Prof. Dr. Ir. Aunuddin selaku penguji atas semua sarannya. 3. Rekan-rekan seperjuangan, Defri Ramadhan Ismana dan M. Mufti Mubarak atas semua saran, diskusi, dan semangat yang diberikan kepada penulis selama mengerjakan karya ilmiah ini. 4. Melisa, Anton Kisworo, Tri Miranti, dan Angga Warel la untuk diskusi mengenai paket R yang telah dikembangkan sebelumnya. 5. Rekan-rekan pembahas seminar (Septiyan Allan dan Lili Puspita Rahayu) serta rekan -rekan yang bersedia hadir pada seminar saya. Terima kasih atas semua masukan yang diberikan. 6. Mama, Papa, dan Noer Alvisachrin atas doa, kepercayaan, dan semangat yang diberikan kepada penulis hingga saat ini. Semoga segala budi baik yang telah diberikan kepada penulis mendapat balasan dari Allah SWT. Penulis juga berharap agar karya ilmiah ini dapat bermanf aat bagi semua pihak yang membutuhkan dan memberikan sedikit kontribusi untuk kemajuan statistika di Indonesia.
Bogor, Februari 2011
Kamelia
Judul : Penyusunan Paket R untuk Pen gembangan Pakar (Paket Analisis Regresi) Nama : Kamelia NRP : G14061870
Menyetujui :
Pembimbing I,
Pembimbing II,
Agus Mohamad Soleh , S.Si, MT. NIP. 197503151999031004
Utami Dyah Syafitri, S.Si., M.Si NIP. 197709172005012001
Mengetahui : Ketua Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB
Dr. Ir. Hari Wijayanto, M.Si NIP. 196504211990021001
Tanggal Lulus :
DAFTAR ISI Halaman DAFTAR GAMBAR .....................................................................................................................viii DAFTAR TABEL ..........................................................................................................................viii DAFTAR LAMPIRAN ..................................................................................................................viii PENDAHULUAN ........................................................................................................................... 1 Latar Belakang ........................................................................................................................... 1 Tujuan......................................................................................................................................... 1 TINJAUAN PUSTAKA .................................................................................................................. 1 Regresi Komponen Utama ......................................................................................................... 1 Regresi Gulud ............................................................................................................................. 2 Regresi Logistik ......................................................................................................................... 2 Regresi Logistik Biner .......................................................................................................... 2 Regresi Logistik Ordinal ....................................................................................................... 2 Regresi Logistik Multinomial ............................................................................................... 2 Pengujian Parameter Regresi Logistik .................................................................................. 3 Rasio Odds............................................................................................................................ 3 Akaike Information Criterion (AIC) ..................................................................................... 3 Sisaan.................................................................................................................................... 3 Regresi Kuadrat Terkecil Parsial ................................................................................................ 3 Validasi Silang ........................................................................................................................... 4 METODOLOGI ............................................................................................................................... 4 HASIL DAN PEMBAHASAN ........................................................................................................ 5 Kebutuhan Sistem....................................................................................................................... 5 Analisis dan Perancangan Sistem ............................................................................................... 5 Implementasi Sistem .................................................................................................................. 7 Menu File.............................................................................................................................. 7 Menu Edit ............................................................................................................................. 7 Menu Data ............................................................................................................................ 7 Menu Statistika ..................................................................................................................... 9 Menu Bantuan......................................................................................................................12 Pengujian ...................................................................................................................................12 Batasan dan Pemasangan Sistem ............................................................................................... 13 KESIMPULAN DAN SARAN .......................................................................................................13 Kesimpulan................................................................................................................................ 13 Saran..........................................................................................................................................14 DAFTAR PUSTAKA .....................................................................................................................14 LAMPIRAN....................................................................................................................................15
DAFTAR GAMBAR Halaman 1. Tahapan penyusunan paket R dengan model air terjun. ................................................................ 4 2. Diagram aliran data level 0 ........................................................................................................... 5 3. Diagram aliran data level 1. .......................................................................................................... 6 4. Diagram aliran data level 2 proses 1. ............................................................................................ 7
DAFTAR TABEL Halaman 1. Paket-paket yang dibutuhkan untuk menjalankan Pakar 2.0 ......................................................... 7 2. Perbandingan keluaran Pakar 2.0 dengan Minitab, SAS, dan SPSS menggunakan metode blackbox .................................................................................................................................... 12
DAFTAR LAMPIRAN Halaman 1. Diagram aliran data level 2 proses 1 (Input Data) ...................................................................... 16 2. Diagram aliran data level 2 proses 2 (Manajemen Data) ........................................................... 16 3. Diagram aliran data level 2 proses 10 (Simpan Data) ................................................................ 16 4. Diagram aliran data level 3 proses 6.2 (Regresi Logistik) ......................................................... 17 5. Diagram aliran data level 4 proses 6.2.4 (Fungsi Penghubung) ................................................. 17 6. Diagram aliran data level 3 proses 6.5 (Pemilihan Model Regresi Terbaik) .............................. 17 7. Diagram aliran data level 3 proses 6.3 (Algoritma Regresi Kuadrat Terkecil Parsial) .............. 18 8. Diagram aliran data level 3 proses 6.6 (Validasi Silang) ........................................................... 18 9. Lingkungan utama dan skema menu Pakar 2.0 .......................................................................... 19 10. Kotak Dialog Regresi Komponen Utama ................................................................................. 22 11. Kotak Dialog Regresi Gulud .................................................................................................... 23 12. Kotak Dialog Regresi Logistik Biner ....................................................................................... 24 13. Kotak Dialog Regresi Logist ik Ordinal ................................................................................... 25 14. Kotak Dialog Regresi Logistik Multinomial ............................................................................ 26 15. Kotak Dialog Regresi Kuadrat Terkecil Parsial ....................................................................... 27 16. Tabel perbandingan keluaran regresi komponen utama antara Pakar 2.0 dengan SAS ............ 28 17. Tabel perbandingan keluaran regresi gulud antara Pakar 2.0 dengan SAS .............................. 29 18. Perbandingan plot regresi gulud antara Pakar 2.0 dengan SAS ............................................... 30 19. Tabel perbandingan keluaran regresi logistik biner (fungsi penghubung logit) antara Pakar 2.0 dengan Minitab, SAS, dan SPSS .............................................................................. 31 20. Perbandingan tabel klasifikasi regresi logistik biner (fungsi penghubung logit) antara Pakar 2.0 dengan Minitab, SAS, dan SPSS .............................................................................. 32 21. Tabel perbandingan keluaran regresi logistik ordinal (fungsi penghubung logit) antara Pakar 2.0 dengan Minitab, SAS, dan SPSS .............................................................................. 33 23. Tabel perbandingan keluaran regresi kuadrat terkecil parsial antara Pakar 2.0 dengan Minitab, dan SAS ..................................................................................................................... 34 24. Contoh keluaran Pakar 2.0 ....................................................................................................... 35
1
PENDAHULUAN Latar Belakang R merupakan perangkat lunak statistika berbasis open source dan berbasis pemrograman, sehingga tidak semua orang terbiasa untuk menggunakannya. Sejak tahun 2009, Departemen Statistika Institut Pertanian Bogor melakukan pengembangan paket dal am R dengan antarmuka user friendly untuk memudahkan penggunaan R sebagai alat analisis statistika. Analisis statistika yang sudah dikembangkan dalam paket tersebut diantaranya analisis regresi, analisis peubah ganda, analisis deret waktu, dan analisis perancangan percobaan. Namun paket yang telah dikembangkan masih memiliki beberapa kekurangan, sehingga penelitian ini dilakukan untuk menyempurnakan beberapa kekurangan tersebut. Paket analisis regresi (Pakar) merupakan bagian dari paket R yang telah dikemba ngkan. Pakar meliputi perhitungan statistika dasar, plot pengepasan garis, analisis regresi linier, dan analisis regresi bertatar (Melisa 2009). Komponen analisis regresi dan sistem manajemen data pada Pakar masih terbatas. Batasan tersebut yaitu hanya sa tu dataset yang dapat digunakan dalam sistem, impor dan ekspor data masih terbatas pada file Excel dengan ekstensi .csv dan .xls, serta keterbatasan menu untuk memodifikasi data. Penelitian ini dilakukan untuk mengembangkan Pakar dengan menambahkan beberapa analisis regresi dan menyempurnakan sistem manajemen data. Paket hasil pengembangan Pakar akan diberi nama Pakar 2.0. Tujuan Tujuan dari penelitian ini adalah menyusun paket R untuk mengembangkan paket analisis regresi (Pakar) dengan menambahkan analisis regresi komponen utama, analisis regresi gulud, analisis regresi logistik biner, analisis regresi logistik ordinal, analisis regresi logistik multinomial, dan analisis regresi kuadrat terkecil parsial dengan antarmuka user friendly serta mengatasi batasan-batasan yang ada pada Pakar.
TINJAUAN PUSTAKA Pakar 2.0 merupakan suatu sistem dengan antarmuka user friendly pada lingkungan R. Menurut Hornik (2010), R merupakan
implementasi sebuah lingkungan komputasi dan pemrograman bahasa statistika. R disusun dari bahasa S dan bahasa Scheme oleh Ross Ihaka dan Robert Gentleman. Paket R merupakan sebuah ekstensi dari sistem dasar R yang terdiri atas kode, data, dan dokumentasi. Paket R dapat diunduh secara bebas pada http://CRAN.R-Project.org. Untuk membuat paket R pada lingkungan Windows dibutuhkan Rtools, LaTeX, dan HTML Help Workshop sebagai perangkat lunak tambahan. Komponen analisis regresi yang ditambahkan dalam Pakar 2.0 antara lain regresi komponen utama, regresi gulud, regresi logistik, dan regresi kuadrat terkecil parsial. Regresi Komponen Utama (RKU) Regresi Komponen Utama (RKU) merupakan implementasi dari Analisis Komponen Utama (AKU). RKU digunakan untuk mengatasi masalah multikolinier antar peubah bebas. Prinsip dari RKU adalah mentransformasi peubah-peubah bebas menjadi peubah-peubah baru yang saling ortogonal. Kemudian peubah -peubah baru tersebut diregresikan dengan peubah bebas. Transformasi peubah bebas menjadi peubah baru tersebut adalah dengan AKU. Komponen utama yang dibentuk berdasarkan matriks ragam-peragam adalah sebagai berikut. Misalkan Σ merupakan matriks ragam-peragam dari vektor x 1,x2,…,xp dengan pasangan akar ciri dan vektor ciri yang saling ortonormal (λ 1,e1), (λ2,e2), …, (λ p,ep) dengan λ 1≥λ2 ≥ … ≥ λp≥0, maka komponen utama ke-i didefinisikan sebagai berikut (Jollife 2002):
λ1 merupakan akar ciri terbesar yang memaksimumkan ragam KU 1 dan e1 merupakan vektor ciri yang berpadanan dengan λ 1. Urutan KU1, KU2, …, KU p harus memenuhi persyaratan λ 1 ≥ λ2 ≥ … ≥ λp. Sementara itu, kontribusi keragaman dari setiap komponen utama ke -k terhadap keragaman total adalah: λ
λ
λ λ …
λ
Matriks Σ dapat berupa matriks ragam peragam atau matriks korelasi. Model regresi komponen utama adalah sebagai berikut:
2
dengan adalah vektor peubah respons, adalah vektor koefisien regresi kom ponen utama dari m buah komponen utama, adalah matriks berukuran (n x m) yang kolomnya merupakan skor komponen utama, serta adalah komponen error model (Jollife 2002). Regresi Gulud Regresi gulud juga digunakan untuk mengatasi masalah multikolinieritas antar peubah bebas. Multikolinieritas ini mengakibatkan nilai dugaan parameter model menjadi tidak stabil. Regresi gulud didasarkan pada konsep bahwa penduga berbias namun memiliki ragam yang lebih kecil akan lebih disukai. Menurut Myers (1990), prosedur regresi gulud adalah dengan menambahkan sebuah konstanta k yang berada dalam selang [0,1] ke dalam matriks (X’X) pada pendugaan parameter regresi sehingga diperoleh: adalah penduga berbias bagi namun memiliki ragam yang lebih kecil daripada . Ada beberapa cara untuk menentukan nilai k yang optimum. Salah satunya adalah dengan menggunakan metode ridge trace. Metode ini merupakan penelusuran nilai k yang optimum dengan mencoba berbagai macam nilai k dan melihat pengaruhnya pada nilai yang didapatkan. Plot antara dengan berbagai nilai k dapat digunakan untuk melihat metode tersebut secara eksploratif. Regresi Logistik Menurut Hosmer dan Lemeshow (2000) regresi logistik adalah metode analisis statistika yang mendeskripsikan hubungan antara peubah respons yang memiliki dua kategori atau lebih dengan satu atau lebih peubah bebas berskala kategori atau kontinu. Pendugaan parameter yang digunakan dalam regresi logistik adalah metode kemungkinan maksimum (maximum likelihood). Model regresi logistik terdiri atas regresi logistik dengan respons biner, ordinal, dan multinomial. Regresi Logistik Biner Model regresi logistik biner merupak an model matematika yang dapat digunakan untuk memodelkan hubungan antara peubah bebas X dengan peubah respons Y yang bersifat biner. Peubah respons Y mengikuti sebaran Bernoulli dengan y = 0 atau 1 dan
adalah peluang terjadinya y = 1. Model regresi logistik dengan E(Y= 1|x) sebagai π(x) adalah: 1
exp
exp
Fungsi hubung yang sesuai untuk model regresi logistik biner adalah fungsi logit. Transformasi logit sebagai fungsi dari π(x) adalah (Hosmer dan Lemeshow 2000): ln
1
Regresi Logistik Ordinal Model regresi logistik ordinal digunakan untuk menganalisis peubah respons berskala ordinal dengan lebih dari dua kategori. Menurut Hosmer dan Lemeshow (2000), salah satu cara yang dapat digunakan untuk membentuk model dengan respons kategorik yang berskala ordinal adalah dengan membentuk fungsi logit dari peluang kumulatif : |
dengan k bernilai 0, 1, 2, …, K -1. K adalah banyaknya nilai respons yang mungkin terjadi, dan adalah peluang kumulatif kategori k. Fungsi logit dari peluang kumulatif adalah sebagai berikut (Hosmer dan Lemeshow 2000): | |
Regresi Logistik Multinomial Model regresi logistik multinomial digunakan untuk menganalisis peubah respons berskala nominal dengan lebih dari dua kategori. Misalkan πj(x) = P(Y= j|x) dimana j=0,1,2,…,K-1 adalah peubah nominal yang digunakan dalam model. Berikut adalah persamaan umum yang digunakan untuk menyatakan peluang bersyarat bagi setiap kategori (Hosmer dan Lemeshow 2000): |
∑
exp
exp
Misalkan ada tiga kategori maka terdapat tiga fungsi peluang bersyarat. Fungsi penghubung logit untuk peluang bersyar at tersebut adalah:
3
| 0| Pengujian Parameter Regresi Logistik Pengujian peranan peubah bebas dalam model secara bersama-sama adalah dengan uji rasio kemungkinan (likelihood ratio test) menggunakan statistik uji-G. Rumus umum untuk statistik uji-G adalah: 2
dimana L0 adalah fungsi kemungkinan tanpa peubah bebas dan L 1 adalah fungsi kemungkinan dengan peubah bebas. Hipotesis yang digunakan adalah sebagai berikut: H0 : β 1 = β 2 = … = β p = 0 H1 : minimal ada satu β j ≠ 0 dimana j = 1,2,...,p. Statistik uji-G mengikuti sebaran χ 2 dengan derajat bebas p. Hipotesis nol ditolak jika G > χ 2 p(α) . Pengujian peubah bebas secara parsial dilakukan menggunakan statistik uji Wald dengan rumus umum:
Hipotesis yang digunakan dalam uji Wald: H0 : β j = 0 H1 : βj ≠ 0 dimana j = 1,2,...,p. Statistik uji Wald mengikuti sebaran normal baku. H 0 ditolak jika |W| > Z α/2 (Hosmer dan Lemeshow 2000). Rasio Odds Dalam kajian hubungan antar peubah kategorik dikenal adanya ukuran asosiasi atau ukuran keeratan hubungan antara peubah kategorik. Rasio odds merupakan salah satu ukuran asosiasi yang dapat diperoleh melalui analisis regresi logistik. Odds sendiri diartika n sebagai rasio peluang kejadian sukses dengan kejadian tidak sukses dari peubah respons. Rasio odds didefinisikan sebagai exp β dengan selang kepercayaan (Hosmer dan Lemeshow 2000):
Akaike Information Criterion (AIC) Ravishanker dan Dey (2002) menyatakan bahwa salah cara untuk melihat kebaikan model regresi logistik adalah menggunakan statistik Akaike Information Criterion (AIC): 2
2
Selain untuk melihat kebaikan model, statistik AIC juga digunakan untuk pemilihan peubah bebas (stepwise, forward, dan backward) yang berbasis pada fungsi kemungkinan. Nilai AIC yang semakin kecil menandakan model yang semakin baik. Sisaan Dalam regresi linier, sisaan didefinisikan sebagai beda antara respons dan dugaan respons . Dalam regresi logistik, terdapat beberapa cara untuk menghitung sisaan, diantaranya (Hosmer dan Lemeshow 2000): 1. Sisaan Pearson Sisaan Pearson didefinisikan sebagai: ,
1
dimana adalah peluang kejadian sukses. 2. Sisaan Deviance Sisaan deviance didefinisikan sebagai: ,
2
1
1 1
dimana tanda + atau – digunakan untuk memastikan bahwa sisaan deviance memiliki tanda yang sama dengan . Regresi Kuadrat Terkecil Parsial Metode regresi kuadrat terkecil parsial (RKTP) adalah suatu metode untuk melakukan pendugaan model ketika banyak terdapat peubah bebas dalam model dan peubah-peubah tersebut saling berkorelasi. Untuk meregresikan sekumpulan peubah Y dengan peubah X 1, X2, …, Xp, metode PLSR melibatkan peubah bebas baru yang berperan seperti X. Peubah ini disebut peubah laten dimana setiap komponennya merupakan kombinasi linier dari X 1, X2, .., Xp. Peubah laten ini kemudian dinotasikan sebagai T. Metode RKTP menggambarkan hubungan eksternal dan hubungan internal antar peubah X dan peubah Y. Hubungan eksternal tersebut ditulis dengan persamaan berikut (Naes et al. 2002): ∑
∑
T adalah adalah matriks skor komponen dengan kolom-kolom yang berupa vektor laten. Matriks P berisi vektor muatan (loading vector) dan q adalah vektor muatan. E dan f masing-masing adalah matriks dan vektor
4
sisaan. Matriks T dihitung sebagai kombinasi linier dari X dengan W yang saling ortogonal sehingga diperoleh: dimana W adalah matriks dengan kolom kolom yang berupa vektor pembobot. Validasi Silang Validasi silang digunakan untuk menentukan jumlah komponen optimum pada analisis regresi komponen utama dan analisis regresi kuadrat terkecil parsial. Pemilihan jumlah komponen yang optimum ini diperlukan untuk mengatasi masa lah overfitting. Overfitting disebabkan oleh jumlah peubah bebas yang lebih banyak daripada amatan atau karena peubah bebas yang saling berkorelasi. Akibat dari overfitting ini adalah model yang dihasilkan sudah sesuai menggambarkan keadaan data contoh namun kurang baik untuk memprediksi data baru. Menurut Draper dan Smith (1992) terdapat dua pendekatan validasi silang, diantaranya buang satu amatan dan buang sekelompok amatan. Validasi silang ini menghasilkan statistik-statistik untuk melihat kemampuan model dalam memprediksi diantaranya (Myers 1990): 1. PRESS (Prediction Sum of Square) ∑
,
dengan , adalah nilai dugaan respons tanpa amatan yang dibuang. Model yang baik adalah model dengan nilai PRESS yan relatif kecil. 2. (R2 Prediction) 1
∑
merefleksikan kemampuan model dalam memprediksi amatan baru. Nilai yang besar menggambarkan bahwa model tersebut mampu melakukan prediksi dengan baik. 3. RMSECV (Root Mean Square Error of Cross Validation) RMSECV adalah kuadrat tengah sisaan berdasarkan hasil validasi silang. Semakin kecil nilai RMSECV maka model tersebut akan semakin baik. ∑
,
METODOLOGI Pembuatan paket R ini mengikuti kaidah rekayasa perangkat lunak dengan model air terjun, berikut tahapannya: 1. Analisis dan identifikasi kebutuhan sistem Tahapan ini dilakukan dengan menggali kebutuhan sistem dengan memperhatikan kebutuhan pengguna yang diadopsi dari perangkat lunak yang sudah ada seperti SPSS, Minitab, dan SAS. 2. Analisis perancangan sistem Tahapan ini dilakukan dengan merancang sistem yang sudah direncanakan melalui diagram aliran data dan antarmuka. 3. Implementasi dan pengujian unit Rancangan yang sudah dibangun pada tahap sebelumnya kemudian diimplementasikan dalam bahasa S menggunakan perangkat lunak R dan paket-paket R yang berhubungan. Pembuatan antarmuka memanfaatkan paket R yang bernama tcltk.
Analisis dan identifikasi kebutuhan
Analisis perancangan sistem Implementasi dan pengujian unit Integrasi dan pengujian sistem Operasi dan pemeliharaan Gambar 1 Tahapan penyusunan paket R dengan model air terjun.
5
4. Integrasi dan pengujian sistem Pada tahapan ini, semua unit sistem disatukan menjadi suatu perangkat lunak yang utuh. Pengujian sistem yang dilakukan mencakup keseluruhan fungsi dalam sistem menggunakan metode blackbox. Metode ini membandingkan keluaran dari perangkat lunak yang dibuat dengan keluaran dari perangkat lunak statistika yang sudah ada. 5. Operasi dan pemeliharaan Tahap ini lebih mengutamakan pada dokumentasi dari sistem yang telah dibuat. Dokumentasi tersebut meliputi spesifikasi perangkat lunak, deskripsi perangkat lunak, dan cara penggunaan perangkat lunak. Gambar 1 menunjukkan diagram alir untuk tahapan pembentukan perangkat lunak menggunakan metode ini. Tahapan pengembangan perangkat lunak ini merupakan suatu siklus. Oleh sebab itu, tahapan berikutnya dapat dimulai apabi la tahapan sebelumnya telah selesai (Sommerville 2003).
Analisis Perancangan Sistem Tahap awal perancangan sistem adalah dengan membuat diagram aliran data. Diagram aliran data adalah alat perancangan sistem yang berorientasi pada alur data dengan konsep dekomposisi. Pembuatan diagram ini berguna untuk menggambarkan analisis maupun rancangan sistem yang mudah dikomunikasikan oleh profesional sistem kepada pemakai maupun pembuat program. Diagram aliran data dibuat mulai dari level awal hingga level akhir sampai tidak bisa didekomposisi lagi. Level akhir pada sistem yang dikembangkan ini adalah level 4. Berikut adalah penjelasan dari setiap diagram aliran data yang digunakan pada proses perancangan sistem ini: Diagram aliran data level 0 (Gambar 2) menunjukkan bahwa Pakar 2.0 memungkinkan pengguna memasukkan data ke dalam sistem dan menerima hasil pengolahan data yang ditampilkan ke monitor atau disimpan dalam bentuk file.
HASIL DAN PEMBAHASAN Kebutuhan Sistem Analisis regresi merupakan salah satu teknik statistika yang banyak digunakan dalam berbagai bidang. Paket Analisis Regresi (Pakar) merupakan suatu sistem dengan antarmuka user friendly yang dibuat untuk melakukan prosedur analisis regresi pada lingkungan R. Analisis regresi pada Pakar meliputi plot pengepasan garis, anal isis regresi linier, dan regresi bertatar . Paket R dalam karya ilmiah ini diberi nama Pakar 2.0 yang merupakan pengembangan dari Pakar. Dalam Pakar 2.0 ditambahkan beberapa analisis regresi seperti analisis regresi komponen utama, analisis regresi gulud, analisis regresi logistik biner, analisis regresi logistik ordinal, analisis regresi logistik multinomial, dan analisis regresi kuadrat terkecil parsial. Selain penambahan beberapa analisis regresi, pada Pakar 2.0 juga ditambahkan fungsi ekspor data, fungsi impor data, fungsi untuk menampilkan lebih dari satu d ataset dalam sistem, fungsi kalkulator sebagai alat modifikasi data, fungsi membangkitkan bilangan acak, dan fungsi untuk menampilkan keluaran dalam bentuk HTML.
Gambar 2 Diagram aliran data level 0.
Diagram aliran data level 1 (Gambar 3) merupakan diagram aliran data keseluruhan dari tujuh penelitian yang ada. Pengguna dapat melakukan input data melalui empat proses, diantaranya Proses 1.1 Input Data Langsung, Proses 1.2 Impor Data, Proses 1.3 Memuat Data yang Tersimpan, dan Proses 1.4 Bangkitkan Data. Proses input data ini ditampilkan pada Lampiran 1. Data dari proses tersebut kemudian akan masuk ke dalam dataset. Dataset menerima input dari Proses 1 Input Data Langsung, Proses 2 Manajemen Data, Proses 5 Analisis Peubah Ganda, dan Proses 6 Analisis Regresi. Dataset dari Proses 5 dan Proses 6 berisi data dan hasil perhitungan pada proses tersebut masuk ke dalam dataset. Selain itu, dataset juga
6
Gambar 3 Diagram aliran data level 1. menjadi input untuk proses 2. Proses 2 dapat didekomposisi menjadi Proses 2.1 Pilih Dataset Aktif, Proses 2.2 Edit Dataset Aktif, Proses 2.3 Kalkulator, Proses 2.4 Bangkitkan Bilangan Acak, dan Proses 2.5 Pilih Peubah. Setelah pengguna memilih peubah, maka dataset telah siap digunakan untuk analisis. Proses manajemen data ini ditampilkan pada Lampiran 2. Data yang telah diolah dalam sistem kemudian dapat disimpan melalui dua proses, yaitu Proses 10.1 Ekspor Dataset dan Proses 10.2 Simpan Dataset (Lampiran 3). Aliran data pada Proses 5 Analisis Regresi dijelaskan oleh Gambar 4. Proses 6.2 Analisis Regresi Logistik didekomposisi lagi menjadi Proses 6.2.1 Regresi Logistik Biner, Proses 6.2.2 Regresi Logistik Ordinal, dan Proses 6.2.3 Regresi Logistik Multinomial (Lampiran 4). Kemudian Proses 6.2.1 dan Proses 6.2.2 akan masuk ke Proses 6.2.4 Fungsi Penghubung. Proses 6.2.4 ini didekomposisi kembali menjadi tiga fungsi penghubung, yaitu logit, probit dan complementary log-log yang disajikan dalam Lampiran 5. Setelah menentukan fungsi penghubung, data yang masuk dapat langsung dianalisis baik melalui prosedur pemilihan model regresi terbaik (stepwise, forward, dan
backward) ataupun tidak (Lampiran 6). Nilai sisaan, nilai peluang respons, dan nilai dugaan kategori respons hasil analisis regresi logistik kemudian disimpan dalam dataset. Proses 5.7 Analisis Regresi Kuadrat Terkecil Parsial didekomposisi kembali berdasarkan empat algoritma yang biasa digunakan, yaitu algoritma kernel, wide kernel, SIMPLS dan orthogonal scores atau biasa dikenal dengan NIPALS. Proses ini dijelaskan pada Lampiran 7. Analisis regresi komponen utama melibatkan keluaran dari analisis komponen utama yang merupakan bagian dari proses analisis peubah ganda. Nilai akar ciri dan vektor ciri yang dihasilkan dari analisis komponen utama akan digunakan dalam analisis regresi linier untuk melakukan analisis regresi komponen utama. Selanjutnya pengguna dapat langsung mencetak hasil analisis regresi kuadrat terkecil parsial dan hasil analisis regresi komponen utama atau melakukan Proses 6.6 Validasi Silang. Ada dua jenis validasi silang yang digunakan, yaitu buang satu amatan dan buang lebih dari satu amatan (Lampiran 8). Nilai dugaan respons, sisaan, skor X dan skor Y dari analisis regresi komponen utama dan analisis regresi kuadrat terkecil parsial tersimpan dalam dataset.
7
Gambar 4 Diagram aliran data level 2 proses 1. Implementasi Sistem Implementasi sistem menggunakan program R.2.11.1 dan beberapa paket tambahan lainnya untuk menjalankan fungsi fungsi pada Pakar 2.0. Tabel 1 menunjukkan paket-paket yang diperlukan untuk menjalankan Pakar 2.0. Paket standar adalah paket yang sudah tersedia dalam program R. Sedangkan paket tambahan adalah paket yang harus diunduh melalui http://CRAN.RProject.org . Tabel 1. Paket-paket yang dibutuhkan untuk menjalankan Pakar 2.0 No. 1. 2. 3. 4. 5. 6. 7.
Paket standar tcltk stats foreign MASS nnet
Paket tambahan tkrplot RODBC R2HTML car nortest tseries pls
Pakar 2.0 tersusun oleh pilihan menu di bagian atas dan jendela hasil di bagian bawah menu untuk menampilkan keluaran. Pakar 2.0 terdiri atas lima menu utama yaitu Menu File, Menu Edit, Menu Data, Menu Statistika, dan Menu Bantuan. Lingkungan utama dan skema menu Pakar 2.0 disajikan pada Lampiran 9.
Menu File Menu File terdiri atas delapan submenu yaitu: 1. Buat Dataset Baru Submenu ini digunakan untuk memasukkan data ke dalam sistem secara langsung. Sebelum membuat dataset baru, pengguna harus memberi nama untuk dataset tersebut. 2. Memuat Dataset Submenu ini digunakan untuk memuat dataset yang telah disimpan dalam file R dengan ekstensi .rda atau .rdata. Namun fungsi ini tidak dapat digunakan untuk memuat dataset yang tersimpan pada paket R tambahan. 3. Impor Dataset Submenu ini terdiri atas lima fungsi yaitu “SPSS”, “.csv (,)”, “.csv (;)”, “Ms. Excel” dan “Ms. Access”. Fungsi-fungsi tersebut memungkinkan pengguna untuk mengimpor dataset dari file SPSS (.sav dan .por), Ms. Excel (.xls, .xlsx, dan .csv), dan Ms. Access (.mdb dan .accdb). Impor data dengan ekstensi .csv dapat digunakan untuk mengimpor file dengan pembatas “,” dan “;”. Sebelum mengimpor data, pengguna harus memberi nama untuk dataset yang akan diimpor data tersebut.
8
4. Ekspor Dataset Submenu ini terdiri atas empat fungsi yaitu “SPSS”, “.csv (,)”, “.csv (;)”, dan “Ms. Excel 2003”. Fungsi-fungsi tersebut memungkinkan pengguna untuk mengekspor dataset aktif ke file SPSS (.sps) dan Ms. Excel 2003 (.xls dan .csv). Ekspor data dengan ekstensi .csv dapat digunakan untuk mengekspor file dengan pembatas “,” dan “;”. 5. Simpan Dataset Submenu simpan dataset digunakan untuk menyimpan dataset hasil input langsung atau dataset hasil pengolahan data dengan Pakar 2.0. Dataset tersebut akan tersimpan dengan ekstensi .rda atau .rdata. 6. Simpan Hasil Submenu ini digunakan untuk menyimpan keluaran yang terdapat pada jendela hasil dalam bentuk teks dengan ekstensi .txt. Selain itu hasil juga dapat disimpan dengan ekstensi .doc. 7. Hasil HTML Submenu ini digunakan untuk menampilkan keluaran yang dicetak ke jendela hasil dalam format HTML. Fungsi ini aktif jika tombol cek “Tampilkan Output HTML” dan direktori folder terisi. Jika fungsi ini aktif maka setiap pengguna mencetak keluaran ke jendela hasil, keluaran tersebut juga akan ditampilkan oleh browser yang terdapat pada komputer pengguna. 8. Keluar Submenu ini digunakan untuk keluar dari Pakar 2.0. Menu Edit Menu edit terdiri atas tujuh submenu untuk melakukan edit pada jendela hasil. Ketujuh submenu tersebut antara lain : 1. Cut Submenu ini digunakan untuk mengirimkan objek yang terpilih pada jendela hasil ke clipboard sistem komputer dan menghapus objek yang terpilih pada jendela hasil. 2. Salin Submenu ini digunakan untuk mengirimkan objek yang terpilih pada jendela hasil ke clipboard sistem komputer. Fungsi ini biasanya digunakan untuk menyalin objek yang terpilih. 3. Paste Submenu ini digunakan untuk menampilkan objek yang ada pada clipboard sistem komputer ke jendela
hasil. Fungsi ini biasanya digunakan untuk menampilkan objek yang sudah disalin. 4. Hapus Submenu ini digunakan untuk menghapus objek yang terpilih pada jendela hasil. 5. Undo Submenu ini digunakan untuk mengembalikan tampilan jendela hasil ke tampilan sebelum tampilan terakhir. 6. Pilih Semua Submenu ini digunakan untuk memilih semua objek yang ada pada jendela hasil. 7. Bersihkan Jendela Submenu ini digunakan untuk menghapus semua objek yang ada pada jendela hasil. Untuk menggunakan fungsi pada menu edit, pengguna harus mengaktifkan kursor pada jendela hasil. Fungsi-fungsi dalam menu ini mempunyai kegunaan yang sama dengan fungsi klik kanan pada jendela hasil. Menu Data Menu data merupakan menu untuk memodifikasi, memilih, melihat, mengedit, dan mencetak dataset. Menu ini dapat dijalankan jika terdapat dataset aktif pada program. Submenu dalam menu data antara lain: 1. Pilih Dataset Aktif Submenu pilih dataset aktif digunakan untuk memilih dataset mana yang akan digunakan, sehingga memungkinkan pengguna untuk memiliki lebih dari satu dataset dalam sistem. 2. Lihat Dataset Aktif Submenu ini digunakan untuk melihat dataset aktif. 3. Edit Dataset Aktif Submenu ini digunakan untuk mengedit data atau menambahkan data baru pada dataset aktif. 4. Kalkulator Submenu kalkulator terdiri atas perhitungan aritmatika standar (+, -, *, /, ^), operator perbandingan (>, <, >=, <=, !=), operator logika (&, |), serta beberapa fungsi lain yang tersedia dalam program R. Submenu ini memungkinkan pengguna untuk melakukan modifikasi data. 5. Bangkitkan Bilangan Acak Submenu ini digunakan untuk membangkitkan bilangan acak dari sebaran seragam, sebaran binomial, dan sebaran normal. 6. Cetak Dataset Aktif Submenu ini digunakan untuk mencetak dataset aktif yang kemudian ditampilkan pada jendela hasil.
9
Menu Statistika Menu statistika adalah menu utama dalam Pakar 2.0 yang berisi fungsi -fungsi untuk melakukan analisis regresi dan perhitungan statistika dasar. Menu ini terdiri atas dua submenu, yaitu statistika dasar dan analisis regresi. Submenu statistika dasar terdiri atas perhitungan korelasi, perhit ungan kovarian, dan uji kenormalan. Submenu analisis regresi terdiri atas sembilan sub-submenu, yaitu plot pengepasan garis, analisis regresi linier, analisis regresi bertatar, analisis regresi komponen utama, analisis regresi gulud, analisis regresi logistik biner, analisis regresi logistik ordinal, analisis regresi logistik multinomial, dan analisis regresi kuadrat terkecil parsial. Sesuai dengan ruang lingkup dalam karya ilmiah ini, maka yang akan dibahas lebih lanjut adalah enam sub -submenu terakhir: 1. Regresi Komponen Utama Sub-submenu ini merupakan fungsi untuk mengatasi masalah multikolinieritas pada regresi linier berganda menggunakan analisis komponen utama. Sub -submenu ini memanfaatkan paket pls. Pengguna harus memasukkan peubah respons dan peubah prediktor terlebih dahulu. Peubah prediktor minimal terdiri atas dua peubah. Pengguna dapat menentukan berapa jumlah komponen yang akan disertakan dalam model dengan mengetikkan jumlah komponen yang diinginkan. Input data yang digunakan adalah matriks X dan matriks Y. Matriks X adalah matriks yang setiap kolomnya merupakan peubah prediktor dan berukuran (n x p). Sedangakan matriks Y adalah matriks peubah respons berukuran (n x 1). Hasil dari fungsi ini adalah nilai proporsi keragaman, nilai loading, nil ai skor, RMSEP, R 2, MSEP, koefisien regresi, serta plot-plot regresi komponen utama. Nilai skor X dari regresi komponen utama tersimpan dalam dataset aktif. Plot yang dihasilkan dalam fungsi ini antara lain plot R2, plot RMSEP, plot MSEP, plot prediksi, plot koefisien, plot skor, plot loading, biplot skor X vs loading X, dan biplot loading X vs loading Y. Kotak dialog untuk fungsi ini disajikan pada Lampiran 10. Berikut adalah sintaks R yang digunakan untuk melakukan analisis regresi komponen utama (misalka n jumlah komponen = 1): rku <-
mvr(Y ~ X, ncomp = 1, data = Data, scale = TRUE, method = ”svdpc”)
Fungsi validasi silang digunakan untuk menentukan jumlah komponen yang optimum dalam model. Ada dua jenis validasi yang digunakan dalam analisis ini, yaitu validasi dengan membuang satu amatan dan validasi dengan membuang lebih dari satu amatan. Buang satu amatan: rku <-
mvr(Y ~ X, ncomp = 1, data = Data, scale = TRUE, method = ”svdpc”, validation = “LOO”)
Buang lebih dari satu amatan (misalkan 10 kelompok amatan): val <- crossval(rku, ncomp = 1, segments = 10, segment.type= c(“random”, “consecutive”, “interleaved”))
Validasi silang akan menghasilkan nilai PRESS, RMSECV, dan R 2 prediksi. Fungsi plot yang digunakan dalam analisis regresi komponen utama sama d engan fungsi plot pada analisis regresi kuadrat terkecil parsial. Berikut adalah sintaks R yang digunakan untuk menampilkan plot -plot regresi komponen utama: Plot R2: plot(rku, estimate = “all”, “validation”, val.type = “R2”)
Plot RMSEP: plot(rku, estimate = “all”, “validation”, val.type= “RMSEP”)
Plot MSEP: plot(rku, estimate = “all”, “validation”, val.type = “MSEP”)
Plot prediksi: predplot(rku, ncomp=rku$ncomp)
Plot koefisien: plot(rku, plottype = “coefficients”, ncomp = 1:rktp$ncomp, type = “l”)
Plot skor: plot(rku, plottype = “scores”, comps = 1: rktp$ncomp)
Plot loading: plot(rku, plottype=“loadings”, comps = 1: rktp$ncomp)
Biplot skor X vs loading X: biplot(rku, which = “x”)
Biplot loading X vs loading Y: biplot(rku, which = “loadings”)
2. Regresi Gulud Sub-submenu ini merupakan fungsi untuk mengatasi masalah multikolinieritas pada regresi linier berganda dengan menambahkan konstanta k pada diagonal utama matriks X’X. sub -submenu ini memanfaatkan paket MASS. Data yang
10
digunakan dalam analisis ini ha rus berskala interval atau rasio. Pengguna harus memasukkan peubah respons dan peubah prediktor terlebih dahulu. Untuk melakukan ridge trace, pengguna harus mengisis tombol cek pada “jejak gulud” dan mengisi nilai k awal, k akhir dan lebar grid yang ingin digunakan. Fungsi ini menghasilkan koefisien regresi gulud, persamaan gulud, serta plot koefisien gulud. Kotak dialog untuk fungsi regresi gulud disajikan pada Lampiran 11. Berikut adalah sintaks R yang digunakan (misalkan nilai k awal=0, k akhir=0.1 dan lebar grid=0.01): gulud <- lm.ridge(y ~ x1 + x2, data = Data, lambda = seq(0,0.1,0.01)) select(gulud)
Plot koefisien gulud: matplot(lambda, t(koef), lwd = 2, type = "l", xlab = expression(lambda), ylab = expression(hat(beta)))
3. Regresi Logistik Biner Sub-submenu ini merupakan fungsi untuk melakukan analisis regresi logistik biner berdasarkan tiga jenis fungsi penghubung (logit, probit, da n complementary log-log). Sub-submenu ini memanfaatkan paket stats. Data respons yang digunakan dalam analisis ini harus memiliki dua kategori. Pengguna harus memasukkan peubah respons dan peubah prediktor terlebih dahulu. Kemudian pengguna harus memilih f ungsi penghubung yang ingin digunakan. Fungsi ini menghasilkan tabel analisis deviance, uji Wald, uji G, tabel klasifikasi, prosedur regresi bertatar, serta nilai rasio odds khusus untuk fungsi penghubung logit. Kotak dialog untuk fungsi ini disajikan pada Lampiran 12. Berikut adalah sintaks R yang digunakan: logistik <- glm(y ~ x1 + x2, data = Data, family = binomial(“logit”, “probit”,“cloglog”)) summary(logistik) anova(logistik, test = ”Chisq”)
Prosedur pemilihan model regresi terbaik menggunakan statistik AIC sebagai indikator. Berikut adalah sintaksnya: null <- glm(y ~ 1, data=Data, family = binomial (“logit”,“probit”, “cloglog”)) atas <- glm(y ~ x1 + x2, data = Data, family =binomial
(“logit”,“probit”,“clo glog”))
untuk stepwise: step.AIC(null, scope = list(lower = null, upper = atas), direction = 'both')
untuk forward: step.AIC(null, scope = list(lower = null, upper = atas), direction = 'forward')
untuk backward: step.AIC(atas, direction = 'backward')
Tabel klasifikasi yang dihasilkan adalah tabulasi silang antara respons dengan dugaan kategori respons. Nilai peluang respons yang melebihi atau sama dengan batas cutoff akan dikategorikan sebagai kategori tinggi. Sedangkan nilai peluang respons yang kurang dari batas cutoff akan dikategorikan seba gai kategori rendah. Kategori tinggi dan rendah dalam fungsi ini disesuaikan berdasarkan abjad atau angka dari kategori yang dimasukkan oleh pengguna. Berikut adalah fungsi untuk membuat dugaan kategori respons pada regresi logistik biner: y <- logistik$fitted n <- length(Data[,y]) Kategori <- 1:n for (i in 1:n) { if (y[i] >= cutoff) {Kategori[i] <- kategori2} else if (y[i] < cutoff) {Kategori[i] <- kategori1} }
4. Regresi Logistik Ordinal Sub-submenu ini merupakan fungsi untuk melakukan analisis regresi logistik ordinal berdasarkan tiga jenis fungsi penghubung (logistic, probit, dan complementary log-log) dengan metode kemungkinan maksimum. Sub -submenu ini memanfaatkan paket MASS. Model regresi logistik ordinal yang digunakan adalah proportional odds. Data respons yang digunakan dalam analisis ini harus berskala ordinal dengan lebih dari dua kategori. Pengguna harus memasukkan peubah respons dan peubah prediktor terlebih dahulu. Kemudian pengguna harus memilih fungsi penghubung yang ingin digunakan. Fungsi ini menghasilkan uji Wald, tabel klasifikasi, prosedur regresi bertatar, serta nilai rasio odds khusus untuk fungsi penghubung logit. Kotak dialog untuk fungsi ini disajikan pada Lampiran 13.
11
Berikut adalah sintaks R yang digunakan untuk melakukan analisis regresi logistik ordinal: logistik <- polr(y ~ x1 + x2, data = Data, method = c(“logistic”, “probit”,“cloglog”))
Sintaks regresi bertatar yang digunakan sama dengan sintaks regresi bertatar pada analisis regresi logistik biner. 5. Regresi Logistik Multinomial Sub-submenu ini merupakan fungsi untuk melakukan analisis regresi logistik multiomial berdasarkan fungsi penghubung logit. Sub-submenu ini memanfaatkan paket nnet. Data respons yang digunakan dalam analisis ini harus berskala nominal dengan lebih dari dua kategori. Pengguna harus memasukkan peubah respons dan peubah prediktor terlebih dahulu. Fungsi ini menghasilkan uji Wald, tabel klasifikasi, prosedur regresi bertatar, serta nilai rasio odds. Kotak dialog untuk fungsi ini disajikan pada Lampiran 14. Berikut adalah sintaks R yang digunakan: logistik <- multinom(y ~ x1 + x2, data = Data) summary(logistik, “Wald”=T)
Sintaks regresi bertatar yang digunakan sama dengan sintaks regresi bertatar pada analisis regresi logistik biner. 6. Regresi Kuadrat Terkecil Parsial Sub-submenu ini merupakan fungsi untuk melakukan analisis regresi kuadrat terkecil parsial. Sub-submenu ini memanfaatkan paket pls. Fungsi ini digunakan ketika peubah-peubah prediktor saling berkorelasi tinggi atau ketika jumlah pengamatan lebih sedikit daripada jumlah peubah prediktor. Pengguna harus memasukkan peubah respons dan peubah prediktor terlebih dahulu. Peubah respons dapat berjumlah lebih dari satu peubah. Peubah prediktor minimal terdiri atas dua peubah. Pengguna dapat menentukan berapa jumlah komponen yang akan disertakan dalam model dengan mengetikkan jumlah komponen yang diinginkan. Selanjutnya pengguna harus memilih algoritma dan tipe validasi silang yang akan digunakan. Input data yang digunakan adalah matriks X dan matriks Y. Matriks X adalah matriks yang setiap kolomnya merupakan peubah prediktor dan berukuran (n x p). Matriks Y adalah matriks yang setiap
kolomnya merupakan peubah respons dan berukuran (n x q). Hasil dari fungsi ini adalah nilai proporsi keragam an, nilai loading, nilai skor, RMSEP, R 2, MSEP, koefisien regresi, serta plot -plot regresi kuadrat terkecil parsial. Nilai skor X dari regresi kuadrat terkecil parsial tersimpan dalam dataset aktif. Plot yang dihasilkan dalam fungsi ini antara lain plot R 2, plot RMSEP, plot MSEP, plot prediksi, plot koefisien, plot skor, plot loading, biplot skor X vs loading X, biplot skor Y vs loading Y, biplot skor X vs skor Y, dan biplot loading X vs loading Y. Biplot antara skor Y vs loading Y serta skor X vs skor Y tidak dapat ditampilkan jika hanya terdapat satu komponen dalam model. Kotak dialog untuk fungsi ini disajikan pada Lampiran 15. Berikut adalah sintaks R yang digunakan (misalkan jumlah komponen = 1): rktp <- mvr(Y ~ X, ncomp = 1, data = Data, scale = TRUE, method = c(“oscorespls”, “simpls”, “kernelpls”, “widekernelpls”))
Fungsi validasi silang digunakan untuk menentukan jumlah komponen yang optimum dalam model. Ada dua jenis validasi yang digunakan dalam analisis ini, yaitu validasi dengan membuang satu amatan dan validasi dengan membuang lebih dari satu amatan. Buang satu amatan: rktp <- mvr(Y ~ X, ncomp = 1, data = Data, scale = TRUE, method = c(“oscorespls”, “simpls”, “kernelpls”, “widekernelpls”), validation = “LOO”)
Buang lebih dari satu amatan (misalka n 10 kelompok amatan): val <- crossval(rktp, ncomp = 1, segments = 10, segment.type= c(“random”, “consecutive”, “interleaved”))
Terdapat tiga cara untuk membangkitkan data yang akan dibuang dalam setiap kelompok amatan yaitu acak ( random), berurutan (consecutive), dan berselangseling (interleaved). Validasi silang akan menghasilkan nilai PRESS, RMSECV, dan R2 prediksi. Berikut adalah sintaks R yang digunakan untuk menampilkan plot -plot regresi kuadrat terkecil parsial:
12
Plot R2: plot(rktp, estimate = “all”, “validation”, val.type = “R2”)
Plot RMSEP: plot(rktp, estimate = “all”, “validation”, val.type= “RMSEP”)
Plot MSEP: plot(rktp, estimate = “all”, “validation”, val.type = “MSEP”)
Plot prediksi: predplot(rktp, ncomp=rktp$ncomp)
Plot koefisien: plot(rktp, plottype = “coefficients”, ncomp = 1:rktp$ncomp, type = “l”)
Plot skor: plot(rktp, plottype = “scores”, comps = 1: rktp$ncomp)
Plot loading: plot(rktp, plottype=“loadings”, comps = 1: rktp$ncomp)
Biplot skor X vs loading X: biplot(rktp, which = “x”)
Biplot skor Y vs loading Y: biplot(rktp, which = “y”)
Biplot skor X vs skor Y: biplot(rktp, which = “scores”)
Biplot loading X vs loading Y: biplot(rktp, which = “loadings”)
Menu Bantuan Menu bantuan digunakan untuk memberikan informasi penggunaan Pakar 2.0. Menu ini terdiri atas dua submenu yaitu: 1. Bantuan Pakar 2.0 Submenu ini berisis dokumentasi tentang pengunaan Pakar 2.0. 2. Tentang Pakar 2.0 Submenu ini berisi informasi tentang versi Pakar 2.0 dan pengembangan Pakar 2.0. Pengujian Pengujian Pakar 2.0 dimulai dari implementasi fungsi-fungsi Pakar 2.0 hingga pengujian Pakar 2.0 secara menyeluruh. Ada beberapa data yang digunakan dalam pengujian ini. Data Winearoma.MTW yang berasal dari lembar kerja Minitab digunakan untuk menguji regresi kuadrat terkecil parsial dan regresi komponen utama. Data EXH_REGR.MTW digunakan untuk menguji regresi logistik biner. Data mlogit.csv digunakan untuk menguji regresi logistik multinomial dan diunduh dari http://www.ats.ucla.edu/stat/r/dae/mlogit.csv Data ologit.csv digunakan untuk menguji regresi logistik ordinal dan diunduh dari http://www.ats.ucla.edu/stat/r/dae/ologit.csv . Data longley yang berasal dari dataset R digunakan untuk menguji regresi gulud.
Tabel 2. Perbandingan keluaran Pakar 2.0 dengan Minitab, SAS, dan SPSS menggunakan metode blackbox Fungsi dalam Perangkat Perbandingan Pakar 2.0 Lunak Keluaran Minitab Regresi Komponen SAS Berbeda* Utama SPSS Minitab Regresi Gulud SAS Berbeda SPSS Minitab Sama Regresi SAS Sama Logistik Biner SPSS Sama Minitab Berbeda* Regresi Logistik SAS Berbeda* Ordinal SPSS Sama Minitab Sama Regresi Logistik SAS Sama Multinomial SPSS Berbeda* Minitab Sama Regresi Kuadrat SAS Berbeda* Terkecil Parsial SPSS *) berbeda tidak signifikan akibat adanya perbedaan kategori acuan yang digunakan dan perbedaan nilai desimal hasil iterasi.
Pengujian paket dilakukan dengan membandingkan keluaran Pakar 2.0 dengan keluaran dari perangkat lunak statistika lainnya yaitu Minitab, SAS, dan SPSS. Hasil perbandingan dari keempat perangkat lun ak tersebut ditampilkan pada Tabel 2. Berikut adalah penjelasan mengenai tabel perbandingan di atas: 1. Regresi Komponen Utama Data yang digunakan untuk analisis regresi komponen utama adalah data terbakukan. Matriks yang digunakan dalam analisis ini adalah matriks kovarian. Terdapat perbedaan nilai loading antara Pakar 2.0 dengan SAS, namun kisaran nilai loading yang dihasilkan sama. Nilai loading dalam analisis ini adalah vektor ciri. Oleh sebab itu, perbedaan nilai loading antara kedua perangkat lunak dikarenakan nilai vektor ciri yang tidak unik. Hasil perbandingan antara Pakar 2.0 dan SAS dapat dilihat pada Lampiran 16. Berdasarkan hasil simulasi, analisis regresi komponen utama pada Pakar 2.0 mampu menganalisis hingga 5000 peubah prediktor. 2. Regresi Gulud Perbandingan regresi gulud antara Pakar 2.0 dan SAS menunjukkan hasil yang berbeda. Hal ini disebabkan metode pendugaan koefisien regresi yang berbeda
13
3.
4.
5.
6.
antara kedua perangkat lunak. Hasil perbandingan regresi gulud dis ajikan pada Lampiran 17. Sedangkan perbandingan plot regresi gulud antara Pakar 2.0 dan SAS ditampilkan pada Lampiran 18. Regresi Logistik Biner Perbandingan analisis regresi logistik biner antara Pakar 2.0, Minitab, SPSS, dan SAS menunjukkan hasil yang sama untuk beberapa kasus uji. Tabel klasifikasi keluaran dari Pakar 2.0, SPSS dan SAS menunjukkan hasil yang sama. Hasil perbandingan regresi logistik biner dengan fungsi penghubung logit ditampilkan pada Lampiran 19. Sedangkan perbandingan tabel klasifikasinya ditampilkan pada Lampiran 20. Regresi Logistik Ordinal Perbandingan nilai koefisien regresi untuk analisis regresi ordinal antara Pakar 2.0, Minitab, SPSS, dan SAS menunjukkan hasil yang berbeda. Perbedaan tersebut terjadi pada peubah prediktor yang bernilai kategorik. Peubah pared dan public merupakan peubah kategorik dengan nilai 0 dan 1. Pakar 2.0 dan SPSS menggunakan 1 sebagai kategori acuan, sedangkan Minitab dan SAS menggunakan 0 sebagai kategori acuan, oleh sebab itu tanda koefisiennya menjadi berbeda. Nilai koefisien antara Pakar 2.0, Minitab, dan SAS berbeda dengan SPSS. Hal ini disebabkan oleh proses iterasi pada metode kemungkinan maksimum yang berbeda. Nilai rasio odds hasil keluaran Pakar 2.0 berbeda dengan Minitab dan SAS disebabkan oleh perbedaan tanda pada koefisien regresi. Hasil perbandingan regresi logistik ordinal dapat dilihat pada Lampiran 21. Regresi Logistik Multinomial Perbandingan analisis regresi multinomial antara Pakar 2.0, Minitab, SPSS, dan SAS menunjukkan hasil yang sama untuk beberapa kasus uji. Namun nilai dugaan koefisien SPSS sedikit berbeda dibandingkan hasil keluaran dari perangkat lunak lainnya. Hal ini disebabkan karena SPSS menggunakan kategori acuan dan proses iterasi pada metode kemungkinan maksimum yang berbeda dengan ketiga perangkat lunak lainnya. Hasil perbandingan regresi logistik multinomial dapat dilihat pada Lampiran 22. Regresi Kuadrat Terkecil Parsial Hasil perbandingan menggunakan algoritma NIPALS menunjukkan bahwa nilai loading keluaran Pakar 2.0 dan
Minitab sama, tetapi berbeda dengan SAS. Hal ini dikarenakan proses iterasi yang berbeda pada setiap perangkat lunak. Tabel hasil perbandingan antara Pakar 2.0, Minitab dan SAS dapat dilihat pada Lampiran 23. Berdasarkan hasil simula si, analisis regresi kuadrat terkecil parsial pada Pakar 2.0 mampu menganalisis hingga 5000 peubah prediktor. Batasan dan Pemasangan Sistem Sistem ini mempunyai batasan -batasan tertentu yaitu: 1. Analisis regresi gulud hanya menghasilkan nilai koefisien regresi gulud dan plotnya, tidak menghasilkan nilai RMSE. 2. Analisis regresi logistik belum mampu melakukan pengaturan terhadap kategori acuan yang digunakan. 3. Plot regresi komponen utama dan plot regresi kuadrat terkecil parsial yang mampu ditampilkan dalam satu jendela grafik maksimum berjumlah sembilan plot. 4. Analisis regresi komponen utama dan analisis regresi kuadrat terkecil parsial belum menghasilkan nilai prediksi. 5. Ekspor dataset aktif pada Pakar 2.0 masih terbatas pada file SPSS dan Ms. Excel 2003. Pemasangan Pakar 2.0 diawali dengan pemasangan program R dan paket R lain yang dibutuhkan. Setelah itu, pasang paket Pakar 2.0 melalui menu “Packages > Install package(s) from local zip file …”. Untuk memuat Pakar 2.0 ketikkan pada R console sebagai berikut: library(Pakar2) Pakar2()
KESIMPULAN DAN SARAN Kesimpulan Penelitian ini telah berhasil menyusun paket R dengan antarmuka user friendly sebagai pengembangan dari paket analisis regresi (Pakar) yang telah ada sebelumnya. Paket ini diberi nama Pakar 2.0. Fungsi -fungsi statistika dalam Pakar 2.0 mencakup fungsi kovarian, korelasi, uji kenomalan, plot pengepasan garis, analisis regresi linier , prosedur pemilihan model regresi terbaik, analisis regresi kuadrat terkecil parsial, analisis regresi logisitik (biner, ordinal, dan multinomial), analisis regresi komponen utama, dan analisis regresi gulud. Pakar 2.0 terdiri atas lima menu utama, yaitu Menu File,
14
Menu Edit, Menu Data, Menu Statistika, dan Menu Bantuan. Pengujian yang dilakukan menunjukkan bahwa Pakar 2.0 sudah mampu melakukan analisis-analisis yang ditentukan dengan baik, walaupun masih terdapat beberapa perbedaan hasil dengan perangkat lunak statistika lainnya. Saran Untuk menyempurnakan penelitian ini, maka dibutuhkan beberapa perbaikan pada penelitian selanjutnya yaitu: 1. Ekspor dataset aktif mencakup file Ms. Excel 2007 dan Ms. Access. 2. Menampilkan nilai RMSE untuk analisis regresi gulud. 3. Membuat pengaturan kategori acuan untuk regresi logistik. 4. Jendela grafik mampu menampilkan lebih dari sembilan plot. 5. Analisis regresi komponen utama dan analisis regresi kuadrat terkecil parsial mampu menghasilkan nilai prediksi untuk amatan baru.
DAFTAR PUSTAKA Draper N, Smith H. 1992. Analisis Regresi Terapan, Edisi Kedua. Terjemahan Bambang Sumantri. Jakarta : Gramedia. Hornik F. 2010. Frequently Asked Questions on R. http://www.r-project.org [10 Januari 2011]. Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression, Second Edition. New York: John Wiley & Sons. Jollife IT. 2002. Principal Component Analysis, Second Edition. New York: Springer. Melisa. 2009. Pengembangan Paket R Analisis Regresi Linier dengan Antar Muka User Friendly Bagi Praktisi. [Skripsi]. Departemen Statistika FMIPA IPB, Bogor. Myers RH. 1989. Classical and Modern Regression with Applications, Second Edition. Boston: PWS-KENT Publishing Company. Naes T, Isaksson T, Fear T, Davies T. 2002. A User-Friendly Guide to Multivariate Calibration and Classification . Chichester: NIR Publications. Ravishanker N, Dey DK. 2002. A First Course in Linear Model Theory . New York: Chapman & Hall.
Sommerville I. 2003. Software Engineering (Rekayasa Perangkat Lunak)/Edisi 6/Jilid 1. Terjemahan Yuhilza Hanum. Jakarta : Erlangga.
15
LAMPIRAN
16
Lampiran 1. Diagram aliran data level 2 proses 1 (Input Data)
Lampiran 2. Diagram aliran data level 2 proses 2 (Manajemen Data)
Lampiran 3. Diagram aliran data level 2 proses 10 (Simpan Data)
17
Lampiran 4. Diagram aliran data level 3 proses 6.2 (Regresi Logistik)
Lampiran 5. Diagram aliran data level 4 proses 6.2.4 (Fungsi Penghubung)
Lampiran 6. Diagram aliran data level 3 proses 6.5 (P emilihan Model Regresi Terbaik )
18
Lampiran 7. Diagram aliran data level 3 proses 6.3 (Algoritma Regresi Kuadrat Terkecil Parsial)
Lampiran 8. Diagram aliran data level 3 proses 6.6 (Validasi Silang)
19
Lampiran 9. Lingkungan utama dan skema menu Pakar 2.0 1. Lingkungan Utama Pakar 2.0
20
Lampiran 9. Lanjutan 2. Skema Menu Pakar 2.0 a. Menu File File
Buat Dataset Baru
Memuat Dataset
Impor Dataset
Ekspor Dataset
Simpan Dataset
SPSS
SPSS
.csv (,)
.csv (,)
.csv (;)
.csv (;)
Ms. Excel
Ms. Excel 2003
Simpan Hasil
Hasil HTML
Ms. Access
b. Menu Edit Edit
Cut
Salin
Paste
Hapus
Undo
Pilih Semua
Bersihkan Jendela
c. Menu Data Data
Pilih Dataset Aktif
Lihat Dataset Aktif
Edit Dataset Aktif
Kalkulator
Bangkitkan Bilangan Acak
Bilangan Acak Seragam
Bilangan Acak Binomial
Bilangan Acak Normal
Cetak Dataset
Keluar
21
Lampiran 9. Lanjutan e. Menu Bantuan
d. Menu Statistika
Bantuan
Statistika
Bantuan Pakar 2.0 Statistika Dasar
Analisis Regresi
Plot Pengepasan Garis
Analisis Regresi Linier
Analisis Regresi Bertatar
Analisis Regresi Komponen Utama
Analisis Regresi Gulud
Analisis Regresi Logistik Biner
Analisis Regresi Logistik Ordinal
Analisis Regresi Logistik Multinomial
Analisis Regresi Kuadrat Terkecil Parsial
Tentang Pakar 2.0
22
Lampiran 10. Kotak Dialog Regresi Komponen Utama a. Kotak Dialog Utama
b. Kotak Dialog Validasi Silang
d. Kotak Dialog Pilihan
c. Kotak Dialog Grafik
23
Lampiran 11. Kotak Dialog Regresi Gulud
24
Lampiran 12. Kotak Dialog Regresi Logistik Biner a. Kotak Dialog Utama
b. Kotak Dialog Pilihan
25
Lampiran 13. Kotak Dialog Regresi Logistik Ordinal a. Kotak Dialog Utama
b. Kotak Dialog Pilihan
26
Lampiran 14. Kotak Dialog Regresi Logistik Multinomial a. Kotak Dialog Utama
b. Kotak Dialog Pilihan
27
Lampiran 15. Kotak Dialog Regresi Kuadrat Terkecil Parsial a. Kotak Dialog Utama
b. Kotak Dialog Validasi Silang
c. Kotak Dialog Grafik d. Kotak Dialog Pilihan
d. Kotak Dialog Pilihan
28
Lampiran 16. Tabel perbandingan keluaran regresi komponen utama antara Pakar 2.0 dengan SAS Kasus Uji Nilai keragaman kumulatif (%):
Pakar 2.0
SAS
Komponen 1 24.4177
Komponen 2 40.1402
Komponen 1 24.4177
Komponen 2 40.1402
-0.164
0.36
-0.04429
0.360244
0.522
0.163462
0.522462
0.124
-0.032279
0.124259
0.178857
0.082523
0.041932
0.042446
-0.26
-0.024728
-0.259467
Loading X : Cd Mo Mn Ni
-0.179
Cu Al Ba
-0.339
-0.186
0.338704
-0.186204
Cr
-0.241
0.224
0.240608
0.22403
Sr
-0.377
-0.214
0.376707
-0.213696
Pb
-0.158
0.514
0.157737
0.513736
-0.001333
0.034471
B Mg
-0.397
0.39727
0.005712
Si
-0.298
0.298122
-0.053741
Na
-0.263
0.262575
-0.233776
Ca
-0.328
0.327468
0.093608
P
-0.194
0.194372
0.130145
-0.234 0.13
-0.369 -0.164 0.368582 -0.164225 K Data yang kosong pada hasil Pakar 2.0 menunjukkan nilai loading yang kecil (mendekati nol)
29
Lampiran 17. Tabel perbandingan keluaran regresi gulud antara Pakar 2.0 dengan SAS Pakar 2.0
k
Unemployed
Armed.Forces
Population
Year
0
Intersep -3482.26
GNP.deflator 0.0150619
GNP -0.0358192
-0.0202023
-0.0103323
-0.051104
1.82915
0.01
-2307.35
-0.0018682
-0.0150427
-0.0087284
-0.148944
1.22702
1.22702
0.02
-1877.44
0.0093468
0.0051902
-0.0137616
-0.0081273
-0.128808
1.00355
0.03
-1620.43
0.0210596
0.0079943
-0.0131457
-0.0077519
-0.10188
0.86912
0.04
-1442.71
0.030744
0.0094135
-0.0127679
-0.0074784
-0.077721
0.77585
0.05
-1310.59
0.0385846
0.0102337
-0.0125038
-0.0072632
-0.057223
0.70638
0.06
-1207.84
0.0449642
0.0107496
-0.0123033
-0.0070854
-0.039942
0.65228
0.07
-1125.36
0.0502107
0.0110937
-0.0121422
-0.0069336
-0.025293
0.60881
0.08
-1057.56
0.0545754
0.0113333
-0.0120074
-0.0068008
-0.012763
0.57305
0.09
-1000.75
0.0582462
0.0115056
-0.011891
-0.0066823
-0.001947
0.54308
0.1
-952.43
0.061364
0.0116325
-0.0117881
-0.0065749
0.007474
0.51757
SAS
k 0
Intersep -3482.26
GNP.deflator 0.015
0.01
-766.48
0.02
GNP -0.04
Unemployed -0.0202
Armed.Forces -0.01033
Population -0.051
Year 1.829
0.073
0.01
-0.0113
-0.00607
0.045
0.419
-575.23
0.083
0.01
-0.0105
-0.00518
0.087
0.318
0.03
-500.08
0.086
0.01
-0.0099
-0.00452
0.102
0.279
0.04
-458.7
0.086
0.01
-0.0093
-0.00396
0.11
0.257
0.05
-431.83
0.086
0.01
-0.0088
-0.00347
0.114
0.243
0.06
-412.57
0.086
0.01
-0.0083
-0.00302
0.117
0.233
0.07
-397.85
0.085
0.01
-0.0079
-0.00262
0.118
0.225
0.08
-386.05
0.085
0.01
-0.0075
-0.00225
0.119
0.219
0.09
-376.29
0.084
0.01
-0.0071
-0.00191
0.12
0.214
Perbedaan rumus regresi gulud yang digunakan: X adalah matriks peubah bebas berukuran (n x p) y adalah vektor peubah respon berukuran (n x 1) SAS:
dengan D adalah matriks diagonal berukuran (p x p) yang berisi unsur diagonal utama dari matriks X’X. Matriks X yang digunakan adalah matriks X terbakukan. Pakar 2.0:
dengan Z adalah hasil penguraian nilai singular dari matriks X yang telah dibakukan.
30
Lampiran 18. Perbandingan plot regresi gulud antara Pakar 2.0 dengan SAS Plot hasil regresi gulud pada Pakar 2.0 Plot antara nilai k vs dugaan koefisien gulud
8
Peubah Bebas
-2
0
2
^
4
6
GNP.deflator GNP Unemployed Armed.Forces Population Year
0.00
0.02
0.04
0.06
Plot hasil regresi gulud pada SAS
0.08
0.10
31
Lampiran 19. Tabel perbandingan keluaran regresi logistik biner (fungsi penghubung logit) antara Pakar 2.0 dengan Minitab, SAS, dan SPSS Kasus Uji Koefisien regresi: Intersep Smokes Weight SK 95% koefisien: Intersep Smokes Weight nilai Z (Wald): Intersep Smokes Weight Odds Ratio: Smokes Weight SK 95% odds ratio: Smokes Weight AIC Null deviance Residual deviance Statistik G P-value G
Pakar 2.0 -1.98717 -1.19297 0.02502
Hasil Minitab SPSS -1.98717 -1.19297 0.0250226
SAS
-1.987 -1.193 0.025
-1.987 -1.1929 0.025
0.303 1.025
0.303 1.025
93.64 7.574
99.64 101.214 93.64 7.5743
-5.4153 1.228 -2.3107 -0.1191 0.0021 0.0506 -1.183 -2.157 2.042
-1.18 -2.16 2.04
0.3033 1.0253
0.3 1.03
0.0992 0.887 1.0021 1.0519 99.64 101.21 93.64 7.5743 0.0227
0.1 0.9 1 1.05
7.574 0.023
32
Lampiran 20. Perbandingan tabel klasifikasi regresi logistik biner (fungsi penghubung logit) antara Pakar 2.0 dengan Minitab, SAS, dan SPSS Tabel Klasifikasi R RestingPulse Dugaan High Low High 2 20 Low 2 68 SPSS RestingPulse Dugaan High Low High 2 20 Low 2 68 SAS RestingPulse Dugaan High Low High 2 20 Low 2 68 Lampiran 21. Tabel perbandingan keluaran regresi logistik ordinal (fungsi penghubung logit) antara Pakar 2.0 dengan Minitab, SAS, dan SPSS Hasil
Kasus Uji Pakar 2.0
Minitab
SPSS
SAS
Koefisien regresi: b0 (0)
2.2039
2.20332
2.119
b0 (1) pared (1) public (1)
4.2994
4.29877
4.214
4.2983
1.0477
-1.04766
1.051
-1.0478
-0.0588
0.05868
-0.056
0.0585
0.6159
-0.61575
0.596
-0.6156
b0 (0)
2.8272
2.81
b0 (1)
5.3454
5.31
pared (1)
3.9418
-3.9
public (1)
-0.1974
0.2
2.3633
-2.34
pared (1)
2.8511
0.35
0.351
public (1)
0.9429
1.06
1.06
gpa
1.8513
0.54
0.54
AIC
727.0249
gpa
2.2029
nilai Z (Wald):
gpa Odds Ratio:
Null deviance Residual deviance
727.025 741.205
717.0249
717.025
33
Lampiran 22. Tabel perbandingan keluaran regresi logistik multinomial antara Pakar 2.0 dengan Minitab, SAS, dan SPSS Hasil
Kasus Uji Pakar 2.0
Minitab
SPSS
SAS
Koefisien regresi: b0 (2)
-11.7747
-11.7747
-11.251
-11.7746
b0 (3)
-22.7214
-22.7214
-22.255
-22.7214
female (2)
0.5238
0.523814
-0.524
0.5238
female(3)
0.4659
0.465941
-0.466
0.4659
age(2)
0.3682
0.368206
0.368
0.3682
age(3)
0.6859
0.685908
0.686
0.6859
b0 (2)
-6.6351
-6.64
b0 (3)
nilai Z (Wald): -11.0404
-11.04
female (2)
2.6967
2.7
female(3)
2.0609
2.06
age(2)
6.6943
6.69
age(3)
10.9524
10.95
female (2)
1.6884
1.69
1.688
female(3)
1.5934
1.59
1.594
age(2)
1.4451
1.45
1.445
age(3)
1.9856
1.99
1.986
Odds Ratio:
AIC
1417.9414
1417.941
Residual deviance
1405.9414
1405.941
34
Lampiran 23. Tabel perbandingan keluaran regresi kuadrat terkecil parsial antara Pakar 2.0 dengan Minitab, dan SAS
Kasus Uji
Pakar 2.0 Komponen Komponen 1 2
Minitab Komponen Komponen 1 2
Nilai keragaman kumulatif (%):
22.5149
36.6697
22.5149
36.6697
R-square(pred)
0.45659
0.46324
0.456585
0.463238
22.39045
22.11633
22.3904
22.1163
0.117094
PRESS
SAS Komponen Komponen 1 2 22.515
36.67
0.068153
0.112583
0.057013
-0.000775
0.508907
-0.000745
0.425724
0.035704
-0.035632
0.034328
-0.029808
-0.160192
0.114982
-0.154021
0.096187
-0.017745
0.050879
-0.017062
0.042562
-0.083849
-0.285146
-0.080619
-0.238537
-0.440711
-0.09625
-0.423733
-0.080518
Loading X : Cd
0.117
Mo
0.509
Mn Ni
-0.16
0.115
Cu Al
-0.285
Ba
-0.441
Cr
-0.137
0.45
-0.137135
0.44952
-0.131852
0.376044
Sr
-0.487
-0.122
-0.487433
-0.121531
-0.468655
-0.101666
-0.008749
0.378982
Pb B
0.112
0.453
-0.0091
0.453032
0.417
0.112403
0.417321
0.108073
0.349108 0.145732
Mg
-0.41
0.174
-0.409967
0.174207
-0.394173
Si
-0.262
0.299
-0.262182
0.299153
-0.252082
0.250255
Na
-0.321
0.102
-0.320968
0.102507
-0.308603
0.085752 0.201575 0.387708
Ca P
-0.288
0.241
-0.287606
0.240962
-0.276527
0.464
-0.079286
0.463463
-0.076231
-0.361763 0.201878 K -0.376 0.241 -0.376258 0.241323 Data yang kosong pada hasil Pakar 2.0 menunjukkan nilai loading yang kecil (mendekati nol)
35
Lampiran 24. Contoh keluaran Pakar 2.0