PERBANDINGAN REGRESI LOGISTIK BINER DENGAN JARINGAN SYARAF TIRUAN (Studi pada Klasifikasi Status Akreditasi Sekolah Menengah Pertama Provinsi DKI Jakarta)
HARUMI FAJRI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Perbandingan Regresi Logistik Biner dengan Jaringan Syaraf Tiruan (Studi pada Klasifikasi Status Akreditasi Sekolah Menengah Pertama Provinsi DKI Jakarta) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2014 Harumi Fajri NIM G14090085
ABSTRAK HARUMI FAJRI. Perbandingan Regresi Logistik Biner dengan Jaringan Syaraf Tiruan (Studi pada Klasifikasi Status Akreditasi Sekolah Menengah Pertama Provinsi DKI Jakarta). Dibimbing oleh KUSMAN SADIK dan FARIT MOCHAMAD AFENDI. Klasifikasi merupakan salah satu teknik statistika dalam mengelompokkan data yang disusun secara sistematis. Contoh klasifikasi yang populer di bidang pendidikan adalah status akreditasi sekolah. Status akreditasi sekolah dipengaruhi oleh standar Pendidik dan Tenaga Kependidikan (PTK). Ada banyak metode statistika yang dapat digunakan untuk menyelesaikan masalah klasifikasi, diantaranya regresi logistik biner dan Jaringan Syaraf Tiruan (JST). Hasil perhitungan pada penelitian menggunakan regresi logistik biner memberikan nilai Area di Bawah Kurva (ABK) sebesar 0.852 untuk data training dan 0.834 untuk data testing. Perhitungan dengan JST back propagation untuk data training dan data testing memberikan nilai ABK sebesar 0.911 dan 0.899. Dengan demikian, JST back propagation dapat memprediksi lebih baik dari pada regresi logistik biner. Adapun peubah yang berpengaruh nyata terhadap klasifikasi status akreditasi sekolah adalah jumlah guru (X1) dan kualifikasi akademik kepala tenaga administrasi (X6). Kata kunci: back propagation, jaringan syaraf tiruan, klasifikasi, regresi logistik biner. ABSTRACT HARUMI FAJRI. Comparison Binary Logistic Regression and Artificial Neural Networks (Studies in Classification of Secondary School Accreditation Status DKI Jakarta). Supervised by KUSMAN SADIK and FARIT MOCHAMAD AFENDI. Classification is one of statistical technique in classifying data compiled systematically. One popular example of classification in the field of education is the accreditation status of the school. Accreditation status of schools affected by the standard of Teachers and Education Personnel (TOD). There are many statistical methods that can be used to solve classification problems, including binary logistic regression and Artificial Neural Network (ANN). The result of the calculations in studies using binary logistic regression gives an Area Under Curve (AUC) of 0.852 for training data and 0.834 for testing data. Calculation with a back propagation ANN for training data and testing data give an AUC of 0.911 and 0.899. Thus, the back propagation ANN can predict better than the binary logistic regression. The variables that significantly affect the classification of the accreditation status of the school is the number of teachers (X1) and the qualifications of chief administrative personnel (X6). Keywords: back propagation, classification, neural network, binary logistic regression.
PERBANDINGAN REGRESI LOGISTIK BINER DENGAN JARINGAN SYARAF TIRUAN (Studi pada Klasifikasi Status Akreditasi Sekolah Menengah Pertama Provinsi DKI Jakarta)
HARUMI FAJRI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PRAKATA
Tidak ada ucapan yang pantas diucapkan kecuali rasa syukur yang mendalam kehadirat Allah SWT. Atas izin dan kebesaran-Nya lah karya ilmiah ini dapat diselesaikan dengan baik. Secercah harapan muncul seiring dengan berakhirnya perjalanan menyelesaikan karya ilmiah ini. Karya ilmiah yang berjudul Perbandingan Regresi Logistik Biner dengan Jaringan Syaraf Tiruan (Studi pada Klasifikasi Status Akreditasi Sekolah Menengah Pertama Provinsi DKI Jakarta) ini disusun sebagai salah satu syarat untuk mendapat gelar Sarjana Statistika di Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Penulis menyadari bahwa penyusunan karya ilmiah ini tidak terlepas dari bantuan dan keterlibatan banyak pihak. Maka sudah sepantasnyalah jika penulis secara khusus menyampaikan ucapan terima kasih kepada pengelola Program Sarjana program studi Statistika Institut Pertanian Bogor (IPB) beserta para dosen khususnya kepada Bapak Dr Kusman Sadik, MSi dan Bapak Dr Farit Mochamad Afendi, MSi selaku dosen pembimbing yang telah memberikan banyak bimbingan dan arahan selama penulisan karya ilmiah ini. Ungkapan terima kasih juga penulis sampaikan kepada Ibu Dra Itasia Dina S, MSi dan Ibu Dr Erfiani, MSi beserta Bapak Dr Bagus Sartono, MSi selaku dosen moderator kolokium, seminar, dan penguji luar sidang yang telah meluangkan waktunya dan memberikan pengarahan, perbaikan, saran, serta masukan kepada penulis. Selain itu, penulis juga mengucapkan terima kasih tak terhingga kepada keluarga yaitu Bapak Marsudi, Ibu Udaryatun, serta adik Infan Nur Kharismawan atas segala doa, perhatian, semangat dan kasih sayangnya kepada penulis. Penulis juga mengucapkan terima kasih kepada Bapak Bambang Suryadi, Bapak Suhari, MSi, Bapak Sambas Ali M, Bapak Fitriadi, beserta Bapak Riyan dari Kementerian Pendidikan dan Kebudayaan yang telah banyak membantu penulis selama pengumpulan data dan permohonan informasi. Tidak lupa, penulis juga mengucapkan terima kasih kepada Ais, Anggrevita, Eka, Hani, Ria, Tia, Layfah, Nani, Casia, Try, Fajri, Lutfi, Nugraha, Meira, Keke, serta semua teman-teman dan kakak serta adik kelas yang telah memberikan bantuan moril maupun materiil kepada penulis. Akhirnya, semoga Allah SWT senantiasa memberikan bimbingan dan keridhoan kepada kita semua. Besar harapan penulis agar karya ilmiah ini dapat bermanfaat bagi semua pihak yang berkepentingan.
Bogor, Agustus 2014 Harumi Fajri
DAFTAR ISI DAFTAR TABEL
viii
DAFTAR GAMBAR
viii
DAFTAR LAMPIRAN
viii
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Regresi Logistik Biner
2
Jaringan Syaraf Tiruan
4
Standar Pendidik dan Tenaga Kependidikan
7
Standar Mutu Pendidikan
7
METODOLOGI
8
Data
8
Metode
8
HASIL DAN PEMBAHASAN Eksplorasi Data
9 9
Regresi Logistik Biner
12
Jaringan Syaraf Tiruan
14
Evaluasi Kebaikan Model
17
SIMPULAN
19
SARAN
19
DAFTAR PUSTAKA
20
LAMPIRAN
21
RIWAYAT HIDUP
24
DAFTAR TABEL 1 Statistika deskriptif untuk indikator guru dan tenaga administrasi 2
10
Tabulasi silang indikator kepala sekolah, indikator kepala tenaga administrasi, dan indikator pustakawan terhadap status akreditasi sekolah
11
3
Pengujian multikolinieritas
12
4
Uji signifikansi secara serentak
12
5
Uji signifikansi secara parsial
13
6
Uji signifikansi secara parsial pada model II
13
7
Uji signifikansi secara parsial pada model III
13
8
Hasil pengujian berdasarkan jumlah unit pada lapisan tersembunyi
14
9
Hasil pengujian berdasarkan laju pelatihan
16
10 Hasil pengujian berdasarkan momentum
17
11 Nilai AUC regresi logistik biner
17
12 Nilai AUC jaringan syaraf tiruan
18
DAFTAR GAMBAR 1
Struktur sederhana JST
5
2
Tiruan neuron dalam JST
5
3
Arsitektur jaringan syaraf tiruan optimal
15
4
Hasil pengujian berdasarkan jumlah siklus vs laju pelatihan
16
5
Kurva ROC data training (kiri) dan testing (kanan) regresi logistik biner
18
Kurva ROC data training (kiri) dan testing (kanan) Jaringan syaraf tiruan
18
6
DAFTAR LAMPIRAN 1
Keterangan peubah penjelas yang digunakan
21
2
Output SPSS kurva ROC regresi logistik biner data testing
22
3
Output SPSS kurva ROC jaringan syaraf tiruan data testing
23
1
1 PENDAHULUAN Latar Belakang Dalam suatu analisis metode statistika, data merupakan suatu hal yang kerap ditemui yang menjadi bahan baku dalam melakukan analisis. Oleh karena begitu pentingnya data, maka data menjadi salah satu pertimbangan dalam pemilihan metode analisis statistika. Untuk keperluan pengolahan, penyajian dan peringkasan data atau informasi tak jarang perlu dilakukan pengklasifikasian. Klasifikasi merupakan salah satu dari teknik statistika dalam mengelompokkan data yang disusun secara sistematis. Klasifikasi telah banyak digunakan dalam berbagai bidang, diantaranya bidang kesehatan, pemasaran, maupun pendidikan. Salah satu ilmu statistika yang berkaitan dengan klasifikasi adalah analisis regresi logistik biner. Regresi logistik biner merupakan teknik statistika yang menggambarkan hubungan antara satu peubah respon (Y) yang memiliki skala biner dengan peubah-peubah penjelasnya (Hosmer dan Lemeshow 2000). Sebagaimana dalam model regresi lainnya, dua peubah penjelas atau lebih dapat disertakan dalam analisis ini. Peubah penjelas ini dapat berupa data kontinu maupun data kategorik. Metode statistika lainnya yang menjadi salah satu terobosan besar dalam masalah klasifikasi adalah jaringan syaraf tiruan. Jaringan syaraf tiruan merupakan algoritma matematis yang dikembangkan berdasarkan sistem kerja jaringan syaraf biologi. Jaringan syaraf tiruan merupakan metode alternatif yang baik karena memiliki keunggulan dalam mengklasifikasikan pola data yang belum pernah dilatih. Tidak hanya itu, jaringan syaraf tiruan juga sangat berpotensi dalam melakukan berbagai analisis statistika karena dapat menyelesaikan proses tanpa membutuhkan asumsi spesifik pada data input maupun output (Larasati et al. 2011). Penelitian mengenai regresi logistik dan jaringan syaraf tiruan merupakan bidang yang masih luas dan berpotensi untuk dikaji. Beberapa penelitian sebelumnya menunjukkan bahwa kedua metode tersebut memiliki kemampuan yang baik dalam mengklasifikasikan suatu data. Penelitian mengenai perbandingan antara regresi logistik dengan jaringan syaraf tiruan telah dilakukan oleh Larasati et al. (2011) dan Mirawanti dan Ulama (2013). Dari kedua penelitian tersebut, metode jaringan syaraf tiruan memberikan tingkat ketepatan klasifikasi yang lebih baik dibandingkan dengan metode regresi logistik. Merujuk pada paparan di atas, penelitian ini bertujuan untuk menerapkan dan membandingkan regresi logistik biner dengan jaringan syaraf tiruan sebagai metode pengklasifikasian data status akreditasi Sekolah Menengah Pertama (SMP) di provinsi DKI Jakarta. Kedua metode tersebut akan dibandingkan berdasarkan analisis kurva ROC (Relative Operating Characteristics) dengan melihat nilai AUC (Area Under the Curve). Metode yang memiliki nilai AUC yang lebih besar akan dipilih sebagai metode pengklasifikasian yang lebih baik.
2 Tujuan Penelitian Penelitian ini bertujuan untuk membandingkan regresi logistik biner dengan jaringan syaraf tiruan berdasarkan nilai AUC untuk memilih metode pengklasifikasian yang lebih baik .
TINJAUAN PUSTAKA Regresi Logistik Biner Regresi logistik biner merupakan analisis regresi yang digunakan ketika peubah respon bersifat biner dan peubah bebas bersifat kategori, kontinu, atau gabungan dari keduanya. Regresi logistik biner berfungsi untuk memodelkan dan menganalisis efek antara peubah respon biner dengan peubah-peubah penjelasnya serta untuk memperoleh probabilitas dari peubah respon. Misalkan peubah respon Y yang merupakan peubah biner memiliki nilai 0 yang menunjukkan tidak munculnya suatu karakteristik tertentu dan nilai 1 yang menunjukkan munculnya karakteristik tertentu. Karena Y hanya mempunyai nilai 0 dan 1, maka P(Yi=1|xi) = 𝜋(xi) dan P(Yi=0|xi) = 1-𝜋(xi). Nilai harapan Y diperoleh berdasarkan penjumlahan antara perkalian 1 dan 𝜋(xi) dengan perkalian 0 dan 1-𝜋(xi). Jika diasumsikan terdapat vektor dari p peubah bebas untuk observasi ke-i; i=1,2, ..., n, yaitu Xi = (X1i, X2i, ..., Xpi) dan P(Yi=1|xi) = 𝜋(xi) maka model regresi logistik biner dapat dituliskan sebagai berikut : π(xi) = E(Yi|xi) =
p p
= dengan 0, 1, akan dicari.
2,
...,
p
i
i
i
p
p pi
i i
p pi i
p pi
adalah parameter-parameter regresi logistik biner yang
Pendugaan Parameter Regresi Logistik Biner Pendugaan parameter regresi logistik biner dapat dilakukan dengan menggunakan metode penduga kemungkinan maksimum (Maximum Likelihood Estimation / MLE). Fungsi penduga kemungkinan dapat dinyatakan sebagai berikut : l ) =∏ni= πi
i
-πi)
- i=
∏
(
πi ) -πi
i
-πi)
sedangkan fungsi log penduga kemungkinan-nya adalah sebagai berikut : L ) = ln l ) L ) =∑
i
ln (
πi ) -πi
ln
-π
3 πi )= -πi logistik biner maka didapatkan
dengan mensubtitusikan ln
L ) = ∑ni=
i
(
i
0
p pi
1x1i
ln
2x2i
-
...
p
pxpi dan
i
p
model regresi p pi)
i i
i
p pi)
)
Selanjutnya, penduga parameter dari regresi logistik biner dapat diperoleh dengan memaksimumkan log penduga kemungkinan yaitu dengan menurunkan L ) t rhadap s tiap param t r dan m n amakan d ngan . Pengujian Signifikansi Parameter Secara Serentak Setelah penduga parameter dari model regresi logistik diperoleh, selanjutnya dilakukan uji signifikansi parameter secara serentak. Pengujian parameter secara serentak dilakukan untuk mendiagnosa peranan peubah bebas terhadap model yang bertujuan untuk melihat ada tidaknya pengaruh peubah bebas terhadap model. Hipotesis dari pengujian ini diberikan sebagai berikut : H0 : 1 = 2 = ... = p = 0 H1 : s dikitn a ada satu p ≠ , dengan p adalah jumlah peubah bebas. Statistik uji yang digunakan dalam pengujian secara serentak adalah statistik uji rasio kemungkinan yang disebut uji G, dengan G = -2 ln(L0/Lk). L0 adalah log penduga kemungkinan tanpa peubah bebas dan Lk adalah log penduga kemungkinan dengan peubah bebas. Statistik uji G menyebar chi kuadrat dengan derajat bebas p, oleh karena itu pengambilan keputusan dilakukan dengan membandingkan nilai statistik uji G dengan nilai chi kuadrat tabel dengan taraf nyata sebesar α dan d rajat b bas p. Selanjutnya, hipotesis nol ditolak apabila nilai statistik uji G > χ2 α,db) atau p-value < α. P nolakan H0 memberi arti bahwa terdapat paling sedikit satu peubah bebas yang berpengaruh nyata pada taraf nyata s b sar α. Pengujian Signifikansi Parameter Secara Parsial Pengujian parameter secara parsial dilakukan untuk mengetahui apakah peubah bebas berpengaruh nyata terhadap peubah respon atau tidak. Hipotesisnya adalah : H0 : p = 0 H1 : p ≠ , dengan p adalah jumlah peubah bebas. Statistik uji yang digunakan dalam pengujian secara parsial ini adalah uji Wald (W). Berikut adalah rumus dari uji Wald : Wp = [
̂
(̂
]
Statistik uji Wald mendekati sebaran chi kuadrat dengan derajat bebas 1 sehingga pengambilan keputusan dilakukan dengan membandingkan nilai uji Wald terhadap nilai chi kuadrat tabel dengan taraf nyata s b sar α dan d rajat bebas 1. Selanjutnya, hipotesis nol ditolak apabila nilai Wp > χ2 α, ) atau p-value < α. Bila H0 ditolak, maka parameter tersebut berpengaruh nyata pada taraf nyata s b sar α. Hal ini m nunjukan bahwa p ubah b bas t rs but mempunyai pengaruh terhadap peubah respon Y.
4 Jaringan Syaraf Tiruan Jaringan Syaraf Tiruan (JST) atau yang dalam bahasa inggris diterjemahkan sebagai Artificial Neural Network (ANN) merupakan salah satu representasi buatan dari otak manusia untuk mensimulasikan proses pelatihan pada otak manusia. Istilah buatan digunakan karena jaringan syaraf ini diimplementasikan dengan menggunakan program komputer yang mampu menyelesaikan sejumlah proses perhitungan selama proses pelatihan. JST memiliki keunggulan dalam hal menduga data non-linier dan menyelesaikan proses tanpa membutuhkan asumsi spesifik baik pada data input maupun data output (Larasati et al. 2011). JST juga cocok untuk klasifikasi karena JST memiliki keunggulan dalam mengklasifikasikan pola data yang belum pernah dilatih. JST merupakan suatu sistem pemrosesan informasi yang mampu mengenali kegiatan dengan berbasis pada pola data. Data masukan akan dipelajari oleh JST sehingga keputusan diberikan. JST dibentuk sebagai generalisasi model matematis dari jaringan syaraf manusia dengan didasarkan pada asumsi-asumsi berikut : 1. Pemrosesan informasi terjadi pada elemen sederhana (neuron). 2. Sinyal dikirim antar neuron-neuron melalui penghubung yang disebut dengan sinapsis. 3. Setiap sinapsis memiliki bobot. 4. Setiap neuron menggunakan fungsi aktivasi (biasanya bukan fungsi linier) untuk menentukan output (Hermawan 2006). Struktur Jaringan JST Seperti yang ditunjukkan pada Gambar 1, struktur jaringan syaraf tiruan sederhana merupakan susunan yang terdiri dari tiga lapisan yaitu lapisan masukan (input), lapisan tersembunyi dan lapisan keluaran (output). Lapisan pertama yaitu lapisan masukan mempunyai satu atau lebih unit (nodes) yang menunjukkan peubah bebas. Lapisan keluaran juga terdiri dari satu atau lebih unit (nodes) yang menunjukkan peubah respon. Lapisan keluaran menunjukkan keputusan model klasifikasi dimana setiap satu kriteria klasifikasi sama dengan satu unit. Sementara itu, lapisan tersembunyi merupakan lapisan yang menghubungkan lapisan masukan dan keluaran secara langsung. Pada umumnya, satu atau lebih lapisan tersembunyi dapat ditempatkan di antara lapisan masukan dan keluaran (Behara et al. 2002; Garver 2002 dalam Larasati et al. 2011). Sama halnya dengan otak manusia, JST terdiri atas beberapa neuron yang saling berhubungan untuk mentransformasi informasi yang diterima melalui sinapsis. Pada jaringan syaraf, hubungan ini dikenal dengan nama bobot. Adapun tiruan neuron dalam struktur jaringan syaraf tiruan adalah seperti yang ditunjukkan pada Gambar 2. Sejumlah sinyal informasi x (input) akan dikalikan dengan masing-masing bobot (w). Kemudian dilakukan penjumlahan dari seluruh hasil perkalian tersebut dan keluaran yang dihasilkan akan dihitung berdasarkan fungsi aktivasi sehingga nilai output (keluaran jaringan) didapatkan. Nilai ini dipakai sebagai dasar untuk merubah bobot dalam meningkatkan kualitas koneksi antar satu neuron dengan neuron lainnya (Martiana 2012).
5
Gambar 1 Struktur sederhana JST
Gambar 2 Tiruan neuron dalam JST Back Propagation Algoritma pelatihan back propagation atau ada yang menerjemahkannya menjadi propagasi balik termasuk metode pelatihan terbimbing (supervised). Back propagation adalah algoritma pelatihan yang paling populer di dalam metode pelatihan terbimbing (Tu 1996 di dalam Larasati et al. 2011). Penamaan back propagation pada algoritma ini didasarkan pada konsep pelatihan jaringan. Secara umum, mekanisme pelatihan algoritma back propagation diberikan sebagai berikut : mula-mula jaringan diberikan pola masukan sebagai pola pelatihan yang kemudian bergerak menuju unit-unit lapisan tersembunyi untuk diteruskan ke unit-unit lapisan keluaran. Selanjutnya, lapisan keluaran akan memberikan tanggapan yang disebut sebagai output (keluaran jaringan). Jika output yang dihasilkan tidak sama dengan target yang diharapkan maka output akan menyebar mundur (backward) menuju lapisan tersembunyi dan lapisan masukan. Algoritma pelatihan back propagation terdiri dari dua tahapan, yaitu propagasi maju (feed forward) untuk menentukan output (keluaran jaringan) serta propagasi mundur (back propagation) untuk menentukan perubahan bobot sehingga galat minimum didapatkan. Algoritma Pelatihan pada Back Propagation Algoritma pelatihan pada back propagation dapat dibedakan menjadi dua jenis, yaitu algoritma pelatihan sederhana dan algoritma pelatihan yang lebih cepat. Prinsip dasar dari algoritma pelatihan sederhana adalah memperbaiki bobot-bobot jaringan dengan arah yang membuat fungsi kinerja menjadi turun
6 dengan cepat (gradient descent). Hanya saja, algoritma pelatihan sederhana ini memiliki kelemahan yakni proses pelatihan biasanya akan berjalan cukup lambat, sehingga algoritma diperbaiki dengan algoritma pelatihan yang lebih cepat yang memiliki dua alternatif dimana salah satunya adalah teknik heuristik (Kusumadewi 2004). Teknik heuristik merupakan pengembangan dari suatu analisis kinerja pada algoritma gradient descent standar. Contoh dari teknik ini adalah gradient descent dengan momentum dan adaptive learning rate. Jika laju pelatihan (learning rate) selama proses pelatihan pada gradient descent standar bernilai konstan, maka nilai laju pelatihan pada gradient descent dengan momentum dan adaptive learning rate akan diubah selama proses pelatihan untuk menjaga agar algoritma ini senantiasa stabil. Dengan teknik ini, apabila laju pelatihan terlalu tinggi maka akan diturunkan. Sebaliknya, jika laju pelatihan terlalu rendah maka laju pelatihan akan dinaikkan. Dengan demikian, algoritma pelatihan akan tetap terjaga pada kondisi stabil. Selanjutnya fungsi ini akan memperbaiki bobot-bobot berdasarkan gradient descent dengan laju pelatihan yang bersifat adaptif dan menggunakan momentum. Parameter yang perlu diset untuk pelatihan ini adalah fungsi pelatihan, menjadi gradient descent dengan momentum dan adaptive learning rate. Adapun parameter-parameter lain yang harus diset adalah : 1. Maksimum epoh. Maksimum epoh merupakan jumlah epoh maksimum yang dapat dilakukan selama proses pelatihan. Sementara yang dimaksud dengan epoh adalah satu siklus langkah pelatihan pada back propagation. 2. Kinerja tujuan. Kinerja tujuan adalah target nilai fungsi kinerja. Fungsi kinerja yang sering digunakan untuk back propagation adalah KTG (kuadrat tengah galat). Fungsi ini akan mengambil rata-rata kuadrat galat yang terjadi antara output jaringan dan target. 3. Maksimum kenaikan kinerja. Maksimum kenaikan kinerja merupakan nilai maksimum kenaikan galat yang diizinkan antara galat saat ini dan galat sebelumnya. 4. Laju pelatihan. 5. Rasio untuk menaikkan laju pelatihan. Rasio ini berfungsi sebagai faktor pengali untuk menaikkan laju pelatihan apabila laju pelatihan yang ada terlalu rendah. 6. Rasio untuk menurunkan laju pelatihan. Rasio ini berfungsi sebagai faktor pengali untuk menurunkan laju pelatihan apabila laju pelatihan yang ada terlalu tinggi. 7. Momentum. Momentum merupakan salah satu konstanta yang dapat memengaruhi besarnya perubahan bobot. Nilai momentum berkisar antara 0 sampai 1. 8. Jumlah epoh yang akan ditunjukkan kemajuannya. Fungsi Aktivasi Dalam back propagation, fungsi aktivasi yang dipakai harus memenuhi beberapa syarat yaitu kontinu dan dapat dideferensialkan. Salah satu fungsi yang memenuhi syarat tersebut adalah fungsi hyperbolic tangent. Fungsi hyperbolic
7 tangent yang memiliki range -1 sampai 1 ini menjadi salah satu fungsi yang sering digunakan. Fungsi hyperbolic tangent dirumuskan sebagai berikut : ( dengan turunan hyperbolic tangent dirumuskan sebagai berikut : (
=
( ]
( ]
Standar Pendidik dan Tenaga Kependidikan Salah satu cara untuk menjamin mutu pendidikan nasional dan menghasilkan sumber daya manusia yang unggul adalah dengan menyediakan fasilitas pendidikan yang memadai. Oleh sebab itu, pemerintah kemudian menetapkan delapan lingkup standar nasional pendidikan yang diatur dalam Peraturan Pemerintah Nomor 19 Tahun 2005. Standar nasional pendidikan adalah kriteria minimal tentang sistem pendidikan di seluruh wilayah Negara Kesatuan Republik Indonesia. Standar nasional pendidikan berfungsi sebagai dasar dalam perencanaan, pelaksanaan, dan pengawasan pendidikan dalam rangka mewujudkan pendidikan nasional yang bermutu. Salah satu lingkup dari delapan standar nasional pendidikan adalah standar pendidik dan tenaga kependidikan. Standar pendidik dan tenaga kependidikan yang selanjutnya disingkat dengan PTK ini telah diatur dalam Peraturan Menteri Pendidikan Nasional Nomor 13 dan 16 Tahun 2007 serta Peraturan Menteri Pendidikan Nasional Nomor 24 dan 25 Tahun 2008. PTK merupakan standar yang ditentukan untuk menjaga kualitas pendidikan berdasarkan kualifikasi akademik dan kompetensi pendidik dan tenaga kependidikan seperti guru, kepala sekolah, tenaga administrasi, dan sebagainya. Standar PTK ini disusun untuk lingkup pendidikan formal, jenis pendidikan umum, jenjang pendidikan dasar dan menengah. Dengan pendidik dan tenaga kependidikan yang memadai, pelaksanaan pembelajaran dalam pendidikan nasional diharapkan dapat meningkat. Standar Mutu Pendidikan Dengan adanya pendidik dan tenaga kependidikan yang memadai seharusnya dapat meningkatkan mutu pendidikan. Peningkatan mutu pendidikan tidak terlepas dari sistem akreditasi dengan tujuan untuk menilai kelayakan program dan satuan pendidikan. Menurut PP Nomor 19 Tahun 2005, akreditasi adalah kegiatan penilaian kelayakan program dan satuan pendidikan berdasarkan kriteria yang telah ditetapkan. Berkaitan dengan hal tersebut, pemerintah kemudian mendirikan Badan Akreditasi Nasional Sekolah/Madrasah (BAN S/M) sebagai badan evaluasi mandiri yang menetapkan kelayakan program dan satuan pendidikan.
8
METODOLOGI Data Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari Direktorat Pembinaan Pendidik dan Tenaga Kependidikan Pendidikan Dasar (P2TK) serta publikasi yang diterbitkan oleh Badan Akreditasi Nasional Sekolah/Madrasah (BAN S/M), Kementerian Pendidikan dan Kebudayaan. Untuk membatasi ruang lingkup penelitian, penulis menggunakan data sekolah menengah pertama negeri Provinsi DKI Jakarta. Peubah respon dalam penelitian ini adalah status akreditasi sekolah. Peubah bebas yang digunakan ditentukan berdasarkan data pendidik dan tenaga kependidikan yang terdiri dari 13 peubah. Daftar peubah bebas yang digunakan terdapat pada Lampiran 1. Sementara itu, data diolah dengan menggunakan software SPSS dan Matlab. Metode 1.
2. 3.
4.
Berikut adalah tahapan analisis yang akan dilakukan dalam penelitian ini : Membagi data menjadi data training (60%) dan data testing (40%) serta mempersiapkan data yang bertujuan untuk menyeragamkan nilai setiap peubah. Indikator serta perhitungan masing-masing peubah dapat dilihat pada Lampiran 1. Mengeksplorasi data menggunakan tabulasi silang terhadap peubah bebas dengan peubah respon untuk melihat karakteristik data. Melakukan analisis regresi logistik biner sehingga pengaruh setiap peubah diketahui dan model regresi logistik biner didapatkan. Untuk itu, berikut adalah tahapan yang dilakukan dalam analisis regresi logistik biner : a. Menguji signifikansi parameter secara serentak untuk melihat pengaruh pebah bebas pada peubah respon secara bersama-sama. b. Menguji signifikansi parameter secara parsial untuk mengetahui peubah bebas yang berpengaruh terhadap peubah respon secara parsial. c. Membentuk model regresi logistik biner dengan menggunakan peubah bebas yang berpengaruh nyata terhadap peubah respon. Melakukan analisis jaringan syaraf tiruan dengan metode pelatihan back propagation. Berikut adalah algoritma pada back propagation : a. Menentukan input dan output. Data input dan output sudah mengalami praproses data sehingga data sudah dalam kondisi seragam yakni berbentuk data numerik. Oleh sebab itu, jumlah unit untuk lapisan input sama dengan jumlah peubah input yang digunakan yakni sebanyak 13 buah. Adapun jumlah unit pada lapisan output ada sebanyak satu unit. b. Melakukan transformasi data sehingga data-data input dan output masuk dalam range tertentu. c. Membangun jaringan feed forward dengan menentukan banyaknya unit pada lapisan tersembunyi. Penentuan jumlah unit pada lapisan tersembunyi dilakukan dengan cara trial and error sampai diperoleh jumlah unit yang optimal yang dapat
9 meminimumkan fungsi kinerja yaitu KTG. Variasi jumlah unit lapisan tersembunyi yang dicobakan adalah dari satu sampai sembilan. d. Menentukan fungsi aktivasi yang akan digunakan dalam jaringan feed forward menjadi fungsi hyperbolic tangent. e. Menginisialisasi bobot-bobot awal secara acak (random). f. Menentukan parameter optimum yang digunakan. Parameter yang digunakan dalam proses pelatihan meliputi laju pelatihan serta momentum. Variasi nilai laju pelatihan yang dicobakan adalah 0.0001; 0.001; 0.01; 0.1 dan 1. Sementara itu, variasi nilai momentum yang dicobakan adalah 0; 0.3; 0.5; 0.7 dan 1. Selain itu juga ditetapkan jumlah siklus pelatihan maksimum sebanyak 15000, serta kinerja tujuan sebesar 0.7. Hal ini diperlukan sebagai kriteria henti jaringan dalam melakukan pelatihan. g. Melakukan proses pelatihan terhadap input dan output yang sudah ditransformasi dengan menggunakan parameter laju pelatihan dan momentum yang optimum. 5. Mengevaluasi kebaikan model regresi logistik biner dan jaringan syaraf tiruan dengan menggunakan kurva ROC (Relative Operating Characteristics). Kurva ROC menunjukkan variasi tingkat kebaikan klasifikasi pada setiap cut off point yang berbeda. Penentuan cut off point yang optimal dapat dilakukan dengan melihat kurva ROC. Cut off point yang optimal terletak pada pojok kiri atas kurva. Pada umumnya, cut off point tersebut memberikan nilai sensitifitas nilai spesitifitas yang besar. Secara keseluruhan, kebaikan kurva ROC dalam melakukan klasifikasi dapat terlihat dari nilai AUC (Area Under the Curve). Jika nilai AUC semakin besar (mendekati 1) maka kemampuan kurva ROC akan semakin baik. 6. Membandingkan nilai AUC untuk memilih metode terbaik di antara regresi logistik biner dan jaringan syaraf tiruan. Metode terbaik adalah metode yang mempunyai nilai AUC yang lebih besar. HASIL DAN PEMBAHASAN Eksplorasi Data Hasil eksplorasi data pada peubah respon menunjukkan bahwa hanya terdapat dua kategori status akreditasi pada sekolah tingkat menengah pertama di provinsi DKI Jakarta, yaitu sekolah memiliki akreditasi A sebanyak 80% dan sekolah memiliki akreditasi B sebanyak 20%. Oleh karena itu, kategori status akreditasi dibagi menjadi dua yaitu terakreditasi A dan terakreditasi B. Untuk mengetahui karakteristik setiap indikator Pendidik dan Tenaga Kependidikan (PTK) sekolah tingkat menengah pertama di Provinsi DKI Jakarta, dilakukan analisis statistika deskriptif dan tabulasi silang antara peubah PTK terhadap status akreditasi sekolah. Hasil statistika deskriptif disajikan pada tabel di bawah ini.
10 Tabel 1 Statistika deskriptif untuk indikator guru dan tenaga administrasi Indikator guru Peubah bebas Rata-rata Modus Jumlah guru (X1) 44 42 Jumlah guru berdasarkan kualifikasi 32 32 pendidikan D4 ke atas (X2) Jumlah guru berdasarkan kesesuaian pendidikan dengan mata pelajaran 24 24 yang diampu (X3) Indikator tenaga administrasi Jumlah tenaga administrasi (X9) 7 5 Jumlah tenaga administrasi berdasarkan kualifikasi pendidikan 7 8 SMA atau yang sederajat (X10) Jumlah tenaga administrasi berdasarkan latar belakang 2 1 pendidikan administrasi (X11)
Minimum 22
Maksimum 74
12
60
9
51
1
15
1
14
0
7
Tabel 1 menunjukkan bahwa rata-rata jumlah guru sekolah menengah pertama provinsi DKI Jakarta ada sebanyak 44 guru dengan jumlah guru paling sedikit sebanyak 22 guru dan jumlah guru terbanyak sebanyak 74 guru. Selain itu, terdapat 10 sekolah yang memiliki frekuensi jumlah guru yang sama yaitu sebanyak 42 guru. Selanjutnya, jika peubah jumlah guru berdasarkan pendidikan D4 ke atas (X2) dibandingkan dengan peubah jumlah guru secara keseluruhan (X1) maka terjadi penurunan sebesar 27%. Penurunan juga kembali terjadi pada peubah X3 bila dibandingkan dengan dua peubah sebelumnya. Dilihat dari indikator tenaga administrasi, sekolah menengah pertama di provinsi DKI Jakarta memiliki rata-rata tenaga administrasi sebanyak tujuh orang dengan jumlah minimum sebanyak satu orang dan jumlah maksimum sebanyak 15 orang. Semua tenaga administrasi memiliki kualifikasi pendidikan minimal SMA atau yang sederajat tetapi hanya sedikit yang berasal dari latar belakang pendidikan administrasi. Tabel 2 di bawah ini menunjukan eksplorasi data berdasarkan indikator kepala sekolah, kepala tenaga administrasi, dan pustakawan. Dilihat dari peubah kualifikasi akademik, 61% kepala sekolah di sekolah menengah pertama Provinsi DKI Jakarta memiliki pendidikan kurang atau sama dengan S1 dan sisanya memiliki pendidikan minimal S2. Hal ini sesuai dengan peraturan pemerintah yang menyatakan bahwa kualifikasi umum kepala sekolah adalah sarjana (S1) atau diploma empat (D4). Meski begitu, masih ada dua sekolah yang dipimpin oleh kepala sekolah dengan kualifikasi akademik diploma tiga (D3). Sementara itu, sebagian besar kepala sekolah juga memiliki status sebagai guru.
11 Tabel 2 Tabulasi silang indikator kepala sekolah, indikator kepala tenaga administrasi, dan indikator pustakawan terhadap status akreditasi sekolah Peubah bebas
Indikator kepala sekolah Kategori
Status akreditasi A B Kualifikasi akademik (X4) ≤S 62 22 ≥S 48 6 Total (%) 80 20 Status sebagai guru (X5) Tidak 14 4 Ya 96 24 Total (%) 110 28 Indikator kepala tenaga administrasi Kualifikasi akademik (X6) < D3 66 24 ≥ D3 44 4 Total (%) 80 20 Masa kerja (X7) ≤ 4 tahun 24 4 >4 tahun 86 24 Total (%) 80 20 Latar belakang pendidikan (X8) Non administrasi 71 23 Administrasi 39 5 Total (%) 80 20 Indikator pustakawan Memiliki pustakawan (X12) Tidak 50 15 Ya 60 13 Total (%) 80 20 Terdapat pustakawan yang Tidak ada 52 12 memiliki latar belakang Ada 8 1 pendidikan ilmu perpustakaan Total (%) 82 18 dan informasi (X13)
Total (%) 61 39 100 13 87 100 65 35 100 20 80 100 68 32 100 47 53 100 88 12 100
Di Provinsi DKI Jakarta masih banyak ditemukan kepala tenaga administrasi dengan pendidikan kurang dari D3. Tabel 2 menunjukkan bahwa 48 sekolah atau sekitar 35% sekolah memiliki kepala tenaga administrasi dengan kualifikasi akademik sesuai standar yakni berpendidikan minimal lulusan D3 dan 65% sekolah lainnya memiliki kepala tenaga administrasi berpendidikan kurang dari D3. Dilihat dari masa kerja, sebagian besar sekolah memiliki kepala tenaga administrasi dengan masa kerja lebih dari empat tahun. Sementara itu sama halnya dengan peubah kualifikasi akademik, latar belakang pendidikan kepala tenaga administrasi juga masih banyak yang berasal dari non administrasi. Tabel 2 juga menunjukkan bahwa terdapat perbedaan yang sangat tipis di antara jumlah sekolah yang memiliki pustakawan dengan yang tidak memiliki pustakawan. Sebanyak 47% sekolah menengah pertama di Provinsi DKI Jakarta tidak memiliki pustakawan dan selebihnya sebanyak 53% sekolah memiliki pustakawan dengan rata-rata jumlah pustakawan yang dimiliki setiap sekolah hanya berkisar satu sampai dua orang dan hanya sedikit sekolah yang memiliki pustakawan lebih dari dua orang. Sementara itu, hampir semua pustakawan tidak berasal dari latar belakang pendidikan Ilmu Perpustakaan dan Informasi.
12 Tabel 3 Pengujian multikolinieritas Peubah Konstanta X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13
VIF 5.228 7.800 5.846 1.182 1.084 1.176 1.062 1.187 23.024 24.444 1.230 1.204 1.233
Berdasarkan hasil pengujian pada Tabel 3, terdapat multikolinieritas pada peubah bebas X9 dan X10. Hal ini ditunjukkan dengan nilai VIF (Variance Inflation Factor) yang lebih dari 10. Namun kedua peubah bebas tersebut tidak dihilangkan dari model karena dalam proses analisis selanjutnya akan dilakukan seleksi peubah untuk mencari model terbaik. Selain itu, kedua peubah bebas tersebut juga diduga memengaruhi status akreditasi sekolah. Regresi Logistik Biner Pengujian Signifikansi Parameter Secara Serentak Sebelum membentuk model regresi logistik, terlebih dahulu dilakukan uji signifikansi parameter. Uji yang pertama kali dilakukan adalah uji signifikansi parameter terhadap model secara serentak atau keseluruhan yaitu dengan menggunakan uji G. Tabel 4 Uji signifikansi secara serentak G 31.955
Cox & snell r square 0.320
Nagelkerke r square 0.523
Tabel 4 menunjukan bahwa nilai statistik uji G yang diperoleh dari model adalah sebesar 31.955. Dengan taraf nyata 10% (0.1) dan derajat bebas 13, didapatkan nilai khi kuadrat tabel sebesar 19.812. Dengan demikian dapat dilihat bahwa G > χ2α;db. Berdasarkan nilai ini, maka dapat disimpulkan bahwa H0 ditolak. Hal ini menyatakan bahwa terdapat paling sedikit satu parameter yang berpengaruh nyata terhadap klasifikasi status akreditasi Sekolah Menengah Pertama (SMP) di Provinsi DKI Jakarta pada taraf nyata 10%. Pengujian Signifikansi Parameter Secara Parsial Untuk mengetahui peubah apa saja yang signifikan terhadap model maka dilakukan uji signifikansi secara parsial dengan menggunakan uji Wald. Hasil pendugaan parameter regresi logistik biner secara parsial disajikan pada Tabel 5.
13 Tabel 5 Uji signifikansi secara parsial X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 Konstanta
0.232 0.100 -0.102 1.358 -1.532 2.423 -1.163 1.580 -0.164 -0.063 0.783 -0.021 -0.253 -6.132
S.E 0.110 0.150 0.175 1.070 1.385 1.467 1.061 1.237 0.942 0.978 0.425 0.882 1.487 3.381
Wald 4.434 0.449 0.338 1.609 1.224 2.729 1.201 1.632 0.030 0.004 3.397 0.001 0.029 4.157
Derajat bebas 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Nilai-p 0.035 0.503 0.561 0.205 0.269 0.099 0.273 0.201 0.862 0.949 0.065 0.981 0.865 0.041
E p ) 1.261 1.105 0.903 3.888 0.216 11.285 0.313 4.856 0.849 0.939 2.188 0.979 0.777 0.001
Berdasarkan nilai pendugaan parameter pada Tabel 5, diketahui bahwa hanya peubah X1, X6, dan X11 yang berpengaruh nyata terhadap klasifikasi status akreditasi SMP di Provinsi DKI Jakarta. Hal ini dapat dilihat dari nilai-p yang kurang dari taraf nyata (α) yang digunakan yaitu 10%. Untuk memperoleh model yang lebih baik, maka dibentuk model baru (model II) dengan mengeluarkan peubah yang tidak berpengaruh nyata terhadap model sehingga model II hanya mengikutsertakan peubah X1, X6, dan X11. Nilai statistik uji G pada model II adalah sebesar 21.725. Dengan tingkat signifikansi 10% dan derajat bebas sama dengan tiga, didapatkan nilai chi kuadrat tabel adalah sebesar 6.251. Berdasarkan perbandingan kedua nilai tersebut, dapat dilihat bahwa nilai statistik uji G model II lebih besar dari nilai chi kuadrat tabel, sehingga model baru yang terbentuk diterima dan dapat dilakukan analisis selanjutnya. Tabel 6 Uji signifikansi secara parsial pada model II X1 X6 X11 Konstanta
0.140 2.347 0.372 -4.909
S.E. 0.047 1.185 0.297 1.868
Wald 9.050 3.926 1.568 6.905
Derajat bebas 1 1 1 1
Nilai-p 0.003 0.048 0.210 0.009
E p ) 1.150 10.456 1.450 0.007
Tabel 6 menunjukkan nilai pendugaan parameter pada model II. Berdasarkan hasil tersebut, terlihat bahwa nilai-p X11 adalah sebesar 0.210. Oleh karena nilai tersebut lebih besar dari taraf nyata yang digunakan (10%) maka peubah X11 tidak berpengaruh nyata terhadap respon. Untuk membentuk model yang diharapkan lebih baik, maka dibentuk model baru (model III) dengan mengikutsertakan peubah yang berpengaruh nyata yaitu peubah X1 dan X6. Tabel 7 Uji signifikansi secara parsial pada model III X1 X6 Konstanta
0.138 2.175 -4.422
S.E. 0.045 1.146 1.758
Wald 9.391 3.603 6.327
Derajat bebas 1 1 1
Nilai-p 0.002 0.058 0.012
E p ) 1.148 8.800 0.012
14 Tabel 7 menunjukkan nilai pendugaan parameter pada model III. Berdasarkan hasil tersebut, terlihat bahwa nilai konstanta regresi logistik biner adalah sebesar -4.422. Sementara itu, koefisien regresi X1 (jumlah guru) sebesar 0.138 dan koefisien regresi X6 (kualifikasi akademik kepala tenaga administrasi) sebesar 2.175. Nilai-nilai tersebut kemudian dirumuskan dalam bentuk dugaan persamaan regresi logistik biner sebagai berikut : ln (̂
̂) = -4.422 + 0.138 X1 + 2.175 X6 Jaringan Syaraf Tiruan
Transformasi Data Input Sebelum dilakukan pelatihan, terlebih dahulu dilakukan transformasi pada input dan target sehingga data-data input dan target masuk dalam suatu range tertentu. Pada penelitian ini, proses transformasi dilakukan dengan mengurangi nilai input dan target terhadap rata-ratanya kemudian dibandingkan dengan simpangan baku. Proses transformasi tersebut bertujuan untuk membawa data ke bentuk normal dengan rata-rata sama dengan nol dan simpangan baku sama dengan satu. Arsitektur Jaringan Syaraf Tiruan Setelah dilakukan transformasi, jaringan syaraf tiruan dengan metode back propagation dapat dibangun sehingga arsitektur jaringan terbentuk. Untuk mendapatkan bentuk arsitektur yang optimal, dilakukan proses trial and error yaitu dengan menentukan jumlah unit lapisan tersembunyi. Proses trial and error tersebut akan dilakukan berulang-ulang sampai mendapatkan hasil yang paling optimal agar memberikan hasil pengklasifikasian yang maksimal dan dengan nilai KTG yang minimum. Tabel 8 Hasil pengujian berdasarkan jumlah unit pada lapisan tersembunyi Jumlah unit lapisan tersembunyi 1 2 3 4 5 6 7 8 9
KTG 0.700 0.687 0.697 0.695 0.698 0.695 0.699 0.699 0.699
Tabel 8 menunjukan bahwa banyaknya unit lapisan tersembunyi pada suatu arsitektur JST tidak memengaruhi nilai KTG yang diperoleh dari hasil trial and error karena nilai KTG menyebar secara acak untuk setiap unit lapisan tersembunyi. Selanjutnya, dapat juga dilihat bahwa nilai KTG berfluktuasi turun dan naik mulai dari unit tersembunyi sama dengan satu hingga akhirnya mencapai maksimum dan konstan saat unit tersembunyi sama dengan tujuh. Sementara itu, nilai KTG minimum dihasilkan dari unit lapisan tersembunyi sama dengan dua.
15 Sebagaimana penjelasan di atas, maka dapat diketahui bahwa arsitektur JST yang paling optimal adalah arsitektur jaringan yang terdiri dari 13 unit lapisan masukan, dua unit lapisan tersembunyi dan satu unit lapisan keluaran. Hal tersebut ditunjukkan dengan nilai KTG yang paling minimum yakni sebesar 0.687. Arsitektur jaringan syaraf tiruan dapat dilihat pada Gambar 4.
Gambar 3 Arsitektur jaringan syaraf tiruan optimal Arsitektur JST seperti yang ditunjukkan pada Gambar 3 memiliki satu lapisan masukan, satu lapisan tersembunyi, dan satu lapisan keluaran. Lapisan masukan terdiri dari 13 unit yang mana masing-masing unit memiliki dua penghubung menuju lapisan tersembunyi dan setiap penghubung memiliki suatu bobot tertentu. Adapun lapisan tersembunyi terdiri dari dua unit dengan masingmasing unit memiliki satu penghubung dengan bobot tertentu yang menuju lapisan keluaran. Parameter Jaringan Syaraf Tiruan Setelah mendapatkan arsitektur JST yang optimal, langkah selanjutnya adalah menentukan nilai parameter JST seperti laju pelatihan dan momentum. Sama halnya dengan menentukan jumlah unit lapisan tersembunyi yang optimal, parameter JST juga ditentukan dengan melakukan proses trial and error. Proses tersebut akan dilakukan berulang-ulang dengan variasi laju pelatihan dan momentum yang berbeda pada setiap perulangan. Adapun konfigurasi JST yang digunakan adalah satu lapisan tersembunyi dengan jumlah unit sama dengan dua, jumlah siklus pelatihan maksimum sama dengan 15000, kinerja tujuan sama dengan 0.700, fungsi aktivasi pada lapisan tersembunyi dan lapisan keluaran adalah hyperbolic tangent serta bobot-bobot diinisialisasi secara acak. JST dilatih dengan nilai laju pelatihan yang berbeda untuk setiap proses trial and error, yaitu 0.0001; 0.001; 0.01; 0.1 dan 1.
16 Tabel 9 Hasil pengujian berdasarkan laju pelatihan Laju pelatihan 0.0001 0.0010 0.0100 0.1000 1.0000
KTG 0.696 0.694 0.687 0.688 0.695
Hasil penelitian menunjukkan bahwa perubahan nilai laju pelatihan yang semakin besar tidak berbanding lurus terhadap perubahan KTG. Pada awalnya KTG akan semakin menurun seiring dengan laju pelatihan yang semakin besar hingga akhirnya KTG naik kembali pada saat laju pelatihan sama dengan 0.1. Nilai KTG maksimum dihasilkan dari laju pelatihan yang paling kecil yaitu 0.0001. Sebaliknya, nilai KTG minimum dihasilkan dari laju pelatihan 0.01. Oleh sebab itu, laju pelatihan 0.01 dipilih sebagai laju pelatihan optimal. Selain mengamati nilai KTG yang dihasilkan, jumlah siklus pelatihan yang terbentuk juga diamati untuk setiap laju pelatihan. Berdasarkan Gambar 4, diketahui bahwa semakin besar laju pelatihan yang dicobakan maka jumlah siklus pelatihan yang diperlukan agar jaringan mencapai optimal semakin minimum.
Gambar 4 Hasil pengujian berdasarkan jumlah siklus vs laju pelatihan Parameter yang perlu ditentukan selanjutnya adalah momentum. Konfigurasi JST yang digunakan sama dengan konfigurasi yang digunakan dalam menentukan laju pelatihan, hanya saja nilai laju pelatihan dibuat konstan (0.01) sementara nilai momentum diubah-ubah. Tabel 10 menunjukkan perubahan KTG untuk setiap nilai momentum yang dicobakan. KTG terlihat cukup stabil saat momentum sama dengan 0.500 sampai dengan momentum sama dengan 0.900. KTG optimum tidak terjadi pada nilai momentum sama dengan 1 meski siklus pelatihan yang dilakukan sudah mencapai maksimum. Sebaliknya, nilai KTG yang relatif minimum dihasilkan dari momentum sama dengan 0.010 dan 0.300. Dari kedua nilai tersebut, momentum sama dengan 0.010 memberikan nilai KTG lebih kecil dibandingkan dengan momentum sama dengan 0.300. Oleh sebab itu, momentum sama dengan 0.010 dipilih sebagai momentum optimum.
17 Tabel 10 Hasil pengujian berdasarkan momentum Momentum 0.000 0.010 0.300 0.500 0.700 0.900 1.000
KTG 0.697 0.676 0.687 0.697 0.696 0.697 1.080
Berdasarkan pembahasan jaringan syaraf tiruan di atas, maka model JST dalam penelitian ini menggunakan algoritma back propagation dengan satu lapisan masukan yang terdiri dari 13 unit masukan, satu lapisan tersembunyi yang terdiri dari dua unit tersembunyi, dan satu lapisan keluaran yang terdiri dari satu unit keluaran. Fungsi aktivasi yang digunakan merupakan hyperbolic tangent dengan laju pelatihan dan momentum diset sebesar 0.010. Selanjutnya, kriteria ini akan digunakan untuk melatih data testing sehingga prediksi respon Y yaitu status akreditasi sekolah didapatkan. Evaluasi Kebaikan Model Evaluasi kebaikan model dilakukan untuk melihat tingkat keakuratan metode regresi logistik biner dan metode jaringan syaraf tiruan. Pada penelitian ini, evaluasi kebaikan model dilakukan dengan menggunakan analisis kurva ROC. Regresi Logistik Biner Model regresi logistik biner yang diperoleh model III sebelumnya digunakan untuk mengklasifikasikan data testing. Selanjutnya, kurva ROC digunakan untuk melihat kebaikan model regresi logistik biner dalam pengklasifikasian. Berikut adalah kurva ROC untuk data training dan data testing yang diperoleh dari regresi logistik biner. Tabel 11 Nilai AUC regresi logistik biner Data AUC Data training 0.852 Data testing 0.834 Berdasarkan hasil kurva ROC pada Gambar 5, cut off point optimal yang didapatkan adalah sebesar 0.877. Cut off point tersebut memberikan sensitivitas sebesar 0.714 dan spesifisitas sebesar 0.846. Nilai sensitifitas 71.4% menyatakan bahwa model regresi logistik biner dapat memprediksi sekolah memiliki status akreditasi A sebesar 71.4% pada kelompok sekolah yang memang memiliki status akreditasi A. Sedangkan nilai spesifisitas 84.6% menyatakan bahwa model regresi logistik biner dapat memprediksi sekolah yang memiliki akreditasi B sebesar 84.6% untuk kelompok sekolah yang memang memiliki status akreditasi B. Sementara itu, nilai AUC yang dihasilkan dari metode regresi logistik biner ini adalah sebesar 0.852 untuk data training dan 0.834 untuk data testing. Dengan demikian dapat disimpulkan bahwa regresi logistik biner memiliki tingkat kebaikan model yang cukup bagus.
18
Gambar 5
Kurva ROC data training (kiri) dan testing (kanan) regresi logistik biner
Jaringan Syaraf Tiruan Sama halnya dengan regresi logistik biner, besarnya kemampuan JST dalam mengklasifikasikan suatu data dapat diketahui dari kurva ROC. Dengan menggunakan kriteria model JST sebagaimana yang sudah dipaparkan sebelumnya, berikut adalah hasil analisis kurva ROC bagi JST. Tabel 12 Nilai AUC jaringan syaraf tiruan Data AUC Data training 0.911 Data testing 0.899
Gambar 6
Kurva ROC data training (kiri) dan testing (kanan) Jaringan syaraf tiruan
Sebagaimana yang ditunjukkan pada hasil analisis kurva ROC pada Tabel 12 dan Gambar 6, metode JST memberikan nilai AUC sebesar 0.911 untuk data training dan 0.899 untuk data testing. Tingginya nilai AUC tersebut menunjukkan bahwa JST memiliki kemampuan yang baik dalam mengklasifikasikan suatu data. Sementara itu, cut off point optimal terjadi pada titik 0.775. Cut off point tersebut
19 memberikan sensitifitas sebesar 0.905 dan spesifisitas sebesar 0.846. Nilai sensitifitas 90.5% menyatakan bahwa jaringan syaraf tiruan dapat memprediksi sekolah memiliki status akreditasi A sebesar 90.5% pada kelompok sekolah yang memang memiliki status akreditasi A. Sedangkan nilai spesifisitas 84.6% menyatakan bahwa jaringan syaraf tiruan dapat memprediksi sekolah yang memiliki akreditasi B sebesar 84.6% untuk kelompok sekolah yang memang memiliki status akreditasi B. Perbandingan Regresi Logistik Biner dengan Jaringan Syaraf Tiruan Pemilihan metode terbaik antara regresi logistik biner dengan jaringan syaraf tiruan dalam hal klasifikasi dapat dilakukan dengan melihat nilai AUC. Nilai AUC yang dihasilkan dari metode regresi logistik biner adalah sebesar 0.852 untuk data training dan 0.834 untuk data testing. Sementara itu, nilai AUC yang dihasilkan dari metode JST adalah sebesar 0.911 untuk data training dan 0.899 untuk data testing. Berdasarkan perbandingan tersebut dapat dikatakan bahwa nilai AUC yang dihasilkan metode JST lebih besar dibandingkan dengan metode regresi logistik biner. Dengan demikian dapat disimpulkan bahwa pada penelitian ini metode JST back propagation dapat memprediksi lebih baik dibandingkan dengan metode regresi logistik biner. SIMPULAN Hasil dari regresi logistik biner menunjukkan bahwa ada dua peubah bebas yang berpengaruh nyata terhadap status akreditasi SMP di provinsi DKI Jakarta pada taraf nyata 10% yaitu jumlah guru (X1) dan kualifikasi akademik kepala tenaga administrasi (X6). Metode regresi logistik biner menunjukkan bahwa model terbaik memberikan nilai AUC sebesar 0.852 untuk data training dan 0.834 untuk data testing. Sementara itu, pemodelan menggunakan JST back propagation memberikan nilai AUC yang lebih baik daripada metode regresi logistik biner dimana nilai AUC JST untuk data training dan data testing sebesar 0.911 dan 0.899. Dengan demikian dapat disimpulkan bahwa pada penelitian ini metode JST back propagation dapat memprediksi lebih baik dari pada metode regresi logistik biner. SARAN Penelitian ini hanya menggunakan 13 peubah bebas dari indikator Pendidik dan Tenaga Kependidikan yang diduga memengaruhi klasifikasi status akreditasi sekolah menengah pertama. Penelitian selanjutnya disarankan untuk dapat menambahkan beberapa faktor dari indikator lain selain Pendidik dan Tenaga Kependidikan yang diduga memengaruhi klasifikasi status akreditasi sekolah. Selain itu, disarankan pula untuk menggunakan analisis jaringan syaraf tiruan dengan algoritma pelatihan selain back propagation.
20 DAFTAR PUSTAKA Hadjaratie L. 2011. Jaringan Syaraf Tiruan Untuk Prediksi Tingkat Kelulusan Mahasiswa Diploma Program Studi Manajemen Informatika Universitas Negeri Gorontalo [tesis]. Bogor (ID): Institut Pertanian Bogor. Hermawan A. 2006. Jaringan Saraf Tiruan Teori dan Aplikasi. Yogyakarta : Andi. Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. Ed ke-2. New York : John Wiley and Sons. Kusumadewi S. 2004. Membangun Jaringan Syaraf Tiruan Menggunakan Matlab & Excel Link. Yogyakarta : Graha Ilmu. Larasati A, DeYong CF, Slevitch L. 2011. Comparing Neural Network and Ordinal Logistic Regression to Analyze Responses [Internet]. [diunduh 2013 Okt 02]. Tersedia pada : http://servsci.journal.informs.org/content/3/4/304.full.pdf. Long JS. 1997. Regression Models for Categorical and Limited Dependent Variables. California : Sage Publications. Martiana. 2012. Bab 8 Jaringan Syaraf Tiruan [Internet]. [diunduh 2014 Feb 11]. Tersedia pada : http://digilib.its.ac.id/public/ITS-Master-19016-Paper387485.pdf. Mirawanti Y, Ulama BSS. 2013. Perbandingan Metode Regresi Logistik Ordinal dengan Jaringan Syaraf Tiruan Fungsi Radial Basis [Internet]. [diunduh 2013 Okt 24]. Tersedia pada : http://digilib.its.ac.id/public/ITS-Master19016-Paper-387485.pdf.
21 Lampiran 1 Keterangan peubah penjelas yang digunakan Indikator penelitian Guru
Kepala sekolah
Kepala tenaga administrasi
Tenaga administrasi
Pustakawan
Keterangan
Kategori
Jumlah guru (X1) Jumlah guru berdasarkan pendidikan D4 ke atas (X2) Jumlah guru berdasarkan kesesuaian latar pendidikan dengan matpel yang diampu (X3) Kualifikasi akademik (X4) 0. 1. Kepala sekolah memiliki status sebagai guru (X5) 0. 1. Kualifikasi akademik (X6) 0. 1. Masa kerja (X7) 0. 1. Latar belakang pendidikan (X8) 0.
≤S ≥S Tidak Ya 4 tahun Non administrasi 1. Administrasi
Jumlah tenaga administrasi (X9) Jumlah tenaga administrasi berdasarkan kualifikasi pendidikan minimal SMA atau yang sederajat (X10) Jumlah tenaga administrasi berdasarkan latar belakang pendidikan administrasi (X11) Memiliki pustakawan (X12) 0. 1. Terdapat pustakawan dengan latar belakang ilmu 0. perpustakaan dan informasi (X13) 1.
Tidak Ya Tidak ada Ada
22 Lampiran 2 Output SPSS kurva ROC regresi logistik biner data testing Cut off point 0.000 0.252 0.318 0.382 0.447 0.499 0.550 0.584 0.617 0.664 0.709 0.737 0.785 0.829 0.854 0.877 0.892 0.906 0.916 0.922 0.927 0.931 0.943 0.959 0.966 0.971 0.976 0.980 0.983 0.985 0.987 0.989 0.990 0.991 0.992 0.994 0.997 0.999 1.000
Sensitifitas 1 - spesifisitas 1.000 1.000 1.000 0.923 1.000 0.846 1.000 0.769 0.976 0.769 0.952 0.769 0.929 0.769 0.905 0.769 0.881 0.615 0.881 0.538 0.857 0.462 0.786 0.385 0.762 0.308 0.738 0.308 0.714 0.231 0.714 0.154 0.690 0.077 0.667 0.077 0.619 0.077 0.595 0.077 0.571 0.077 0.571 0.000 0.524 0.000 0.500 0.000 0.476 0.000 0.452 0.000 0.429 0.000 0.405 0.000 0.381 0.000 0.286 0.000 0.262 0.000 0.238 0.000 0.214 0.000 0.190 0.000 0.143 0.000 0.119 0.000 0.095 0.000 0.048 0.000 0.000 0.000
Spesifisitas 0.000 0.077 0.154 0.231 0.231 0.231 0.231 0.231 0.385 0.462 0.538 0.615 0.692 0.692 0.769 0.846 0.923 0.923 0.923 0.923 0.923 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
23 Lampiran 3 Output SPSS kurva ROC jaringan syaraf tiruan data testing Cut off point -0.500 0.505 0.520 0.535 0.545 0.555 0.565 0.575 0.600 0.630 0.650 0.665 0.705 0.750 0.775 0.830 0.875 0.885 0.915 0.945 0.955 0.965 0.975 0.985 1.000 1.015 1.025 1.035 1.045 1.055 1.065 1.075 1.085 1.095 2.100
Sensitifitas 1 - spesifisitas 1.000 1.000 1.000 0.923 1.000 0.846 0.976 0.846 0.976 0.769 0.976 0.692 0.976 0.615 0.976 0.538 0.976 0.462 0.976 0.385 0.976 0.231 0.952 0.231 0.929 0.231 0.905 0.231 0.905 0.154 0.881 0.154 0.857 0.154 0.810 0.154 0.786 0.154 0.762 0.154 0.738 0.154 0.667 0.154 0.643 0.077 0.595 0.077 0.524 0.077 0.476 0.077 0.452 0.077 0.405 0.077 0.381 0.077 0.333 0.077 0.310 0.000 0.286 0.000 0.214 0.000 0.095 0.000 0.000 0.000
Spesifisitas 0.000 0.077 0.154 0.154 0.231 0.308 0.385 0.462 0.538 0.615 0.769 0.769 0.769 0.769 0.846 0.846 0.846 0.846 0.846 0.846 0.846 0.846 0.923 0.923 0.923 0.923 0.923 0.923 0.923 0.923 1.000 1.000 1.000 1.000 1.000
24 RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 10 Januari 1992 dari pasangan Bapak Marsudi dan Ibu Udaryatun. Penulis merupakan anak pertama dari dua bersaudara. Penulis memulai pendidikan di Taman Kanak-kanak Ahmad Yani pada tahun 1996. Jenjang pendidikan dasar ditempuh penulis di SD Negeri Sukamaju Baru II dan lulus pada tahun 2003. Selanjutnya, penulis melanjutkan pendidikan di SMPI PB Soedirman dan lulus pada tahun 2006, serta mengikuti pendidikan di SMA Negeri 98 Jakarta Timur dan lulus pada tahun 2009. Penulis diterima sebagai mahasiswa Institut Pertanian Bogor pada tahun 2009 melalui jalur Ujian Talenta Mandiri (UTM) pada Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama menjadi mahasiswa, penulis mengikuti kegiatan kepanitiaan sebagai Staf Kesekretariatan dalam acara Pesta Sains Nasional tahun 2010. Selain itu, penulis juga menyempatkan diri untuk mengikuti pendidikan non formal dalam pelatihan Brevet AB di IAI Cabang Depok. Dalam rangka menyelesaikan studi di Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor, penulis melakukan penelitian dan m n usun skripsi b rjudul “Perbandingan Regresi Logistik Biner dengan Jaringan Syaraf Tiruan (Studi pada Klasifikasi Status Akreditasi Sekolah Menengah Pertama Provinsi DKI Jakarta)” di bawah bimbingan Bapak Dr Kusman Sadik, MSi dan Bapak Dr Farit Mochamad Afendi, MSi.