BAB 2 LANDASAN TEORI
2.1
Teori Umum 2.1.1
Regresi Logistik Analisis Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan variabel-variabel yang lain. Variabel “penyebab” disebut dengan bermacam-macam istilah, di antaranya seperti variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel “terkena akibat” dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak. Analisis Regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini. Adapun Regresi Logistik (kadang disebut model logistik atau model logit) merupakan salah satu bagian dari Analisis Regresi, yang digunakan untuk memprediksi probabilitas kejadian suatu peristiwa, dengan mencocokkan data pada fungsi logit kurva logistik. Metode ini merupakan model linear umum yang digunakan untuk regresi
binomial. Seperti analisis regresi pada umumnya, metode ini menggunakan beberapa variabel bebas, baik numerik maupun kategori. Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa tubuh. Regresi Logistik juga digunakan secara luas pada bidang kedokteran, ilmu sosial, dan bahkan pada bidang pemasaran, seperti prediksi kecenderungan pelanggan untuk membeli suatu produk atau berhenti berlangganan. Regresi
Logistik
tidak
memerlukan
asumsi
normalitas,
heteroskedastisitas, dan autokorelasi, dikarenakan variabel terikat yang terdapat pada Regresi Logistik merupakan variabel dummy (0 dan 1), sehingga residualnya, tidak memerlukan ketiga pengujian tersebut. Untuk asumsi multikolinearitas, karena hanya melibatkan variabel-variabel bebas, maka masih perlu untuk dilakukan pengujian. Untuk pengujian multikolinearitas ini dapat digunakan uji kebaikan suai (goodness of fit test), yang kemudian dilanjutkan dengan pengujian hipotesis (uji χ 2 ), guna melihat variabel-variabel bebas mana saja yang signifikan, sehingga dapat tetap digunakan dalam penelitian. Selanjutnya, di antara variabel-variabel bebas yang signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak terdapat variabel-variabel bebas yang saling memiliki korelasi yang tinggi, maka dapat disimpulkan bahwa tidak terdapat gangguan multikolinearitas pada model penelitian (David W. Hosmer, 2011).
Persamaan logit bagi Regresi Logistik : g ( x) = β 0 + β1 x1 + β 2 x2 + β 3 x3
(2.1)
Persamaan untuk menentukan nilai peluang dari persamaan logit :
π ( x) =
eg ( x) 1 + e g ( x)
(2.2)
Keterangan : •
π ( x ) adalah peluang memperoleh pekerjaan bagi seorang mahasiswa lulusan baru, jika diketahui IPK, jenis kelamin, dan usianya.
•
g ( x ) adalah nilai estimasi logit.
•
β0, β1, β2, dan β3 berturut-turut adalah nilai koefisien untuk variabel-variabel konstan, IPK, jenis kelamin, dan usia, yang diperoleh
menggunakan
metode
Maximum
Likelihood
Estimation. Statistik W untuk uji signifikansi parameter Regresi Logistik : Wi =
βi SEi
(2.3)
Wilayah kritis : Wi > χ k2,α
(2.4)
Keterangan : •
βi adalah nilai koefisien regresi logistik untuk variabel ke-i.
•
SEi adalah nilai standard error untuk variabel ke-i.
•
k adalah banyaknya variabel bebas yang digunakan.
•
α adalah taraf nyata.
Rumus untuk menentukan odds ratio : p1 (1 − p1 ) p2 (1 − p2 )
(2.5)
Keterangan :
2.1.2
•
p1 adalah peluang kejadian pada kelompok pertama.
•
p2 adalah peluang kejadian pada kelompok ke-2.
Bahasa R R adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik. R dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh R Development Core Team. Bahasa R kini menjadi standar de facto di antara statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas untuk pengembangan perangkat lunak statistika dan analisis data. R merupakan bagian dari proyek GNU. Kode sumbernya tersedia secara bebas di bawah lisensi publik umum GNU, dan versi biner prekompilasinya tersedia untuk berbagai sistem operasi. R menggunakan antarmuka baris perintah, meski beberapa antarmuka pengguna grafik juga tersedia. R menyediakan berbagai teknik statistika (pemodelan linear dan nonlinear, uji statistik klasik, analisis deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik (Ross Ihaka, 1993). Berikut
merupakan contoh sintaks untuk memperoleh nilai-nilai koefisien regresi logistik dengan menggunakan Bahasa R : Logit <- glm(Y~X1+X2+X3, family = binomial (link="logit")) summary(logit)
Keterangan : •
logit merupakan variabel yang digunakan untuk menampung hasil perhitungan.
•
glm merupakan singkatan dari Generalized Linear Models, yaitu sintaks yang digunakan untuk memperoleh model linear yang tergeneralisasi. summary merupakan sintaks yang digunakan untuk menampilkan nilai-nilai dari koefisien yang telah diperoleh.
2.1.3
Bahasa C Bahasa
pemrograman
C
merupakan
salah
satu
bahasa
pemrograman komputer. Dibuat pada tahun 1972 oleh Dennis Ritchie untuk sistem operasi Unix di Bell Telephone Laboratories. Meskipun C dibuat untuk memprogram sistem dan jaringan komputer, namun bahasa ini juga sering digunakan dalam mengembangkan software aplikasi. C juga banyak dipakai oleh berbagai jenis platform sistem operasi dan arsitektur komputer. C secara luar biasa telah
mempengaruhi bahasa-bahasa populer lainnya, terutama C++ yang merupakan ekstensi dari C (Agung Sudrajat Supriatna, 2008). Adapun Visual C++ adalah sebuah produk Integrated Development Environment (IDE) untuk bahasa pemrograman C dan C++, yang dikembangkan oleh Microsoft. Visual C++ merupakan salah satu bagian dari paket Microsoft Visual Studio. Dengan menggunakan Visual C++, pengguna dimungkinkan untuk merancang berbagai jenis program aplikasi, seperti dalam bentuk form atau console. Berikut merupakan contoh penggalan sintaks sederhana Bahasa C untuk menampilkan tulisan “Hello World”. printf(“Hello World”);
2.2
Teori Pendukung 2.2.1
Peluang Peluang atau kebolehjadian atau dikenal juga sebagai probabilitas adalah cara untuk mengungkapkan pengetahuan atau kepercayaan bahwa suatu kejadian akan berlaku atau telah terjadi. Konsep ini telah dirumuskan dengan lebih ketat dalam matematika, dan kemudian digunakan secara lebih luas, tidak hanya dalam matematika atau statistika, tetapi juga keuangan, sains, dan filsafat (Sheldon Ross, 2009).
2.2.2
Sarjana Sarjana (dari bahasa Sansekerta) adalah gelar akademik yang diberikan kepada lulusan program pendidikan sarjana (S-1). Untuk mendapatkan gelar sarjana, secara normatif dibutuhkan waktu selama 4 (empat) sampai 6 (enam) tahun, tetapi ada juga yang menyelesaikannya dalam 2 (dua) tahun ataupun lebih dari 6 (enam) tahun. Hal tersebut tergantung dari kebijakan dari perguruan tinggi yang bersangkutan. Karya ilmiah yang diwajibkan dan merupakan persyaratan untuk memperolah gelar sarjana dinamakan dengan skripsi. Para sarjana adalah lulusan akademi atau perguruan tinggi, yang menempuh jenjang studi berdasarkan spesifikasi jurusannya masing-masing (Irvan Andi Wiranata, 2009).
2.2.3
Pekerjaan Pekerjaan dalam arti luas adalah aktivitas utama yang dilakukan oleh manusia. Dalam arti sempit, istilah pekerjaan digunakan untuk suatu tugas atau kegiatan yang menghasilkan uang bagi seseorang. Dalam pembicaraan sehari-hari, istilah ini sering dianggap sinonim dengan profesi (Cookey Pratama, 2009).
2.3
Kerangka Pemikiran
Gambar 2.1 Kerangka Pemikiran
Sesuai dengan yang ditunjukkan oleh Gambar 2.1, terdapat tiga buah input pada penelitian ini, yaitu IPK, jenis kelamin, dan usia dari mahasiswa lulusan baru. Ketiga input tersebut kemudian akan diproses sedemikian rupa menggunakan Regresi Logistik, sehingga akan menghasilkan sebuah nilai, yang merupakan besaran peluang bagi seorang mahasiswa lulusan baru untuk dapat memperoleh pekerjaan.