BAB 3 LANDASAN TEORI
3.1
Definisi Operasional Dalam skripsi ini digunakan istilah umum dan tidak umum yang harus dijabarkan agar mengurangi kesalahan pemikiran. Berikut beberapa istilah tersebut.
3.1.1
Kendaraan Bermotor Menurut definisi di situs resmi Badan Pusat Statistik (BPS) DKI Jakarta, kendaraan bermotor adalah setiap kendaraan yang digerakkan oleh peralatan teknik yang ada pada kendaraan itu, biasanya digunakan untuk angkutan orang atau barang di jalan, selain kendaraan yang berjalan di atas rel. Kendaraan bermotor yang dicatat adalah semua kendaraan bermotor kecuali kendaraan bermotor Angkatan Bersenjata Republik Indonesia dan Korps Diplomatik. Menurut definisi di situs resmi Badan Pusat Statistik (BPS) DKI Jakarta, sepeda motor adalah kendaraan bermotor yang beroda dua.
3.1.2
Perilaku Berkendara Perilaku Berkendara dalam penelitian ini dapat didefinisikan sebagai tingkah laku pemilik atau pengguna kendaraan dalam mengemudi dan merawat kendaraannya. Dalam penelitian ini penulis membagi perilaku berkendara menjadi tujuh kategori yang dirangkum dari situs Wahana Artha, Kapanlagi.com dan ASCO.
17 Tujuh kategori tersebut adalah : 1. Keadaan gas kendaraan saat dalam keadaan berhenti. Pada saat kendaraan berhenti atau diam ditempat biasanya pengendara sering memutar-mutar gas (dalam bidang otomotif). 2. Kestabilan atau kekonstanan kecepatan berkendara. Sering kali pengendara memacu kendaraannya dengan cepat atau lambat secara tiba-tiba. 3. Penggunaan gigi (dalam bidang otomotif) persneling yang tepat untuk setiap kecepatan. 4. Kecepatan tertinggi rata-rata. Kecepatan tertinggi rata-rata yang dicapai oleh seorang pengendara dengan satuan km/jam. 5. Tekan angin ban. Tekanan angin ban standar untuk motor biasanya sekitar 29 PSI untuk ban depan dan 33 PSI untuk ban belakang. 6. Setting standar kendaraan. Melakukan perubahan pada setting pabrik yang dapat mengakibatkan kendaraan menjadi lebih boros. 7. Service berkala. Service berkala yang dilakukan oleh pengendara. Biasanya sekitar 90 hari atau tiap 5000 km.
3.1.3
Kehematan Kendaraan Kehematan berasal dari kata dasar hemat yang berarti tidak boros.
18 Kehematan sendiri dapat diartikan sebagai suatu kondisi yang dapat dilihat apakah sesuatu itu hemat atau tidak. Dengan demikian kehematan kendaraan berarti kondisi yang menyatakan apakah suatu kendaraan hemat atau tidak. Hemat atau tidaknya suatu kendaraan sangat relatif sekali bagi setiap orang. Pada penelitian ini penulis mendefinisikan hemat atau tidaknya suatu kendaraan berdasarkan besar konsumsi bahan bakar suatu kendaraan (km/ l) dibandingkan rata-rata konsumsi bahan bakar (km/ l) tiap kendaraan yang sejenis dari hasil penelitian. Kondisi hemat terjadi bila konsumsi bahan bakar suatu kendaraan lebih besar dari rata-rata konsumsi kendaraan yang sejenis, sedangkan kondisi tidak hemat terjadi jika konsumsi bahan bakar suatu kendaraan lebih kecil dari rata-rata konsumsi kendaraan yang sejenis.
3.1.4
Hemat
: km/ l suatu motor ≥ km/ l rata-rata motor yang sejenis
Tidak hemat
: km/ l suatu motor < km/ l rata-rata motor yang sejenis
R-Language R- language adalah suatu software open source komputasi statistika dan grafis. R-language merupakan suatu bentuk program yang berorientasi objek yang memiliki sintaks seperti bahasa C. R-language memungkinkan menulis suatu ekspresi yang digunakan sebagai input untuk permodelan statistik dan grafik. R- language merupakan sistem komputasi dan grafik statistika. R- language terdiri dari sebuah bahasa dan lingkungan run-time dengan grapik, debugger, akses ke beberapa fungsi sistem dan kemampuan untuk menjalankan program yang disimpan dalam file script.
19 Inti dari R- language adalah interprestasi bahasa komputer mengijinkan branching
yang
dan looping sama dengan pemrograman modular
menggunakan fungsi. Banyak fungsi user-visible dalam R- language ditulis di Rlanguage. Sangat mungkin untuk pengguna membuat interface untuk prosedur yang ditulis di bahasa C, C++ atau Fortran untuk efisiensi. Distribusi Rlanguage berisi prosedur-prosedur statistik yang fungsional. Diantaranya : model linear dan generalized linear, nonlinear regression, analisis time series, uji parametrik dan nonparametrik, clustering dan smoothing. Ada juga fungsi luas ruang menyediakan lingkungan grafik fleksibel untuk membuat berbagai jenis presentasi data. Modul tambahan (“add-on packages”) ada untuk berbagai tujuan khusus. R-language dapat juga dihubungkan dengan program aplikasi dan bahasa pemrograman lain, misalnya: MS Excel, Visual Basic, C, C++, Borland Delphi dan lain-lain, melalui bantuan R (D)COM server yang menyediakan COMInterface untuk R- language.
3.1.5
Borland Delphi Borland Delphi merupakan salah satu software pemrograman GUI (Grafic User Interface) yang sangat terkenal di lingkungan berbasis MS Windows. Delphi menggunakan Pascal sebagai bahasa dasar. Pemrograman GUI membuat tampilan program lebih user-friendly, jika dibandingkan dengan tampilan program berbasis DOS yang penuh dengan sintaks dalam teks. Ketika anda menjalankan Delphi, anda langsung diberikan integrated development environment (IDE- lingkungan pengembangan terintegrasi).
20 Lingkungan ini menyediakan peralatan yang anda butuhkan untuk mendesain, mengembangkan, tes, debug, dan membangun berbagai aplikasi. Lingkungan pengembangan Delphi terdiri dari
visual form designer,
Object Inspector, Object TreeView, Component palette, Project Manager, source code editor dan debugger diantara seluruh peralatan. Beberapa peralatan tidak disertakan dalam semua versi. Anda bisa memindahkan secara bebas dari representasi visual dari sebuah objek (dalam form designer), Object Inspector untuk mengedit pernyataan runtime awal dari objek, source code editor untuk mengedit eksekusi logika dari objek. Perubahan kode properti code-related, misalnya nama dari event handler,
dalam Object Inspector secara otomatis
merubah source code yang berhubungan. Selain itu, perubahan dalam source code, misalnya rename sebuah metode event handler dalam sebuah deklarasi kelas form, segera direfleksikan dalam Object Inspector. IDE mendukung mengembangan aplikasi melalui langkah daur hidup produk dari desain ke pengembangan. Menggunakan peralatan dalam IDE dapat digunakan untuk rapid prototyping dan waktu pengembangan yang singkat.
3.1.6
Microsoft Access Microsoft Access merupakan salah satu paket yang ditawarkan oleh program aplikasi Microsoft Office. Microsoft Access digunakan sebagai program aplikasi database. Microsoft Access adalah program yang powerfull untuk membuat dan mengatur database anda. Microsoft Access memiliki banyak fitur untuk membantu anda membangun dan melihat informasi anda. Microsoft Access lebih rumit dan merupakan genuine aplikasi database daripada program lain
21 seperti Microsoft Works.
3.1.7
R(D)COM Server R(D)COM
server
menyediakan
COM-interface
untuk
R-language
sebagaimana berbagai objek COM dan kontrol Active X untuk aplikasi anda. Sebagai tambahan, Add-In untuk Microsoft Excel disiapkan untuk memudahkan penggunaan R-language dalam Microsoft Excel dan membuat aplikasi statistik dengan Microsoft Excel sebagai GUI. Fitur dari paket R(D)COM Server adalah: •
COM server untuk penggunaan local dan remote dengan R-language
•
Transfer data dari dan ke R-language, termasuk NA, NaN,...
•
Active X Controls untuk output teks dan grafik
•
Installation/Uninstallation
•
Repository untuk R-language instances untuk akses share dan eksklusif
•
Contoh yang beragam
•
Excel Add-In
3.2 Analisis Regresi Analisis regresi adalah metodologi statistika yang memanfaatkan hubungan antara dua atau lebih variabel quantitatif sehingga salah satu variabel bisa di duga dari yang lainnya (Netter et al, 1996, p3). Analisis regresi ini pertama kali dikembangkan Sir Francis Galton abad 19 akhir. Galton mengembangkan deskripsi matematis dari kecenderungan regresi, pendahulu dari model regresi sekarang ini (Netter et al, 1996, p6).
22 Salah satu kegunaan analisis regresi adalah dapat mendeskripsikan apakah variabel dependent memiliki pengaruh dengan variabel independent (Netter et al, 1996, p9). Secara umum analisis regresi dibagi menjadi dua, model regresi linear dan model regresi non-linear. Regresi dikatakan linear bila hubungan antara variabel independent dan dependent adalah linear. Hubungan linear terjadi bila diagram pencar (Scatter Plot) mendekati pola garis lurus. Bentuk dari regresi linear adalah sebagai berikut : yˆ = β o + β 1 X + .... + ε
(3.1)
Jika hubungan antara variabel independent dan dependent tidak linear, maka regresi ini disebut regresi non-linear. Bentuk dari regresi non-linear adalah sebagai berikut : yˆ i = f ( Xi, γ ) + ε
(3.2)
Dengan f ( Xi, γ ) adalah fungsi respon non-linear dari parameternya. Error
pada regresi non-linear diasumsikan untuk memiliki nilai harapan sebesar nol, ragam yang konstan dan tidak dikorelasikan, sama seperti asumsi error pada model regresi linear (Netter et al, 1996, p532).
3.2.1
Distribusi Binomial
Menurut Walpole (1995) distribusi binomial adalah distribusi dari suatu percobaan dengan dua kemungkinan hasil, sukses atau gagal. Pada distribusi binomial, peluang sukses disimbolkan dengan simbol p dan kemungkinan gagal disimbolkan dengan simbol q, dimana q=1-p.
23 Peluang pada distribusi binomial dapat dihitung sebagai berikut : p r ( x) =
n! p x q n− x x!(n − x)!
(3.3)
Nilai harapan dari distribusi binomial adalah :
μ = E ( X ) = np
(3.4)
Ragam dari distribusi binomial adalah :
σ 2 =E{ X − E ( X )}2 = E ( X − np) 2 = npq
(3.5)
Standar deviasi dari distribusi binomial adalah :
σ = npq
3.2.2
(3.6)
Odds dan Odds Ratio
Selain probabilitas ada cara lain untuk mengukur perubahan bahwa suatu perubahan akan terjadi, yaitu odds yang diklaim mendekati alamiah (Allison, 1999, p11). Odds dari sebuah kejadian merupakan rasio dari berapa kali jumlah yang diharapkan terjadi dibandingkan dengan berapa kali jumlah yang diharapkan tidak terjadi (Allison, 1999, p11). Ada hubungan sederhana antara probabilitas (p) dan odds (o) sebagai berikut (Allison, 1999, p11): o=
p 1− p
(3.7)
p=
o 1+ o
(3.8)
Hubungan ini dapat dilihat ditabel 3.1
24 Tabel 3.1
Hubungan antara Odds dan Probabilitas Probabililitas 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
Odds 0,11 0,25 0,43 0,67 1,00 1,50 2,33 4,00 9,00
Dari tabel 3.1 dapat dilihat bahwa odds di bawah 1,00 berkoresponden dengan probabilitas di bawah 0,5. Sedangkan odds lebih dari 1,00 berkoresponden dengan probailitas di atas 0,5. Batas bawah Odds sama dengan probabilitas yang memiliki nilai 0 (nol). Odds tidak memiliki batas atas seperti pada probabilitas (Allison, 1999, p12). Menurut Allison (1999, p12) odds diperlukan karena skala yang dimilikinya lebih sensible (pantas) untuk perbandingan multiplicative. Odds dari satu per tiga bisa diartikan bahwa probabilitas dari kejadian akan terjadi adalah satu per tiga probabilitas kejadian tidak terjadi. Untuk itulah kenapa kita menggunakan odds ratio. Odds ratio
adalah alat ukur yang banyak digunakan untuk mengukur
hubungan antara dua variabel dikotomi (Allison, 1999, p12). Odds ratio adalah satu-satunya ukuran dari gabungan estimasi langsung dari model.
3.2.3
Regresi Logistik
Regresi logistik adalah pendekatan model matematika yang bisa digunakan untuk mendeskripsikan hubungan beberapa variabel independent (x) dengan
25 variabel dependent (y) (Kleinbaum, 1992, p5). Variabel independent (x) dapat berupa variabel dikotomi, kontinuous dan kategorik. Sedangkan variabel dependent (y) yang merupakan variabel dikotomi Model regresi logistik dapat dilihat di persamaan di bawah ini
e ( β0 + β1x1 + β 2 x2 + β3 x3 + β 4 x4 + β5 d x5 d + β5 b x5 b + β6 x6 + β7 x7 ) P ( xi ) = 1 + e ( β0 + β1x1 + β 2 x2 + β3 x3 + β 4 x4 + β5 d x5 d + β5 b x5 b + β6 x6 + β7 x7 )
3.2.4
(3. 9)
Link Function Regresi Logistik
Link function adalah fungsi yang menetapkan hubungan antara prediktor linear dan fungsi distribusi (melalui mean nya). Ada banyak link function untuk regresi logistik salah satunya adalah logit. Model logit juga dikenal dengan sebutan model regresi logistik. Model logit lebih populer dibandingkan dengan model yang lainnya karena alasan-alasan berikut ini (Allison, 1999, p15): 1. Koefisien memiliki interprestasi sederhana dalam bentuk odds ratio. 2. Model logit dengan baik sekali menghubungkan model loglinear. 3. Model logit memiliki sampling properties yang diperlukan. 4. Modelnya dapat dengan mudah menggeneralisasi perkalian, kategori tidak terurut untuk variabel dependent. Masalah utama dalam model probabilitas linear adalah nilainya dibatasi oleh 0 (nol) dan 1 (satu), tetapi fungsi linear memiliki sifat turunan tak terbatas. Solusinya adalah dengan mentransformasi probabilitas sehingga tidak lagi terbatas (Allison, 1999, p13).
26 Mentransformasi probabilitas ke odds dapat menghilangkan batas atas. Jika kita mengambil logaritma dari odds, kita juga akan menghilangkan batas bawah. Pengaturan hasil sama dengan fungsi linear dari variabel independent (x) (Allison, 1999, p13). Berikut adalah fungsi transformasi dari logit: ⎡ P( xi ) ⎤ LogitP(x)= lne ⎢ ⎥ = β0 + β1x1 + β2 x2 + β3 x3 + β4 x4 + β5d x5d + β5b x5b + β6 x6 + β7 x7 (3.10) P x 1 ( ) − i ⎦ ⎣
Tidak seperti model regresi linear , persamaan model logit tidak memiliki istilah random disturbance ε i . Tapi bukan berarti model ini deterministic karena masih ada tempat untuk variasi acak untuk hubungan probabilitas antara P ( xi ) dan y i . Meskipun demikian, masalah akan timbul bila ada heterogensitas (keberagaman) yang tidak teramati di dalam sampel. (Allison, 1999, p14). Dari persamaan (3.9) dapat disederhanakan dengan membagi penyebut dan pembilang dengan nilai pembilang dari persamaan tersebut. Hasilnya dapat dilihat sebagi berikut :
P(xi ) =
1 1+ e−(β0 +β1x1+β2x2 +β3x3 +β4x4 +β5d x5d +β5bx5b +β6x6 +β7x7 )
(3.11)
Persamaan (3.11) di atas sudah memenuhi sifat yang mana apapun nilai yang dimasukkan ke β 0 , β 1 ,..., β p dan x1,x2,...,xp, P ( xi ) akan selalu bernilai 0
(nol) dan 1 (satu).
27 P ( xi )
1
0,5
0
X
Gambar 3.1 Kurva model logit membentuk huruf S
Jika kita mempunyai satu variabel independent x dengan β 0 = 0 dan
β 1 = 1 , persamaan bisa digambarkan untuk menghasilkan kurva bentuk S. Saat x menjadi besar atau kecil, P ( xi ) mendekati 1 (satu) atau 0 (nol) tetapi tidak pernah sama dengan batas-batas tersebut. Secara khusus, kelandaian (slope) dari kurva dapat ditulis sebagai berikut : ∂P ( xi ) = βP ( xi )(1 − P ( xi )) ∂xi
(3.12)
Ketika β = 1 dan P ( xi ) = 0,5 , kenaikkan satu unit dari variabel independent x menghasilkan kenaikkan probabilitas 0,25. Ketika β membesar, kelandaian dari kurva S saat P ( xi ) = 0,5 makin curam, dan ketika β negatif, kurvanya berbalik horisontal begitu juga P ( xi ) mendekati 1 (satu)
ketika x kecil dan akan
mendekati 0 (nol) ketika x besar.
3.2.5
Estimasi Parameter Regresi Logistik
Dahulu banyak peneliti menggunakan OLS (Ordinary Least Square) untuk mencari koefisien regresi dari data dengan variabel dikotomi. Sebagian peneliti
28 tidak mengetahui metode lain yang tepat selain OLS. Sebagian yang lain menyadari bahwa ada kejanggalan jika mereka menggunakan OLS dan tahu metode logistik adalah metode yang tepat untuk variabel dikotomi tetapi mereka terkendala dengan masalah komputasi karena perhitungan untuk mencari koefisien regresi yang begitu sulit dilakukan dengan cara manual. (Allison, 1999, p7) Ada banyak cara dalam mengestimasi koefisien. Caranya tergantung dari tipe data apa yang anda miliki. Jika anda memiliki data terkelompok, ada tiga metode yang dapat dipakai, yaitu : OLS (Ordinary Least Squares), WLS (Weight Least Square), dan ML (Maximum Likelihood) (Allison, 1999, p15).
ML adalah metode untuk mengestimasi model logit untuk data terkelompok dan satu-satunya metode yang umumnya digunakan untuk data ditingkat individual. (Allison, 1999, p16). OLS dan WLS tidak bisa digunakan dengan jenis data ini kecuali datanya bisa dikelompokkan dengan suatu cara. Ada dua langkah dalam mengestimasi nilai parameter yang dicari dengan ML (Allison, 1999, p17): 1.
Langkah pertama dikenal sebagai konstruksi dari fungsi likelihood. Untuk menyelesaikannya anda harus menetapkan model, yang sama dengan memilih distribusi probabilitas dari variabel dependent dan memilih bentuk fungsional yang menghubungkan parameter dari distribusi ini ke nilai dari variabel independent. Dalam kasus model logit, variabel dependent dikotomi agaknya memiliki distribusi binomial dengan “trial” tunggal dan parameter pi. Kemudian pi diasumsikan tergantung oleh variabel independent menurut
persamaan (3.10). Akhirnya kita mengasumsikan bahwa observasi bebas
29 untuk semua individual. 2.
Langkah kedua –maksimalisasi- khususnya membutuhkan metode iterasi numerik, yang berarti bahwa akan melibatkan pendekatan suksesif. Metode ini sering memerlukan komputasi, yang menjelaskan mengapa estimasi ML menjadi populer dalam dua dekade terakhir ini. Berikut perincian langkah-langkah di atas: Misalkan P(xi) adalah probabiliti bahwa yi = 1, kita mengasumsikan bahwa
data dihasilkan dari model logit pada persamaan (3.11)
P( xi ) =
1 1 + e − ( β 0 + β1 x1 + β 2 x2 + β 3 x3 + β 4 x4 + β 5 d x5 d + β 5 b x5 b + β 6 x6 + β 7 x7 )
Parameter yang dicari dapat diekspresikan dengan membuat fungsi likelihood sebagai berikut : L = Pr( y1 , y 2 ,..., y n )
(3.13)
Karena kita mengasumsikan bahwa observasi adalah independent, seluruh probabilitas dari semua observasi yi bisa difaktorkan ke dalam produk dari probabilitas individual : n
L = Pr( y1 ) Pr( y 2 )... Pr( y n ) = ∏ Pr( y i )
(3. 14)
i =1
dimana ∏ mengindikasikan perkalian berulang. Dengan definisi, Pr(yi=1)=pi dan Pr(yi=0)=1- pi. Kita bisa menulisnya menjadi : Pr( yi) = p iyi (1 − pi )1− yi
Dengan menggabungkan persamaan (3.14) ke (3.13) kita mendapatkan
(3.15)
30 n
L = ∏ p (1 − pi ) yi i
⎛ p = ∏ ⎜⎜ i i =1 ⎝ 1 − p i n
1− yi
i =1
yi
⎞ ⎟⎟ (1 − pi ) ⎠
(3.16)
Sekarang kita ambil logaritma dari kedua persamaan untuk mendapatkan
⎛ p log L = ∑ y i log⎜⎜ i i ⎝ 1 − pi
⎞ ⎟⎟ + ∑ log(1 − pi ) ⎠ i
(3.17)
Dengan merubah ekspresi dari model logit (3.11) . kedalam persamaan (3.17) kita mendapatkan
log L =
∑ β x y − ∑ log(1 + e i
β0 −
i
∑ β ik + xik )
(3.18)
i
i
Sejauh ini kita telah menyederhanakan fungsi likelihood. Langkah ke 2, memilih nilai β yang membuat persamaan (3.18) sebesar mungkin. Ada banyak metode berbeda untuk memaksimalkan fungsi seperti ini. Salah satu yang terkenal adalah dengan mencari turunan dari fungsi ini terhadap
β , set turunan ini sama dengan 0 (nol), kemudian mulai diturunkan terhadap β sebagai berikut :
∂ log L −β + β x = ∑ xi y i − ∑ xi (1 + e 0 ∑ 1 K ik ) −1 ∂β i i = ∑ xi y i − ∑ xi yˆ i = 0 i
(3.19)
i
dimana
yˆi =
1 1+ e
− β0 +
∑ βik xik
(3.20)
probabilitas prediksi dari y untuk nilai xi. Karena xi adalah sebuah vektor, persamaan (3.20) sebenarnya adalah sistem dari persamaan k + 1, satu elemen
31 dari β .
3.2.6 Newton-Raphson
Persamaan (3.19) pada baris kedua sama dengan teori OLS yang identik dengan persamaan normal dari model linear. Berbedaannya adalah bahwa yˆ adalah bukan fungsi linear dari β dalam model linear tetapi fungsi linear dari β dari model logit. Untuk itu, kita harus mengandalkan metode iterasi, yang sama dengan pendekatan suksesif untuk solusi sampai pendekatan ”konvergen” ke nilai yang benar. Sekali lagi, ada banyak metode untuk melakukan hal ini. Semuanya menghasilkan solusi yang sama, tetapi mereka berbeda dalam faktor kecepatan kekonvergenan, sensitif untuk nilai awal, dan secara komputasi sulit untuk dilakukan. Satu yang paling banyak digunakan adalah algoritma Newton-Raphson, yang bisa dideskripsikan sebagai berikut : Misalkan U ( β ) adalah vektor turunan pertama dari log L terhadap β dan I ( β ) adalah matrik turunan kedua dari log L terhadap β dapat dilihat sebagai berikut : U (β ) =
∂ log L = ∑ xi y i − ∑ xi yˆ i ∂β i i
(3.21)
I (β ) =
∂ 2 log L = ∑ xi x 'i yˆ i (1 − yˆ i ) ∂β∂β ' i
(3.22)
Vektor dari turunan pertama U ( β ) sering disebut sebagai gradient atau score. Matrik turunan kedua I ( β ) disebut Hessian. Algoritma Newton-Raphson adalah
32 sebagai berikut :
β j +1 = β j − I −1 ( β j )U ( β j )
(3.23 )
dimana I-1 adalah invers dari I. Dalam prakteknya, kita memerlukan nilai awal dari β 0 yang biasanya dimulai dari 0 (nol). Nilai awal ini disubstitusikan ke sebelah kanan persamaan, yang menghasilkan hasil dari iterasi β 1 . Nilai ini kemudian disubstitusi kembali ke bagian kanan persamaan. Turunan pertama dan kedua dikomputasi ulang yang menghasilkan β 2 . Proses ini berlangsung berulang-ulang sampai perubahan maximum untuk setiap parameter yang diestimasi dari langkah satu ke langkah berikutnya kurang dari suatu kriteria Bila nilai absolut dari parameter yang diestimasi β j kurang dari atau sama dengan 0,01, kriteria dari kekonvergenan menjadi
β j +1 − β j < 0,01
(3.24)
Bila parameter yang diestimasi lebih besar dari 0,01, kriterianya menjadi
β j +1 − β j < 0,01 βj
(3.25)
Setelah solusi dari βˆ ditemukan, hasil sampingan dari algoritma NewtonRaphson adalah estimasi dari matriks kovarians dari koefisien, yaitu − I −1 ( βˆ ) . Matriks ini, sangat berguna untuk membuat uji hipotesis tentang kombinasi linear dari koefisien. Estimasi standard error dari koefisien diambil dari akar kuadrat dari elemen diagonal dari matriks.
33 3.3
Uji Goodness-of-Fit Model
Goodness-of-fit adalah kebaikan fit suatu parameter yuang telah diestimasi pada regresi logistik. Menurut Hosmer dan Lemeshow (1989, p136), pengukuran goodness-of-fit itu memberikan keseluruhan indikasi fit dari model.. Ada beberapa cara dalam menguji Goodness-of-fit model, yaitu:
3.3.1
Uji Likelihood Ratio Statistic (LRS)
Untuk menguji variabel bebasnya apakah salah suatu variabel bebas dapat memberikan hubungan lebih kuat dibandingkan jika tidak menggunakan variabel tersebut, penulis menggunakan uji Likelihood Ratio Statistic sebagai berikut (Hosmer dan Lemeshow, 1989, p15): ⎡ ( LikelihoodTanpaVariabel ⎤ χ2 = − 2 ln ⎢ ⎥ ⎣ LikelihoodDenganVariabel ⎦
(3.26)
H0: β 1 = β 2 = ... = β p = 0 .
χ2 banding χ2 tabel dengan derajat bebas jumlah parameter dalam model dikurangi 1. Bila χ2 lebih besar dari χ2 tabel (χ2 >χ2 tabel) maka H0 diterima.
3.3.2
Uji Wald
Uji Wald hampir sama dengan LRS. Uji Wald didapat dengan membandingkan estimasi maximum likelihood dari parameter β 1 , β 2 ,..., β p dengan estimasi dari standard error. (Hosmer dan Lemeshow,1989, p16)
34 Perbandingan ini dapat dibandingkan dengan distribusi normal. Dalam kasus ini uji statistiknya adalah wald =
βˆ SE ( βˆ )
(3.27)
Dimana SE ( βˆ ) adalah standard error dari estimasi maximum likelihood.
H0: β p = 0 .
Bila uji wald lebih besar dari nilai tabel Z maka β p signifikan.
3.4
Interpretasi Koefisien
Setelah kita mendapatkan nilai koefisisien model regresi logistik dari data yang kita dapat maka kita harus menginterpretasikan apa yang dimaksud dari nilai koefisien tersebut. Pada awal analisis regresi logistik populer, banyak yang mengeluh bahwa nilai koefisiennya memiliki arti yang intuitif. Tidak mudah untuk menginterpretasikannya seperti pada model regresi linear (Allison, 1999, p26). Interpetasi dari koefisiennya sangat sulit kecuali pada tanda bacanya, negatif atau positif(Allison, 1999, p28). Bagi yang masih memaksakan menginterpretasikan model logit dalam bentuk probabilitas ada beberapa metode grafis dan tabular yang bisa dipakai (Long, 1996). Mungkin pendekatan yang sederhana adalah dengan menggunakan persamaan berikut (Allison, 1999, p30): ∂p i = βp i (1 − p i ) ∂x i
(3.28)
Persamaan (3.28) di atas menyatakan bahwa perubahan dalam probabilitas
35 dalam x tergantung dari koefisien regresi dari x, sebagaimana nilai dari probabilitas itu sendiri Jika kita harus memilik satu nilai, yang paling alami dari proporsi (p) keseluruhan dari kasus adalah kejadiannya (Allison, 1999, p30).
3.5
Software Engineering
Menurut Pressman (1997) Software adalah (1) perintah (program komputer) yang bila dieksekusi memberikan fungsi dan unjuk kerja seperti yang diinginkan.(2) struktur data yang memungkinkan program memanipulasi informasi secara proposional, dan (3) dokumen yang menggambarkan operasi dan kegunaan program. Menurut
standar
IEEE
(Institute
of
Electrical
Electronics
Engineers) yang ditulis oleh Pressman (1997) software engineering adalah (1) Aplikasi dari sebuah pendekatan kuantifiabel, disiplin dan sistematis kepada pengembanagan, operasi, dan pemeliharaan software, yaitu aplikasi dari software (2) Studi tentang pendekatan pendekatan seperti pada (1).
3.5.1
Model Proses Software Engineering.
Dalam software engineering terdapat berbagai model proses perancangan software. Salah satunya adalah model prototipe. Model ini biasanya digunakan ketika pengembang sistem tidak yakin terhadap efisiensi dari algoritma yang digunakan, tingkat adaptasi terhadap sistem operasi atau rancangan form use interface (Pressman,1997).
36
Gambar 3.2 Model Prototipe
Langkah-langkah dalam pemodelan prototipe yaitu: 1. Pengumpulan kebutuhan Pengembang dan klien bertemu untuk menentukan tujuan umum, kebutuhan yang diketahui dan gambaran bagian-bagian yang akan dibutuhkan
berikutnya.
Detil
kebutuhan
mungkin
tidak
dibicarakan disini, pada awal pengumpulan kebutuhan. 2. Perancangan Perancangan dilakukan cepat dan rancangan mewakili semua aspek software yang diketahui, dan rancangan ini menjadi dasar pembuatan prototipe. 3. Evaluasi Klien mengevaluasi prototipe yang dibuat dan digunakan untuk memperjelas kebutuhan software. Ketiga proses di atas terus berulang hingga semua kebutuhan klien terpenuhi
37
3.5.2
State Transition Diagram (STD)
Menurut Whitten et al.(2004) state transition diagram (STD) digunakan untuk menggambarkan urutan dan variasi layar yang dapat muncul ketika pengguna sistem mengunjungi terminal.
Tampilan layar
Gambar 3.3 Simbol tampilan layar STD
Menurut Whitten et al. (2004) bujur sangkar
digunakan untuk
menggambarkan tampilan layar. Bujur sangkar hanya menggambarkan apa yang akan muncul di dialog. Nama aliran kontrol
Gambar 3.4 Simbol aliran kontrol STD
Menurut Whitten et al. (2004) anak panah menggambarkan aliran kontrol dan menggerakkan kejadian yang akan menyebabkan layar menjadi aktif atau menerima fokus. Arah anak panah menunjukkan urutan munculnya layar-layar tersebut. Sebuah anak panah yang terpisah , masing-masing memiliki nama, digambarkan untuk setiap arah karena tindakkan yang berbeda akan menggerakkan aliran kontrol dari dan ke layar yang ada.
3.5.3
Data Flow Diagram (DFD)
Menurut Whitten et al.(2004) DFD adalah alat yang menggambarkan aliran
38 data melalui sistem dan kerja atau pengolahan yang dilakukan oleh sistem tersebut. Sedangkan menurut Pressman (1997) DFD adalah sebuah teknis grafis yang menggambarkan aliran informasi dan transformasi yang diaplikasikan pada saat data bergerak dari input menjadi output. DFD hanya memiliki tiga simbol dan satu koneksi Whitten et al.(2004),
yaitu: 1. Persegi panjang bersudut tumpul menyatakan proses atau bagaimana tugas dikerjakan.
Prosess
Gambar 3.5 Simbol proses DFD bentuk Gane & Sarson
Proses adalah kerja yang dilakukan oleh sistem sebagai respon terhadap aliran data masuk atau kondisi, Sinonimnya adalah transform (Whitten et al., 2004). 2. Persegi empat menyatakan agen eksternal.
Agen Eksternal
Gambar 3.6 Simbol agen eksternal DFD bentuk Gane & Sarson
Agen eksternal adalah orang, unit organisasi, sistem, atau organisasi luar yang berinteraksi dengan sistem. Disebut juga entitas eksternal (Whitten
39 et al., 2004). 3. Kotak dengan ujung terbuka menyatakan data store, terkadang disebut file atau database. Data store Gambar 3.7 Simbol data store DFD bentuk Gane & Sarson
Data store adalah penyimpanan data yang ditujukan untuk penggunaan
selanjutnya. Sinonimnya adalah file dan database (Whitten et al., 2004). 4. Panah menyatakan aliran data, atau input dan output, ke dan dari proses tersebut.
Gambar 3.8 Simbol aliran data DFD bentuk Gane & Sarson
Aliran data adalah data dalam pergerakkan (Whitten et al., 2004). Langkah-langkah dalam pembuatan DFD adalah sebagai berikut (Ahmad, 2004): 1. Buat diagram context
Menurut Whitten et al.( 2004) context diagram adalah model proses untuk mendokumentasikan lingkup sistem. Disebut juga model lingkungan. Diagram
ini
adalah
diagram
level
tertinggi
dari
DFD
menggambarkan hubungan sistem dengan lingkungan luarnya. Cara : - Tentukan nama sistemnya. - Tentukan batasan sistemnya.
yang
40 - Tentukan terminator apa saja yang ada dalam sistem. - Tentukan apa yang diterima atau diberikan terminator dari atau pada sistem. - Gambarkan diagram context. 2. Buat diagram level Zero
Menurut Whitten et al.( 2004) decomposition diagram adalah alat yang digunakan untuk menggambarkan dekomposisi sistem. Disebut juga bagan hierarki. Diagram ini adalah dekomposisi dari diagram Context. Cara : - Tentukan proses utama yang ada pada sistem. - Tentukan apa yang diberikan atau diterima masing-masing proses pada atau dari sistem sambil memperhatikan konsep keseimbangan (alur data yang keluar atau masuk dari suatu level harus sama dengan alur data yang masuk atau keluar pada level berikutnya) - Apabila diperlukan, munculkan data store (master) sebagai sumber maupun tujuan alur data. - Gambarkan diagram level zero. - Hindari perpotongan arus data - Beri nomor pada proses utama (nomor tidak menunjukkan urutan proses). 3. Buat diagram level Satu
Diagram ini merupakan dekomposisi dari diagram level zero. Cara :
41 - Tentukan proses yang lebih kecil (sub-proses) dari proses utama yang ada di level zero. - Tentukan apa yang diberikan atau diterima masing-masing subproses pada atau dari sistem dan perhatikan konsep keseimbangan. - Apabila diperlukan, munculkan data store (transaksi) sebagai sumber maupun tujuan alur data. - Gambarkan DFD level Satu - Hindari perpotongan arus data. - Beri nomor pada masing-masing sub-proses yang menunjukkan dekomposisi dari proses sebelumnya. Contoh : 1.1, 1.2, 2.1 4. DFD level dua, tiga, ..
Diagram ini merupakan dekomposisi dari level sebelumnya. Proses dekomposisi dilakukan sampai dengan proses siap dituangkan ke dalam program. Aturan yang digunakan sama dengan level satu.