1
PENDAHULUAN Latar Belakang Pada tahun 2008, tingkat pembajakan perangkat lunak di dunia secara total mengalami peningkatan. Hal ini lebih disebabkan oleh pesatnya pertumbuhan pengiriman komputer personal di negaranegara dengan tingkat pembajakan tinggi seperti China dan India, sehingga menutupi kemajuan yang terjadi di negara-negara ini dan lainnya. Hal ini pulalah yang terjadi di Indonesia. Berdasarkan hasil survei Business Software Alliance (BSA) dalam www.bsa.org (2009), tingkat pembajakan piranti lunak pada komputer personal di Indonesia adalah 85 persen di 2008, termasuk perangkat lunak untuk analisis statistika. Kerugian yang diakibatkan oleh pembajakan perangkat lunak mencapai US$544 juta. Namun, sudah banyak pula perangkat lunak yang dapat dikembangkan secara bebas (open source), yang sekarang ini sudah banyak dimanfaatkan oleh orang-orang dari berbagai bidang di dunia. Salah satu perangkat lunak statistika yang legal dan dapat dikembangkan serta didistribusikan secara bebas ialah R. R adalah perangkat lunak yang digunakan untuk analisis statistika dan grafik yang merupakan implementasi dari bahasa pemrograman S. Ide awal R adalah untuk menyediakan sebuah alat statistika yang mengkombinasikan membuat grafik dengan kemampuan pengepasan model yang sangat baik. Terdapat perbedaan antara R dan S, tetapi perbedaan itu tidak terlalu signifikan. Penggunaan R untuk analisis statistika di Indonesia masih sangat kurang karena perangkat ini tidak mudah digunakan khususnya bagi yang belum terlalu paham statistika dan pemrograman. Berdasarkan hal tersebut, perlu dikembangkan paket R bagi pengguna perangkat lunak nonstatistisi dan nonprogramer. Paket R merupakan bagian dari R, terdapat paket standar dan paket yang dikembangkan oleh banyak ahli statistika. Pengembangan paket R di lingkungan Microsoft Windows memerlukan perangkat lunak lain seperti Perl, MinGW, HTML Help Workshop dan Tex Penelitian ini difokuskan hanya pada paket statistika inferensia dasar dan analisis perancangan percobaan dan yang merupakan satu kesatuan dari empat karya ilmiah.
Tujuan Tujuan dari penelitian ini adalah menyusun dan mengembangkan paket R yang mudah digunakan untuk analisis rancangan percobaan yang memiliki antar muka user friendly. Ruang Lingkup Penelitian ini merupakan penyusunan paket R untuk analisis statistika yang mudah digunakan. Analisis statistika tersebut mencakup: Analisis statistika dasar meliputi statistika deskriptif dan inferensia dasar. Statistika grafik Analisis regresi linier meliputi model/koefisien regresi, analisis ragam, uji parsial, uji asumsi, penentuan selang kepercayaan dan selang prediksi bagi dugaan respons, nilai VIF, sisaan, sisaan terstandarkan, dugaan respons, indikator data berpengaruh (Leverages, Cook’s Distance, DFFITS, DFBETAS, dan COVRATIO), dan prosedur pemilihan peubah prediktor (stepwise, forward, dan backward). Analisis rancangan percobaan meliputi model RAL, RAK, RBSL, faktorial RAL, faktorial RAK, Split plot, uji asumsi, dan uji lanjut (BNT, BNJ, dan Duncan). Analisis deret waktu mencakup plot deret waktu, pemulusan, pemodelan ARIMA, dan uji asumsi. Analisis multivariat mencakup statistika dasar, uji kenormalan ganda, analisis komponen utama, analisis gerombol, analisis faktor, dan biplot. Penelitian ini hanya difokuskan pada penyusunan paket R untuk uji Z satu populasi, uji t satu populasi, uji t dua populasi, uji t data berpasangan, uji 1 proporsi, uji 2 proporsi, uji 1 ragam, uji 2 ragam, statistika non parametrik, dan analisis perancangan percobaan. TINJAUAN PUSTAKA Rekayasa Perangkat Lunak Rekayasa perangkat lunak adalah disiplin ilmu yang membahas semua aspek produksi perangkat lunak, mulai dari tahap awal spesifikasi sistem sampai pemeliharaan sistem setelah digunakan (Sommerville, 2003). Rekayasa ini mencakup masalah pemilihan metode paling sesuai untuk satu set keadaan dan pendekatan yang lebih kreatif, infomal terhadap pengembangan yang mungkin efektif pada beberapa keadaan.
2
Uji Parametrik 1 Populasi 1. Uji z 1 Populasi Uji z 1 populasi adalah uji untuk menduga nilai tengah dari contoh acak yang kontinu berukuran n yang diambil dari suatu populasi dengan ragam diketahui. Jika x adalah nilai tengah dari contoh berukuran n dan hipotesis nol H0: μ=μ0 , maka statistik x -μ0 z= σ √n memiliki sebaran normal baku (Hunstberger & Billingsley, 1987). 2. Uji t 1 Populasi Uji t adalah uji yang berdasarkan asumsi bahwa data menyebar normal. Uji ini menduga nilai tengah dari contoh acak berukuran n yang diambil dari suatu populasi dengan ragam tidak diketahui. Jika x adalah nilai tengah dari contoh berukuran n dan hipotesis nol H0: μ = μ , maka statistik x -μ0 t= s √n dimana s adalah simpangan baku dari contoh, memiliki sebaran t dengan derjat bebas n-1 (Hunstberger & Billingsley, 1987). 3. Uji 1 Proporsi Uji 1 proporsi umumnya berdasarkan sebaran binomial dengan parameter ukuran contoh n dan parameter peluang p. Untuk ukuran contoh yang besar, dapat didekati dengan sebaran normal dengan nilai tengah np dan ragam np(1-p). Jika banyaknya kejadian sukses adalah x dan hipotesis nol H0: p = p , maka statistik uji yang digunakan x-np0 u= np0 (1-p0 ) mendekati sebaran normal baku atau u2 mendekati sebaran khi-kuadrat () dengan derajat bebas 1 (Dalgaard, 2002b).
dengan
sp2 =
n1 -1 s12 +(n2 -1)s22 n1 -n2 -2
, untuk ragam
kedua populasi sama dan statistik t=
(x 1 -x2 )-d0 s12 n1
+
s22 n2
untuk ragam tidak sama, memiliki sebaran t dengan derajat bebas n1+n2-2 (Hunstberger & Billingsley, 1987). 2. Uji t Data Berpasangan Uji t data berpasangan adalah uji untuk menduga nilai tengah dari dua contoh acak kontinu yang diambil dari dua populasi yang berpasangan. Dalam hal ini, ragam kedua populasi tidak dapat dianggap sama. Pengujian ini memperhatikan selisih dari masing-masing pasangan pengamatan. Selisih-selisih tersebut dipandang sebagai nilai-nilai suatu contoh acak d1, d2, …, dn dari suatu populasi normal dengan nilai tengah d tetapi ragam d2 tidak diketahui. Ragam d2 dapat diduga dengan sd2 yang merupakan ragam dari selisih-selisih tersebut (Walpole, 1987). Jika hipotesis nol H0: μ = d maka statistik uji yang digunakan d-d0 t= s d √n
3. Uji 2 Proporsi Uji 2 proporsi adalah uji untuk menduga proporsi keberhasilan dalam selisih dua parameter binom dengan d=x1/n1-x2/n2, yang dapat didekati dengan sebaran normal dengan nilai tengah 0 dan ragam 1 1 Vp (d)= + *p(1-p). Jika hipotesis nol N1
N2
Uji Parametrik 2 Populasi
H0: p = p maka statistik uji yang digunakan d u= Vp (d) mendekati sebaran normal baku atau u2 mendekati sebaran khi-kuadrat () dengan derajat bebas 1 (Dalgaard, 2002b).
1. Uji t 2 Populasi Uji t 2 populasi adalah uji untuk menduga nilai tengah dari dua contoh acak yang kontinu yang diambil dari dua populasi yang saling bebas dengan ragam tidak diketahui nilainya. Untuk hipotesis H0 : μ − μ = d , statistik (x 1 -x2 )-d0 t= 1 1 sp + n1 n2
4. Uji 2 ragam Uji 2 ragam adalah uji untuk menduga ragam dari dua contoh kontinu. Uji ini menguji hipotesis nol H0: σ = σ dengan membandingkan ragam dari dua contoh 2 ∑ X1j -X 1 2 s1 = n1 -1 2 ∑ X2j -X 2 2 s2 = n2 -1
3
Perbandingan ini dihitung dengan rasio F: s12 F= 2 s2 (Hunstberger & Billingsley, 1987) Uji Nonparametrik 1. Uji Wilcoxon 1 Populasi Uji Wilcoxon 1 Populasi adalah sebuah uji nonparametrik yang memanfaatkan arah maupun besar arah dari selisih antara pengamatan dengan tipe data minimal kategorik. Hipotesis yang diuji adalah H0 : M=M0 H1 : M<M0 atau M>M0 atau M≠M0 Prosedur pengujiannya menurut Daniel (1990) yaitu: a. Hitung selisih setiap pengamatan dengan hipotesis median M0 Di =X i -M0 b. Memberi peringkat pada selisih tersebut c. Beri tanda pada selisih (negatif atau positif) d. Untuk jumlah peringkat positif disebut T+. Untuk jumlah peringkat negatif disebut T. Kemudian hitung hanya salah satu jumlah saja sehingga diperoleh hubungan T+=[n(n+1)/2]-T2. Uji Wilcoxon 2 Populasi Uji Wilcoxon 2 Populasi adalah prosedur uji Wilcoxon dengan 2 contoh dengan tipe data minimal kategorik. Hipotesis yang diuji adalah: H0 : MX =MY H1 : MX <MY atau MX >MY atau MX ≠MY Prosedur uji mirip dengan Wilcoxon 1 populasi dengan menggabungkan kedua contoh kemudian diperingkatkan. Statistik uji yang digunakan: n1 (n1 +1) T=S2 dimana S adalah jumlah peringkat dari contoh (Daniel, 1990) 3. Uji Kruskal-Wallis Uji Kruskal-Wallis merupakan teknik pengujian nonparametrik dengan beberapa sampel. Uji ini biasa digunakan untuk analisis ragam dengan klasifikasi satu arah secara nonparametrik dengan tipe data minimal kategorik. Hipotesis yang diuji adalah: H0 : k populasi memiliki sebaran yang identik H1 : k populasi tidak memiliki median yang sama
Statistik uji yang digunakan dalam Daniel (1990) yaitu: 12 H= n(n+1)
k
i=1
ri2 -3(n+1) ni
yang dapat dihampiri dengan sebaran khikuadrat. 4. Uji Friedman Uji friedman merupakan prosedur dari pengujian analisis ragam nonparametrik dengan klasifikasi dua arah dengan tipe data minimal kategorik. Uji ini menetukan apakah jumlah peringkat dari setiap perlakuan berbeda nyata. Hipotesis yang diuji adalah: H0 : M1 =M2 =…=Mk , Mj adalah median perlakuan ke-j H1 : Setidaknya ada satu M yang tidak sama dengan M Statistik uji yang digunakan dalam Daniel (1990) yaitu: χ2r =
12 bk(k+1)
k
j=1
jR
b(k+1) 2
2
yang dapat dihampiri dengan sebaran khikuadrat. Rancangan Percobaan Penamaan untuk suatu Perancangan Percobaan merupakan kombinasi dari Rancangan Perlakuan dan Rancangan Lingkungan (Mattjik & Sumertajaya 2002). Penamaan-penamaan tersebut beserta model yang dibentuknya adalah sebagai berikut (dengan adalah rataan umum): 1. Rancangan Acak Lengkap (RAL) Satu Faktor Rancangan ini dibentuk dari satu faktor dengan beberapa perlakuan dan ulangan. Model : yij = μ+τi +εij Keterangan model: yij = pengamatan pada perlakuan ke-i dan ulangan ke-j τi = pengaruh perlakuan ke-i εij = pengaruh acak pada perlakuan ke-i dan ulangan ke-j 2. Rancangan Acak Kelompok (RAK) Satu Faktor Rancangan ini dibentuk dari satu faktor dengan beberapa perlakuan dan kelompok. Model : yij = μ+τi +βj +εij Keterangan model: yij = pengamatan pada perlakuan ke-i dan kelompok ke-j τi = pengaruh perlakuan ke-i βj = pengaruh kelompok ke-j
4
εij = pengaruh acak pada perlakuan ke-i dan kelompok ke-j 3. Rancangan Bujur Sangkar Latin (RBSL) Satu Faktor Rancangan ini dibentuk dari satu faktor dengan beberapa perlakuan dan ulangan yang teracak sempurna pada kolom-kolom dan baris-baris yang masing-masingnya berjumlah sama dengan ulangan dan perlakuan. Model : yijk = μ+τi +βj +αk +εijk Keterangan model: yijk = pengamatan pada perlakuan ke-I, baris ke-j, dan lajur ke-k τi = pengaruh perlakuan ke-i βj = pengaruh baris ke-j αk = pengaruh lajur ke-k εijk = pengaruh acak pada perlakuan ke-i, baris ke-j dan lajur ke-k 4. Faktorial dalam RAL Rancangan ini dibentuk dari dua faktor dengan beberapa perlakuan dan ulangan. Model : yijk = μ+αi +βj +(αβ)ij +εijk Keterangan model: yijk = pengamatan pada faktor pertama taraf ke-i, faktor kedua taraf ke-j, dan ulangan ke-k αi = pengaruh utama faktor pertama βj = pengaruh utama faktor kedua (αβ)ij = komponen interaksi dari faktor pertama dan kedua εijk = pengaruh acak yang menyebar normal 5. Faktorial dalam RAK Rancangan ini dibentuk dari dua faktor dengan beberapa perlakuan dan kelompok. Model : yijk = μ+αi +βj +(αβ)ij +ρk +εijk Keterangan model: yijk = pengamatan pada faktor pertama taraf ke-i, faktor kedua taraf ke-j, dan kelompok ke-k αi = pengaruh utama faktor pertama βj = pengaruh utama faktor kedua (αβ)ij = komponen interaksi dari faktor pertama dan kedua ρk = pengaruh aditif dari kelompok ke-k dan diasumsikan tidak berinteraksi dengan perlakuan εijk = pengaruh acak yang menyebar normal
6. Split Plot dengan RAL Rancangan ini dibentuk dari dua faktor yang terdiri dari petak utama dan anak petak dengan beberapa perlakuan dan ulangan. Model : yijk = μ+αi +βj +(αβ)ij +δik +εijk Keterangan model: yijk = pengamatan pada faktor petak utama taraf ke-i, faktor anak petak taraf ke-j, dan ulangan ke-k αi = pengaruh utama faktor petak utama βj = pengaruh utama faktor anak petak (αβ)ij= komponen interaksi dari faktor petak utama dan anak petak δik = komponen acak dari faktor petak utama εijk = pengaruh acak dari anak petak yang menyebar normal 7. Split Plot dengan RAK Rancangan ini dibentuk dari dua faktor yang terdiri dari petak utama dan anak petak dengan beberapa perlakuan dan kelompok. Model : yijk = μ+αi +βj +(αβ)ij +δik +ρk +εijk Keterangan model: yijk = pengamatan pada faktor petak utama taraf ke-i, faktor anak petak taraf ke-j, dan kelompok ke-k αi = pengaruh utama faktor petak utama βj = pengaruh utama faktor anak petak (αβ)ij= komponen interaksi dari faktor petak utama dan anak petak δik = komponen acak dari faktor petak utama ρk = pengaruh aditif dari kelompok ke-k εijk = pengaruh acak dari anak petak yang menyebar normal Uji Kenormalan Sisaan Uji Shapiro-Wilk Uji Shapiro-Wilk ialah uji kernomalan dengan hipotesis : H0 : data mengikuti sebaran normal H1 : data tidak mengikuti sebaran normal. Statistik uji yang digunakan : 2
i 1 ai x(i) n i 1( xi x )2
W
n
5
dimana data terurut dari kecil ke besar X(1)≤X(2)≤…≤X(n) dan koefisien a1,a2,… ,an/2 diperoleh dari tabel uji Shapiro-Wilk. Data menghampiri sebaran normal jika W > Wtabel atau nilai W mendekati 1. Uji ini relatif powerful dibandingkan dengan uji kenormalan lainnya. Uji ini juga mempunyai kekuatan uji yang relatif tinggi untuk data simetrik menjulur dengan ekor pendek dan data menjulur dengan ekor panjang dibandingkan dengan uji lain. Thode (2002) merekomendasikan uji ini untuk pengujian kenormalan data secara umum. Uji Kehomogenan Ragam Sisaan Uji Bartlett Uji Bartlett digunakan untuk menguji asumsi kehomogenan ragam sisaan. Hipotesis yang diuji adalah H0 = 12=22=…=k2=2 H1 = ∃!∀ σi 2 ≠σ2 Prosedur pada uji Bartlett ini menggunakan pendekatan sebaran khi-kuadrat dengan (a-1) derajat bebas (Mattjik & Sumertajaya 2002). Statistik ujinya adalah: χ02 q c 1)]
= 2.3026qc-1 = (N-a) log10Sp2 – ∑ (ni -1)log 10 Si2 =1 + {[3( − 1)] [∑( − ( − ) } -1
Sp = ∑ (ni -1)Si2 N-a Keterangan: N = banyaknya amatan a = banyaknya perlakuan n = banyaknya ulangan Si = ragam contoh pada perlakuan ke-i 2
Uji Kebebasan Uji Durbin-Watson Uji Durbin-Watson digunakan untuk mendeteksi korelasi serial tertentu (Draper & Smith, 1992) . Statistik uji yang digunakan : n
(e
d u 2
u
eu1 )2
n
e u1
2
u
Kaidah pengambilan kesimpulan yaitu : Untuk uji satu arah dengan hipotesis alternatif ρ>0 maka jika d
dU tidak tolak H0, dan jika dL≤d≤dU pengujian tidak konklusif pada taraf nyata α.
Untuk uji satu arah dengan hipotesis alternatif ρ<0 maka jika 4-ddU tidak tolak H0, dan jika dL≤4d≤dU pengujian tidak konklusif pada taraf nyata α. Untuk uji dua arah dengan hipotesis alternatif ρ≠0 maka jika ddU atau 4-d>dU tidak tolak H0, dan jika dL≤d≤dU atau dL≤4-d≤dU pengujian tidak konklusif pada taraf nyata α. Uji Runtunan Uji runtunan ialah uji nonparametrik untuk melihat keacakan data. Hipotesis yang diuji ialah H0 : data mempunyai pola yang acak H1 : data mempunyai pola yang tidak acak atau tidak saling bebas. Statistik ujinya ialah u yaitu jumlah runtunan dengan 2 n1n2 1, n1 n2
2
2n1n2 ( 2n1n2 n1 n2 )
( n1 n2 ) 2 ( n1 n2 1) µ dan σ2 merupakan nilai tengah dan ragam bagi sebaran u yang diskret. z
(u
1 ) 2
Nilai z merupakan suatu simpangan normal dengan n ialah jumlah ukuran contoh, n1 ialah jumlah amatan tipe satu, dan n2 ialah jumlah amatan tipe lainnya. Data berpola acak pada taraf nyata α jika nilai-p pada tabel uji runtunan lebih besar dari taraf nyata α untuk statistik uji u, n1, dan n2. Menurut Draper & Smith (1992), uji ini cukup baik digunakan jika n1>10 dan n2>10.
Uji Perbandingan Ganda Peneliti sering tertarik pada pengujian lanjutan, bila perlakuan-perlakuan secara simultan pada suatu model berpengaruh nyata terhadap respons. Pengujian ini bertujuan menentukan perlakuan mana yang memberikan pengaruh paling besar pada respons. Bebebrapa metode uji perbandingan ganda yang digunakan pada penelititan ini dalam adalah: 1. Uji Fisher (Beda Nyata Terkecil (BNT)) Uji BNT menguji perlakuan secara berpasang-pasangan. Metode BNT akan sangat sensitif terhadap perbedaan yang muncul dalam perlakuan karena kriteria
6
pemisahan perlakuan tidak terlalu (Mattjik & Sumertajaya 2002). Hipotesis yang diuji adalah: H0 : μ = μ ∗ H1 : μ ≠ μ ∗ Nilai kritis BNT:
ketat
1 1 BNT=t α/2,dbg KTG( + * ) ri ri
2. Uji Tukey (Beda Nyata Jujur (BNJ)) Prosedur perbandingan BNJ akan sangat bagus digunakan untuk memisahkan perlakuan-perlakuan yang benar berbeda dan metode ini dikenal tidak terlalu sensitif (Mattjik & Sumertajaya 2002). Nilai kritis BNJ yaitu: BNJ=q α,p,dbg KTG/r dimana q , , ialah nilai tabel Tukey 3. Duncan’s Multiple Range Test (Uji Perbandingan berganda Duncan) Perbandingan berganda Duncan pada dasarnya hampir sama dengan metode Tukey tetapi prosedur Duncan mempersiapkan segugus nilai pembanding yang nilainya meningkat tergantung jarak peringkat dua buah perlakuan yang akan dibandingkan (Mattjik & Sumertajaya 2002). Nilai kritis yang digunakan: R p =rα/2,dbg KTG/rh dimana t rh = t ∑i=1 1/ri METODOLOGI
1. Analisis dan identifikasi kebutuhan Tahap ini mendefinisikan sistem yang akan dibangun dengan memperhatikan kebutuhan pengguna. Hal ini dilakukan dengan memeperhatikan perangkatperangkat lunak statistika yang sudah ada seperti SPSS, Minitab, SAS, dan Stata. 2. Analisis perancangan sistem Tahapan perancangan sistem dilakukan dengan merancang sistem yang sudah direncanakan dengan merancang aliran data sistem dan tampilan antar muka pengguna. 3. Implementasi dan pengujian unit Rancangan yang sudah dibangun diimplementasikan dalam bahasa S dengan menggunakan perangkat lunak R dan paket-paket R yang berhubungan dengan sistem. Untuk antar muka pengguna, digunakan paket R bernama tcl/tk dan tcl/tk2. 4. Integrasi dan pengujian sistem
Sistem yang telah dibangun diuji dengan serangkaian uji. Uji yang dilakukan mencakup keseluruhan fungsi dalam sistem. Bila terdapat kegagalan uji maka dilakukan perbaikan tahap implementasi. 5. Operasi dan pemeliharaan Tahapan ini lebih mengutamakan pada dokumentasi dari sistem yang telah dibuat seperti spesifikasi perangkat lunak, deskripsi perangkat lunak, dan cara penggunaan perangkat lunak. HASIL DAN PEMBAHASAN Kebutuhan Sistem Perancangan dan analisis percobaan merupakan prosedur yang banyak digunakan dalam penelitian. Prosedur ini tidak hanya digunakan dalam bidang pertanian, tapi juga dapat diterapkan di bidang lainnya seperti ekonomi. Namun, belum ada perangkat lunak yang memudahkan pengguna dalam menganalisis percobaan. Paket ini diberi nama ARP atau desain dan analisis percobaan. Paket ini mampu menyediakan tampilan untuk beberapa model tertentu. Tidak hanya untuk analisis rancangan percobaan, paket ini juga terdapat fungsi-fungsi statistika dasar yang lain seperti uji Z 1 populasi, uji t 1 populasi, uji t 2 populasi saling bebas, uji t 2 populasi data berpasangan, uji 2 ragam populasi, uji 1 proporsi, uji 2 proporsi, uji tanda 1 populasi, uji wilcoxon 1 populasi, uji wilcoxon 2 populasi saling bebas, uji kruskal-wallis, dan uji friedman sedangkan untuk rancangan percobaan terdapat fungsi-fungsi untuk menampilkan tabel analisis ragam, pengujian asumsi, menampilkan graifk, dan uji lanjut. Uji lanjut yang disediakan terdiri dari uji Fisher’s LSD (Beda Nyata Terkecil), uji Tukey HSD (Beda Nyata Jujur), dan uji Duncan. Pengembangan paket ini memanfaatkan beberapa paket lainnya seperti tcltk, tcltk2, tkrplot, car, tseries, dan xlsReadWrite. Paket tcltk dan tcltk2, digunakan untuk membuat tampilan antarmuka pengguna. Paket tkrplot digunakan untuk membuat tampilan antarmuka untuk grafik. Paket xlsReadWrite digunakan untuk mengimpor dan mengekspor data dari dan ke file Excel 2003. Paket car digunakan untuk uji DurbinWatson. Paket tseries berguna untuk pengujian sisaan pada model yaitu uji runtunan.