2009
PE NG G UNAAN PR OG R AM R LAPORAN PRAKTIKUM KOMPUTASI STATISTIKA PENGGUNAAN PROGRAM R DALAM MENYELESESAIKAN PERMASALAHAN STATISTIKA
Oleh : WIDNU PRAMANA PUTRA BARUS (10835) GEMPUR SAFAR (10877) ADHIARSA RAKHMAN (11063) ARYA ANDIKA DUMANAUW (11093)
Asisten: JIM OKLAHOMA MEILIANA BUDI EKAWATI
Dosen Pengampu : Dr.rer.nat. DEDI ROSADI, S.Si., M.Sc.
LABORATORIUM KOMPUTASI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA
YOGYAKARTA 2009
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R Permasalahan
1. Berikut ini adalah data keuntungan penjualan (Y) suatu produk yang dipengaruhi oleh jenis promosi : Penjualan 215.36 295.15 254.26 452.62 330.92 320.14 254.25 235.26 302.21 312.25 222.32 265.99 300.12 265.21 354.25 323.45 362.02 423.00 400.23 412.60 423.22 400.25 366.25 435.23 430.22 352.16 365.21 415.25 451.29 512.33
Iklan Koran 20.98 22.41 22.98 23.21 23.25 23.45 24.86 24.88 25.00 25.12 25.87 25.89 26.23 26.23 26.25 28.94 29.80 32.26 32.79 33.45 33.98 34.55 34.76 35.99 36.21 36.25 36.87 36.99 40.12 44.98
Iklan TV 27.90 32.28 29.49 39.17 34.25 33.63 29.38 29.19 32.82 33.44 29.14 32.09 32.33 30.22 35.42 33.72 35.84 37.12 36.10 36.85 37.44 36.15 35.92 38.20 37.91 34.79 35.91 36.96 38.98 39.33
Iklan Radio 13.23 13.44 15.26 18.45 19.58 12.03 13.87 15.69 16.35 12.88 18.97 12.05 12.23 15.87 13.67 18.29 15.26 13.56 18.78 13.02 16.59 14.23 15.26 15.78 13.33 12.89 12.45 19.25 14.32 13.45
Jumlah Outlet 7.00 5.00 10.00 5.00 8.00 8.00 6.00 9.00 9.00 8.00 8.00 11.00 7.00 5.00 6.00 9.00 8.00 5.00 9.00 6.00 7.00 9.00 9.00 8.00 10.00 9.00 8.00 8.00 8.00 8.00
Analisislah data di atas, hingga diperoleh model regresi terbaik, kemudian lakukan analisis residual pada model yang telah diperoleh! Ingat, asumsi analisis residual : •
Normalitas
•
Homoskedastisitas
•
No Autokorelasi
•
No Multikolinearitas
(Tidak perlu dilakukan penanganan jika asumsi-asumsi untuk analisis residual tidak terpenuhi !)
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
2. Tiga galur tikus diteliti di bawah 2 kondisi lingkungan yang berbeda dengan mengukur unjuk kerjanya dalam suatu test lorong-lorong yang rumit. Skor kesalahan bagi 48 tikus yang dicobakan adalah sebagai berikut: Lingkungan Bebas
Terbatas
Cerdik 28 22 25 36 72 48 25 91
12 23 10 86 32 93 31 19
Galur Campuran 33 83 36 14 41 76 22 58 60 89 35 126 83 110 99 118
Dungu 101 33 122 35 136 38 64 87
94 56 83 23 120 153 128 140
Diasumsikan data berdistribusi normal dan variansi nya sama. Apakah ada efek antara lingkungan dan galur dengan unjuk kerja tikus? (Petunjuk : Gunakan Anava 2 arah !) 3. a.
Diketahui seseorang berusia 25 tahun , peluang dia tetap hidup sampai 1 tahun lagi adalah 0.9 , dengan begitu, probabilitasnya dia akan mati sebelum satu tahun adalah 0.1 .Usia Bambang sekarang 25 tahun.
Berapa peluang bambang
meninggal sebelum usia 28? tunjukkan matrix stokastik / matrix transisi nlangkahnya! b.
Tanpa mengganti probabilitas kematian pada poin a, terdapat tambahan asumsi dimana peluang seseorang yang sehat berusia 25 tahun menderita suatu penyakit kronis sebelum 1 thn kedepan adalah 0.2, Dan peluang seseorang dengan umur yang sama dan telah menderita penyakit tersebut untuk mati sebelum 1 tahun kedepan adalah 3 kali lipat peluang kematian seseorang yang sehat. Dan diketahui seseorang yang telah terjang kit penyakit
ini tidak mungkin untuk
sembuh. Berapa kemungkinannya Sinta akan bertahan sampai setidaknya 2 tahun dari sekarang? tunjukkan juga matrix stokastiknya! 4. a. Dengan mengunakan operasi matriks di R dan aturan Cramer selesaikan persamaan berikut:
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
b. Buat fungsi untuk mencari persamaan regresi linear berganda dan harus bisa digunakan untuk semua data. 5. a. Tulislah fungsi untuk menghitung sudut terkecil yang terbentuk antara jarum panjang dan jarum pendek saat menunjuk jam tertentu. sebagai contoh jika pengguna memasukkan jam 3.30 fungsi akan menampilkan output “75 derajat”. Input dari fungsi ini adalah dua bilangan bulat yang melambangkan jam dan menit. Output dari fungsi ini adalah sudut terkecil yang dibentuk oleh jam tersebut. b. Tuliskan fungsi untuk mencari semua nilai x, y dan z yang memenuhi persamaan linear berikut:
dengan
c. Tulislah fungsi yang meminta masukan dari pengguna berupa koordinat tiga titik. Fungsi ini harus menuliskan “segitiga” jika titik-titik tersebut dapat membentuk segitiga dan “bukan segitiga” jika titik-titik tersebut tidak dapat membentuk segitiga. Sebagai contoh jika pengguna memasukkan tiga titik masing-masing (1,1), (3,3), dan (5,5) fungsi akan menampilkan “bukan segitiga”. Bila pengguna memasukkan (1,1), (3,3) dan (5,0) fungsi akan menampilkan “segitiga”. Input dari pengguna adalah enam bilangan real yang melambangkan nilai x dan y dari tiga koordinat titik. Output dari fungsi ini adalah “segitiga” atau “bukan segitiga”. 6. Buat fungsi untuk menampilkan
segitiga
cantik sama kaki yang mengandung 2
karakter dimana karakternya tidak boleh sama dengan karakter di kanan, kiri, atas dan bawahnya(selang seling gitu lho!)dengan inputnya adalah tinggi segitiga-nya! berikut contoh outputnya untuk input 8 dan 15:
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R Jawab : 1. Data :
Pemodelan Regresi (menggunakan Rcmdr): Scatter Diagram : Graph Scatterplot (scatterplot matrix) pilih sumbu x dan y
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R Statistics Fit Models Linear Regression Output :
Dari output tersebut diperoleh bahwa : R-square = 0.9721 yang berarti bahwa model regresi dengan 4 variabel independet tersebut mampu menjelaskan 97.21% variasi dalam penjualan. Adjusted R-square = 0.9677 Untuk uji overall test, kita dapat melihat nilai output pada baris terakhir, terlihat bahwa p-value < 2.2e-16 yang dapat disimpulkan bahwa model regresi dengan 4 variabel independen tersebut layak untuk digunakan. Selanjutnya untuk uji partial kelayakan masing-masing variabel independen, terlihat bahwa ada variabel independen yang tidak signifikan, yaitu Iklan Radio, maka dilakukan regresi ulang tanpa mengikutsertakan variabel ini. Dan diperoleh :
Terlihat semua variabel telah signifikan, sehingg diperoleh model regresi : Penjualan= - 370.5591+ 2.1453 IklanKoran + 19.9495 IklanTV – 4.0195 JumlahOutlet
Analisis Residual Models Numerical Diagnostic pilih analisis residual yang ingin dilakukan Normalitas Residual Models Graphs Basic Diagnostic Plots
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
Dari Normal QQ-Plot tersebut terlihat bahwa nilai observasi (titik-titik) terletak dekat dengan garis diagonal yang menandakan residual berdistribusi normal. Atau dengan menggunakan uji Shapiro-Wilk karena data berjumlah 30 (<50) dengan terlebih dahulu menyimpan nilai residual dengan cara Models Add Observation Statistics to Data aktifkan Residual Setelah itu pilih Statistics Summaries Shapiro –Wilk test of Normality pilih residual
Terlihat bahwa nilai p-value > alpha 0.05 yang berarti asumsi kenormalan data terpenuhi. No autokorelasi Statistics Summaries Durbin Watson Test For autokorelation Durbin-Watson test data:
Penjualan ~ Iklan.Koran + Iklan.TV + Jumlah.Outlet
DW = 1.5966, p-value = 0.1804 alternative hypothesis: true autocorelation is not 0 dari output tersebut terlihat bahwa p-value = 0.1804 > alpha 0.05 yang berartoi bahwa Hipothesis nol tidak ditolak, sehingga dapat disimpulkan bahwa asusmsi no autokorelasi residual terpenuhi. Non Multikolinearitas Untuk mengetahui apakah asumsi no Multikolinieritas terpenuhi, langsung di cek dengan mengetikkan sintax vif(nama model regresi fit yang diperoleh)
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
Dari output terlihat bahwa semua nilai VIF < 10 yang berarti bahwa asumsi no multikolinearitas terpenuhi Homoskedastisitas
Terlihat bahwa asumsi homoskedastisitas tidak terpenuhi karena terlihat titik-titik residual terletak menyebar jauh dari nol. Dan cenderung membentuk pola kuadratik
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R 2. Data
Analisis Variansi 2 Arah : Statistics means Multi-way ANOVA Output : Anova Table (Type II tests) Response: kesalahan Sum Sq Df F value
Pr(>F)
galur
18154
2
lingkungan
14876
1 14.8076 0.0003988 ***
galur:lingkungan Residuals Signif. codes:
1235
2
9.0356 0.0005448 ***
0.6148 0.5455629
42193 42 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Dari output tersebut terlihat bahwa efek galur dan efek lingkungan masing-masing secara terpisah signifikan untuk tingkat signifikansi 5%, sedangkan untuk interaksi antara galur dan lingkungan tidak signifikan.
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R 3. a. Sintax :
Jadi, peluang budi meninggal sebelum usia 28 tahun adalah 0.271 b. syntax
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R Jawab :
4. a. Dengan mengunakan operasi matriks di R dan aturan Cramer akan diselesaikan persamaan berikut:
Script R dan hasil : a=matrix(c(1,-3,-1,0,4,-2,2,6,3),nrow=3) b=matrix(c(6,30,8,0,4,-2,2,6,3),nrow=3) c=matrix(c(1,-3,-1,6,30,8,2,6,3),nrow=3) d=matrix(c(1,-3,-1,0,4,-2,6,30,8),nrow=3) x=det(b)/det(a) y=det(c)/det(a) z=det(d)/det(a) { cat("x1=",x,"\n") cat("x2=",y,"\n") cat("x3=",z,"\n") } x1= -0.909091 x2= 1.636364 x3= 3.454545
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
b. Fungsi untuk mencari persamaan regresi linear berganda dan bisa digunakan untuk semua data Script : reg.ganda=function(x,y) { X=cbind(1,x) n=length(y) p=ncol(X) b=solve(t(X)%*%X)%*%(t(X)%*%y) dfr=p-1 dfe=n-p dft=n-1 ssr=round((t(b)%*%(t(X)%*%y)-(sum(y))^2/n)[1],3) sse=round((t(y)%*%y-t(b)%*%t(X)%*%y)[1],3) sst=ssr+sse msr=round(ssr/dfr,3) mse=round(sse/dfe,3) fhit=round(msr/mse,3) p_v=round(pf((fhit),dfr,dfe,lower.tail=FALSE),3) rsquare=round(ssr/sst,3) r=round(sqrt(rsquare),3) adjrsquare=round(rsquare-((p-1)*(1-rsquare)/(n-p)),3) yhead=X%*%b ehead=y-yhead min=round(min(ehead),3) max=round(max(ehead),3) q1=round(quantile(ehead)[2],3) q2=round(quantile(ehead)[3],3)
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R q3=round(quantile(ehead)[4],3) residual=cbind(min,q1,q2,q3,max) colnames(residual)=c("Min","1Q","Median","3Q","Max") rownames(residual)="" skuadrat=mse*solve(t(X)%*%X) sb=NULL for(i in 1:ncol(skuadrat)) { for(j in 1:nrow(skuadrat)) { if(i==j) { sb[i]=sqrt(skuadrat[i,j]) } } } t_hit=round(b/sb,4) p_value=round(2*pt(abs(t_hit),dfe,lower.tail=FALSE),4) beta=NULL for(i in 1:ncol(X)) { beta[i]=i-1 }
coefficients=data.frame(Beta=beta,Estimate.Std=b,Std.Error=sb,t_val ue=t_hit,P_value=p_value) anova=data.frame(smbr.var=c("Regresi","Sesatan","Total"),db=c(dfr,d fe,dft),SS=c(ssr,sse,sst),MS=c(msr,mse," "),F_hit=c(fhit," "," "),P_value=c(p_v," "," ")) model=data.frame(R=r,R.Square=rsquare,Adj.R.Square=adjrsquare)
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
list(Residuals=residual,Model.Summary=model,ANOVA=anova,Coefficient s=coefficients) } { cat("\tANALISIS REGRESI GANDA\n") cat("usage:\n") cat("regganda(x,y)\n") cat("\tx=matrix(x)\n") cat("\ty=matrix(y)\n") }
5. a. Fungsi untuk Menghitung Sudut Terkecil yang Terbentuk dari 2 Jarum Jam Script di R :
Contoh :
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R
b. fungsi untuk mencari semua nilai x, y dan z yang memenuhi persamaan linear berikut:
dengan
Script :
Output :
c. Fungsi Untuk menentukan apakah 3 koordinat titik membentuk segitiga atau tidak Script :
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R Contoh :
6. fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2 karakter dimana karakternya tidak sama dengan karakter di kanan, kiri, atas dan bawahnya dengan input adalah tinggi segitiga Script :
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0
2009
PE NG G UNAAN PR OG R AM R Contoh (untuk tinggi 10 dan 20)
w i n d u ,g e m p u r ,a d h i , a r y a
Pag e 0