MODUL STATISTIKA II
2013 (Part 2)
Note : Terdapat beberapa kesalahan dalam modul ini, misalnya dalam kunci jawaban
Alya Fauziyah
Taufik Nur Rachman
Deasy Puspasari
Karina Indri M. S.
Rudolf P. Purba
Yessica Sardina Purba
Ahmad Hamdi
Farhatunisa
Siti Hudaepah
Lois Jessica
Karina Megasari
Anita Kesia Zonebia
Nina Arina
Yana Mulyana Fauzi
Catra Evan Ramadhani
DAFTAR ISI
REGRESI DAN KORELASI SEDERHANA………………………………………………..79 REGRESI DAN KORELASI BERGANDA………………………………………………..101 CHI-SQUARE………………………………………………………………………………154 NON PARAMETRIK ……………………………………………………………………...168 NON PARAMETRIK 1…………………………………………………………………….171 NON PARAMETRIK 2……………………………………………………………………198
REGRESI DAN KORELASI SEDERHANA Untuk mempelajari hubungan-hubungan antar variabel dalam suatu persamaan dapat mengunakan regresi dan korelasi dalam menganalisisnya. Regresi sederhana menunjukan hubungan linear (garis lurus) antar dua variabel dan memperkirakan nilai dari variabel terikat Y berdasarkan nilai dari variabel bebas X. Sedangkan korelasi sederhana mempelajari hubungan antara variabel-variabel atau dengan kata lain menunjukan apakah dua variabel mempunyai hubungan atau tidak.
A. REGRESI SEDERHANA 1. Pengertian Regresi Persamaan Regresi adalah sebuah persamaan yang menunjukan hubungan linear antara dua variabel. (Lind, Teknik-teknik Statistik dalam Ekonomi dan Bisnis :74) Bentuk Umum
Ŷ = a + bX Keterangan : Ŷ
= Variabel Terikat (Variabel yang diperkirakan)
X
= Variabel Bebas (Variabel yang mempengaruhi variabel terikat)
a
= nilai Y dimana diperkirakan garis regresinya memotong sumbu Y ketika X bernilai nol (intercept)
b
= kemiringan garis, atau perubahan rata-rata Y setiap perubahan satu unit X (slope)
2. Metode Pengukuran Regresi Sederhana a. Least Square Method Bentuk Umum
=
Ŷ = a + bX
79
Rum us : ΣY = an + bΣX
atau
a=
(
) (∑ )(∑ ) ( )
(∑
ΣXY = aΣX + bΣX2 atau
)
b. Product Moment Method Bentuk Umum
: Ŷ = a + bX
Rumus : Σxy = b ΣX+ bΣX2
atau
Σxy = ΣXY –
Σx2 = ΣX2 –
b=
,dimana (
)
Σy2 = ΣY2 – ∑
(
)
∑
B. Korelasi Analisis korelasi adalah sekumpulan teknik untuk mengukur hubungan antar dua variabel. (Lind, Teknik-teknik Statistika dalam Bisnis dan Ekonomi: 61)
1. Koefisien korelasi (r) Koefisien korelasi menunjukan kekuatan hubungan antara dua himpunan variabel. Diberi tanda r, dan nilai r dapat berkisar dari -1 sampai +1. Tanda negatif berarti varibel berkorelasi negatif, tanda positif berarti variabel berkorelasi positif, serta apabila tidak terdapat hubungan sama sekali antar variabel maka r bernilai 0. Kekuatan dari koefisien korelasi menurut Iqbal Hasan: 0.00 < r ≤ 0.20
= sangat lemah
0.21 < r ≤ 0.40
= lemah
0.41 < r ≤ 0.60
= cukup 80
0.61 < r ≤ 0.80
= kuat
0.81 < r ≤ 1.00
= sangat kuat
Rumus Pearson :
(
√(
) )(
(
) )
Rumus Product Moment :
r=
√(
)
2. Koefisien Determinasi Koefisien determinasi adalah perbandingan total variasi dalam variabel terikat Y yang dapat dijelaskan oleh variasi dalam variabel bebas X. (Lind) Dirumuskan r2 x 100% -
Koefisien non determinasi adalah perbandingan total variasi terikat Y yang dapat dijelaskan oleh variabel diluar model. Dirumuskan 1 - r2
3. Kesalahan Standard Estimasi ( Standard Error of Estimate ) Adalah suatu ukuran yang menunjukan seberapa tepat prediksi untuk Y berdasarkan X atau sebaliknya, seberapa tidak akuratnya estimasi itu. Dirumuskan Least Square Method SYX =√
Product Moment Method SYX = √
Keterangan : n = banyaknya pasangan variabel independen x dan variabel dependen y 81
k = banyaknya macam variabel independen x
4. Penaksiran tentang interval α dan interval β Menaksir interval α
Menaksir interval β
(n > 30)
(n > 30)
a – Z1/2α.Sa < konstanta α < a + Z1/2α.Sa
b – Z1/2α.Sb < konstanta β < b + Z1/2α.Sb
(n ≤ 30)
(n ≤ 30)
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
b – t1/2α.Sb < konstanta β < b + t1/2α.Sb
Sa = SYX . √
Sb = SYX . √
5. Pengujian tentang Koefisien Regresi Menguji α
Menguji
- Tentukan Ho dan Ha Ho : Konstanta α = 0 (tidak berpengaruh signifikan) Ha : Konstanta α ≠ 0 (ada pengaruh signifikan) - Tentukan t1/2α dengan df = n-k-1 n = jumlah sampel
-
Tentukan Ho dan Ha Ho
: β = (tidak berpengaruh
signifikan) Ha : β ≠ (ada pengaruh signifikan) -
Tentukan t1/2α dengan df = n-k-1
-
Tentukan thitung dengan
k = jumlah variabel x
t=
Tentukan thitung dengan : -
t= -
β
Tentukan daerah penolakan yaitu thitung < -t1/2α atau thitung > t1/2α Ho
Tentukan daerah penolakan yaitu
ditolak
thitung < -t1/2α atau thitung > t1/2α Ho ditolak
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat ditolak
ditolak
Daerah penolakan Ho (daerah kritis )
Daerah penolakan Ho (daerah kritis )
Daerah penerimaan Ho
-t1/2α
?
t1/2α
82
-
Kesimpulan
6. Interval Taksiran Interval taksiran untuk rata-rata taksiran µYX
Interval taksiran untuk Y individu
Ŷo – t1/2α SŶ< µYX < Ŷo + t1/2α SŶ
Ŷo – t1/2α SŶ< Y< Ŷo + t1/2α SŶ
(
SŶ = SYX √
x )
SŶ = SYX √
(
x )
7. Pengujian Korelasi populasi Menguji apakah sampel berasal dari populasi yang berkorelasi Ho : ρ = 0 (tidak berasal dari populasi yang berkorelasi) Ha : ρ ≠ 0 (berasal dari populasi yang berkorelasi) df = n-k-1 t=
(√ √
Ho ditolak jika -thitung < -t1/2α atau thitung > t1/2α
8. Batas-batas koefisien korelasi populasi ρ - jika berkorelasi tidak perlu dihitung, jika berkorelasi perlu dihitung (
)
(
)
Sr =
Z1/2α. Sr <
(
)
(
)
<
(
)
(
)
Z1/2α.Sr
√
83
CONTOH SOAL Manager Investasi di Astra International, memiliki data mengenai penghasilan karyawan di perusahaan tersebut dan persentase investasi kembali para karyawan pada produk keuangan yang dikeluarkan perusahaan. Karyawan
Penghasilan (juta)
Investasi Kembali (%)
Ade
7,0
20,2
Ahmad
7,8
20,4
Anjar
8,2
30,6
Andi
9,1
28,5
Adi
8,7
25,4
Anji
11,3
30,5
Adi
11,7
32,8
Ari
10,0
42,0
Apri
12,8
29,0
Ati
12,2
29,3
Tentukanlah : a. Persamaan regresi dan interpretasi b. Koefisien korelasi, determinasi, non determinasi serta artinya c. Standard Error of estimate.
Jawaban Penghasilan (X) 7,0 7,8 8,2
Investasi Kembali (Y) 20,2 20,4 30,6
(XY)
X²
Y²
141,4
49
408,04
159,12
60,84
416,16
250,92
67,24
936,36
84
9,1 8,7 11,3 11,7 10,0 12,8 12,2 X = 98.8
28,5 25,4 30,5 32,8 42,0 29,0 29,3 Y = 288.7
259,35
82,81
812,25
220,98
75,69
645,16
344,65
127,69
930,25
383,76
136,89
1075,84
420
100
1764
371,2
163,84
841
357,46
148,84
858,49
ΣXY = 2908,76
ΣX² = 1012,84
ΣY²= 8687,55
a. Persamaan Regresi a= =
(
(
) ( ) (
(
) )
= 13.6838565511
(∑ ) (∑ )(∑ ) (∑ ) (∑ )
Dan =
)
(
) ( ) (
(
) )
= 1.53706126008
Maka persamaan regresinya adalah : Y= 13.6838565511 + 1.53706126008X Dari persamaan tersebut dapat diketahui bahwa rata-rata persentase investasi kembali tanpa dipengaruhi oleh variabel apapun adalah sebesar 13.6838565511 Sedangkan jika dipengaruhi oleh penghasilan, jika pendapatan naik sebesar 1 juta rupiah rata-rata jumlah investasi kembali akan bertambah adalah sebanyak 1.53706126008 unit.ceteris paribus b. r =
r=
(
√(
) )(
( √(
(
(
) )
) ( ) (
)(
) (
) (
))
r = 0.49573313338 Artinya, korelasi antara jumlah pengasilan dengan investasi kembali adalah cukup kuat dan searah. Koefisien determinasi adalah : R2 X 100% = 0.495733133382 X 100% = 24.575133953 % 85
Artinya, variasi jumlah penghasilan menjelaskan total variasi Persentase investasi kembali sebesar 24.575133953 % dan sisanya dijelaskan oleh variabel lain diluar model. Koefisien non determinasi 1 – R2 = 1 - 0.495733133382 = 0.24575133953 x 100 % = 75.424866047 c. SYX =√ (
=√
) (
) (
)
= 5.69799
Jadi, rata-rata penyimpangan variabel persentasi investasi kembali prediksi terhadap variabel variabel persentase investasi kembali adalah sebesar 5.69799.
86
SOAL REGRESI DAN KORELASI SEDERHANA 1. Berikut ini adalah data berat mobil dalam ribuan pon dan konsumsi bahan bakar dalam mil/gallon. Berat mobil Konsumsi bahan bakar
2.0
2.4
2.8
3.4
3.6
3.2
2.6
2.9
2.5
2.7
32
30
28
23
19
25
27
24
29
33
a. Buat persamaan regresi dan interpretasinya! b. Hitung standard error of estimate! c. Hitung koefisien korelasi dan determinasi, jelaskan! d. Pada tingkat signifikansi 5%, dapatkah disimpulkan bahwa terhadap hubungan negatif antara dua variabel tersebut? e. Batas-bats taksiran koefisien regresi α pada tingkat kepercayaan 95%! Jawab :
Berat Mobil (X)
Konsumsi Bahan Bakar (Y)
XY
X2
Y2
2.0
32
64
4
1024
2.4
30
72
5.76
900
2.8
28
78.4
7.84
784
3.4
23
78.2
11.56
529
3.6
19
68.4
12.96
361
3.2
25
80
10.24
625
2.6
27
70.2
6.76
729
2.9
24
69.6
8.41
576
2.5
29
72.5
6.25
841
2.7
33
89.1
7.29
1089
ΣX=28.1
ΣY=270
ΣXY=742.4 ΣX2=81.04
ΣY2=7458
a. Persamaan Regresi a=
( (
)
)( (
) ( ) (
)(
)
)
87
(∑
(∑ )(∑ ) ( )
)
(
) (
( )
)( (
) )
maka persamaan regresinya adalah Y =
X.
Dari persamaan tersebut dapat diketahui bahwa rata-rata konsumsi bahan bakar tanpa dipengaruhi oleh variabel apapun adalah sebesar
%. Sedangkan jika
dipengaruhi oleh berat mobil , jika berat mobil naik sebesar 1 ribu pon, maka rata-rata konsumsi bahan bakar akan turun sebesar b.SYX = √
mil/gallon, ceteris paribus. (
√
) (
)(
)
Jadi, rata-rata penyimpangan variabel konsumsi bahan bakar bakar prediksi terhadap variabel konsumsi bahan bakar sebenarnya adalah sebesar ) (
(
c.
√(
(
) )(
(
) )
√(
(
) (
)(
) (
) (
))
Artinya, koefisien korelasi dari berat mobil dan bahan bakar minyak adalah sebesar . Artinya korelasi antara kedua variabel adalah negatif dan sangat kuat. Koefisien determinasi adalah R2 X 100% = (
)2 X 100 % = 0.76069653449 x 100 = 76.069653449 %
Artinya variabel berat mobil mampu menjelaskan variabel konsumsi bahan bakar sebanyak 76.069653449 % dan sisanya 23.930346551% dijelaskan oleh faktor lain di luar model. d. Ho : ρ = 0 (tidak ada korelasi) Ha : ρ ≠ 0 (ada korelasi ) df = 10-1-1 = 8 t 1/2α = 2,3060 t=
(√ √
√ √
t=
88
kriteria : Ho ditolak jika -thitung < -t1/2α atau thitung > t1/2α Ternyata
< -2,306 atau
> 2.306 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi negatif antara berat mobil dan konsumsi bahan bakar. Sa = SYX . √
e.
→ Σx2 = ΣX2 –
(
)
–
=
(
)
= 2.079
.√
Sa = Sa = 0.708899
df = 10-1-1=8
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa –2.3060*0.708899
<
Konstanta
α
<
+
2.3060*0.708899 47.396545 < Konstanta α < 50.665988 Jadi pada tingkat signifikansi 5%, batas-batas taksiran kostanta α berada dalam regresi populasi -47.396545 hingga 50.665988.
2. Norton Corp. Ingin mengetahui hubungan antara bonus yang diterima dengan jumlah lembur karyawan tersebut. Kemudian Norton Corp. Mewawancarai 20 karyawannya dan mendapatkan : ΣX=75 ; ΣY=250 ; ΣXY=1500; ΣX2=700 ; ΣY2=5000. Dari informasi tersebut, tentukan : a. Tentukan persamaan regresinya dan interpretasi! b. r dan r2 serta berikan interpretasinya! c. Pada tingkat signifikansi 5%, ujilah bahwa jumlah lembur dapat mempengaruhi jumlah bonus yang diterima oleh karyawan Norton Corp.! Jawab : (
a. a =
(
(∑
)
)
)(
) ( (
) (
(∑ )(∑ ) ( )
)(
)
)
(
) (
( )
)( ( )
)
89
maka persamaan regresinya adalah Y =
X.
Dari persamaan tersebut dapat diketahui bahwa jumlah bonus tanpa dipengaruhi oleh variabel apapun adalah sebesar
satuan. Sedangkan jika dipengaruhi oleh
lembur, jika jumlah lembur naik sebesar 1 satuan, maka rata-rata jumlah bonus akan naik sebesar
satuan, ceteris paribus. ) (
(
b.
√(
(
) )(
(
) )
√(
(
) (
)(
) (
) (
0.6348111 ))
Artinya, koefisien korelasi dari jumlah bonus dan jumlah lembur adalah sebesar 0.6348111. Artinya korelasi antara kedua variabel adalah positif dan kuat. r2 = (0.6348111)2 = 0.4029851 x 100% = 40.29851 % k2 + r2 = 100% k 2 = 100% - 40.29851 %= 59.70149% Artinya variabel berat mobil mampu menjelaskan variabel konsumsi bahan bakar sebanyak 40.29851 % dan sisanya 59.70149% dijelaskan oleh faktor lain di luar model. c. Ho : ρ = 0 (tidak ada korelasi) Ha : ρ ≠ 0 (ada korelasi ) df = 20-1-1 = 18 t 1/2α = 2.1009 t=
(√ √
√
= 3.4856851
√
kriteria : Ho ditolak jika -thitung < -t1/2α atau thitung > t1/2α Ternyata
< -2.1009 atau 3.4856851 > 2.1009 maka Ho ditolak
Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi positif antara jumlah bonus dan jumlah lembur karyawan.
3. Based on the theory of supply, it can be presumed that there is a relationship between production and price. below is the data production and palm oil prices from 1995 to 2004.
90
Production (million of ton) 4.54 4.53 5.03 6.05 6.09 6.14 6.37 7.40 7.22 7.81 8.49 8.81
Year 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Price (US $/ton) 271 319 411 348 287 330 383 384 472 610 640 652
Determine : a. The regression equation and give the interpretation! b. How much r and r2 and give the interpretation! c. The standard error of estimation and interpretation! d. With significance 5%, estimate interval constanta α! e. With significance 5%, estimate interval constanta β and test constanta β can influence the regression model significantly! f. At significance 5%, can we conclude that the sample comes from population which have correlation? Answer : Production (Y) 4.54 4.53 5.03 6.05 6.09 6.14 6.37 7.40 7.22 7.81 8.49 8.81 ΣY=78.48
Price (X) 271 319 411 348 287 330 383 384 472 610 640 652 ΣX=5107
X2 73441 101761 168921 121104 82369 108900 146689 147456 222784 372100 409600 425104 Σ X2=2380229
Y2 20.61 20.52 25.30 36.60 37.09 37.70 40.58 54.76 52.13 61.00 72.08 77.62 Σ Y2=535.98
XY 1230.34 1445.07 2067.33 2105.40 1747.83 2026.20 2439.71 2841.60 3407.84 4764.10 5433.60 5744.12 Σ XY=35253.14
a. Regression equation a=
( (
)
)( (
) ( ) (
)(
) )
91
(∑
) (∑ )(∑ ) ( )
(
) ( (
)(
) (
)
0.008963
)
So, the regression equation is Y = + X. It means that average production if not influenced by anything variabel is about millions of ton. And if influenced by price, in one US $/ton increasing in price then average production will be increasing about 0.008963 US $/ton, ceteris paribus. b.
) (
( √(
(
) )(
(
) )
√(
) (
(
)(
) (
) (
0.8550648 ))
So, the correlation between production and price is 0.8550648. On the other hand, the corelation is very strong and positive, because the value close to +1. r2 = (0.8550648)2 = 0.7311359 x 100% = 73.11359 % k2 + r2 = 100% k 2 = 100% - 73.11359 %= 0.99268864% so, the variation of production can explain total variation of price about 73.11359 % and the residual about 0.99268864% is explained by variable out of model. c. SYX = √
(
√
) (
So the standard error of estimate is
)(
)
. It means that varians of production
prediction can explain real production about 16.28992761. d. Sa = SYX . √
→ Σx2 = ΣX2 –
(
)
=
–
(
)
= 206774.9167
.√
Sa = Sa = 2.19560320235
df = 12-1-1=10
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa –2.2281*2.19560320235 < Konstanta α <
+ 2.2281*2.19560320235
-2.28275 < Konstanta α < 7.733593 So, with significance 5% the limits of estimated α regression -2.28275 to 7.733593.
are constant in the population
e. (n ≤ 30) b – t1/2α.Sb < konstanta β< b + t1/2α.Sb
92
Sb = SYX . √ Σx2 = ΣX2 –
(
)
Σx2 =
–
(
)
= 206774.9167
Maka Sb = Sb = 0.00492982807
.
√
df = 12-1-1=10
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb –2.2281*0.00492982807 < Konstanta α <
+ 2.2281*0.00492982807
2.71443785 < Konstanta β < 2.73640615 With significance 5%, interval estimation constanta β for regression of population is between 2.71443785 to 2.73640615 Uji t Ho: β = 0 (tidak ada pengaruh signifikan) Ha: β ≠ 0 (Ada pengaruh signifikan) α= 0,05
df = 10
t α/2 = 2.2281 t= t=
t = 552.8432151 criteria
-thitung <-t1/2α atau thitung > t1/2α
→ Ho ditolak
evidently -552.8432151 < - 2.2281 or 552.8432151 > 2.2281 → Ho rejected so, with significance 5%, the test shows that constanta β ≠ 0. It means that constanta β influence significantly.
d. Ho : ρ = 0 (no correlation) Ha : ρ ≠ 0 (correlation) df = 12-1-1 = 10 t 1/2α = 2.2281 93
t=
(√
√
√
√
t = 5.214740 criteria : Ho rejected if -thitung < -t1/2α or thitung > t1/2α -5.214740 < -2.2281 or 5.214740 > 2.2281 then Ho is rejected So, at significance 5%, there are positif correlation between production and price.
4. The data below is the income and consumption data per day from Nabila. Income (tens of thousands of dollars) 40 55 60 75 87 95 120
Consumption (tens of thousands of dollars) 25 40 50 55 65 73 90
Determine : a. What is the regression equation and give the interpretation? b. How much the coeficient corelation for the case and interpretation? c. How much the size of house can explain the selling price and interpretation? d. Determine the standard error of estimate and interpretation? Answer : Income (X) 40 55 60 75 87 95 120 ΣX=532
Consumption (Y) 25 40 50 55 65 73 90 ΣY=398
X2
Y2
XY
100 121 110.25 144 64 110.25 81 Σ X2=44.844
121 169 144 121 169 100 144 Σ Y2=25.404
140 143 126 132 104 105 108 Σ XY=33.715
94
a. Regression equation (
a=
( (∑
)(
)
) (
(
) (∑ )(∑ ) ( )
)(
) ( (
)
) ( (
0.000318
) )(
) (
)
0.73545
)
So, the regression equation is Y = 0.000318+ 0.73545X. It means that average consumption if not influenced by anything variabel is about 0.000318 tens of thousands of dollars. And if influenced by income, in tens of thousands of dollars increasing in price then average consumption will be increasing about 0.73545 tens of thousands of dollars, ceteris paribus. (
b.
√(
(
) )(
(
) )
) (
√( (
) (
)
)( (
) (
))
-1.0000013
So, the correlation between consumption and income is -1.0000013. On the other hand, the corelation is very strong and negative. 2
2
c. r = (-1.0000013) = 1.00000 x 100% = 100 %
k2 + r2 = 100% k 2 = 100% - 100 %= 0% so, the variation of consumption can explain total variation of price about 100 % and the residual about 0% is explained by variable out of model. d. SYX = √
(
√
) (
So the standard error of estimate is prediction can explain real production about
)(
)
. It means that varians of production .
5. The following table is the observation of the random sample of 8 villages in cities "alphabet" of income and health expenditure villagers during 2012. Village A B C D E F G H
Income (millions of rupiah) 21 15 15 9 12 18 6 12
Health expenditure (millions of rupiah) 4 3 3.5 2 3 3.5 2.5 2.5
95
a. What is the regression equation and give the interpretation? b. Determine the value of the coefficient of correlation, coefficient of determination, coefficient of non-determination and give the explanation! Answer : Village
Health expenditure (Y) 4 3 3.5 2 3 3.5 2.5 2.5 ΣY=24
Income (X)
A B C D E F G H
21 15 15 9 12 18 6 12 ΣX=108 a. Regression equation (
a=
( (∑
)
)(
) (
(
) (∑ )(∑ ) ( )
) ( (
)(
)(
) (
Y2
XY
441 225 225 81 144 324 36 144 Σ X2=1620
16 9 12.25 4 9 12.25 6.25 6.25 Σ Y2=75
84 45 52.5 18 36 63 15 30 Σ XY=343.5
0.735443361
) ) (
(
)
X2
) )
0.735443
So, the regression equation is Y = 0.735443361+ 0.735443X. It means that average health expenditure if not influenced by anything variabel is about 0.735443361 millions of rupiah. And if influenced by income, in one millions of rupiah increasing in income then average health expenditure will be increasing about 0.735443 millions of rupiah, ceteris paribus.
b. Coefficient of correlation ( √(
(
) )(
(
) )
√( (
) ( ) (
)( (
) ) (
))
0.884538
So, the correlation between consumption and income is 0.884538. On the other hand, the corelation is very strong and positive. Coefficient of determination r2 = (0.884538)2 = 0.7824074 x 100% = 78.24074 % k2 + r2 = 100% Coefficient of non determination k 2 = 100% - 78.24074 %= 21.75926 % so, the variation of income can explain total variation of health expenditure about 78.24074 % and the residual about 21.75926 % is explained by variable out of model.
96
6. Tabel berikut menunjukkan hasil pengamatan terhadap sampel acak yang terdiri dari 15 usaha kecil di suatu kecamatan mengenai omzet penjualan dan laba (dalam juta rupiah). Omzet Penjualan Laba 34 32 38 36 34 31 40 38 30 29 40 35 40 33 34 30 35 32 39 36 33 31 32 31 42 36 40 37 42 35 a. Tentukan persamaan regresinya dan interpretasi! b. r dan r2 serta berikan interpretasinya! c. Pada tingkat signifikansi 5%, ujilah bahwa omzet penjualan dapat mempengaruhi laba!
Jawab : Omzet Penjualan (X) 34 38 34 40 30 40 40 34 35 39 33 32 42 40 42 ΣX=553
Laba (Y) 32 36 31 38 29 35 33 30 32 36 31 31 36 37 35 ΣY=502 (
a. a =
( (∑
)
) (∑ )(∑ ) ( )
)(
) (
(
XY
1156 1444 1156 1600 900 1600 1600 1156 1225 1521 1089 1024 1764 1600 1764 Σ X2=20599
1024 1296 961 1444 841 1225 1089 900 1024 1296 961 961 1296 1369 1225 Σ Y2=16912
1088 1368 1054 1520 870 1400 1320 1020 1120 1404 1023 992 1512 1480 1470 Σ XY=18641
)
115.7944
)
) ( (
Y2
)(
) ( (
X2
) (
)(
) )
0.632557 97
maka persamaan regresinya adalah Y =
X.
Dari persamaan tersebut dapat diketahui bahwa laba tanpa dipengaruhi oleh variabel apapun adalah sebesar 115.7944 juta rupiah. Sedangkan jika dipengaruhi oleh omzet penjualan, jika jumlah omzet penjualan naik sebesar 1 juta rupiah, maka rata-rata laba akan naik sebesar
juta rupiah, ceteris paribus. ) (
(
b.
√(
(
) )(
(
) )
√(
(
) (
)(
) (
) (
0.8707684 ))
Artinya, koefisien korelasi dari laba dan omzet penjualan adalah sebesar 0.6348111. Artinya korelasi antara kedua variabel adalah positif dan kuat. r2 = (0.8707684)2 = 0.7582377 x 100% = 75.82377 % k2 + r2 = 100% k 2 = 100% - 75.82377 %= 24.17623 % Artinya variabel omzet penjualan mampu menjelaskan variabel laba sebanyak 75.82377 % dan sisanya 24.17623 % dijelaskan oleh faktor lain di luar model. c. Ho : ρ = 0 (tidak ada korelasi) Ha : ρ ≠ 0 (ada korelasi ) df = 15-1-1 = 13 t 1/2α = 2.1604 t=
(√ √
√ √
t = 6.38528 kriteria : Ho ditolak jika -thitung < -t1/2α atau thitung > t1/2α Ternyata -6.38528 < -2.1604 atau 6.38528 > 2.1604 maka Ho ditolak Jadi, pada tingkat signifikansi 5%, ternyata ada korelasi positif antara laba dan omzet penjualan.
98
7. Dibawah ini adalah biaya promosi dan volume penjualan dari PT.Cahaya Kamila. Biaya Promosi (Rupiah) 12 13.50 12.75 12.60 14.85 15.20 15.75 16.80 18.45 17.90
Volume Penjualan (Buah) 56 62.43 60.85 61.30 65.83 66.35 65.26 68.80 70.47 65.20
Tentukan : a. Persamaan regresi dan interpretasi! b. Hitunglah standard error estimasinya! c. Taksirlah berapa volume penjualan, apabila biaya promosi yang dikeluarkan adalah Rp 19?
Jawab : Biaya Promosi (X)
Volume Penjualan
X2
Y2
XY
(Y)
12
56
144
3136
672
13.50
62.43
182.25
3897.5
842.805
12.75
60.85
162.563
3702.72
775.838
12.60
61.30
158.76
3757.69
772.38
14.85
65.83
220.523
4333.59
977.576
15.20
66.35
231.04
4402.32
1008.52
15.75
65.26
248.063
4258.87
1027.85
16.80
68.80
282.24
4733.44
1155.84
18.45
70.47
340.403
4966.02
1300.17
17.90
65.20
320.41
4251.04
1167.08
ΣX=149.8
ΣY=642.49
Σ X2=2290.25
Σ Y2=41439.2
Σ XY=9700.05
99
(
a. a = (∑
( ) ) (∑ )(∑ ) ( )
)(
) (
( (
)(
) ( ) ( (
)
) )(
)
) (
)
39.77692 1.63365
maka persamaan regresinya adalah Y =
X.
Dari persamaan tersebut dapat diketahui bahwa volume penjualan tanpa dipengaruhi oleh variabel apapun adalah sebesar
rupiah. Sedangkan jika dipengaruhi oleh biaya
promosi, jika biaya promosi naik sebesar 1 rupiah, maka rata-rata vome penjualan akan naik sebesar 1.63365 satuan, ceteris paribus. b. SYX =√
=√
(
)(
) (
)(
)
= 62.9775912527 Jadi, rata-rata penyimpangan variabel volume penjualan prediksi terhadap variabel volume penjualan sebenarnya adalah 62.9775912527.
c. Y = Y=
X (15)
Y = 64.28167 Jadi, ketika biaya promosi yang dikeluarkan adalah Rp 19 maka volume penjualan adalah sebesar 64.28167.
100
REGRESI DAN KORELASI BERGANDA A. REGRESI LINEAR BERGANDA 1. Hubungan Linear Lebih dari Dua Variabel Disamping hubungan linear antar dua variabel, hubungan linear lebih dari dua variabel juga sering terjadi. Misalnya, hubungan antara hasil penjualan dengan harga dan daya beli, hubungan antara rata-rata harga beras dengan dengan jumlah penduduk, pendapatan, dan jumlah uang beredar, atau hubungan antara produksi padi dengan bibit, pupuk, luas sawah, dan curah hujan. (Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua).Friedman (1962) menyatakan bahwa keputusan seseorang untuk mengonsumsi sesuatupada dasarnya tidak hanya dipengaruhi oleh faktor pendapatannya, tetapi juga perkiraan pendapatannya pada masa akan dating, selain faktor suku bunga, pajak, distribusi pendapatan, dan lainnya. Hubungan linear lebih dari dua variabel bila dibuat dalam persamaan matematis sebagai berikut: = a + b1X1 + b2X2+ ... +bkXk Keterangan: Y
= variabel dependen
X1, X2, ..., Xk
= variabel independen
a
= bilangan konstan (konstanta)
b1, b2, ..., bk
= koefisien variabel
Pada persamaan linear lebih dari dua variabel, variabel Y dipengaruhi oleh lebih dari dua variabel, yaitu X1, X2,...., Xk. Dimana variabel Y disebut dengan variabel terikat atau dependent variable / explained variable / predictand / regressand / response / endogeneous / outcome / controlled variable, dan variabelvariabel X1, X2,...., Xk disebut dengan variabel bebas atau independent variable / explanatory variable / predictor / regressor / stimulus / exogenous / covariate / control variable.(Damodar N. Gujarati, Basic Econometrics).
101
2. Persamaan Regresi Linear Berganda Regresi Linear berganda adalah regresi dimana variabel terikatnya (Y) di dijelaskan oleh lebih dari satu variabel bebas (X1, X2,...., Xk) namun masih menunjukkan diagram hubungan yang linear.(Ir. M. Iqbal Hasan, M.M., PokokPokok Materi Statistik 2 (Statistik Inferensif), edisi kedua) Bentuk umum persamaan regresi linear berganda : a. Bentuk Stokastik ̂ = a + b1X1 + b2X2+ ... +bkXk + e b. Bentuk Nonstokastik (Deterministik) ̂ = a + b1X1 + b2X2+ ... +bkXk Keterangan: ̂
= variabel terikat / dependen (nilai duga Y)
X1, X2, ..., Xk
= variabel bebas / independen
a
= bilangan konstan (konstanta)
b1, b2, ..., bk
= koefisien regresi (parameter)
e
= nilai residual / error / pengganggu (Y-̂)
3. Persamaan Regresi Linear Berganda dengan Dua Variabel Bebas Bentuk umum persamaan regresi linear berganda dengan dua variabel bebas adalah sebagai berikut: = a + b1X1 + b2X2 Keterangan: Y
= variabel terikat / dependen (nilai duga Y)
X1, X2
= variabel bebas / independen
b1,b2
=koefisien regresi linear berganda disebut juga sebagai koefisien regresi parsial (partial coefficient regression)
a
= konstanta (nilai Y, apabila X1 = X2 = 0)
b1
= besarnya kenaikan/penurunan Y dalam satuan, jika X1naiksatu satuan dan X2 konstan
b2
= besarnya kenaikan/penurunan Y dalam satuan, jika X2naik satu satuan dan X1 konstan
+ atau -
= tanda yang menunjukkan arah hubungan antara Y dan X1atau X2 102
Nilai dari koefisien a, b1, b2 dapat ditentukan salah satunya dengan metode kuadrat terkecil atau Ordinary Least Square Method.
Metode Kuadrat Terkecil Metode Kuadrat terkecil atau Ordinary Least Square Method pada prinsipnya adalah meminimumkan jumlah kuadrat deviasi di sekitar garis regresi. Dan nilai koefisien regresi a, b1, dan b2 dapat dipecahkan secara simultan dari tiga persamaan berikut : ∑Y = na + b1∑X1 + b2∑X2 ∑X1Y = a∑X1 + b1∑X12 + b2∑X1∑X2 ∑X2Y = a∑X2 + b1∑X1∑X2 + b2∑X22 Untuk mendapatkan koefisien regresi a, b1, dan b2 dengan menggunakan persamaan di atas, diperlukan perhitungan yang cukup panjang, oleh karena itu, dikembangkan beberapa cara yang lebih mudah, sebagai berikut : A = n∑X1Y – ∑X1∑Y B = n∑X22– (∑X2)2 C = n∑X1X2 - ∑X1∑X2 D = n∑X2Y - ∑X2∑Y E = n∑X12– (∑X1)2 F = EB – C2 Dari beberapa persamaan tersebut, nilai koefisien regresi untuk a, b1, dan b2dapat diperoleh dengan cara berikut :
∑
∑
∑
103
B. PENGUJIAN KOEFISIEN REGRESI 1. Standard Error of Estimate / KesalahanBaku dalam Penaksiran (SE) Kesalahan baku dalam penaksiran melihat seberapa jauh nilai penduga, yaitu b1 dan b2 dari nilai sebenarnya, yaitu B1 dan B2 (parameter populasi). Oleh karena nilai ini menunjukkan besarnya penyimpangan atau error, maka semakin kecil nilainya dianggap akan lebih baik. Untuk menghitung kesalahan baku ini dapat digunakan rumus berikut : √ ∑ ∑
∑
(∑
)
(∑
)
∑ ∑
∑
df = n – k – 1 = n – 3 ∑ ∑
2.
)
∑(
Pendugaan Hipotesis Koefisien Regresi Berganda (Parameter 𝛃1 dan 𝛃1) a. Pengujian Hipotesis Simultan (F statistik) Digunakan (
untuk
melihat
signifikansi
variabel
independent
)secara keseluruhan / bersama–sama dalam mempengaruhi nilai
variabel dependen (Y).Langkah-langkah pengujiannya adalah sebagai berikut : i.
Menentukan formulasi hipotesis (X1 dan X2 secara bersama-sama tidak mempengaruhi Y) (X1 dan X2 secara bersama-sama mempengaruhi Y atau paling sedikit ada satu X yang mempengaruhi Y)
ii.
Menentukan Taraf nyata (α) dan nilai F Taraf nyata (α) dan nilai F tabel ditentukan dengan derajat kebebasan v1 = k 1 dan v2 = n – k.
104
iii.
Menentukan nilai F stat
MSR
SSR df1
SST = ΣY2 – n Y
MSE
SSE df 2
2
SSR = b1 ΣX1Y + b2 ΣX2Y SSE = SST – SSR iv.
Menentukan Kriteria Pengujian F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak atau
v.
Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Membuat Kesimpulan Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
b. Pengujian Hipotesis Individual / Parsial (t statistik) Digunakan untuk melihat signifikansi variabel independent (
)
secara parsial dalam mempengaruhi variabel dependen (Y).Langkah-langkah pengujiannya adalah sebagai berikut : i.
Menentukan formulasi hipotesis Ho
: 𝛃i = 0 ( tidak ada pengaruh Xi secara parsial terhadap Y)
Ha
: 𝛃i > 0 ( ada pengaruh positif Xi secara parsial terhadap Y) 𝛃i < 0 ( ada pengaruh negatif Xi secara parsial terhadap Y) 𝛃i ≠ 0 ( ada pengaruh Xi secara parsial terhadap Y)
ii.
Menentukan Taraf nyata (α) dan nilai t tabel Taraf nyata dari t tabel ditentukan dengan derajat kebebasan : df = n – k – 1, (k = banyaknya jumlah variabel X)
iii.
Menentukan nilai t stat
t stat iv.
bi Bi , i 2,3 Sbi
MenentukanKriteria Pengujian
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak 105
tstat> ttabel→ Ho ditolak atau
v.
Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Membuat Kesimpulan Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
C. KORELASI LINEAR BERGANDA Korelasi linear berganda merupakan alat ukur mengenai hubungan yang terjadi antara variabel terikat (variabel Y) dan dua atau lebih variabel bebas (X1, X2, ..., Xk). Analisis korelasinya menggunakan tiga koefisien korelasi, yaitu koefisien determinasi berganda, koefisien korelasi berganda dan koefisien korelasi parsial.(Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua ) a. Koefisien Determinasi Berganda (R2) Koefisien Determinasi Berganda, dilambangkan dengan R2, merupakan ukuran kesesuaian garis regresi linear berganda terhadap suatu data. Koefisien determinasi tersebut digunakan untuk :
Mengukur besarnya kontribusi variasi X1 dan X2 (variable independen) terhadap variasi Y dalam hubungnnya dengan persamaan garis regresi linear berganda
= a + b1X1 + b2X2.
Menentukkan apakah garis regresi linear berganda Y terhadap X1 dan X2 sudah cocok untuk dipakai sebagai pendekatan hubungan linear antar variabel berdasarkan hasil observasi (goodness of fit).
Nilai koefisien determinasi berganda terletak antara 0 dan 1 (0 ≤ R2 ≤ 1). Koefisien determinasi berganda dirumuskan: R2
b1 x1 y b2 x2 y
y
2
(Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua )
106
b. Koefisien Korelasi Berganda (R) Koefisien korelasi berganda, disimbolkan Ry.12, merupakan ukuran keeratan hubungan antara variabel terikat dan semua variabel bebas secara bersama-sama. R y.12
b1 x1 y b2 x2 y
y
2
c. Koefisien Korelasi Parsial (r) Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel jika variabel lainnya konstan, pada hubungan yang melibatkan lebih dari dua variabel. Sebelum menghitung koefisien korelasi parsial, dilakukan terlebih dahulu perhitungan koefisien korelasi sederhana, yaitu: ∑ √[ ∑
(∑ ) ][ ∑ ∑
√[ ∑
√[ ∑
(∑
) ]
∑ ) ][ ∑
∑ (∑
) ]
)(
)
Koefisien Korelasi Parsial antara Y dan X2, apabila X1 konstan √(
) ]
Koefisien Korelasi Parsial antara Y dan X1, apabila X2 konstan √(
(∑
(∑
∑ ∑
(∑ ) ][ ∑ ∑
∑ ∑
)(
)
Koefisien Korelasi Parsial antara X1 dan X2, apabila Y konstan √(
)(
)
(Suharyadi & Purwanto, Statistika, Untuk Ekonomi dan Keuangan Modern, Edisi 2)
107
Contoh soal: Dibawah ini adalah data dari PDB, jumlah investasi, dan nilai ekspor negara YY dalam kurun waktu 10 tahun terakhir:
PDB
Jumlah Investasi
Nilai Ekspor
(triliun rupiah)
(miliar rupiah)
(miliar rupiah)
190
20
40
340
45
65
350
30
70
400
57
80
300
40
50
450
62
80
370
50
70
180
22
35
280
60
40
300
34
60
Sumber: fiktif a. Tentukan persamaan regresi dan interpretasikan! b. Tentukan koefisien determinasi dan nondeterminasi! Interpretasikan nilainya! c. Berapa besar penyimpangan variabel PDB yangdiprediksi terhadap variabel PDB sebenarnya? d. Tentukan koefisien korelasi berganda dan korelasi parsial antara variabel jumlah investasi terhadap variabel PDB dengan menganggap variabel nilai ekspor konstan, korelasi parsial antara variabel nilai ekspor terhadap variable PDB dengan menganggap variabel jumlah investasi konstan, dan korelasi parsial antarvariabel independen ! Bagaimana sifatnya? e. Dengan tingat kepercayaan 95%, apakah jumlah investasi dan nilai ekspor memengaruhi secara parsial terhadap PDB? f. Apakah investasi dan nilai ekspor memengaruhi secara bersama-sama terhadap PDB? (α=5%)
108
Penyelesaian: Langkah – langah dengan menggunakan softwareSPSS : 1.
Buka SPSS, masukkan nama variabel pada variable view, dan masukkan data pada data view
2.
pada menu bar, pilih analyze, sub menu regression, lalu klik linear
3.
masukkan variabel Y ke dalam kotak dependent dan X1 dan X2 ke dalam kotak independent
4.
5.
6.
Klik Statistics
Regression Coefficient → aktifkan estimates
Aktifkan model fit, descriptives, dan part and partial correlations
Klik Continue
Klik Option
Pilih Stepping Method Kriteria → entry 0.05
Aktifkan Include Constant in Equation
Pada box missing value pilih exclude cases pairwise
Klik Continue
Lalu klik OK
Outputnya adalah sebagai berikut :(Jawab) Coefficientsa
Model
Unstandardized Coefficients B
Standardized Coefficients
Std. Error
1 (Constant) 8.942 20.079 X1 1.987 0.416 X2 3.79 0.38 a. Dependent Variable: Y
Correlations t
Sig.
Beta
0.356 0.744
0.445 4.772 9.971
0.669 0.002 0
Zeroorder
Partial
Part
0.766 0.94
0.875 0.967
0.298 0.622
a. Persamaan regresi : Y = 8,942 + 1,987 X1 + 3,790 X2 Interpretasi : a = 8,942 Tanpa dipengaruhi oleh variabel apapun, rata – rata PDB yang didapatkan negara YY adalah sebesar 8,942 triliun rupiah.
109
b1 = 1,987 Artinya, setiap kenaikan jumlah investasi sebesar 1 miliar rupiah, maka rata – rata PDB akan naik sebesar 1,987 triliun rupiah dengan variabel nilai ekspor dianggap konstan. b2 = 3,790 artinya setiap kenaikan nilai ekspor sebesar 1 miliar rupiah, maka rata – rata PDB akan naik sebesar 3,790 triliun rupiah dengan variabel investasi dianggap konstan. Model Summary Model
R
1
.986a
R Square Adjusted R Square .973
Std. Error of the Estimate
.965
16.00284
a. Predictors: (Constant), X2, X1 b. Koefisien determinasi : R2 = 0,973 Koefisien nondeterminasi : K2 = 1 - R2 = 1 – 0,973 = 0,027 Artinya,variabel jumlah investasidanvariabel nilai ekspor mampu menjelaskan variasi dari PDB negara YY sebesar 97,3%, dan sisanya sebesar 2,7% dijelaskan oleh faktor lain di luar model. c. Standard Error of Estimate (SE) SE = 16,00284 Artinya, rata-rata penyimpangan variabel PDB yang diprediksi dengan variabel PDB sebenarnya adalah sebesar 16,00284 Triliun Rupiah d. Koefisien korelasi berganda (R) = 0,986 Artinya, hubungan keseluruhan antara variabel PDB, variabeljumlah investasi, dan variabel nilai eksporadalah searah dan sifatnya sangat erat yaitu sebesar 0,986.
110
Correlations Y
X1
X2
Pearson
Y
1.000
.766
.940
Correlation
X1
.766
1.000
.550
X2
.940
.550
1.000
Y
.
.005
.000
X1
.005
.
.050
X2
.000
.050
.
Y
10
10
10
X1
10
10
10
X2
10
10
10
Sig. (1-tailed)
N
ry1.2 = 0,766 Artinya hubungan antara variabel jumlah investasi secara parsial terhadap variabel PDB adalahsearah dan sifatnya erat dengan nilai sebesar 0,766, dengan menganggap variabel nilai ekspor konstan. ry2.1 = 0,940 Artinya hubungan antara variabel nilai ekspor secara parsial terhadap variabel PDB adalahsearah dan sifatnya sangat erat dengan nilai sebesar 0,940, dengan menganggap variabel jumlah investasi konstan. r12.y = 0,550 Artinya hubungan antara variabel jumlah investasi dan variabel nilai ekspor secara parsial adalahsearah dan sifatnya cukup eratdengan nilai sebesar 0,550, dengan menganggap variabel PDB konstan.
111
Coefficientsa
Model
Unstandardized Coefficients B
Standardized Coefficients
Std. Error
Correlations t
Sig.
Beta
1 (Constant) 8.942 20.079 X1 1.987 0.416 X2 3.79 0.38 a. Dependent Variable: Y
0.356 0.744
0.445 4.772 9.971
0.669 0.002 0
Zeroorder
Partial
Part
0.766 0.94
0.875 0.967
0.298 0.622
e. Uji t statistik : 1. Uji Parsial variabel PDB terhadap Variabel Jumlah Investasi Hipotesis : (variabel jumlah investasi secara parsial tidak berpengaruh signifikan terhadap variabel PDB) (variabel jumlah investasi secara parsial berpengaruh signifikan terhadap variabel PDB) Nilai t stat dan t tabel : t stat = 4,772 t tabel = 2,3646 df = n – k – 1 = 10 – 2 – 1 = 7 α = 0,05 Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat> ttabel, yaitu 4,772 ˃ 2,3646 makaHo ditolak ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,002 dan α = 0,05 Ternyata Sig. < α, yaitu 0,002< 0,05 maka
ditolak 112
Kesimpulan : Pada tingkat signifikansi 5%, variabel jumlah investasi secara parsial berpengaruh signifikan terhadap variabel PDB
2. Uji Parsial variabel PDB terhadap Variabel Jumlah Investasi Hipotesis : (variabel nilai ekspor secara parsial tidak berpengaruh signifikan terhadap variabel PDB) (variabel nilai ekspor secara parsial berpengaruh signifikan terhadap variabel PDB) Nilai t stat dan t tabel : t stat = 9,971 t tabel = 2,3646 df = n – k – 1 = 10 – 2 – 1 = 7 α = 0,05 Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat> ttabel, yaitu 9,971 > 2,3646 makaHo ditolak ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,000 dan α = 0,05 Ternyata Sig. < α, yaitu 0,000< 0,05 maka
ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel nilai ekspor secara parsial berpengaruh signifikan terhadap variabel PDB.
113
f. Uji F statistik ANOVAb Model 1
Sum of Squares
df
Mean Square
F
Sig.
Regression
64047.363
2
32023.681
125.048
.000a
Residual
1792.637
7
256.091
Total 65840.000 a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
9
Hipotesis : (variabel jumlah investasidan variabel nilai ekspor secara bersama-samatidak
berpengaruh
signifikan
terhadap
variabel PDB) (variabel jumlah investasidan variabel nilai eksporsecara bersama-sama berpengaruh signifikan terhadap variabel PDB) Nilai F stat dan F tabel : F stat = 125,048
α = 0,05
F tabel = 5,32
v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 10 – 2 = 8 Kriteria uji : i. Uji tabel F F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak Ternyata F stat > F tabel, yaitu 125,048 >5,32 maka Ho ditolak ii. Uji Sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,000 dan α = 0,05 Ternyata Sig. < α, yaitu 0,000< 0,05, maka
ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel jumlah investasidan variabel nilai eksporsecara bersama-sama berpengaruh signifikan terhadap variabel PDB
114
SOAL REGRESI DAN KORELASI BERGANDA 1. Konsumen yang loyal akan memberi peningkatan keuntungan. Banyak cara yang bisa dilakukan untuk meningkatkan loyalitas konsumen. Untuk memuaskan konsumen, ada pemikiran di kalangan pengusaha kuliner atau rumah makan di daerah Bandung untuk meningkatkan keuntungan usaha, yaitu dengan menambah jumlah tenaga kerja untuk meningkatkan kepuasan pelayanan atau memperluas area parkir sebagai usaha memberikan pelayanan yang baik pada konsumen. Untuk itu, dilakukan survey terhadap 15 pengusaha kulinerdi wilayah Bandung pada tahun 2012. Hasil survey tersebut adalah sebagai berikut: Pendapatan
Jumlah Tenaga Kerja
Parkir Mobil
(Juta Rupiah)
(Orang)
(Ruang)
Double Steak
280
14
18
Waroeng Steak
130
7
3
Steak Ranjang
123
13
8
Giggle Box
160
12
7
Hummingbird
450
39
36
Tokyo Connection
570
67
84
The Cost
315
20
5
Javan Steak
64
4
8
Kopi Progo
340
48
55
Hanamasa
670
81
98
Laksana
370
12
65
Nanny’s Pavillon
644
59
9
Bebek Garang
128
44
12
The Kiosk
415
28
9
Ampera
387
65
12
Nama Restoran
a. Tentukan persamaan regresinya dan interpretasikan ! b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial ! Interpretasikan ! c. Berapa besar penyimpangan variabel
pendapatan pengusaha kuliner
yangdiprediksi terhadap variabel pendapatan yang sebenarnya?
115
d. Lakukan pengujian secara parsial antar variabel pendapatan dan jumlah tenaga kerja, juga variabel pendapatan dan parkir mobil, dengan tingkat signifikansi 5% ! e. Lakukan pengujian simultan antara variabel jumlah tenaga kerja dan variabel parkir mobil terhadap variabel pendapatan ! f. Jika anda seorang pengusaha kuliner di Bandung, apakah anda harus menambah tenaga kerja saja, area parkir saja, atau keduanya ? Jawab : Coefficients Model
1 (Constant) X1 X2
Unstandardized Coefficients B
Std. Error
123.911
54.379
4.873
1.5789
1.602
1.260
Standardized Coefficients
a
t
Sig.
Beta
Correlations Zeroorder
Partial
Part
2.279
0.042
0.634
3.087
0.009
0.785
0.665
0.519
0.261
1.271
0.228
0.627
0.345
0.214
a. Dependent Variable: Y
a. Persamaan regresi : Y = 123,911 + 4,873 X1 + 1,602 X2 Interpretasi : a = 123,911 Tanpa dipengaruhi oleh variabel apapun, rata – rata pendapatan yang didapatkan pengusaha kuliner adalah sebesar Rp 123.911.000. b1 = 4,873 Artinya, setiap kenaikan jumlah tenaga kerja sebanyak 1 orang, maka rata – rata pendapatan pengusaha kuliner akan naik sebesar Rp 4.873.000 dengan variabel lahan parkir mobil dianggap konstan. b2 = 1,602 Artinya setiap kenaikan lahan parkir mobil sebanyak1 lahan, maka rata – rata pendapatan akan naik sebesar Rp 1.602.000 dengan variabel jumlah tenaga kerja dianggap konstan.
116
Model Summary Model
R
R Square
1
.813
a
Adjusted R Square Std. Error of the Estimate
.661
.605
121.55813
a. Predictors: (Constant), X2, X1
Correlations
Pearson Correlation
Sig. (1-tailed)
N
Y
X1
X2
Y
1.000
.785
.627
X1
.785
1.000
.576
X2
.627
.576
1.000
Y
.
.000
.006
X1
.000
.
.012
X2
.006
.012
.
Y
15
15
15
X1
15
15
15
X2
15
15
15
b.
Koefisien Determinasi : R2 = 0,605 (Adjusted R2) Koefisien Non Determinasi : K2 = 1 - R2 = 1 – 0,605 = 0,395 Artinya,variabel jumlah tenaga kerjadanvariabel lahan parkir mobil mampu menjelaskan variasi dari pendapatan pengusaha kulinersebesar 60,5%, dan sisanya sebesar 39,5% dijelaskan oleh faktor lain di luar model.
Koefisien Korelasi Berganda (R) = 0,813 Artinya, hubungan keseluruhan antara variabel pendapatan pengusaha kuliner, variabeljumlah tenaga kerja, dan variabel lahan parkir adalah searah dan sifatnya cukup erat yaitu sebesar 0,813 atau 81,3%.
Koefisien Korelasi Parsial (r) ry1.2 = 0,785 Artinya hubungan antara variabel jumlah tenaga kerja secara parsial terhadap variabel pendapatan pengusaha kulineradalah searah dan sifatnya eratdengan nilai sebesar 0,785, dengan menganggap variabel lahan parkir mobil konstan.
117
ry2.1 = 0,627 Artinya hubungan antara variabel lahan parkir mobil secara parsial terhadap variabel
pendapatan
pengusaha
kulineradalah
searah
dan
sifatnyacukuperatdengan nilai sebesar 0,627, dengan menganggap variabel jumlah tenaga kerja konstan. r12.y = 0,576 Artinya hubungan antara variabel jumlah tenaga kerja dan variabel lahan parkir mobil secara parsial adalah searah dan sifatnya cukup eratdengan nilai sebesar 0,576, dengan menganggap variabel pendapatan pengusaha kuliner konstan. c. Standard Error of Estimate (SE) SE = 121,55813 Artinya, rata-rata penyimpangan variabel pendapatan pengusaha kuliner yang diprediksi dengan variabel pendapatan pengusaha kuliner yang sebenarnya adalah sebesar RP 121.558.130.
d. Uji t statistik : 1. Uji Parsial Variabel Pendapatan Pengusaha Kuliner Terhadap Variabel Jumlah Tenaga Kerja Hipotesis : (variabel jumlah tenaga kerja secara parsial tidak berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner) (variabel jumlah tenaga kerja secara parsial berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner) Nilai t stat dan t tabel : t stat = 3,087 t tabel = 2,1788 df = n – k – 1 = 15 – 2 – 1 = 12 α = 0,05
118
Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat> ttabel, yaitu 3,087 ˃ 2,1788makaHo ditolak ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,009 dan α = 0,05 Ternyata Sig. < α, yaitu 0,009< 0,05 maka
ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel jumlah tenaga kerja secara parsial berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner.
2. Uji Parsial Variabel Pendapatan Pengusaha Kuliner Terhadap Variabel Lahan Parkir Mobil Hipotesis : (variabellahan parkir mobil secara parsial tidak berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner) (variabellahan parkir mobil secara parsial berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner) Nilai t stat dan t tabel : t stat = 1,271 t tabel = 2,1788 df = n – k – 1 = 15 – 2 – 1 = 12 α = 0,05
119
Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,1788 <1,271< 2,1788makaHo tidak dapat ditolak ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,228 dan α = 0,05 Ternyata Sig. > α, yaitu 0,228 > 0,05 maka
tidak dapat ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel lahan parkir mobil secara parsial tidak berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner. b
ANOVA Sum of
Model
1
Squares
df
Mean Square
F
Sig.
11.724
.002
Regression
346473.054
2
173236.527
Residual
177316.546
12
14776.379
Total
523789.600
14
a
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Hipotesis : (variabel jumlah tenaga kerja dan variabel lahan parkir mobil secarabersama-sama tidak berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner) (variabel jumlah tenaga kerja dan variabel lahan parkir mobil secara bersama-sama berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner)
120
Nilai F stat dan F tabel : F stat = 11,724
α = 0,05
F tabel = 4,67
v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 15 – 2 = 13 Kriteria uji : iii. Uji tabel F F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak Ternyata F stat > F tabel, yaitu 11,724> 4,67 maka Ho ditolak iv. Uji Sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,002 dan α = 0,05 Ternyata Sig. < α, yaitu 0,002< 0,05, maka
ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel jumlah tenaga kerjadan variabel lahan parkir mobilsecara bersama-sama berpengaruh signifikan terhadap variabel pendapatan pengusaha kuliner. 2. Salah satu penyebab krisis ekonomi di Indonesia yang berkepanjangan adalah belum membaiknya iklim di sektor riil yang disebabkan masih tingginya suku bunga kredit. Ada beberapa alasan mengapa suku bunga bank tetap tinggi, yaitu masalah inflasi dan nilai tukar. Berdasarkan hal tersebut, disusun hipotesis, yaitu suku bunga dipengaruhi oleh besarnya inflasi dan nilai tukar secara individual. Untuk analisis tersebut, akan digunakan data dari tahun 1996 sampai 2007. Berikut adalah hasil pengumpulan data tersebut : Suku Bunga
Inflasi
Nilai Tukar
(% / tahun)
(% / tahun)
(Rp / USD)
1996
20,37
8,91
1905
1997
20,69
9,52
1997
1998
19,25
9,48
2074
1999
15,24
9,77
2118
Tahun
121
2000
16,77
9,24
2205
2001
16,86
6,09
2305
2002
17,02
6,47
2385
2003
18,49
11,05
5700
2004
25,09
7,63
8025
2005
26,22
2,01
7100
2006
19,55
9,35
9595
2007
19,15
12,55
10435
Dengan menggunakan data tersebut, buatlah persamaan regresinya dan apakah benar suku bunga dipengaruhi oleh inflasi dan nilai tukar secara individual ? Jawab : Coefficients
Model
1
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
(Constant)
22.644
2.641
X1
-.651
.284
X2
.001
.000
a
Correlations t
Sig.
Beta
Zero-order
Partial
Part
8.576
.000
-.538
-2.296
.047
-.482
-.608
-.535
.532
2.272
.049
.476
.604
.529
a. Dependent Variable: Y
a. Persamaan regresi : Y = 22,644– 0,651X1 + 0,001X2 Interpretasi : a = 22,644 Tanpa dipengaruhi oleh variabel apapun, rata – rata suku bunga kredit adalah sebesar22,644%. b1 = -0,651 Artinya, setiap kenaikan inflasi sebesar 1%, maka rata – rata suku bunga kreditakanturun sebesar 0,651%, dengan variabel nilai tukar dianggap konstan. b2 = 0,001 Artinya setiap kenaikan nilai tukar sebesarRp 1 / USD, maka rata – rata suku bunga kreditakan naik sebesar 0,001% dengan variabel inflasi dianggap konstan.
122
b
ANOVA Model
Sum of Squares
df
Mean Square
F
Sig.
60.597
2
30.298
4.709
.040
57.903
9
6.434
Regression 1 Residual
Total 118.500 a. Predictors: (Constant), X2, X1
a
11
b. Dependent Variable: Y
b. Uji t statistik : 1. Uji Parsial Variabel Suku Bunga Kredit Terhadap Variabel Inflasi Hipotesis : (variabelinflasi secara parsial tidak berpengaruh signifikan terhadap variabel suku bunga kredit) (variabelinflasi secara parsial berpengaruh signifikan terhadap variabel suku bunga kredit) Nilai t stat dan t tabel : t stat = -2,296 t tabel = 2,2622 df = n – k – 1 = 12 – 2 – 1 = 9 α = 0,05 Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat˂-ttabel, yaitu -2,296˂-2,2622makaHo ditolak ii. UjiSig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,047 dan α = 0,05 Ternyata Sig. < α, yaitu 0,047< 0,05 maka
ditolak
123
Kesimpulan : Pada tingkat signifikansi 5%, variabel inflasi secara parsial berpengaruh signifikan terhadap variabelsuku bunga kredit.
2. Uji Parsial Variabel Suku Bunga Kredit Terhadap Variabel Nilai Tukar Hipotesis : (variabelnilai tukar secara parsial tidak berpengaruh signifikan terhadap variabel suku bunga kredit) (variabelnilai tukar secara parsial berpengaruh signifikan terhadap variabel suku bunga kredit) Nilai t stat dan t tabel : t stat = 2,272 t tabel = 2,2622 df = n – k – 1 = 12 – 2 – 1 = 9 α = 0,05 Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyatatstat> ttabel, yaitu 2,272> 2,2622makaHo ditolak ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,049dan α = 0,05 Ternyata Sig. < α, yaitu 0,049< 0,05 maka
ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel nilai tukar secara parsial tidak berpengaruh signifikan terhadap variabel suku bunga kredit.
124
3. Taufik, The district sales manager for a major automobile manufacturer is studying car sales. Specifically, he would like to determine what factors affect the number of cars sold at a dealership. To investigate, he randomly selects 10 dealers. From these dealers, he obtains the number cars sold last month, the minutes of radio advertising purchased last month, the number of full-time salespeople employed in the dealership, and wheter the dealer is located in the city. The information is as follows : Cars Sold Last Month
Advertising
Sales Force
City (No = 0, Yes = 1)
127
18
10
Yes
138
15
15
No
159
22
14
Yes
144
23
12
Yes
139
17
12
No
128
16
12
Yes
161
25
14
Yes
180
26
17
Yes
102
15
7
No
163
24
15
Yes
a. Determine the regression equation, how many cars would to be sold by a dealership employing 20 salespeople, purchasing 15 minutes of advertising, and located in a city ? b. Conduct a global test of hypothesis with α = 5% c. Conduct a test of hypothesis for the individual regression coefficients. Would you consider deleting any of the independent variables ? Let α = 5% Jawab : Coefficients
Model
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
(Constant)
30.816
7.657
X1
2.687
.534
X2
4.713
X3
-1.513
a
Correlations t
Sig.
Beta
Zero-order
Partial
Part
4.024
.007
.518
5.034
.002
.868
.899
.304
.612
.600
7.699
.000
.910
.953
.465
4.014
-.033
-.377
.719
.546
-.152
-.023
1
125
a. Regression Equatiom : Y = 30,818 + 2,687 X1 + 4,713 X2- 1,513 X3 Interpretation : a = 30,818 Without affected with no variable, the average of cars sold is about 30,818 or 31 unit of cars. b1 = 2,687 Every increasing of 1 minutes advertising, the average of cars sold will be increase as much as 2,687 or 3 unit of cars, considering sales force and city variable are constant. b2 = 4,713 Every increasing of 1 salespeople, the average of cars sold will be increase as much as 4,713 or 5 unit of cars, considering advertising and city variable are constant. b3 = -1,513 Every increasing of 1 point of distantce of the dealer to the city, the average of cars sold will be decrease as much as 1,513 or 2 unit of cars, considering advertising and sales force variable are constant. Estimation : Advertising = 15 minutes Sales Force = 20 salespeople The Dealer near the city (X3 = -1), [X=1 (farther to the city), X=-1 (nearby the city) Y = 30,818 + 2,687 X1 + 4,713 X2- 1,513 X3 Y = 30,818 + (2,687 x 15) + (4,731 x 20) – (1,513 x -1) Y = 167,256 ~ 168 So, there would be 168 cars sold by a dealership employing 20 salespeople, purchasing 15 minutes of advertising, and located in a city.
126
b
ANOVA Model
Sum of Squares
df
Mean Square
F
Sig.
4441.505
3
1480.502
89.370
.000
99.395
6
16.566
4540.900
9
Regression 1
Residual Total
a
a. Predictors: (Constant), X3, X2, X1 b. Dependent Variable: Y
b. Global Hypothesis Test Hypothesis : (Advertising, sales force, and dealer location variables simultaneous don’t affect significantly the amount of cars sold las month) (Advertising, sales force, and dealer location variables simultaneous affect significantly the amount of cars sold las month) The Value of F-Stat and F-table : F stat = 89,370
F tabel = 4,74
α = 0,05
v1 = k – 1 = 3 – 1 = 2 v2 = n – k = 10 – 3 = 7 Criteria : i. F-Table Test F stat ≤ F table → Ho accepted F stat > F table → Ho rejected F stat > F table, or 89,370> 4,74soHo rejected ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,000andα = 0,05 Sig. < α, or 0,000< 0,05, so
rejected
127
Conclusion : Using 5% significance level, advertising, sales force, and dealer location variables simultaneous affect significantly to the amount of cars sold last month. c. t-Test : 1. Partial Test of Advertising Variable to The Amount of Cars Sold Hypothesis : (Advertising variable partially doesn’t affect significantly to the amount of cars sold variable) (Advertising variable partially affects significantly to the amount of cars sold variable) Value of t-stat and t-table : t stat = 5,034 t table = 2,447 df = n – k – 1 = 10 – 3 – 1 = 6 α = 0,05 Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected tstat>ttable, or5,034>2,447, so Ho rejected ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,002andα = 0,05 Sig. < α, or0,002< 0,05so
rejected
Conclusion : Using 5% significance level, advertising variable partiallyaffects significantly to the amount of cars sold last month.
128
2. Partial Test of Sales Force Variable to The Amount of Cars Sold Hypothesis : (Sales force variable partially doesn’t affect significantly to the amount of cars sold variable) (Sales force variable partially affects significantly to the amount of cars sold variable) Value of t-stat and t-table : t stat = 7,699 t table = 2,447 df = n – k – 1 = 10 – 3 – 1 = 6 α = 0,05 Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected tstat>ttable, or7,699 > 2,447, so Ho rejected ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,000 and α = 0,05 Sig. < α, or0,000< 0,05so
rejected
Conclusion : Using 5% significance level, sales force variable partiallyaffects significantly to the amount of cars sold last month. 3. Partial Test of Dealer Location Variable to The Amount of Cars Sold Hypothesis : (Dealer location variable partially doesn’t affect significantly to the amount of cars sold variable) (Dealer location variable partially affects significantly to the amount of cars sold variable) 129
Value of t-stat and t-table : t stat = -0,377 t table = 2,447 df = n – k – 1 = 10 – 3 – 1 = 6 α = 0,05 Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected -ttable ≤ tstat ≤ ttable, or-2,447 <-0,377< 2,447, so Ho accepted ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,719 and α = 0,05 Sig. ≥ α, or0,719≥ 0,05so
accepted
Conclusion : Using 5% significance level, dealer location variable partiallydoesn’taffects significantly to the amount of cars sold last month. Variables Entered/Removed
b
Model Variables Entered Variables Removed 1
X3, X2, X1
a
.
Method Enter
a. All requested variables entered. b. Dependent Variable: Y
There is no variable should be removed or deleted from the model, although one variable (dealer location) doesn’t affect significantly to the amount of cars sold last month.
130
4. Menurut para pengusaha di bidang properti, faktor-faktor yang paling mempengaruhi harga apartemen adalah luas apartemen itu sendiri, jumlah ruangan di dalamnya, fasilitas apartemen, dan jarak apartemen ke pusat perbelanjaan dan rekreasi. Berikut ini adalah data yang diperoleh dari beberapa apartemen di Bandung : Harga
Luas
Jumlah
(Rp .000.000)
(m2)
Ruangan
Dago Suites
275
24
2
4
3
Grand Setiabudhi
300
32
3
5
8
Grand Asia Afrika
250
28
3
5
5
Marbella Suites
143
15
2
3
10
Newton Hybrid
460
40
4
6
7
Pasadena
226
35
3
5
15
Pinewood
178
20
2
3
25
The Majesty
294
27
2
3
12
The Jarrdin
330
33
3
6
10
The Edge
312
26
2
6
9
Nama Apartemen
Fasilitas
Jarak ke Pusat Perbelanjaan (Km)
a. Tentukan persamaan regresi dan berikan interpretasinya ! b. Tentukan koefisien determinasi, korelasi sederhana, dan korelasi parsial untuk semua variabel independen terhadap variabel dependen ! Interpretasikan.
Jawab : Coefficients
Model
1
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
(Constant)
66.637
112.822
X1
9.611
6.329
X2
-22.747
X3 X4
a
Correlations t
Sig.
Beta
Zero-order
Partial
Part
.591
.580
.806
1.519
.189
.799
.562
.360
59.483
-.181
-.382
.718
.661
-.169
-.091
8.105
26.863
.117
.302
.775
.704
.134
.072
-3.566
3.771
-.250
-.946
.388
-.450
-.389
-.224
a. Dependent Variable: Y
131
a. Persamaan regresi : Y = 66,637 + 9,611 X1– 22,747 X2+ 8,105 X3 – 3,566 X4 Interpretasi : a = 66,637 Tanpa dipengaruhi oleh variabel apapun, rata – rata harag apartemen di Bandung adalah sebesar Rp 66.637.000. b1 = 9,611 Artinya, setiap kenaikan luas apartemen sebesar 1 m2, maka rata – rata harga apartemen akan naik sebesar Rp 9.611.000 dengan variabel jumlah ruangan, fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi dianggap konstan. b2 = -22,747 Artinya setiap kenaikanjumlahruangan apartemen sebanyak1 ruangan, maka rata – rata harga apartemen akan turun Rp 22.747.000 dengan variabel luas apartemen, fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi dianggap konstan. b3 = 8,105 Artinya, setiap kenaikan jumlah fasilitas apartemen sebanyak 1 macam, maka rata –rata harga apartemen akan naik sebesar Rp 8.105.999 dengan variabel luas apartemen, jumlah ruangan, dan jarak ke pusat perbelanjaanm dan rekreasi dianggap konstan. b4 = -3,566 Artinya setiap kenaikan jarak apartemen ke pusat perbelanjaan dan rekreasi sebanyak1 km, maka rata – rata harga apartemen akan turun sebesar Rp 3.566.000 dengan variabel luas apartemen, jumlah ruangan, dan fasilitas dianggap konstan.
132
Model Summary Model
R
R Square
1
.848
a
Adjusted R Square Std. Error of the Estimate
.719
.494
62.50674
a. Predictors: (Constant), X4, X1, X3, X2 Correlations
Pearson Correlation
Sig. (1-tailed)
N
Y
X1
X2
X3
X4
Y
1.000
.799
.661
.704
-.450
X1
.799
1.000
.863
.752
-.248
X2
.661
.863
1.000
.678
-.269
X3
.704
.752
.678
1.000
-.420
X4
-.450
-.248
-.269
-.420
1.000
Y
.
.003
.019
.011
.096
X1
.003
.
.001
.006
.245
X2
.019
.001
.
.016
.226
X3
.011
.006
.016
.
.113
X4
.096
.245
.226
.113
.
Y
10
10
10
10
10
X1
10
10
10
10
10
X2
10
10
10
10
10
X3
10
10
10
10
10
X4
10
10
10
10
10
b.
Koefisien Determinasi : R2 = 0,494 (Adjusted R2) Koefisien Non Determinasi : K2 = 1 - R2 = 1 – 0,494 = 0,506 Artinya,variabel luas apartemen, jumlah ruangan, fasilitas, dan jarak apartemen ke pusat perbelanjaan dan rekreasi mampu menjelaskan variasi dari harga apartemensebesar 49,4%, dan sisanya sebesar 50,6% dijelaskan oleh faktor lain di luar model.
Koefisien Korelasi Berganda (R) = 0,848 Artinya, hubungan keseluruhan antara variabel harga apartemen, variabel luas apartemen, jumlah ruangan, fasilitas, dan jarak apartemen ke pusat perbelanjaan dan rekreasiadalah searah dan sifatnya erat yaitu sebesar 0,848 atau 84,8%.
133
Koefisien Korelasi Parsial (r) ry1.234 = 0,799 Artinya hubungan antara variabel luas apartemen secara parsial terhadap variabel harga apartmenadalah searah dan sifatnya eratdengan nilai sebesar 0,799, dengan menganggap konstan variabel jumlah ruangan, fasilitas, dan jarak ke pusat perbeanjaan dan rekreasi. ry2.134 = 0,661 Artinya hubungan antara variabel jumlah ruangan secara parsial terhadap variabel harga apartemenadalah searah dan sifatnya cukup eratdengan nilai sebesar 0,661, dengan menganggap konstan variabel luas apartemen, fasilitas, dan jarak ke pusat perbelanjaan dan rekreasi. ry3.124 = 0,704 Artinya hubungan antara variabel fasilitas secara parsial terhadap variabel harga apartmenadalah searah dan sifatnyaeratdengan nilai sebesar 0,704, dengan menganggap konstan variabel luas apartmen, jumlah ruangan, dan jarak ke pusat perbelanjaan dan rekreasi. ry4.123 = -0,405 Artinya hubungan antara variabel jarak ke pusat perbelanjaan dan rekreasi secara parsial
terhadap
variabel
harga
apartmenadalah
berlainan
arah
dan
sifatnyacukup eratdengan nilai sebesar 0,405, dengan menganggap konstan variabel luas apartmen, jumlah ruangan, dan fasilitas. r12.y34 = 0,863 Artinya hubungan antara variabel luas apartemen dan variabel jumlah ruangan secara parsial adalah searah dan sifatnya eratdengan nilai sebesar 0,863, dengan menganggap variabel lainnya konstan. r13.y24 = 0,752 Artinya hubungan antara variabel luas apartemen dan variabel fasilitas secara parsial adalah searah dan sifatnya eratdengan nilai sebesar 0,752, dengan menganggap variabel lainnya konstan. r14.y23 = -0,248 Artinya hubungan antara variabel luas apartemen dan variabel jarak ke pusat perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya sangat lemahdengan nilai sebesar 0,248, dengan menganggap variabel lainnya konstan. 134
R23.y14 = 0,678 Artinya hubungan antara variabel jumlah ruangan dan variabel fasilitas secara parsial adalah searah dan sifatnya cukup eratdengan nilai sebesar 0,678, dengan menganggap variabel lainnya konstan. R24.y13 = -0,269 Artinya hubungan antara variabel jumlah ruangan dan variabel jarak ke pusat perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya sangat lemahdengan nilai sebesar 0,269, dengan menganggap variabel lainnya konstan. R34.y12 = -0,420 Artinya hubungan antara variabel fasilitas dan variabel jarak ke pusat perbelanjaan dan rekreasi secara parsial adalah berlainanarah dan sifatnya cukup eratdengan nilai sebesar 0,420, dengan menganggap variabel penlainnya konstan.
5. Karina owns a catering company that prepares food and beverages for banquets and parties. But Karina is quite uncertain about her estimation of food-beverage and labor cost over theoverhead cost estimation, it’s all because of the increase of gasoline price.The overhead estimation was based on the actual data for the past 12 monthswhich are presented here. These data indicate the overhead cost vary with direct labor-hours used and electricity used for cooking. Month
Labor Hours
Electricity (Kwh)
Overhead Cost ($)
January
1500
7400
67000
February
1700
8800
73000
March
2000
9250
65000
April
3100
9480
70000
May
6400
10000
78000
June
4500
10300
71000
July
5500
11210
76500
August
3400
6900
68700
September
6000
8000
75430
October
3500
7760
72990
November
3100
7600
70400
December
5300
9520
74000 135
a. Determine regression equation for Karina’s Catering Company, then interpret it! b. Determine determination and nondetermination coefficient and interpret the value! c. Find the difference between predicted overhead cost variable and actual overhead cost ! d. Determine the multiple regression correlation coefficient and all possible partial correlation ! How strong it is ? e. Conduct a global test of hypothesis with α = 5% ! f. Using α = 5%, conduct a test of hypothesis for the individual regression coefficients ! Jawab : Coefficients
Model
Unstandardized
Standardized
Coefficients
Coefficients
B (Constant) 62878.868 1
Std. Error
a
Correlations t
Sig.
Beta
5088.530
Zero-order Partial Part 12.357
.000
X1
1.783
.500
.775
3.568
.006
.813
.765
.687
X2
.240
.636
.082
.377
.715
.440
.125
.073
a. Dependent Variable: Y
a. Regression Equation : Y = 62.878,868 + 1,783 X1 + 0,24 X2 Interpretation : a = 62.878,868 Without affected with no variable, the average of overhead cost is about $62.878,868. b1 = 1,783 Every increasing of 1 hour of labor-hour, the average of overhead cost will be increase as much as $1,783, considering electricity variable is constant. b2 = 0,240 Every increasing of 1 Kwh of electricity, the average of overhead cost will be increase as much as $0,240, considering labor-hour variable is constant.
136
Model Summary Model
R
1
.816
R Square
Adjusted R Square
Std. Error of the Estimate
.666
.592
2482.01916
a
a. Predictors: (Constant), X2, X1
b. Determination Coefficient : R2 = 0,592 (Adjusted R2) Nondetermination Coefficient: K2 = 1 - R2 = 1 – 0,592 = 0,408 It means that labor hour and electricity variable explained the variation of overhead cost of Karina’s Catering Company as much as 59,2%,and the 40,8% residualvalueis explained by another factor out of the model. c. Standard Error of Estimate (SE) SE = 2482,01916 It means that the difference between predicted overhead cost variable and actual overhead cost is about $2482,01916. d. Multiple Regression Correlation (R) = 0,986 A whole relation between overhead cost, labor hour, dan electricity variable is positive and have a very strong relation, it’s 0,986. Correlations
Pearson Correlation
Sig. (1-tailed)
N
Y
X1
X2
Y
1.000
.813
.440
X1
.813
1.000
.463
X2
.440
.463
1.000
Y
.
.001
.076
X1
.001
.
.065
X2
.076
.065
Y
12
12
12
X1
12
12
12
X2
12
12
12
.
137
ry1.2 = 0,813 The relation between labor hour variable partially to overhead cost variable is positive and strong with 0,813 value of correlation, considering electricity variable is constant. ry2.1 = 0,440 The relation between electricity variable partially to overhead cost variable is positive and strong enough with 0,440 value of correlation, considering labor hour variable is constant. r12.y = 0,463 The partial relation between labor hour and electricity variable partially is positive and strong enough with 0,463 value of correlation, considering overhear cost variable is constant.
e. Global Hypothesis Test (F-Test) b
ANOVA
1
Model
Sum of Squares
df
Mean Square
F
Sig.
Regression
110674528.067
2
55337264.034
8.983
.007
Residual
55443771.933
9
6160419.104
Total
166118300.000
11
a
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Hypothesis : (Labor hour and electricity variables simultaneous don’t affect significantly the overhead cost) (Labor hour and electricity variables simultaneous affect significantly the overhead cost) The Value of F-Stat and F-table : F stat = 8,983
F tabel = 4,96
α = 0,05
v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 12 – 2 = 10
138
Criteria : i. F-Table Test F stat ≤ F table → Ho accepted F stat > F table → Ho rejected F stat > F table, or 8,983> 4,96soHo rejected ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,007 and α = 0,05 Sig. < α, or 0,007 < 0,05, so
rejected
Conclusion : Using 5% significance level, advertising, sales force, and dealer location variables simultaneous affect significantly to the amount of cars sold last month.
f. Individual Hypothesis Test (t-Test) 1. Partial Test of Labor Hour Variable to The Overhead Cost Hypothesis : (Labor hour variable partially doesn’t affect significantly to the overhead cost variable) (Labor hour variable partially affects significantly to the overhead cost variable) Value of t-stat and t-table : t stat = 3,568 t table = 2,262 df = n – k – 1 = 12 – 2 – 1 = 9 α = 0,05 Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected tstat>ttable, or3,568 > 2,262, so Ho rejected 139
ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,006 and α = 0,05 Sig. < α, or0,006< 0,05so
rejected
Conclusion : Using 5% significance level, labor hour variable partiallyaffects significantly to the overhead cost of Karina’s Catering Company. 2. Partial Test of ElectricityVariable to The Overhead Cost Hypothesis : (Electricity variable partially doesn’t affect significantly to the overhead cost variable) (Electricity variable partially affects significantly to the overhead cost variable) Value of t-stat and t-table : t stat = 0,377 t table = 2,262 df = n – k – 1 = 12 – 2 – 1 = 9 α = 0,05 Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected -ttable ≤ tstat ≤ ttable, or-2,262<0,377 < 2,262, so Ho accepted ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,715 and α = 0,05 Sig. ≥ α, or0,715≥ 0,05so
accepted
140
Conclusion : Using 5% significance level, electricity variable partiallydoesn’taffects significantly to the overhead cost of Karina’s Catering Company. 6. Consider a study designed to examine the role of television viewing in the lives of selected group of people over 65 years of age. The purpose of the study was to provide guidelines for developing television programming that would adequately meet the special needs of the audience. A sample of 25 senior citizen was selected and from each senior citizen the following data were obtained : y = the average number of hours per day an interviewee spend watching television; x1 = the age of the interviewee; and x3 = the number of years of education of the interviewee. The data are listed below : Individual
Hours
Age
Education
A
0,5
73
14
B
0,5
66
16
C
0,7
65
15
D
0,8
65
16
E
0,8
68
9
F
0,9
69
10
G
1,1
82
12
H
1,6
83
12
I
1,6
81
12
J
2,0
72
10
K
2,5
69
8
L
2,8
71
16
M
2,8
71
12
N
3,0
80
9
O
3,0
71
6
P
3,0
75
6
Q
3,2
76
10
R
3,2
78
6
S
3,3
79
6
T
3,3
79
4 141
U
3,4
78
6
V
3,5
76
9
W
3,6
65
12
X
3,7
72
12
Y
3,7
80
6
a. Determine regression equation for this study, then interpret it! b. Determine determination and nondetermination coefficient and interpret the value! c. Find the difference between predicted average number of hours spent by interviewee for watching televison variable and actual value of that dependent variable ! d. Determine the multiple regression correlation coefficient and all possible partial correlation ! How strong it is ? e. Conduct a global test of hypothesis with α = 5% ! f. Using α = 5%, conduct a test of hypothesis for the individual regression coefficients ! Jawab : Coefficients
Model
1
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
(Constant)
3.355
3.182
X1
.010
.038
X2
-.178
.061
a
Correlations t
Sig.
Beta
Zero-order
Partial
Part
1.054
.303
.053
.272
.788
.328
.058
.046
-.571
-2.928
.008
-.596
-.530
-.500
a. Dependent Variable: Y
a. Regression Equation : Y = 3,355 + 0,01 X1–0,178 X2 Interpretation : a = 3,355 Affected with no variable, the average hours that the interviewee spent for watching television is about 3,355 hours.
142
b1 = 0,01 Every increasing of 1 year age, the average hours that the interviewee spent for watching television will be increase as much as 0,01 hours, considering education variable is constant. b2 = -0,178 Every increasing of 1 year of education, the average hours that the interviewee spent for watching television will be decrease as much as 0,178 hours, considering age variable is constant. Model Summary Model
R
R Square
1
.598
a
Adjusted R Square Std. Error of the Estimate
.358
.299
.94240
a. Predictors: (Constant), X2, X1
b. Determination Coefficient : R2 = 0,299 (Adjusted R2) Nondetermination Coefficient : K2 = 1 - R2 = 1 – 0,299 = 0,701 It means that age and education variable explained the variation of time spent for watching televison as much as 29,9%,and the 70,1% residualvalueis explained by another factor out of the model. c. Standard Error of Estimate (SE) SE = 0,94240 It means that the difference between predicted time spent for watching television variable and actual time spent for watching television is about 0,94240 hours. d. Multiple Regression Correlation (R) = 0,598 A whole relation between time spent by interviewee for watching televison, age, and education variable is positive and have a strong enough correlation, it’s 0,598.
143
Correlations
Pearson Correlation
Sig. (1-tailed)
N
Y
X1
X2
Y
1.000
.328
-.596
X1
.328
1.000
-.482
X2
-.596
-.482
1.000
Y
.
.055
.001
X1
.055
.
.007
X2
.001
.007
.
Y
25
25
25
X1
25
25
25
X2
25
25
25
ry1.2 = 0,328 The relation between age variable partially to time spent by inteviewee for watching television variable is positive and weak with 0,328 value of correlation, considering education variable is constant. ry2.1 = -0,596 The relation between education variable partially to time spent by inteviewee for watching televisionvariable is negative and strong enough with 0,596 value of correlation, considering age variable is constant. r12.y = -0,482 The partial relation between age and education variable is negative and strong enough with 0,482 value of correlation, considering the time spent by inteviewee for watching televisionvariable is constant. e. Global Hypothesis Test (F-Test) b
ANOVA Model
1
Sum of Squares
df
Mean Square
F
Sig.
Regression
10.888
2
5.444
6.130
.008
Residual
19.539
22
.888
Total
30.426
24
a
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
144
Hypothesis : (Age and education variables simultaneous don’t affect significantly the time spent by inteviewee for watching television) (Age and education variables simultaneous affect significantly the time spent by inteviewee for watching television) The Value of F-Stat and F-table : F stat = 6,130
F tabel = 4,24
α = 0,05
v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 25 – 2 = 23 Criteria : j. F-Table Test F stat ≤ F table → Ho accepted F stat > F table → Ho rejected F stat > F table, or 6,130> 4,24soHo rejected iii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,008 and α = 0,05 Sig. < α, or 0,008< 0,05, so
rejected
Conclusion : Using 5% significance level, age and education variables simultaneous affect significantly to the time spent by inteviewee for watching television. f. Individual Hypothesis Test (t-Test) 1. Partial Test of AgeVariable to The Time Spent By Inteviewee For Watching Television Hypothesis : (Age variable partially doesn’t affect significantly to the time spent by inteviewee for watching television variable) (Age variable partially affects significantly to the time spent by inteviewee for watching televisionvariable)
145
Value of t-stat and t-table : t stat = 0,272 t table = 2,074 df = n – k – 1 = 25 – 2 – 1 = 22 α = 0,05 Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected -ttable ≤ tstat ≤ ttable, or-2,074 < 0,272 < 2,262, so Ho accepted ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,788 and α = 0,05 Sig. ≥ α, or0,788< 0,05so
accepted
Conclusion : Using 5% significance level, age variable partiallydoesn’t affectsignificantly to the time spent by inteviewee for watching television. 2. Partial Test of EducationVariable to The Time Spent By Inteviewee For Watching Television Hypothesis : (Education variable partially doesn’t affect significantly to the time spent by inteviewee for watching televisionvariable) (Education variable partially affects significantly to the time spent by inteviewee for watching televisionvariable) Value of t-stat and t-table : t stat = -2,928 t table = 2,074 df = n – k – 1 = 25 – 2 – 1 = 22 α = 0,05 146
Criteria : i. t-Table Test
-ttable ≤ tstat ≤ ttable→ Ho accepted tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected tstat< -ttable, or-2,928<-2,074, so Ho rejected ii. Sig. Test Sig. ≥ α →
accepted
Sig. < α →
rejected
Sig. = 0,008 and α = 0,05 Sig. < α, or0,008< 0,05so
rejected
Conclusion : Using 5% significance level, education variable partiallyaffects significantly to the time spent by inteviewee for watching television.
7. Deasy, pemilik perkebunan tembakau yang relatif besar di Sumedang, selama 2 tahun terakhir, Deasy melakukan uji coba pemberian 2 jenis pupuk pada tanaman tembakaunya demi mendapatkan tembakau dengan kualitas terbaik, yaitu pupuk jenis Zwazelzure Kali (ZK) dan pupuk jenis Zwazelzure Amoniak (ZA). Tembakau jenis ini dipanen setiap 4 bulan sekali, sehingga didapat 8 data penggunaan kedua jenis pupuk terhadap hasil panen tembakau. Berikut data yang berhasil diperoleh : Hasil Panen
Pupuk ZK
Pupuk ZA
(Kw)
(Kg)
(Kg)
Panen I
160
75
60
Panen II
200
125
100
Panen III
250
130
125
Panen IV
185
100
97
Panen V
300
170
156
Panen VI
325
175
160
Panen VII
400
230
218
Panen VIII
500
200
230
Waktu Panen
147
a. Tentukan persamaan regresinya dan interpretasikan ! b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial !Interpretasikan ! c. Lakukan pengujian secara parsial antar variabel hasil panen dan jumlah pupuk ZK yang digunakan, juga variabel hasil panen dan jumlah pupuk ZA yag digunakan, dengan tingkat signifikansi 5% ! d. Lakukan pengujian simultan antara variabel jumlah pupuk ZK dan variabel jumlah pupuk ZA yang digunakan terhadap variabel hasil panen tembakau ! e. Jika anda juga memiliki perkebunan tembakau, apakah anda harus menambah pupuk ZK saja, pupuk ZA saja, atau keduanya ? Jawab : Coefficients Unstandardized
Standardized
Coefficients
Coefficients
Model
1
B
Std. Error
(Constant)
54.154
27.025
X1
-1.286
.586
X2
2.998
.513
a
Correlations t
Sig.
Beta
Zero-order
Partial
Part
2.004
.101
-.576
-2.195
.080
.902
-.700
-.152
1.532
5.839
.002
.976
.934
.403
a. Dependent Variable: Y
a. Persamaan regresi : Y = 54,154–1,286 X1 + 2,998 X2 Interpretasi : a = 54,154 Tanpa dipengaruhi oleh variabel apapun, rata – rata hasil panen yang dihasilkanadalah sebanyak 54,154 Kwintal. b1 = -1,286 Artinya, setiap kenaikan penggunaan pupuk ZK sebanyak 1 Kg, maka rata – rata hasil panen akan turun sebesar 1,286 Kwintal dengan variabel penggunaan pupuk ZA dianggap konstan.
148
b2 = 2,998 Artinya, setiap kenaikan penggunaan pupuk ZA sebanyak 1 miliar rupiah, maka rata – rata hasil panen akan naik sebanyak2,998 Kwintal dengan variabel penggunaan pupuk ZK dianggap konstan. Model Summary Model
R
R Square
1
.988
a
Adjusted R Square Std. Error of the Estimate
.976
.967
21.29678
a. Predictors: (Constant), X2, X1
b. Koefisien determinasi : R2 = 0,967 (Adjusted R2) Koefisien nondeterminasi : K2 = 1 - R2 = 1 – 0,967 = 0,033 Artinya,variabel penggunaan pupuk ZKdanvariabel penggunaan pupuk ZA mampu menjelaskan variasi dari hasil panen Tembakausebesar 96,7%, dan sisanya sebesar 3,3% dijelaskan oleh faktor lain di luar model. c. Standard Error of Estimate (SE) SE = 21,29678 Artinya, rata-rata penyimpangan variabel hasil panen tembakau yang diprediksi dengan variabel hasil panen tembakau yang sebenarnya adalah sebanyak21,29678 Kwintal. d. Koefisien korelasi berganda (R) = 0,988 Artinya,
hubungan
keseluruhan
antara
variabel
hasil
panen
tembakau,
variabelpenggunaan pupuk ZK, dan variabel penggunaan pupuk ZAadalah searah dan sifatnya sangat erat yaitu sebesar 0,988. Correlations
Pearson Correlation
Sig. (1-tailed)
N
Y
X1
X2
Y
1.000
.902
.976
X1
.902
1.000
.965
X2
.976
.965
1.000
Y
.
.001
.000
X1
.001
.
.000
X2
.000
.000
.
Y
8
8
8
X1
8
8
8
X2
8
8
8
149
Koefisien Korelasi Parsial : ry1.2 = 0,902 Artinya hubungan antara variabel penggunaan pupuk ZK secara parsial terhadap variabel hasil panen tembakauadalahsearah dan sifatnya sangat erat dengan nilai sebesar 0,902, dengan menganggap variabel penggunaan pupuk ZA ekspor konstan. ry2.1 = 0,976 Artinya hubungan antara variabel penggunaan pupuk ZA secara parsial terhadap variabel hasil panen tembakauadalahsearah dan sifatnya sangat erat dengan nilai sebesar 0,976, dengan menganggap variabel penggunaan pupuk ZK konstan. r12.y = 0,965 Artinya hubungan antara variabel penggunaan pupuk ZK dan variabel penggunaan pupuk ZA secara parsial adalahsearah dan sifatnya sangat eratdengan nilai sebesar 0,965, dengan menganggap variabel hasil panen tembakau konstan. e. Uji t statistik : 1. Uji Parsial variabel Hasil Panen terhadap Variabel Penggunaan Pupuk ZK Hipotesis : (variabelpenggunaan pupuk ZK secara parsial tidak berpengaruh signifikanterhadap variabel hasil panen tembakau) (variabelpenggunaan pupuk ZK secara parsial berpengaruh signifikanterhadap variabel hasil panen tembakau) Nilai t stat dan t tabel : t stat = -2,195 t tabel = 2,571 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05 Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,571< -2,195 <2,571makaHo tidak dapat ditolak 150
ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,08 dan α = 0,05 Ternyata Sig. ≥ α, yaitu 0,08≥ 0,05 maka
tidak dapat ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZK secara parsial tidak berpengaruh signifikan terhadap variabel hasil panen tembakau
2. Uji Parsial Variabel Hasil PanenTerhadap Variabel Penggunaan Pupuk ZA Hipotesis : (variabelpenggunaan pupuk ZA secara parsial tidak berpengaruh signifikanterhadap variabel hasil panen tembakau) (variabelpenggunaan pupuk ZA secara parsial berpengaruh signifikan terhadap variabel hasil panen tembakau) Nilai t stat dan t tabel : t stat = 5,839 t tabel = 2,571 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05 Kriteria uji : i. Uji tabel t
-ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat> ttabel, yaitu 5,839> 2,571makaHo ditolak ii. Uji sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,002 dan α = 0,05 Ternyata Sig. < α, yaitu 0,008 < 0,05 maka
ditolak 151
Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZA secara parsial berpengaruh signifikan terhadap variabel hasil panen tembakau.
g. Uji F statistik b
ANOVA Model
1
Sum of Squares
df
Mean Square
Regression
92882.235
2
46441.118
Residual
2267.765
5
453.553
Total
95150.000
7
F
Sig. a
102.394 .000
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Hipotesis : (variabelpenggunaan pupuk ZKdan variabel penggunaan pupuk
ZA
secarabersama-sama
tidak
berpengaruh
signifikan terhadap variabel hasil panen tembakau) (variabelpenggunaan pupuk ZK dan variabel penggunaan pupuk ZA secara bersama-sama berpengaruh signifikan terhadap variabel hasil panen tembakau) Nilai F stat dan F tabel : F stat = 102,394
F tabel = 5,99
α = 0,05
v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 8 – 2 = 6 Kriteria uji : i. Uji tabel F F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak Ternyata F stat > F tabel, yaitu 102,394>5,99 maka Ho ditolak
152
ii. Uji Sig. Sig. ≥ α →
tidak dapat ditolak
Sig. < α →
ditolak
Sig. = 0,000 dan α = 0,05 Ternyata Sig. < α, yaitu 0,000< 0,05, maka
ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZKdan variabel penggunaan pupuk ZAsecara bersama-sama berpengaruh signifikan terhadap variabel hasil panen tembakau.
153
CHI-SQUARE Bila kita mempunyai dua macam proporsi dan kita ingin menguji apakah perbedaan antar kedua proporsi itu signifikan atau tidak, maka disini kita menggunakan pengujian hipotesa mengenai beda dua proporsi. Perluasan dari pada pengujian selisih proporsi (beda antara dua proporsi) adalah pengujian Chi Kuadrat, karena didalam pengujian ini kita mengadakan pengujian hipotesa tentang perbedaan proporsi dari proporsi yang banyaknya lebih dari dua. Dengan perkataan lain, pengujian 2 ada-lah pengujian hipotesa mengenai perbe-daan k proporsi dimana k 2 proporsi. Chi square merupakan suatu ukuran yang menyangkut perbedaan yang terdapat di antara frekuensi pengamatan dengan frekuensi teoritis/frekuensi harapan (Schaum’s). Maksud dari pengujian chi square adalah untuk membandingkan fakta yang diperoleh berdasarkan hasil observasi dan fakta yang didasarkan secara teoritis (Drs. Andi Supangat, M.Si.) Dalam statistik, distribusi chi-square (dilambangkan dengan χ2 BUKAN X2) termasuk dalam statistik nonparametrik. Distribusi nonparametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui. Distribusi ini sangat bermanfaat dalam melakukan analisis statistik jika kita tidak memiliki informasi tentang populasi atau jika asumsi-asumsi yang dipersyaratkan untuk penggunaan statistik parametrik tidak terpenuhi. Berikut ini beberapa hal yang berhubungan dengan chi square: a.
Adanya derajat kebebasan/ degree of freedom (df). Besarnya df menunjukan banyak observasi yang bebas untuk bervariasi sesudah batasan-batasan tertentu dikenakan pada data. (Sidney Siegel)
b.
Chi-square tidak pernah bernilai negatif. Hal ini dikarenakan selisih antara frekuensi data observasi ( f o ) dengan frekuensi data yang diharapkan f e dikuadratkan, yaitu f o f e 2
c.
Jika χ2= 0 maka frekuensi-frekuensi teoritis sama dengan frekuensi pengamatan. Jika χ2>0 maka frekuensi-frekuensi teoritis tidak tepat sama dengan frekuensi pengamatan. Semakin besar nilai χ2 semakin besar pula perbedaan antara frekuensi yang diobservasi dan frekuensi teoritis.
d.
Distribusi chi-square adalah menceng kanan. Jika n nya sangat besar maka distribusi χ 2 ini mendekati distribusi normal.
1. Penaksiran Standar Deviasi Dalam pembahasan sebelumnya telah di sampaikan bahwa pada umumnya ada dua cara menaksir, yakni titik taksiran dan interval taksiran. Titik taksiran untuk σ2 digunakan varians dari sampel yang dipakai sebagai bahan untuk menaksir. Guna mendapatkan interval taksiran parameter σ maka:
154
s 2 (n 1)
rumus :
2 / 2
dimana:
s 2 (n 1)
12 / 2
; df = n-1
s = standar deviasi n = banyaknya data yang diobservasi α = tingkat signifikansi
2 / 2 dan 12 / 2 didapat dari daftar distribusi chi-square dengan df = n-1 dan p masing-masing sama dengan dan 1- . 2
2
Uji Hipotesis Standar Deviasi Langkah-langkah pengujian standar deviasi: 1. Tentukan hipotesis awal dan alternatifnya Uji dua pihak
Uji pihak kanan
Uji pihak kiri
Ho : a
Ho : a
Ho : a
Ha : a
Ha : a
Ha : a
2. Tentukan uji kriteria distribusi χ dengan df = n-1 dan tingkat signifikansi α 3. Lakukan uji statistik pada data yang diobservasi dengan menggunakan rumus:
4.
s n 1
; df = n-1
Bandingkan nilai χ dengan nilai distribusi χ yang telah didapat pada langkah sebelumnya sesuai kriteia uji yang digunakan
5. Buat kesimpulan
Ho tidak dapat ditolak Ho ditolak
Uji dua pihak
Uji pihak kanan
Uji pihak kiri
1 / 2 / 2
1
/ 2 1 / 2
1
155
2. Uji Chi-Square Dari Data Multinomial Uji ini dilakukan untuk meneliti peristiwa yang terdiri lebih dari dua golongan. Eksperimen yang dilakukan sebanyak n kali dan hasilnya dicatat, dikumpulkan menrut golongan atau kategorinya masing-masing lalu diperoleh sebuah data, data yang diperoleh demikian dinamakan data multinomial.(Sudjana) Langkah-langkah: 1. Tentukan hipotesis awal dan hipotesis alternatifnya Ho : 1 2 3 ... c Ha : terdapat paling sedikit satu tanda ≠ 2.
Tentukan nilai 2 pada distribusi chi-square dengan df = c-1 dan tingkat signifikansi α dimana c adalah banyaknya kolom dari data.
3.
Lakukan uji statistik dengan menggunakan rumus
2
( oi e j ) 2 ej
Dimana: oi = data hasil observasi ej = data yang diharapkan atau diestimasikan 4.
lakukan uji kriteria dengan membandingkan nilai 2 dan 2 , yaitu:
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak 5.
Buat kesimpulan
3. Uji Chi-Square dari Tabel Kontingensi Tabel kontingensi merupakan tabel klasifikasi dua arah yang terdiri dari banyak kolom dan banyak baris yang merupakan pengambangan konsep dari uji chi-square data multinomial yang menggunakan tabel klasifikasi satu arah atau hanya sebuah variabel saja. Langkah-langkah: 1. Tentukan hipotesis awal dan alternatifnya Ho : 11 12 13 ... 1c
21 22 23 ... 2c 31 32 33 ... 3c Ha : terdapat paling sedikit satu tanda ≠ 156
2. Tentukan nilai 2 dari distribusi chi-square dengan tingkat signifikansi α dan df = (r-1).(c-1), dimana r adalah banyaknya baris dari data dan c adalah banyaknya kolom dari data. 3. Lakukan uji statistik dengan menggunakan rumus:
2
o
eij
2
ij
eij
Dimana: oij= data hasil observasi dari baris ke-i kolom ke-j eij= data hasil estimasi dari baris ke-i kolom ke-j 4. Tentukan uji kriterianya
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak 5. Buat kesimpulan
Koefisien Kontingensi (C) Koefisien kontingensi yaitu bilangan yang digunakan untuk menentukan derajat hubungan antara dua faktor yang telah disusun dalam daftar kontingensi. Rumus: C
2 n 2
dengan nilai maksimum
Cmax
m 1 m
Dimana: n = banyaknya data m = banyaknya baris atau kolom minimal keterangan: Cmax-C < C, hubungan erat Cmax-C = C, hubungan cukup erat Cmax-C > C, hubungan kurang erat
Contoh Soal Dilakukan suatu penelitianterhadap seorang penjual sepatu untuk mengetahui apakah ada pengaruh warna sepatu terhadap banyaknya sepatu yang terjual. Berikut adalah hasil pengamatan sepatu berbagai warna selama satu periode tertentu:
157
Warna Sepatu Sepatu
Hitam
yang 90
Putih
Biru
Coklat
Total
55
25
30
200
terjual (unit)
Pada tingkat signifikansi 1% dapatkah disimpulkan bahwa warna sepatu tersebut berpengaruh terhadap banyaknya sepatu yang terjual?
Jawab: Ho: 1 2 3 4 Ha: terdapat paling sedikit satu ≠ df = c-1= 4-1 = 3 α = 1%
2 = 11, 3449
Uji statistik: ej
o 200 50 e
2
4
o e2 e
2 2 2 2 90 50 55 50 25 50 30 50
50
50
50
50
53
Uji kriteria:
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak Ternyata 53>11,3449 atau 2 2 → Ho ditolak
Pada tingkat signifikansi 1% hasil pengamatan diatas menunjukkan bahwa warna sepatu mempengaruhi banyaknya sepatu yang terjual karena perbedaannya signifikan.
158
SOAL CHI-SQUARE
1. Banyaknya orang yang berbelanja ke sebuah toko setiap hari selama 6 hari adalah sebagai berikut : Hari
Senin
Selasa
Rabu
Kamis
Jumat
Sabtu
Jumlah yang
127
112
121
109
132
149
berbelanja
Apakah banyaknya orang yang berbelanja itu tergantung dari nama-nama hari
ataukah
tidak? Penyelesaian 1) . H0 : banyaknya orang yang berbelanja ke toko itu tidak tergantung pada nama hari. H1 : banyaknya orang yang berbelanja ke toko itu tergantung pada nama hari. 2) df = k – 1 = 6 – 1 = 5 α = 0,05 χα2 = 11,0705 3)
2 2 127 125 112 125 2
125
125
2 149 125 ....
125
8,56
4) . Kriteria: H0 diterima H0 ditolak 5) Ternyata : H0 diterima 6) Kesimpulan : Meskipun banyaknya orang berbelanja tiap hari tidak sama, akan tetapi karena perbedaan hari itu tidak signifikan, maka banyaknya orang yang berbelanja ke toko tersebut setiap harinya selama seminggu adalah sama.
2. Ada yang berpendapat bahwa pekerja-pekerja yang berasal dari dalam kota pada umunya kurang rajin bila dibandingkan dengan pekerja-pekerja dari luar kota. Untuk menguji pendapat ini diadakan penilaian terhadap kerajinan bekerja dari 50 orang pekerja dan diperoleh data seperti dibawah ini :
159
Kerajinan Pekerja
Rajin
Kurang Rajin
Dalam Kota
5
5
Luar Kota
25
15
Asal Pekerja
Penyelesaian 1) H0 : tingkat kerajinan dengan asal pekerja tidak ada hubungan (independen). H1 : tingkat kerajinan dengan asal pekerja ada hubungan (dependen). 2) df = (r – 1).(k – 1) = (2 – 1).(2 – 1) = 1 α = 5% = 0,05 χα2 = 3,841 3)
Kerajinan Pekerja
Rajin
Kurang Rajin
Dalam Kota
(30).(10)/50 = 6
(20).(10)/50 = 4
Luar Kota
(30).(40)/50 = 24
(20).(40)/50 =16
Rajin
Kurang Rajin
Asal Pekerja
Kerajinan Pekerja
Asal Pekerja Dalam Kota
5
5 6
Luar Kota
25
24
4 15
16 160
4) . Kriteria: H0 tidak ditolak H0 ditolak 5) Ternyata : < H0 tidak ditolak 6) Kesimpulan : Kita tidak menolak hipotesa. Dengan perkataan lain, tidak terdapat hubungan
antara
kerajinan pekerja dengan asal pekerja.
3. Simpangan baku dari masa hidup semacam lampu pijar adalah 36 jam dengan sampel 26 buah. Tentukanlah batas-batas taksiran simpangan baku dari masa hidup seluruh produksi lampu, dengan menggunakan tingkat kepercayaan 95%!
α = 5%
Dik
: s = 36
n = 26
Dit
: taksiran simpangan baku
Jawab :
Df = 25 = 40,6465
s 2 (n 1)
2 / 2
√
(
28,2325349
)
(
) = 13,91197
s 2 (n 1)
12 / 2
√
(
)
48,2589856
Dengan tingkat signifikansi 5% maka batas-batas taksiran simpangan baku dari masa hidup seluruh produksi lampu adalah antara 28,2325349 jam dan 48,2589856 jam.
161
4. The Federal Correction Agency wants to investigate the question citied below: Does a male released from federal prison make a different adjustment to civilian life if he returns to his hometown or if he goes elsewhere to live? The agency’s psychologist interviewed 200 randomly selected former prisoners.
Adjustment to civilian life Residence After
Outstanding
Good
Fair
Unsatisfactory
Hometown
27
35
33
25
Not Hometown
13
15
25
25
Released from Prison
To put it another way, is there a relationship between adjustment to civilian life and place of residence after released from prison?
Dik : Ho :there is no relationship between adjustment to civilian life and place of residence after released from prison Ha : there is a relationship between adjustment to civilian life and place of residence after released from prison df= (r-1)(c-1)=(2-1)(4-1)= 3
α = 1% 2 = 11,345
Residence After
Outstanding
Good
Fair
Unsatisfactory
Total
Hometown
27
35
33
25
120
Not Hometown
13
15
25
25
80
Total
40
50
60
50
200
Released from Prison
162
eij
2
(
o
o o o io
oj
eij
2
ij
eij
)
( (
) )
( (
)
(
)
(
)
(
)
)
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak Ternyata
<11,345 maka 2 2 → Ho tidak dapat ditolak
At 1% significance level there is no relationship between adjustment to civilian life and place of residence after released from prison
5. Simpangan baku dari kekuatan semacam kabel yang dihasilkan oleh perusahaan X adalah 100 kg. Didapat data dari industri penjualan kabel bahwa berdasarkan 8 sampel kabel yang diteliti, nilai simpangan bakunya adalah 120 kg. Telitilah, apakah proses dalam pebuatan kabel perusahaan X mengalami perubahan variasi kekuatan kabel yang berarti atau tidak? Ujilah dengan tingkat signifikansi 1%!
163
Penyelesaian
Dik : s = 100 kg
df = n-1= 8-1 = 7 α = 1%
n=8 σ = 120 kg
Dit : apakah proses dalam pebuatan kabel perusahaan X mengalami perubahan variasi kekuatan kabel yang berarti atau tidak Jawab : Ho : σ = 120 Ha : σ ≠120
1 / 2 0,989265 0,99462 / 2 20,2777 4,50308
s n 1
100 8 1 120 2,2048
Uji Kriteria:
1 / 2 / 2 → ho tidak dapat ditolak / 2 → ho ditolak 1 / 2 Ternyata 0,99462 < 2,2048 < 4,50308 maka 1 / 2 / 2 → ho tidak dapat ditolak Dengan tingkat signifikansi 1% maka proses dalam pebuatan kabel perusahaan X tidak mengalami perubahan variasi kekuatan kabel yang berarti.
6. In a particular television market there are three commercial television stations, each with its own evening news program from 06.00 to 06.30 pm. According to a report in this morning’s local newspaper, a random sample of 180 viewers last night revealed 53 Watched the news on channel 5, 64 watched on channel 11, 33 on channel 13and 30 watched on channel 19. At the 0,05 significance level, is there a difference in the proportion of viewers watching the three channels? 164
Solution Dik :
Channel 5 viewer
11 13 19
53 64 33 30
α = 5% Jawab : : there is no difference in the proportion of viewers watching the the three channels : there is difference in the proportion of viewers watching the the three channels
2 =
( oi e j ) 2 ej
(
)
+
(
)
(
)
(
)
= 9,711 Df = 5-1 =4 = 9,48773
2 2 → Ho tidak dapat ditolak
2 2 → Ho ditolak Ternyata 9,711 > 9,48773 , 2 2 → Ho ditolak At 5% significane level there is difference in the proportion of viewers watching the the three channels
7. Suatu penelitian diadakan untuk mengetahui apakah ada hubungan antara penghasilan keluarga yang digolongkan dalam golongan-golongan rendah, sedang dan tinggi, dengan penggunaan angkutan umum ketika bepergian. Angkutan umum yang dapat digunkan ada tiga golongan yaitu kereta api, bus, dan taxi. Hasilnya diberikan dalam daftar berikut : Kereta Api
Bus
Taxi
Pendapatan Rendah
130
270
16
Pendapatan Sedang
215
214
39
Pendapatan Tinggi
80
28
140 165
Apakah ada hubungan yang berarti antara golongan pendapatan dan angkutan umum yang digunakan? Gunakan tingkat signifikasni 1%, Tentukan pula sifat hubungan tersebut !
Dik :
Ho : 11 12 13
21 22 23 31 32 33 Ha : terdapat paling sedikit satu tanda ≠
df= (r-1)(c- 1)=(3-1)(3-1)=4
α = 1% 2 =9,48773 Pendapatan Rendah Pendapatan Sedang Pendapatan Tinggi Jumlah
eij
o o o io
Kereta Api 130
Bus 270
Taxi 16
Jumlah 416
215
214
39
468
80
28
140
248
425
512
195
1132
oj
416 425 156,183 1132 416 512 e12 188,155 1132 416 195 e13 71,661 1132 468 425 e21 175,707 1132 e11
e22 e23 e31 e32 e33
468 512 211,675 1132 468 195 80,618 1132 248 425 93,110 1132 248 512 112,170 1132 248 195 42,721 1132
166
2
2
(
o
eij
2
ij
eij
156,183 )
(
(
)
(
)
156,183 (
(
)
(
2=
)
)
(
)
(
)
)
400,0387
2 2 → Ho tidak dapat ditolak
2 2 → Ho ditolak Ternyata 400,0387 >9,48773
maka 2 2 → Ho ditolak
Dengan tingkat signifikansi 1% maka terdapat hubungan antara tingkat pendapatan dan angkutan umum yang digunakan.
C
2 n 2
C= √
Cmax
= 0,511
m 1 m
C max= √
Kriteria : Cmax-C < C, erat Cmax-C = C, cukup erat Cmax-C > C, kurang erat Ternayata
0,511, makaCmax-C > C, kurang erat
Maka sifat hubungan antara tingkat pendapatan dan angkutan umum yang digunakan kurang erat.
167
NON PARAMETRIK Data pada penelitian kuantitatif dianalisis dengan cara tertentu yaitu menggunakan statistik. Statistik tersebut dibagi menjadi dua kelompok, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif adalah jenis statistik yang menganalisis data populasi dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul, dan tanpa membuat kesimpulan yang berlaku umum. Sedangkan statistik inferensial adalah jenis statistik yang menganalisis data sampel, dan membuat generalisasi (diberlakukan secara umum) pada populasi. Statistik inferensial kemudian dibedakan menjadi statistik parametrik dan statistik non-parametrik. Statistik parametrik mensyaratkan banyak asumsi, yaitu asumsi tentang kenormalan data, homogenitas data, dan datanya berupa interval atau rasio. Sedangkan statistik non-parametrik tidak memerlukan asumsi-asumsi di atas terpenuhi. Statistik non-parametrik dipakai apabila peneliti tidak mengetahui karakteristik kelompok item yang menjadi sumber sampelnya. Metode ini dapat diterapkan terhadap data yang diukur dengan skala ordinal dan dalam kasus tertentu, dengan skala nominal. Pengujian non-parametrik bermanfaat untuk digunakan apabila sampelnya kecil dan lebih mudah dihitung daripada metode parametrik.
Perbedaan Skala pengukuran Bentuk distribusi
Jumlah sampel
Parametrik Skala interval dan rasio. Harus diketahui bentuk distribusinya, mis berdistribusi normal atau bentuk distribusi yang lainnya (binomial, poisson, dsb). Jumlah sampel besar, atau bisa juga jumlah sampel kecil tetapi memenuhi asumsi salah satu bentuk distribusi.
Nonparametrik Skala nominal dan ordinal. Tidak mempermasalahkan bentuk distribusinya (bebas distribusi).
Sampel kecilpun dapat dipergunakan (misalnya sampelnya (n) = 6.
Pada kenyataannya sangatlah sulit untuk mendapatkan sampel yang memenuhi asumsi mempunyai distribusi tertentu. Kebanyakan sampel yang diperoleh hanyalah sebatas mendekati tertentu, seperti mendekati normal. Bahkan banyak juga sampel yang distribusinya tidak diketahui sama sekali. Oleh karena itu kemudian dikembangkan suatu teknik inferensi 168
yang tidak memerlukan uji asumsi-asumsi tertentu mengenai distribusi sampelnya, dan juga tidak memerlukan uji hipotesis yang berhubungan dengan parameter populasinya. Teknik statistik ini dikenal dengan statistik non-parametrik. Istilah non parametrik pertama kali digunakan oleh Wolfowitz pada tahun 1942. Statistik non-parametrik adalah statistik yang tidak memerlukan asumsi-asumsi yang melandasi metode statistik parametrik, terutama tentang bentuk distribusinya, dan juga tidak memerlukan uji hipotesis yang berhubungan dengan parameter-parameter populasinya, oleh karena itu teknik ini dikenal juga dengan distribution-free statistics dan assumption-free test. Adapun asumsi-asumsi yang harus terpenuhi pada penggunaan metode parametrik antara lain:
Sampel (data) diambil dari populasi yang mempunyai distribusi normal.
Pada uji t dan uji F untuk dua sampel atau lebih, kedua sampel diambil dari dua populasi yang mempunyai varians sama.
Variabel (data) yang diuji haruslah data bertipe interval atau rasio, yang tingkatnya lebih tinggi dari data tipe nominal atau ordinal.
Ukuran sampel yang memadai (direkomendasikan > 30 per kelompok) - central limit theorem.
Jadi, untuk data yang tidak memenuhi salah satu dari asumsi di atas, lebih baik menggunakan prosedur statistik non-parametrik untuk pengujian hipotesis. Keuntungan dari penggunaan metode non-parametrik : 1. metode
non-paramertrik
tidak
mengharuskan
data
berdistribusi
normal,
perhitungannya singkat dan syarat skala pengukuran datanya tidak terlalu ketat. 2. Metode ini bisa dipakai untuk level data nominal dan ordinal. 3. Metode non-parametrik cenderung lebih sederhana dan mudah dimengerti. Beberapa Metode non-parametrik1 yang biasa digunakan adalah:
1
Diadaptasi dari: Pett MA. 1997. Nonparametric Statistics for Health Care Research. London, Thousand Oaks,
New Delhi: Sage Publications (dalam Christy C. Tomkins, An Introduction to Non-parametric Statistics, University of Alberta Health Sciences Journal, June 2006, Volume 3 Issue 1).
169
Metode Penjelasan Non-parametrik Sign test
Uji yang digunakan untuk mengetahui apakah terdapat perbedaan yang nyata atau tidak dari pasangan data dengan skala ordinal. Data yang akan dianalisis dinyatakan dalam bentuk tanda-tanda yang tanda positif dan negatif. Biasanya digunakan pada kasus “sebelum sesudah”
Wilcoxon signed rank Sama seperti sign test tapi lebih menitikberatkan pada test
besaran perbedaannya
Mc Nemar test
Digunakan untuk menguji hipotesis komparatif dua sampel yang berkorelasi bila datanya nominal/diskrit. Rancangan penelitiannya biasanya berupa “before after”
Mann Whitney test
Digunakan untuk menguji perbedaan dua populasi yang berupa dua sampel yang independen
Kolmogorov
Smirnov Digunakan untuk goodness of fit test dan menguji dua
test
sampel
independen
(data
berbentuk
ordinal),
khususnya untuk perbedaan varians. Cox and Stuart test
Digunakan untuk mengetahui tren suatu data yang minimal ordinal
Spearman
correlation Digunakan untuk mengetahui hubungan atau untuk
test
menguji signifikansi hipotesis asosiatif bila masingmasing variabel berbentuk ordinal dan sumber datanya tidak sama.
Kruskal Wallis test
Memiliki kegunaan sama seperti Mann Whitney tapi menggunakan lebih dari dua sampel
170
NON-PARAMETRIK 1
RINGKASAN TEORI A. SIGN TEST •
Disebut juga uji tanda dimana kita menggunakan uji ini untuk mengetahui apakah terdapat perbedaan antara data - data yang tersedia atau pengaruh dari hasil dua perlakuan yang diwakili dengan tanda positif (+) dan negatif (-). Hanya melihat arah & adanya perbedaan nyata atau tidak untuk setiap pasangan data, tanpa memperhatikan besarnya perbedaan . Sampel yang digunakan saling berhubungan dengan skala ordinal , uji ini berhubungan pada kasus – kasus
“ sebelum –
sesudah”. Langkah – Langkah Penyelesaian Sign Test Problems
1. Bandingkanlah nilai dari pasangan data yang tersedia, jika data sebelum (x) lebih besar dari data sesudah (y) maka beri tanda “ + ”, Jika sebaliknya nilai x < y maka beri tanda “ – “, Tapi jika nilai data x = y maka data diabaikan atau dihilangkan.namun ini tergantung pada data yang dibandingkan tetapi harus konsisten 2. Kemudian hitunglah jumlah data yang masuk kedalam masing – masing tanda baik + maupun –, lalu ambil data “ + ” = T
3. Lalu, buatlah Hipotesis untuk : Two-Tailed test
Lower tailed test
Upper tailed test
Ho : P (+) = P (-)
Ho : P (+) ≥ P (-)
Ho : P (+) ≤ P (-)
Ha : P (+) ≠ P (-)
Ha : P (+) < P (-)
Ha : P (+) > P (-)
4. Menentukan kriteria pengujian i.
Two-Tailed test
T ≤ t tabel atau T ≥ n-t tabel
maka
ditolak
t
maka
tidak dapat ditolak
171
ii.
Lower tailed test
T ≤ t tabel
maka
ditolak
T > t tabel
maka
tidak dapat ditolak
T ≥ n - t tabel
maka
ditolak
T < n - t tabel
maka
tidak dapat ditolak
iii.
Upper tailed test
5. Menentukan nilai uji statistika Merupakan nilai probabilitas hasil sampel. ( lihat tabel probabilitas binomial dengan n, x tertentu dan p = 0,5), dimana x = jumlah tanda yang terkecil
6. Untuk n > 30 maka kita dapat mengunakan distribusi normal.sebagai pendekatan distribsui binomial ( gunakan tabel distribusi normal baku ) dengan menggunakan faktor koreksi sebagai berikut: Z=
(
) √
Note : T + 0,5 jika T < ½ n, danT – 0,5 jika T > ½ n
Kriteria : Z < α maka tolak Ho. Z > α maka terima Ho.
7. Kesimpulan. Butalah kesimpulan berdasarkan kepada
apakah hipotesa tersebut tidak dapat
ditolak atau dapat ditolak
172
Contoh soal : Karyawan
di suatu perusahaan akan diberikan pelatihan untuk meningkatkan
kemampuannya dalam bidang komputer. Diambil 15 orang sebagai sampel yang akan diukur kemampuan dalam penggunaan komputer sebelum dan setelah dilakukan pelatihan, dengan menggunakan skala likert, sbb: –
1: luar biasa
–
2: sangat baik
–
3: baik
–
4: cukup
–
5: kurang
Pegawai
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
Sebelum 3
4
2
5
2
3
5
2
3
5
3
4
3
3
5
Sesudah
2
3
3
2
1
4
1
5
3
1
2
4
1
3
1
Dengan taraf kepercayaan 95 % , apakah ada perubahan yang sinifikansi terhadap 15 orang tersebut sesudah dan sebelum diadakanya pelatihan ? ( Bahan Kuliah Statistika 2 Merita Bernik, S.E.M.Si )
Jawab Manual:
Pegawai A B C D E F G H I J K L M N O
Sebelum 3 4 2 5 2 3 5 2 3 5 3 4 3 3 5
Sesudah 1 2 3 3 2 1 4 1 5 3 1 2 4 1 3
Tanda perbedaan + + + 0 + + + + + + + +
173
•
Hipotesis ( uji 2 pihak ): –
Ho: tidak adanya perbedaan kemampuan komputer sebelum dan setelah adanya pelatihan.
–
Ha: adanya perbedaan kemampuan komputer sebelum dan setelah adanya pelatihan.
•
Pengujian –
n = 14,tanda + = 11, tanda - = 3
–
Nilai T = 11
–
Nilai tabel untuk n=14 dan p =0,05 berdasarkan tabel binomial maka diperoleh nilai yang mendekati α = 0,05 adalah y = 0,0287 t = 3
Kriteria T ≤ t tabel atau T ≥ n-t tabel
maka
ditolak
t
maka
tidak dapat ditolak
Ternyata T < n - t ( 11 ≥ 11 ) maka Ho ditolak Kesimpulan Jadi, dengan taraf signifikansi 5 %, tidak adanya perbedaan kemampuan komputer sebelum dan setelah adanya pelatihan
B. WILCOXON SIGNED RANK TEST Wilcoxon signed rank test merupakan test atau uji yang sangat berguna untuk ilmu pengetahuan sosial, dengan data sosial (seperti : tingkah laku manusia, sosial, antropologi, psikologi, dan lain lain) Wilcoxon signed rank test pertama sekali diperkenalkan oleh Frank wilcoxon pada tahun 1949 sebagai penyempurnaan dari uji tanda. Selain memperhatikan tanda perbedaan Wilcoxon signed rank test juga memperhatikan besarnya beda dalam menentukan apakah ada perbedaan nyata antara data pasangan yang diambil dari sampel atau sampel yang berhubungan ( Pokok – pokok materi statistika 2 : 304)
174
Langkah – langkah pengujian : Apabila pasangan data kurang dari 30 ( n ≤ 30) –
Tentukan formulasi hipotesisnya, apakah uji 2 pihak atau 1 pihak
–
Untuk setiap pasangan tentukanlah selisihnya.
–
Rankinglah nilai selisih tersebut tanpa melihat tanda + atau -.
–
Berilah tanda pada setiap ranking (+ atau -) sesuai dengan tanda selisih yang dihasilkan.
–
Tentukanlah T = jumlah yang terkecil dari kedua kelompok ranking yang memiliki tanda yang sama.
–
Dengan menggunakan tabel uji wilcoxon dan dibantu dengan nilai α dan n hitunglah Wα
–
Tentukanlah n = banyaknya pasangan data yang memiliki selisih / tanpa tanda 0.
Pengujian jika n > 30, pengujian bisa menggunakan nilai Z, dengan menggunakan tebel distribusi normal. Untuk sampel yang besar n > 30. T = jumlah rangking + N ( N 1) T 4 T T
T Z
N ( N 1)(2 N 1) 24
T
(Mathematical statistics with aplication, KM Ramachandran: 615) –
Kriteria pengujian: • Kriteria Untuk n ≤ 30 : –
–
–
Two-Tailed test •
T+/T- terkecil ≤ Wα/2 (T tabel) → Ho ditolak
•
T+/T- terkecil > Wα/2
→ Ho tidak dapat ditolak
Lower Tailed Test •
T+/T- terkecil ≤ Wα → Ho ditolak
•
T+/T- terkecil > Wα → Ho tidak dapat ditolak
Upper Tailed Test •
T+/T- terkecil ≤ Wα → Ho ditolak
•
T+/T- terkecil > Wα → Ho tidak dapat ditolak 175
• Kriteria Untuk n > 30 : Daerah penolakan Ho apabila :
–
–
z > zα
Untuk Upper Tailed Test
–
z < - zα
Untuk Lower Tailed Test
–
|z| > zα/2
Untuk Two-Tailed test
Kesimpulan : Butalah kesimpulan berdasarkan kepada
apakah hipotesa tersebut tidak dapat
ditolak atau dapat ditolak
Contoh Soal: •
Pada suatu perusahaan pemerintah dilakukan penelitian untuk mengetahui pengaruh ruangan yang diberi AC terhadap produktivitas kerja. Pengumpulan data terhadap produktivitas kerja pegawai dilakukan pada waktu AC sebelum dipasang dan sesudah dipasang. Data produktivitas kerja pegawai sebelum dipasang AC adalah X dan sesudah dipasang adalah Y. jumlah pegawai yang dijadikan sampel adalah 10 orang. Pegawai
X
Y
1
100
105
2
98
94
3
76
78
4
90
98
5
87
90
6
89
85
7
77
86
8
92
87
9
78
80
10
82
83
Dengan α = 5 %, hitunglah apakah ada perbedaan yang berarti bagi pegawai sebelum dan sesudah pemasangan AC ? ( Bahan Kuliah Statistika 2 ; Ibu Merita Bernik )
176
Jawab : Buatlah tabel seperti tertera di bawah ini kemudian lakukan perhitungan sesuai dengan langlah – langkah yang diberikan diatas
Pegawai
X
Y
1 2 3 4 5 6 7 8 9 10
100 98 76 90 87 89 77 92 78 82
105 94 78 98 90 85 86 87 80 83 Jumlah
Beda X-Y -5 4 -2 -8 -3 4 -9 5 -2 -1
Tanda ranking Ranking + 7.5 5.5 5.5 2.5 9.0 4.0 5.5 5.5 10.0 7.5 7.5 2.5 1.0 T=18.5
7.5 2.5 9.0 4.0 10.0 2.5 1.0 36.5
T = 18,5 dan n = 10
Formulasi Hipotesisnya :
H0 = Ruangan ber-AC tidak mempunyai
perbedaab
terhadap produktifitas pegawai H1
=Ruangan
ber-AC
mempunyai
perbedaan
terhadap produktifitas pegawai
Tarif nyata = 5 % dan n = 10 dengan melihat tabel t distribution atau tabel uji wilcoxon maka kita mendapatkan Wα/2 = 9 Kriteria pengujian : T+/T- terkecil ≤ Wα/2 (T tabel) → Ho ditolak T+/T- terkecil > Wα/2
→ Ho tidak dapat ditolak
Kesimpulan : karena T = 18,5 dan Wα/2 = 9, T > Tα , maka H0 tidak dapat ditolak, Jadi dengan taraf kepercayaan 95 % ruang kerja yang ber-AC tidak mempunyai pengaruh yang berarti terhadap produktifitas pegawai
177
C. MC NEMAR Digunakan untuk menguji hipotesis komparatif dua sampel yang berkorelasi bila datanya nominal/diskrit. Rancangan penelitiannya biasanya berupa “before after”, dengan pada umumnya menggunakan data yang ditabulasi dalam bentuk tabel kontingensi 2 x 2 , Uji McNemar sangat cocok untuk membandingan 2 variabel kategori yang dikodekan dengan 2 nilai (biner). Langkah – langkah pengujian :
– Tentukan formulasi hipotesis – Bentuklah tabel kontingensi 2 x 2 berdasarkan kasus yang ada – Carilah nilai dari Mc. Nemar hitung atau ( (
dengan menggunakan :
) )
– Tentukan nilai Mc.Nemar Tabel menggunakan Tabel Chi-Square dengan : df = ( banyak kolom – 1)x(banyak baris-1) Siginifikansi level yang digunakan –
Tentukan Kriteria : Ho tidak dapat ditolak : Ho ditolak
–
Buatlah Kesimpulan Buatlah kesimpulan berdasarkan kepada
apakah hipotesa tersebut tidak
dapat ditolak atau dapat ditolak
Contoh Soal Mc.Nemar Seorang manajer salon ingin meningkatkan penjualan jasa creambath. Diambil sampel 200 pengunjung salon, kemudian bersama para pelayan salon melakukan promosi dan menawarkan langsung kepada calon konsumen yang datang ke salon tersebut. Diperoleh data konsumen yang ingin creambath sebelum promosi adalah 77 dan sisanya tidak creambath. Setelah dilakukan promosi, jumlah pengunjung sebanyak 13 orang yang tadinya ingin creambath jadi tidak creambath dan 36 pengunjung yang tadinya tidak akan creambath menjadi creambath. Dapatkah pemilik salon tersebut mengambil simpulan bahwa promosi creambath berpengaruh pada penjualan jasa creambath? 178
Jawab: 1. Ho: P(Xi) = P(Yi) (Tidak ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi) Ha: P(Xi) ≠ P(Yi) (Ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi) Sesudah
Tidak
Membeli
Jumlah
87
36
123
Membeli
13
64
77
Jumlah
100
100
200
Sebelum
Membeli
Tidak Membeli
( ( (
) )
)(
( ( )
(
) ) )(
)
α = 5% lihat tabel chi-square →
Kriteria: : Ho tidak dapat ditolak : Ho ditolak Ternyata atau
> 3,84146 → Ho ditolak
Jadi, dengan tingkat signifikansi 5% manajer salon tersebut dapat mengambil kesimpulan bahwa promosi jasa creambath berpengaruh pada permintaan jasa creambath karena terdapat perubahan keinginan konsumen sebelum dan sesudah promosi dilakukan.
D. PROSEDUR NON PARAMETRIK 1 DENGAN APLIKASI Sebenarnya banyak sekali aplikasi pada komputer yang dapat kita gunakan untuk menguji Sign test, wilcoxon rank test, dan Mc Nemar dengan komputer diantaranya
179
seperti SPSS ( Statistical Program for Social Science ), Minitab, E-Views, bahkan kita juga bisa menggunakan Microsoft Excel untuk bagian bagian tertentu yang tentu kita sudah familiar dengan itu, karena program SPSS lebih mudah untuk digunakan maka kita akan menggunakan program ini dalam penyelesaian persoalan Nonparametrik ini Langkah – langkah :
Pada Komputer atau Laptop yang telah di instal program SPSS, klik Program SPSS tersebut.
Pada Lembar Variable View isilah kotak yang tesedia yang nantinya akan menjadi label kolom pada lembar Data view.
Masukkan data pada Data view
Kemudian Klik Analyze Non Parametric Test 2 Related samples
Pindahkan isi kotak sebelah kiri ke kotak test pair(s) list dengan mengklik tombol panah yang berada di tengah – tengah
Jika ingin melakukan test sign test maka beri tanda √ pada sign test yang berada di kotak test type, begitu juga jika ingin melakuakn wilcoxon rank test dan Mc Nemar test. Lebih lanjut silahkan lihat contoh dibawah ini,
(i) Contoh pada kasus Sign test: Universitas Padjadjaran setiap tahunnya menerima Mahasiswa baru melalui jalur – jalur khusus misalnya SMUP dan mahasiswa undangan. Guna mengetahui kualitas mahasiswa yang telah diterima melalui jalur tersebut, dilakukan test matrikulasi dan pihak pelaksana melakukan dua kali ujian yaitu sebelum program matrikulasi dilakukan dan setelahnya untuk mengetahui keefektifan program tersebut. Dan untuk itu diambil sampel sebanyak 15 orang dari IPA untuk mata ujian Statistika, dan diperoleh data ( α = 5 %) : Peserta
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
Sebelum 67 54 67 55 87 60 70 45 54 66 73 88 80 65 75 Sesudah
66 75 80 60 78 89 65 70 68 75 74 85 89 90 75
180
Analisanya dalam SPSS adalah sebagai berikut ;
Buka Software SPSS
Pada Variable View ketikkan Sebelum pada Kolom nama baris 1 dan sesudah pada kolom nama baris ke 2
Kemudian pada Data view masukkan data sebagai berikut
Klik Analyze Nonparametric Test 2 Relates samples Aktifan Wilcoxon pada test type jika ingin melakukan wilcoxon rank test dan masukkan variabel yang akan di uji sebagaimana tampak pada kotak dialog :
181
Kemudian Klik OK maka akan muncul outputnya :
Dari output tersebut diperoleh:
Negative Ranks atau selisih antara variabel sebelum dan sesudah yang negatif sebanyak 4 observasi atau dengan kata lain terdapat 4 observasi pada variabel sesudah yang kurang dari observasi pada variabel sebelum. Dan rata-rata rangkingnya = 4 dengan jumlah rangking negatif = 16
Positive Ranks atau selisih variabel sebelum dan sesudah yang positif sebanyak 10 observasi atau denga kata lain terdapat 10 observasi pada variabel sesudah yang lebih dari observasi pada variabel sebelum dengan ratarata rangkingnya = 8,90 dan jumlah rangking positif = 89.
Ties atau tidak ada perbedaan antara variabel sebelim dan sesudah sebanyak 1 observasi.Oleh karena jumah rangking negatif lebih kecil dibanding rangking positif maka nilai T yang digunakan adalah jumlah rangking yang negatif.
Selanjutnya dilakukan uji hipotesis: H0 :
P = 0 (tidak ada perbedaan nilai tes sebelum matrikulasi dan sesudah matrikulasi)
H1 : P ≠ 0 (ada perbedaan diantara nilai tes sebelum matrikulasi dan sesudah matrikulasi )
Tingkat signifikansi a =0,05
182
Statistik uji Untuk nilai statistik uji, tinjau tabel output berikut:
Dari tabel diperoleh nilai asymp sig = 0,022
Kriteria : H0 ditolak jika nilai asymp sig < nilai α Ho tidak dapat ditolak jika nilai asymp sign ≥ α
Kesimpulan Oleh karena asymp sig < α , (0,022 < 0,05 ) maka Ho ditolak yang berarti bahwa tidak ada perbedaan nilai Statistika calon mahasiswa sebelum dan sesudah mengikuti program matrikulasi.
(ii)
SPSS untuk Kasus Mc-Nemar: Seorang manajer salon ingin meningkatkan penjualan jasa creambath. Untuk itu, dia akan melakukan sebuah penelitian untuk mengetahui perilaku konsumen. Diambil sampel sebanyak 200 orang pengunjung salon, kemudian bersama-sama para pelayan salon melakukan promosi dan menawarkan secara langsung kepada calon konsumen yang datang ke salon tersebut. Diperoleh data konsumen yang ingin creambath sebelum promosi adalah 77 dan sisanya tidak creambath. Setelah dilakukan promosi, jumlah pengunjung sebanyak 13 orang yang tadinya ingin creambath jadi tidak creambath dan 36 pengunjung yang tadinya tidak akan creambath menjadi creambath. Dapatkah pemilik salon tersebut mengambil simpulan bahwa promosi creambath berpengaruh pada penjualan jasa creambath?
183
Buka software SPSS Pada lembar Variable View ketik sebelum pada baris 1 dan sesudah pada baris 2, untuk measure: pilih nominal Masukkan data di Data View. Klik Analyze
Non Parametric Tests
2 Related Samples, pada menu
maka kotak dialog Two Related Samples Tests akan muncul.
Blok sebelum dan sesudah sehingga aktif dan pindahkan ke kotak Test Pair(s) List dengan klik tombol panah sehingga muncul sebelum-sesudah pada kotak tersebut. Pada kotak Test Type, pilih McNemar Klik Ok
Maka diperoleh output sebagai berikut : Sebelum & Sesudah
Test Statisticsb
Sesudah
Sebelum &
Sebelum
Sesudah
0
1
0
87
36
N
200
1
13
64
Chi-Squarea
9.878
Asymp. Sig.
.002
a. Continuity Corrected b. McNemar Test Hipotesis Ho: P(Xi) = P(Yi) (Tidak ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi) Ha: P(Xi) ≠ P(Yi) (Ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi) 184
Exact Sig. (2-tailed) dan Tingkat Signifikansi Exact Sig. (2-tailed) = 0,002 =5% Kriteria Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak Exact Sig. (2-tailed) < α : Ho ditolak Ternyata Exact Sig. (2-tailed) < α atau 0,002 < 0,05 Ho ditolak Kesimpulan Jadi, dengan tingkat kepercayaan 95% manager salon tersebut dapat mengambil kesimpulan bahwa promosi jasa creambath berpengaruh pada permintaan jasa creambath karena terdapat perubahan keinginan konsumen sebelum dan sesudah promosi dilakukan.
185
SOAL NONPARAMETRIK I 1. Faculty of Economics do the training of a new employees for one full month to provide increased capacity of the workforce, at the beginning and end of training, new employees be given sort test to evaluate the training, The following are presented the results of their training evaluation: No 1 2 3 4 5 6 7 8 9 10 11 12 13
Name Intan Puspa Taufik Rudolf Purba Ahmad Hamdi Yessica Sardina Alya Karina Nainggolan Deasy
Evaluation Decrease Increase Decrease Increase Increase Increase Increase Decrease Increase No change Increase Decrease No change
From the data, can we conclude that the training program enhanced capabilities the new employees ? (significance level of 5%) A. MANUAL SOLUTION No Name 1 Intan 2 Puspa 3 Taufik 4 Rudolf 5 Purba 6 Ahmad 7 Hamdi 8 Yessica 9 Sardina 10 Alya 11 Karina 12 Nainggolan 13 Deasy Total : 0 = 2; + = 7; - = 4
Evaluation Decrease Increase Decrease Increase Increase Increase Increase Decrease Increase No change Increase Decrease No change
Sign + + + + + + 0 + 0
Hypotesis : Ho : P (+) ≤ P (-) : There is no increase in workfores capacity Ha : P (+) > P (-) : There is an increase in workfores capacity 186
Value T hitung = 7 sedangkan nilai ttabel : 2 Because T < n-t ( 7 < 9 ) so Ho cannot be rejected. So, using 5% significance level, we can conclude that there is no increase in workfores capacity B. SPSS SOLUTION Frequencies N sesudah -
Negative
sebelum
Differences
a
4
b
7
Positive Differences c
2
Total
13
Ties
a. sesudah < sebelum
KRITERIA Exact sig./2 < α Ho rejected Exact sig./2 ≥ α Ho can be rejected
b. sesudah > sebelum
0,274,5 > 0,05 Ho can be rejected
c. sesudah = sebelum
Conclusion : So, using 5% significance level, we can conclude that there is no increase in workfores capacity 2. STA Corp. ingin mengetahui apakah ada perbedaan pemberian program reward and punishment terhadap loyalitas karyawan dalam bekerja di perusahaan. untuk itu diambil skor 12 karyawan yang dihimpun dari para manager pada saat sebelum dan sesudah program reward and punishment dilakukan.
Employee
1
2
3
4
5
6
7
8
9
10
11
12
Before
901
900
600
809
605
800
905
708
850
802
885
709
900
888
605
800
605
804
902
700
850
800
889
704
Program After Program
Dengan menggunakan tingkat kepercayaan 5 %, apakah ada perbedaan loyalitas karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program reward and punishment tersebut. ( Wilcoxon ranked sign test)
187
A. JAWAB MANUAL: Karyawan Sebelum Sesudah Beda Beda Ranking Ranking Rangking Skor Skor + 901 900 -1 1 1 1 1 900 898 -2 2 2,5 2 2,5 600 605 5 5 7,5 3 7,5 809 800 -9 9 10 4 10 605 605 5 0 0 800 804 4 4 5,5 6 5,5 905 902 -3 3 4 7 4 708 700 -8 8 9 8 9 850 850 0 0 9 802 800 -2 2 2,5 10 2,5 885 889 4 4 5,5 11 5,5 709 704 -5 5 7,5 12 7,5 JUMLAH 36,5 18,5 Hipotesis:
= Tidak ada perbedaan loyalitas karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program reward and punishment = ada perbedaan loyalitas karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program reward and punishment
T hitung dan Tα ( T tabel ) T-hitung ( jumlah rangking terkecil ) = 18,5 Wα atau T tabel : n ( jumlah sampel tanpa tanda 0 ) = 10, dengan α = 5 % , dan dengan melihat tabel uji wilcoxon maka didapat Wα/2 ( T tabel ) = 9
Kriteria T hitung > Wα/2 ( T tabel )
tidak dapat ditolak
T hitung ≤ Wα/2 ( T tabel )
ditolak
Kesimpulan : Karena T hitung > Tα/2, 18,5 > 9, maka
tidak dapat ditolak
Jadi, dengan taraf signifikansi 5 % ternyata tidak terdapat perbedaan loyalitas karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program reward and punishment.
188
B. JAWABAN SPSS
Test Statistics
b
KRITERIA :
Sesudah Sebelum Z
-.919
Asymp. Sig. (2-tailed)
Asymp sig. (2-tailed) < α Ho ditolak a
.358
a. Based on positive ranks.
Asymp sig. (2-tailed) ≥ α Ho tidak dapat ditolak 0,358 > 0,05 MAKA Ho tidak dapat ditolak
b. Wilcoxon Signed Ranks Test
Jadi, dengan taraf signifikansi 5 % ternyata tidak terdapat perbedaan loyalitas karyawan di perusahaan antara sesudah dan sebelum dilaksanakannya program reward and punishment
3. Pada pemilihan president director dari STA Corp. Terdapat 2 calon, yaitu A dan H. Sebelum kandidat memaparkan program kerja mereka, yang memilih A sebanyak 10 orang dan yang memilih H sebanyak 8 orang. Setelah pemaparan program kerja kadidat, ternyata 5 orang sebelumnya memilih A berubah menjadi mimilih H, dan yang tadinya memilih H berubah menjadi A sebanyak 6 orang, dengan signifikansi 5%, apakah ada perbedaan respon sebelum dan sesudah diberikannya pemaparan program kerja yang akan dilaksanakan oleh calon tersebut ? A. JAWAB MANUAL: Sebelum Pemaparan Program
Setelah Pemaparan Program Calon A H 5 5 A 6 2 H 11 7 Total
Total 10 8 18
Hipotesis : Ho : tidak ada perbedaan respon sebelum dan sesudah diberikannya pemaparan program kerja Ha : ada perbedaan respon sebelum dan sesudah diberikannya pemaparan program kerja
189
( (
) )
(
)(
( (
) ) )
(
)(
)
α = 5% lihat tabel chi-square → Kriteria : Ho tidak dapat ditolak : Ho ditolak Kesimpulan : Karena
; 0,009090909 < 3,84, maka Ho tidak dapat ditolah
Jadi, dengan tingkat signifikansi 5 %, tidak ada perbedaan respon sebelum dan sesudah diberikannya pemaparan program kerja
B. JAWAB SPSS
Test Statistics
b
KRITERIA :
sebelum &
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak
sesudah N Exact Sig. (2-tailed)
18 1.000
Exact Sig. (2-tailed) < α : Ho ditolak
a
1,000 > 0,05 Maka Ho tidak dapat ditolak
a. Binomial distribution used. b. McNemar Test
Jadi, dengan tingkat signifikansi 5 %, tidak ada perbedaan respon sebelum dan sesudah diberikannya pemaparan program kerja
4. STA Corp has 5 subsidiary companies engaged in telecommunications, mining, agriculture, finance, and transportation. At the AGM, each subsidiary is expected to provide benefits Rp.50.000.000,00/years. Test whether the expectations of shareholders exceeds the real profit will be true? (use 5% significance level). Subsidiary Companies Real Profit (*in million) Telecommunications 41 Mining 84 Agliculture 28 Finance 52 Transportation 59
190
A. JAWAB MANUAL: Subsidiary Companies Telecommunications Mining Agriculture Finance Transportation
Real Profit (*in million) 41 84 28 52 59
Expected
D
[D]
Rank
50 50 50 50 50
-9 34 -22 2 9
9 34 22 2 9
2,5 5 4 1 2,5 ∑
Ket : D = differences
Hypotesis:
Rank -
Rank +
2,5 5 4
6,5
1 2,5 8,5
= shareholders expectation not exceeds real profit = shareholders expectation exceeds real profit
(right tailed test) T hitung dan Tα ( T tabel ) T-hitung ( jumlah rangking terkecil ) = 6,5 Wα atau T tabel : n ( number of sample without 0 ) = 5, with α = 5 % , using tabel wilcoxon ,Wα ( T tabel ) = 1
Kriteria T hitung ≤ Wα
rejected
T hitung > Wα
cannot be rejected
Kesimpulan : Karena T hitung > Wα, 6,5 > 1, maka
cannot be rejected
So, using 5% significance level, shareholders expectation is not exceeds real profit B. JAWABAN SPSS Test Statistics
b
KRITERIA : expected -
Asymp sig. (2-tailed)/2 < α Ho rejected
real_profit Z Asymp. Sig. (2-tailed)
-.271
a
.786
Asymp sig. (2-tailed)/2 ≥ α Ho can be rejected 0,393 > 0,05 MAKA Ho tidak dapat ditolak
a. Based on positive ranks. b. Wilcoxon Signed Ranks Test
191
So, using 5% significance level, shareholders expectation is not exceeds real profit
5. Fly Emirates ingin mengetahui perbedaan sebelum dan sesudah pemberian sponsorship kepada Real Madrid dalam rangka meningkatkan profit perusahaan. untuk itu diambil 20 orang sebagai sampel dimana, sebelum sponsor diberikan terdapat 5 orang yang membeli produk tersebut, sedangkan sisanya tidak. Namun setelah sponsor diberikan, ternyata ada 8 orang yang tidak membeli jadi membeli dan ada 3 orang yang membeli menjadi tidak membeli. Dengan taraf nyata 5%, dapatkah disimpulkan bahwa setelah pemberian sponsor tersebut dapat mempengaruhi profit perusahaan atau tidak?
A. JAWAB MANUAL: After Sponsorship
Before Sponsorship
Total
Buy
Not buy
Buy
2
3
5
Not buy
8
7
15
10
10
20
Total
Hipotesis : Ho : Pemberian sponsor tersebut tidak dapat mempengaruhi profit perusahaan Ha : Pemberian sponsor tersebut dapat mempengaruhi profit perusahaan ( (
) )
(
)(
( (
) ) )
(
)(
)
α = 5% lihat tabel chi-square → Kriteria : Ho tidak dapat ditolak : Ho ditolak Kesimpulan : Karena
; 2,27272 < 3,84, maka Ho tidak dapat ditolah
Jadi, dengan tingkat signifikansi 5 %, Pemberian sponsor tersebut tidak dapat mempengaruhi profit perusahaan.
192
B. JAWAB SPSS: b
KRITERIA :
Test Statistics
sebelum &
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak
sesudah N
Exact Sig. (2-tailed) < α : Ho ditolak
20
Exact Sig. (2-tailed)
.227
0,227 > 0,05 Maka Ho tidak dapat ditolak
a
a. Binomial distribution used. b. McNemar Test
Jadi, dengan tingkat signifikansi 5 %, Pemberian sponsor tersebut tidak dapat mempengaruhi profit perusahaan 6. Statistics Laboratory conducts research to get offer improved campus facilities difference, before and after the application of UKT by the University, using a representative sample of 15 in each faculty, the following sample response to increased facilities Sample
A
B
C
D
E
F
G
H
I
J
Before
2
3
3
3
5
2
3
3
2
3
After
5
4
4
3
6
1
3
2
7
5
Sample K L M N 2 4 3 5 Before 5 6 4 4 After 5 = very satisified,... ; 1 = very unsatisfied
O 5 5
Test the null hypothesis that there is no difference facilities before and after the imposition of UKT by the university? (α = 5%)
A. JAWAB MANUAL: Sampel Sebelum Sesudah Tanda
A 2 5
B 3 4
C 3 4
D 3 3
E 5 6
F 2 1
G 3 3
H 3 2
I 2 7
J 3 5
+
+
+
0
+
-
0
-
+
+
193
K L M N Sampel 2 4 3 5 Sebelum 5 6 4 4 Sesudah Tanda + + + Jumlah tanda “ + “ =9 dan tanda ‘ – “ = 3
Hipotesis:
O 5 5 0
:
there is no difference in facilities before and after UKT
:
there is a difference in facilities before and after UKT
Pengujian T hitung = 9 T tabel
= Gunakan Tabel Binomial untuk mencari nilai t
Dengan n =12, p =0,5 mendekati α, y =0,0193 t = 2
i.
Kriteria t < T < n – t Ho tidak dapat ditolak T ≤ t atau T ≥ n – t Ho ditolak
ii.
Ternyata t < T < n – t atau 2 < 9 < 7 maka Ho tidak dapat ditolak
B. JAWABAN SPSPS Frequencies N sesudah -
Negative
sebelum
Differences
a
3
b
9
Positive Differences c
3
Total
15
Ties
a. sesudah < sebelum
KRITERIA Exact sig. < α maka Ho ditolak Exact sig. ≥ α maka Ho tidak dapat ditolak
b. sesudah > sebelum c. sesudah = sebelum
0,146 > 0,05 Maka Ho tidak dapat ditolak
194
iii.
Kesimpulan Jadi dengan taraf signifikansi 5 %, tidak ada perbedaan fasilitas sebelum dan sesudah pemberlakukan UKT oleh universitas.
7. The following data is the monthly rents ( in dollars ) paid by a random sampe of 25 household selected from a large city. 425 960 1450 655 1025 750 670 975 660 880 1250
780
870
930
550
575
545
840
765
950
1080
425
900
525
1800
Using the wilcoxon signed rank test, test the hypotheses that the median rent in this city is $ 750 against the alternative that it is higher, with α = 0,05 ? (KM Ramachandran .Mathematical statistics with aplication: 615 ) 1. No
MANUAL SOLUTION: Median Monthly D rents
D
Rank
Rank +
1
750
425
-325
325
19,5
2
750
960
210
210
15
15
3
750
1450
700
700
23
23
4
750
655
-95
95
6
5
750
1025
275
275
18
18
6
750
750
0
0
-
-
7
750
670
-80
80
3
8
750
975
225
225
16,5
9
750
660
-90
90
4,5
10
750
880
130
130
8
8
11
750
1250
500
500
22
22
12
750
780
30
30
2
2
13
750
870
120
120
7
7
14
750
930
180
180
11
11
15
750
550
-200
200
25
Rangk 19,5
6
3
16,5 4,5
12,5
195
16
750
575
-175
175
10
10
17
750
425
-325
325
19,5
19,5
18
750
900
150
150
9
19
750
525
-225
225
16,5
20
750
1800
1050
1050
24
21
750
545
-205
205
14
22
750
840
90
90
4,5
4,5
23
750
765
15
15
1
1
24
750
950
200
200
12,5
12,5
25
750
1080
330
330
21
21
9 16,5 24 14
∑
Hipotesis:
194,5
105,5
= the median rent in this city = $ 750 = the median rent in this city > $ 750
T calc and Tα ( T tabel ) T-calc ( total of small rank ) = 105,5 Wα atau T table : n (sample without 0 ) = 24, with α = 5 % , and we found Wα ( T table ) = 92 Criteria T hitung ≤ Wα
rejected
T hitung > Wα
can be rejected
Kesimpulan : Karena T hitung > Wα, 105,5 > 9, maka
can be rejected
So, with significance level 5 % , we can conclude the median rent in this city = $ 750
196
2.
SPSS SOLUTION: Test Statistics
b
KRITERIA :
MEDIAN RENTS Z Asymp. Sig. (2-tailed) a. Based on positive ranks.
Asymp sig. (2-tailed) < α Ho rejected a
-1.272
Asymp sig. (2-tailed) ≥ α Ho can be rejected
.203
0,203 > 0,05 MAKA Ho tidak dapat ditolak
b. Wilcoxon Signed Ranks Test
So, with significance level 5 % , we can conclude the median rent in this city = $ 750
197
NON PARAMETRIK 2 Data pada penelitian kuantitatif dianalisis dengan cara tertentu yaitu menggunakan statistik. Statistik tersebut dibagi menjadi dua kelompok, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif adalah jenis statistik yang menganalisis data populasi dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul, dan tanpa membuat kesimpulan yang berlaku umum. Sedangkan statistik inferensial adalah jenis statistik yang menganalisis data sampel, dan membuat generalisasi (diberlakukan secara umum) pada populasi. Statistik inferensial kemudian dibedakan menjadi statistik parametrik dan statistik non-parametrik. Statistik parametrik mensyaratkan banyak asumsi, yaitu asumsi tentang kenormalan data, homogenitas data, dan datanya berupa interval atau rasio. Sedangkan statistik non-parametrik tidak memerlukan asumsi-asumsi di atas terpenuhi. Statistik non-parametrik dipakai apabila peneliti tidak mengetahui karakteristik kelompok item yang menjadi sumber sampelnya. Metode ini dapat diterapkan terhadap data yang diukur dengan skala ordinal dan dalam kasus tertentu, dengan skala nominal. Pengujian non-parametrik bermanfaat untuk digunakan apabila sampelnya kecil dan lebih mudah dihitung daripada metode parametrik. Metode ini digunakan untuk situasi berikut: 1.
Apabila ukuran sampel demikian kecil sehingga distribusi statistik pengambilan sampel tidak mendekati normal, dan apabila tidak ada asumsi yang dapat dibuat tentang bentuk distribusi populasi yang menjadi sumber sampel.
2.
Apabila digunakan data peringkat atau ordinal. (Data ordinal hanya memberikan informasi tentang apakah suatu item lebih tinggi, lebih rendah, atau sama dengan item lainnya; data ini sama sekali tidak menyatakan ukuran perbedaan)
3.
Apabila digunakan data nominal. (Data nominal adalah data dimana sebutan seperti lakilaki atau perempuan diberikan kepada item dan tidak ada implikasi dalam sebutan tersebut)
198
SPEARMAN Koefisien korelasi peringkat sperman, rs, adalah ukuran erat-tidaknya kaitan antara dua variabel ordinal; artinya rs merupakan ukuran atas kadar/derajat hubungan antara data yang telah disusun menurut peringkat (ranked data) (Supranto, Johanes; 2001). Koefisien korelasi (r) dihitung dengan menggunakan nilai aktual dari X dan Y, sedangkan koefisien Spearman yang akan kita bicarakan berikut ini menggunakan nilai peringkat untuk X dan Y, dan bukan nilai aktual.
Langkah Penghitungan Koefisien Korelasi Spearman (rs) (1) Menyusun peringkat data (2) Menghitung perbedaan peringkat (3) Menyusun hipotesis (4) Menghitung rs (5) Menghitung Wp dengan menggunakan tabel Quantiles of Spearman’s (6) Bandingkan nilai rs dan Wp dengan kriteria (7) Menarik kesimpulan
Hipotesis Spearman Uji dua pihak Ho:
Tidak ada korelasi antara variabel X dengan variabel Y (independen)
Ha:
Ada korelasi antara variabel X dengan variabel Y
Uji pihak kiri Ho:
Tidak ada korelasi antara variabel X dan variabel Y (independen)
Ha:
Ada kecendrungan korelasi negatif antara variabel X dan variabel Y
Uji pihak kanan Ho:
Tidak ada korelasi antara variabel X dan variabel Y (independen)
Ha:
Ada kecendrungan korelasi positif antara nilai variabel X dan Y
199
Menghitung rs (1) Jika tidak ada angka yang sama rs = 1 - (
∑ (
)
)
di = beda urutan dalam satu pasangan data n= banyaknya pasangan data
(2) Jika ada angka yang sama (
∑
rs = (∑
(
)
(
) ( ) ) ) (∑
(
) ( )
(
) )
R(Xi) = Ranking grup 1 R(Yi) = Ranking grup 2 n = banyaknya pasangan data
Kriteria Uji dua pihak : |rs| ≤ W 1- α/2 : Ho tidak dapat ditolak |rs|> W 1- α/2 : Ho ditolak Uji pihak kiri : rs ≥ - W1-α : Ho tidak dapat ditolak rs < - W1-α : Ho ditolak Uji pihak kanan : rs ≤ W1-α : Ho tidak dapat ditolak rs > W1-α : Ho ditolak
200
Contoh Soal : STA Corporation berencana untuk membuka cabang baru di Surabaya, untuk itu Departemen Marketing melakukan pengujian pengaruh antara biaya iklan suatu jasa dan produk yang ditawarkan perusahaan dengan konsumen yang membeli jasa atau produk tersebut. Biaya Iklan
3,5
2,9
3,9
1,25
2
2,75
4
3
2,8
2,6
Jumlah Konsumen
280 259
320
150
175
250
285 260 290 275
Saudara diminta untuk membantu Departemen marketing untuk menemukan kesimpulan pengujian, gunakan tingkat signifikansi 5% ! Jawab : (1)
Tentukan Hipotesis
H0 : tidak ada hubungan antara biaya iklan dan jumlah konsumen Ha: ada hubungan antara biaya iklan dan jumlah konsumen X
Y
R (X)
R (Y)
Di
Di2
3,5
280
8
7
1
1
2,9
259
6
4
2
4
3,9
320
9
10
-1
1
1,25
150
1
1
0
0
2
175
2
2
0
0
2,75
250
4
3
1
1
4
285
10
8
2
4
3
260
7
5
2
4
2,8
290
5
9
-4
16
2,6
275
3
6
-3
9
Jumlah
40
(2) Menghitung rs rs = 1 - (
∑ (
)
)
201
(3) Menghitung Wp dengan menggunakan tabel Quantiles of Spearman’s n = 10 Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,6364 (4) Bandingkan nilai rs dan Wp dengan kriteria |rs| ≤ W 1- α/2 : Ho tidak dapat ditolak |rs|> W 1- α/2 : Ho ditolak Ternyata 0,757575 > 0,6364 atau |rs| > W 1- α/2 maka H0 ditolak (5) Kesimpulan Dengan tingkat signifikansi 5% maka ada hubungan antara biaya iklan dan jumlah konsumen Menggunakan SPSS (1) Buka program SPSS (2) Klik Variable View, kemudian isi variabel-variabel yang telah ditentukan (3) Mengolah data: • Dari menu SPSS, pilih menu Analyze, pilih submenu Correlate kemudian Bivariate • Masukan variabel yang akan dikorelasi ke dalamTest variables, kemudian klik Spearman • Pada kolom Test of Significance pilih Two-tailed • Klik Flag Significant Correlation • OK Correlations Biaya Spearman's
Biaya
Konsumen
Correlation Coefficient 1.000
.758*
Sig. (2-tailed)
.
.011
N
10
10
rho
Konsumen
Correlation Coefficient .758*
1.000
Sig. (2-tailed)
.011
.
N
10
10
*. Correlation is significant at the 0.05 level (2-tailed).
202
Sig α ≥ α H0 tidak dapat ditolak Sig α < α H0 ditolak Ternyata 0,011 < 0,05 atau Sig α < α maka Ho ditolak Kesimpulan : Dengan tingkat signifikansi 5% ada hubungan antara biaya iklan dan jumlah konsumen Kriteria :
MANN WHITNEY Menguji apakah dua kelompok data yang independen berasal dari populasi yang sama atau tidak. Uji Mann-Whitney mengasumsikan bahwa sampel yang berasal dari populasi adalah acak. Pada uji Mann-Whitney sampel bersifat independen (berdiri sendiri). Skala pengukuran yang digunakan adalah (minimal) ordinal. Langkah Perhitungan Mann Whitney (1) Menyusun hipotesis (2) Menyusun peringkat data tanpa memperhatikan kategori sample (gabungan) (3) Menjumlahkan peringkat di setiap kategori sample yang telah di gabungkan (4) Hitung T statistic. (5) Tentukan nilai table (Wα) (6) Bandingkan nilai T statistic dan nilai table dengan kriteria (7) Menarik kesimpulan Menyusun Hipotesis dan Kriteria Hipotesis : Uji Dua Pihak
Uji Pihak Kiri
Uji Pihak Kanan
Ho : P (X) = P (Y)
Ho : P (X) = P (Y)
Ho : P (X) = P (Y)
Ha : P (X) ≠ P (Y)
Ha : P (X) < P (Y)
Ha : P (X) > P (Y)
Kriteria : Ho Tidak Dapat Ditolak Ho Ditolak
Uji Dua Pihak
Uji Pihak Kiri
Uji Pihak Kanan
W1-α/2 ≤ T ≤Wα /2
T ≥Wα
T ≤ W1-α
T < Wα /2 T > W1-α/2
T < Wα
T > W1-α
Keterangan : W1-α = n(N+1)- Wα W1-α/2 = n(N+1)- Wα/2
203
Menghitung T Statistic Jika tidak ada peringkat yang sama atau hanya sedikit yang sama peringkatnya maka statistik ujinya adalah :
∑
dimana
( ):
Jika banyak peringkatnya yang seri maka statistic ujinya :
√
(
)
∑
(
(
)
)
Contoh Soal : A study to examine whether the assistance is able to improve student test scores. For it's taken nine students selected as samples.
Samples
Participated
Samples
Assistance
Not Part of Assistance
A
80
F
100
B
90
G
50
C
70
H
39
D
49
I
40
E
60
Test with a significant level 5%. Are the students who participated assistance is higher than that is not part of assistance?
204
Jawab :
(1) Menyusun Hipotesis Ho : P (X) = P (Y) (score of the students who participated assistance is same as the student who is not part of assistance) Ha : P (X) > P (Y) (score of the students who participated assistance is higher than that is not part of assistance) Score
Rank
39
1
40
2
49
3
50
4
60
5
70
6
80
7
90
8
100
9
(2) Menghitung T Statistic S = ∑ R(X) = 29 T = 29 - 5 (5+1) 2 T = 14 (3) Menentukan Nilai Tabel Lihat tabel: Wα (n=5, m=4 α = 0,05 )( tabel mann whitney ) = 18 W1-α = n(N+1)- Wα = 5(9 +1) - 18 = 32
205
(4) Bandingkan nilai T statistic dan nilai table dengan kriteria Kriteria T ≤ W1-α Ho tidak dapat ditolak T > W1-α Ho ditolak Ternyata, 14 < 32 atau T ≤ W1-α maka Ho tidak dapat ditolak (5) Menarik Kesimpulan With a significant level 5%, we can conclude that score of the students who participated assistance is same as the student who is not part of assistance.
Menggunakan SPSS •
Masuk ke SPSS
•
Masuk ke variable view, measure Ordinal
•
Masukkan data ke dalam data view (gabungkan sample 1 & sample 2 dalam 1 kolom)
•
Kolom 1 = SCORE, kolom 2 = GROUP ( isikan 0 untuk sample Participated Assistance & 1 untuk sample Not Part of Assistance)
•
Masuk ke Analyze , klik Nonparametric Test
•
Klik 2 Independent sample, masukkan SCORE di Test Variable List dan GROUP di grouping Variable
•
Klik Define Group, masukkan grup 1 = 0, grup 2 = 1, continue
•
Checklist Mann whitney
Ranks GROUP
SCORE
N
Mean Rank Sumof Ranks
0
5
5.80
29.00
1
4
4.00
16.00
Total
9
Kriteria : Exact Sig (1-tailed) ≥ α, Ho tidak dapat ditolak Exact Sig (1-tailed) < α, Ho ditolak Asymp Sig (2-tailed) ≥ α, Ho tidak dapat ditolak Asymp Sig (2-tailed) < α, Ho ditolak
206
Test Statisticsb SCORE Mann-Whitney U
6.000
Wilcoxon W
16.000
Z
-.980
Asymp. Sig. (2-tailed)
.327
Exact Sig. [2*(1-tailed Sig.)]
.413a
a. Not corrected for ties. b. Grouping Variable: GROUP
Ternyata : Exact Sig (1-tailed) < α, atau 0.413 > 0,05 maka Ho tidak dapat ditolak Asymp Sig (2-tailed) > α atau 0.327 > 0,05 maka Ho tidak dapat ditolak
Kesimpulan : With 5% significant level, we can conclude that score of the students who participated assistance is same as the student who is not part of assistance
207
SOAL NON PARAMETRIK 2
1. Sebuah perusahaan yang bergerak dibidang kecantikan yaitu Beauty Skin Care Company, ingin mengetahui apakah terdapat hubungan yang erat antara harga dari produk yang diproduksi dengan permintaan konsumen atas produk kecantikan yang diproduksinya. Untuk itu diambil sampel 20 konsumen untuk diobservasi. Berikut ini adalah data dari sampel yang diobservasi. Konsumen Harga Permintaan 1 28 37 2 37 35 3 31 33 4 42 43 5 38 49 6 35 48 7 29 30 8 30 36 9 32 39 10 43 40 11 36 41 12 33 50 13 44 55 14 50 58 15 34 42 16 39 44 17 45 46 18 46 51 19 55 56 20 53 29 Dari data diatas hitunglah spearman rank coefficient of correlation dan apakah terdapat hubungan antara kedua variabel tersebut. Gunakan taraf nyata 5% ! Konsumen Harga (Xi) 1 28 2 37 3 31 4 42 5 38 6 35 7 29 8 30 9 32 10 43 11 36 12 33 13 44
Permintaan ( Yi) 37 35 33 43 49 48 30 36 39 40 41 50 55
R Xi 1 10 4 13 11 8 2 3 5 14 9 6 15
R Yi 6 4 3 11 15 14 2 5 7 8 9 16 18
di -5 6 1 2 -4 -6 0 -2 -2 6 0 -10 -3
di2 25 36 1 4 16 26 0 4 4 36 0 100 9 208
14 15 16 17 18 19 20
50 34 39 45 46 55 53
58 42 44 46 51 56 29
18 7 12 16 17 20 19
20 10 12 13 17 19 1
-2 -3 0 3 0 1 18 Total
4 9 0 9 0 1 324 618
Ho : tidak terdapat hubungan antara harga produk dan permintaan konsumen Ha : terdapat hubungan antara harga produk dan permintaan konsumen rs = 1 - (
∑ (
)
)
n = 20 Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,4451 |rs| ≤ W 1- α/2 : Ho tidak dapat ditolak |rs|> W 1- α/2 : Ho ditolak Ternyata 0,535338 > 0,4451 atau |rs| > W 1- α/2 maka H0 ditolak Dengan tingkat signifikansi 5% maka ada hubungan antara harga produk dan permintaan konsumen. 2. Berikut ini adalah data mengenai pendapatan dari pegawai di PT Telephone Indonesia yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri. Univ. DN 85 78 83 80 74 65 88 79 69 71
Univ. LN 79 68 85 82 80 75 81 64 65
Dengan menggunakan taraf nyata 5%,tentukanlah apakah terdapat perbedaan pendapatan yang signifikan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri !
209
Ho : Tidak terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri Ha : Terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri Univ. DN 85 78 83 80 74 65 88 79 69 71 N1 = 10
Ranking 17.5 9 16 12.5 7 2.5 19 10.5 5 6 R1 = 105
Univ. LN 79 68 85 82 80 75 81 64 65
Ranking 10.5 4 17.5 15 12.5 8 14 1 2.5
N2 = 9
R2 = 85
S = ∑ R(1) = 105 T = 105 - 10 (10+1) 2 T = 60 Wα/2 = 21 W1-α/2 = 69 Kriteria T < Wα/2 Ho ditolak T > W1-α/2 Ho ditolak Ternyata, 60 < 21 maka Ho tidak dapat ditolak Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa tidak terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri. 3. Tabel dibawah ini merupakan tabel yang berisikan data mengenai pendapatan dari Manajer Sumber Daya Manusia di kota Medan dan Makassar. Hitunglah apakah pendapatan di Medan lebih besar daripada di Makassar ? (dalam ribuan Rupiah ) Medan 4500 6000 5750 7000 5400 5400
Makassar 4300 5200 4900 5700 6000 6200 210
6300 5800 7150 4500 6500
5400 4700 6400
Ho : Pendapatan Manajer Sumber Daya Manusia di Medan tidak lebih besar dari Manajer Sumber Daya Manusia di Makassar Ha : Pendapatan Manajer Sumber Daya Manusia di Medan lebih besar dari Manajer Sumber Daya Manusia di Makassar Medan 4500 6000 5750 7000 5400 5400 6300 5800 7150 4500 6500 N1 = 11
Ranking 2.5 13.5 11 19 8 16 12 20 18 2.5 8 R1 = 130.5
Makassar 4300 5200 4900 5700 6000 6200 5400 4700 6400
Ranking 1 6 5 10 13.5 15 8 4 17
N2 = 9
R2 = 79.5
S = ∑ R(1) = 130.5 T = 130.5 - 11(11+1) 2 T = 64.5 Wα = 28 Kriteria T > Wα Ho ditolak Ternyata, 64.5 > 28 maka Ho ditolak Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa pendapatan Manajer Sumber Daya Manusia di Medan lebih besar dari Manajer Sumber Daya Manusia di Makassar. 4. University of England Research Center plans to conduct research about the score of subject A and B in . Using 10 samples of students and the data they get is below : Students 1 2 3
Score of Subject A 90 85 87
Score of Subject B 89 85 92 211
4 5 6 7 8 9 10
83 76 78 81 94 98 79
90 91 76 80 82 81 75
Calculate : a. Spearman rank coefficient of correlation b. Are there any real correlation between the score of the subject A and subject B? Use the significance level of 5% Score of Subject A
Score of Subject B
R Xi
R Yi
90 85 87 83 76 78 81 94 98 79
89 85 92 90 91 76 80 82 81 75
8 6 7 5 1 2 4 9 10 3
7 6 10 8 9 2 3 5 4 1
di
di2
1 1 0 0 -3 9 -3 9 -8 64 0 0 1 1 4 16 6 36 2 4 Total 140
Ho : there is no correlation between the score of the subject A and subject B Ha : there is a correlation between the score of the subject A and subject B rs = 1 - (
∑ (
)
)
n = 10 Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,6364 |rs| ≤ W 1- α/2 : Ho tidak dapat ditolak |rs|> W 1- α/2 : Ho ditolak Ternyata 0,151515 < 0,6364 maka H0 tidak dapat ditolak ditolak Kesimpulan : Using 5% confidence level, there is no real correlation between subject A and B.
212
5. The Dean of Political Science in Political University apply two different methods to two classes. Class A with e-learning method and class B with the conventional teaching method. The Dean want to know whether there are differences in Final Exam Score between the two classes. Class A Class B
80 70 83 70 75 80
85 75 95 90 55 65
84 60 75 85 72
65
With a 5% significance level, determine whether there is a difference in Final Exam Score between the two classes ( class A has a higher score than class B) ! Ho : P (X) = P (Y) (score of the students in class A is same as the student in class B) Ha : P (X) > P (Y) (score of the students in class A is higher than the student in class B) Class A 80 70 83 85 75 95 84 60 75 65 N1 = 10
R (A) Class B R (B) 11.5 70 5.5 5.5 75 9 13 80 11.5 15.5 90 17 9 53 1 18 65 3.5 14 85 15.5 2 72 7 9 3.5 R1=101 N2 = 8 R2 = 70
S = ∑ R(X) = 101 T = 101 - 10 (10+1) 2 T = 46 Lihat tabel: Wα (n=10, m=8 α = 0,05 )( tabel mann whitney ) =21 W1-α = n(N+1)- Wα = 8(10 +1) - 21 = 67 Kriteria T ≤ W1-α Ho tidak dapat ditolak T > W1-α Ho ditolak Ternyata, 46 < 67 atau T ≤ W1-α maka Ho tidak dapat ditolak 213
With a significant level 5%, we can conclude that score of the students in class A is same as the student in class B.
6. The Ministry of Education make a hypothesis that students from high school in urban area obtain a National Exam score higher than at high school students in the rural area. The results obtained from the following tests. Urban 43 56 31 Rural 47 68 39
30 41 38 42 33 54
53 32 45 40 24 30
33 41
With a 5% significance level, determine whether there is a difference between National Examination scores in urban and rural (urban is higher than rural) ! Ho : P (X) = P (Y) (score of the students in urban is same as the student in rural) Ha : P (X) > P (Y) (score of the students in urban is higher than the student in rural) Urban 43 56 31 30 41 38 53 32 45 33 41 N1 = 11
R (1) 14 19 4 2.5 11.5 8 17 5 15 6.5 11.5 R1 = 114
Rural 47 68 39 42 33 54 40 24 30
R (2) 16 20 9 13 6.5 18 10 1 2.5
N2 = 9
R2= 96
S = ∑ R(X) = 114 T = 114 - 11 (11+1) 2 T = 48 Lihat tabel: Wα (n=11, m=9 α = 0,05 )( tabel mann whitney ) =28 W1-α = n(N+1)- Wα = 9(11 +1) - 28 = 80
214
Kriteria T ≤ W1-α Ho tidak dapat ditolak T > W1-α Ho ditolak Ternyata, 48 < 80 atau T ≤ W1-α maka Ho tidak dapat ditolak With a significant level 5%, we can conclude that score of the students in urban is same as the student in rural
7. The following data concerning the relationship between the score of mathematical economics and statistics subjects of the 10 students Mathematical economics
82
75
85
70
77
60
63
66
80
89
Statistics
79
80
89
65
67
62
61
68
81
84
Examine, if there is a real positive correlation between the score of mathematical economics and statistics subjects ? ( significant level 5 % ) Answer ; Mahasiswa
Score of Mathematical Economics
Score of Statistics
d
D2
( X-Y )
X
Urutan
Y
Urutan
1
82
8
79
6
2
4
2
75
5
80
7
-2
4
3
85
9
89
10
-1
1
4
70
4
65
3
1
1
5
77
6
67
4
2
4
6
60
1
62
2
-1
1
7
63
2
61
1
1
1
8
66
3
68
5
-2
4
9
80
7
81
8
-1
1
10
89
10
84
9
1
1
Jumlah
22
215
rs : 1 – Hipotesis
( (
) )
= 0,867 : :
ρs tabel(dimana n = 10 dan α = 5 %) = 0,5315 Kriteria pengujian ; Ho tidak dapat ditolak apabila rs ≤ ρs tabel Karena rs = 0,867> dari ρs tabel = 0,5315, maka Ho ditolak, jadi ada hubungan positif yang nyata antara nilai matematika ekonomi dengan nilai statistika.
216