Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009
REGRESI MULTIVARIATE Oleh: Hery Tri Sutanto Jurusan Matematika MIPA UNESA
Abstrak
Jika analisa regresi univariate yang mempelajari pengaruh dari beberapa variabel bebas terhadap satu variabel bebas. Sebaliknya analisa regresi multiivariate mempelajari pengaruh dari beberapa bebas terhadap beberapa variabel tak bebas. Kata kunci: Regresi univariate, variabel bebas,variabel tak bebas dan regresi multivariate
1 .Pendahuluan Jika analisa regresi ganda univariate yang mempelajari pengaruh dari beberapa variabel bebas terhadap terhadap satu variabel bebas. Tetapi variabel tak bebas lebih dari satu dinamakan analisa regresi multivariate.
2. Model Regresi Multivariate Regresi mulltivariate polinomial nilai observasi vektor N.p diperlukan setiap titik independent .Data pada setiap titik independent
1
, i=1,2,....,n diwakili berikut
Dimana
merupakan respon p variate independent Sebagai ganti suatu model dari observasi original yang cocok adalah suatu model yang pada vektor rata-rata . Misal vektor rata-rata p variate untuk kelompok ke i dinyatakan
Maka model regresi multivariate untuk rata-rata ini menjadi (1) Dimana matrik Y berorder nxp X berorder nx q berorder qxp berorder nxp Atau
Sehingga dan
q=k+1 dan n> q>p Matrik X mewakili setiap variabel bebas Akibatnya semua variabel dependent dalam penelitian ini menggambarkan rgresi multivariate .
2
Sehingga pers (1) menjadi
= Dimana
(2) dan
Setiap kolom Y dan E ditransformasi oleh
dan misal
X
2.1 Pengujian Hipothesis
Perhatikan hipotesis dibawah ini
Maka pers (1) dapat ditulis menjadi
Dan
, maka
Jika
maka matrik diatas menjadi =
Dimana
sehingga
3
= = =
Perhitungan jumlah kuadrat
= =
=
-
=
Dari perhitungan diatas diperoleh tabel anava dibawah ini Sumber Variasi
Residual
SS
Db 1 K
MS
N-k-1 /Nk-1
Total
N
4
Fhit
Ftabel
MSR/MSE
F(
Contoh Tabel 1 Data Analisa regresi Multivariate SAT
PPVT
RPMT
N
S
NS
NA
SS
49 47 11 9 69 35 6 8 49 8 47 6 14 30 4 24 19 45 22 16 32 37 47 5 6 60 58 6 16 45 9 69 35 19 58 58 79
48 76 40 52 63 82 71 68 74 70 70 61 54 55 54 40 66 54 64 47 48 52 74 57 57 80 78 70 47 94 63 76 59 55 74 71 54
8 13 13 9 15 14 21 8 11 15 15 11 12 13 10 14 13 10 14 16 16 14 19 12 10 11 13 16 14 19 11 16 11 8 14 17 14
1 5 0 0 2 2 0 0 0 3 8 5 1 2 3 0 7 0 12 3 0 4 4 0 0 3 1 2 0 8 2 7 2 0 1 6 0
2 14 10 2 7 15 1 0 0 2 16 4 12 1 12 2 12 6 8 9 7 6 9 2 1 8 18 11 10 10 12 11 5 1 0 4 6
6 14 21 5 11 21 20 10 7 21 15 7 13 12 20 5 21 6 19 15 9 20 14 4 16 18 19 9 7 28 5 18 10 14 10 23 6
12 30 16 17 26 34 23 19 16 26 35 15 27 20 26 14 35 14 27 18 14 26 23 11 15 28 34 23 12 32 25 29 23 19 18 21 15
16 27 16 8 17 25 18 14 13 25 24 14 21 17 22 8 27 16 26 10 18 26 23 8 17 21 23 11 8 32 14 21 24 12 18 26 14
Dari data tabel diatas dapat diolah dengan program LISREL diperoleh regresi multivariate dibawah ini 5
DATE: 10/19/2009 TIME: 08:34 P R E L I S 2.80 (STUDENT) BY Karl G. Jöreskog & Dag Sörbom This program is published exclusively by Scientific Software International, Inc. 7383 N. Lincoln Avenue, Suite 100 Lincolnwood, IL 60712, U.S.A. Phone: (800)247-6113, (847)675-0720, Fax: (847)675-2140 Copyright by Scientific Software International, Inc., 1981-2006 Use of this program is subject to the terms specified in the Universal Copyright Convention. Website: www.ssicentral.com The following lines were read from file D:\GMAKALAH\DATARM1.PR2: !PRELIS SYNTAX: Can be edited SY='D:\GMAKALAH\DATARM1.PSF' RG 1 3 2 ON 4 5 6 7 8 OU MA=CM SM=rm.cov treated as continuous. ERROR CODE 201. Total Sample Size =
37
Univariate Marginal Parameters Variable Mean St. Dev. Thresholds -------- ---- -------- ---------RPMT 0.000 1.000 -1.398 -1.237 -0.881 -0.456 -0.310 0.034 0.532 0.785 1.237 1.398 1.926 N 0.000 1.000 -0.382 -0.102 0.310 0.612 0.785 0.986 1.102 1.398 1.926 Univariate Distributions for Ordinal Variables RPMT Frequency Percentage Bar Chart 8 3 8.1 • • • 9 1 2.7 • 10 3 8.1 • • • 11 5 13.5 • • • • • 12 2 5.4 • • 13 5 13.5 • • • • • 14 7 18.9 • • • • • • • 15 3 8.1 • • • 16 4 10.8 • • • • 17 1 2.7 • 19 2 5.4 • • 21 1 2.7 •
6
N Frequency Percentage Bar Chart 0 13 35.1 • • • • • • • • • • • • • 1 4 10.8 • • • • 2 6 16.2 • • • • • • 3 4 10.8 • • • • 4 2 5.4 • • 5 2 5.4 • • 6 1 2.7 • 7 2 5.4 • • 8 2 5.4 • • 12 1 2.7 • Univariate Summary Statistics for Continuous Variables Variable Mean St. Dev. T-Value Skewness Kurtosis Minimum Freq. Maximum Freq. -------- ---- -------- ------- -------- -------- ------- ----- ------- ----SAT 31.270 22.100 8.607 0.407 -1.056 4.000 1 79.000 1 PPVT 62.649 12.526 30.423 0.226 -0.360 40.000 2 94.000 1 S 6.919 5.068 8.304 0.290 -0.927 0.000 3 18.000 1 NS 13.486 6.354 12.912 0.217 -0.989 4.000 1 28.000 1 NA 22.378 7.243 18.793 0.185 -1.144 11.000 1 35.000 2 SS 18.378 6.370 17.550 0.013 -0.854 8.000 4 32.000 1
Estimated Equations SAT = 6.686 + 0.788*N - 0.0762*S - 1.724*NS + 0.428*NA + 2.111*SS Standerr (12.231) (3.562) (0.945) (0.912) (1.019) (1.049) Z-values 0.547 0.221 -0.0807 -1.891 0.420 2.011 P-values 0.585 0.825 0.936 0.059 0.675 0.044 + Error, R² = 0.206
Error Variance = 387.975
RPMT = - 0.487 + 0.375*N + 0.0247*S - 0.00183*NS - 0.0519*NA + 0.0817*SS Standerr (0.531) (0.155) (0.0410) (0.0396) (0.0443) (0.0456) Z-values -0.917 2.426 0.603 -0.0463 -1.172 1.793 P-values 0.359 0.015 0.547 0.963 0.241 0.073 + Error, R² = 0.269
Error Variance = 0.731
PPVT = 33.420 + 0.456*N - 0.731*S - 0.296*NS + 1.464*NA + 0.300*SS Standerr (5.435) (1.583) (0.420) (0.405) (0.453) (0.466) Z-values 6.149 0.288 -1.742 -0.732 3.232 0.644 P-values 0.000 0.773 0.082 0.464 0.001 0.520
7
+ Error, R² = 0.512 Error Variance = 76.623
Covariance Matrix SAT PPVT RPMT N S NS -------- -------- -------- -------- -------- -------SAT 488.425 PPVT 102.514 156.901 RPMT 3.508 1.430 1.000 N 1.529 0.977 0.403 1.000 S 18.023 17.026 0.691 0.505 25.688 NS 9.615 37.342 1.187 0.372 11.346 40.368 NA 41.895 60.970 1.017 0.569 23.782 32.839 SS 47.034 46.887 1.903 0.557 13.726 31.144 Covariance Matrix NA SS -------- -------52.464 36.686 40.575
NA SS Means
SAT PPVT RPMT N S NS -------- -------- -------- -------- -------- -------31.270 62.649 0.000 0.000 6.919 13.486 Means NA SS -------- -------22.378 18.378 Standard Deviations SAT PPVT RPMT N S NS -------- -------- -------- -------- -------- -------22.100 12.526 1.000 1.000 5.068 6.354
Standard Deviations NA SS -------- -------7.243 6.370
The Problem used
13936 Bytes (= 0.0% of available workspace)
8
Ternyata dari output diatas disimpulkan bahwa Variabel SS signifikan terhadap variabel SAT Variabel N signifikan terhadap variabel RPMT Variabel NA signifikan terhadap variabel PPVT Daftar Pustaka 1.Johson, Rchard A dan Wichen, Dean W. Applied Multivarite Statical Analysis.2002. Printice Hall: New Jersey. 2.Wijanto,Setyo Hari, Structural Equation Modeling dengan Lisrel 8.8. 2008. Graha Ilmu: Yogyakarta
9