BAB II LANDASAN TEORI
2.1 Regresi Nonparametrik Metode statistika nonparametrik merupakan metode statistika yang dapat digunakan dengan mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik. Terutama yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistika nonparametrik adalah statistik bebas distribusi. Istilah yang
sering digunakan untuk statistika nonparametrik
adalah
distribution free statistic atau assumption free test. Dari istilah ini dapat dikatakan bahwa pendekatan statistika nonparametrik merupakan metode penggunaan yang tidak terikat asumsi tentang kurva regesi tertentu. Kurva regresi berdasarkan model regresi nonparametrik ini diawali oleh model yang disebut model regresi nonparametrik. Regresi nonparametrik memiliki fleksibelitas yang tinggi dalam menafsirkan kurva regresi, karena tidak mengasumsikan bentuk kurva regresi. Dalam pandangan regresi nonparametrik berdasarkan data yang diharapkan dapat dicari taksiran kurva tanpa dipengaruhi oleh subyektifitas dari peneliti (Eubank,1999 : 10). Ada beberapa teknik penaksiran nilai variabel respon (Y) dalam regresi nonparametrik yakni estimator kernel dan estimator spline. Berikut ini adalah bentuk umum regresi nonparametrik : yi = f ( xi ) + ε i
Universitas Sumatera Utara
Dengan yi
= variabel respon
f (x i ) = fungsi nonparametrik εi
= error, faktor pengguna yang tidak dapat dijelaskan oleh model Tujuan dari regresi nonparametrik adalah untuk menentukan pada penaksiran
fungsi
regresi
daripada
penaksiran
parameter,
kebanyakan
nonparametrik sederhana secara tidak langsung juga disebut
dari
regresi
“ scratles plot
smoothing “ karena penggunaannya adalah untuk menentukan kurva yang mulus melalui plot pencar y terhadap x (Simanjuntak,2009) Statistika nonparametrik disebut juga statistika bebas sebaran, statistika nonparametrik tidak mensyaratkan bentuk sebaran parameter populasi. Statistika nonparametrik dapat digunakan pada data yang sebaran normal atau ordinal. Conover (1980) menjelaskan bahwa penggunaan regresi nonparametrik dilandasi pada asumsi: a. contoh yang diambil bersifat acak dan kontinu ; b. regresi (Y/X) bersifat linier; c. semua nilai X i saling bebas. Regresi nonparametrik merupakan pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuknya atau tidak terdapat informasi masa lalu tentang pola data. Regresi nonparametrik merupakan suatu metode statistika yang digunakan untuk mengetahui hubungan antara variabel respon dengan prediktor yang tidak diketahui bentuk fungsinya, diasumsikan sebagai pemulus dalam suatu ruang fungsi tertentu.
Universitas Sumatera Utara
2.1.1 Regresi Nonparametrik Spline Ada beberapa teknik estimasi dalam regresi nonparametrik antara lain pendekatan histogram, estimator spline, estimator kernel, estimator deret orthogonal, analisis wavelet dan lain-lain. Pendekatan estimator spline ada bermacam-macam antara lain spline original, spline type M, spline relaxed, spline terbobot dan lainlain. Diantara model-model regresi nonparametrik di atas, Spline merupakan model regresi yang mempunyai interpretasi Statistik dan Visual sangat khusus dan sangat baik. Disamping itu Spline mampu menangani karakter data/fungsi yang mulus (smooth). Spline juga memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Bentuk umum dari regresi nonparametrik spline yi = f (t i ) + ε i
Dimana f(t i ) merupakan fungsi yang tidak diketahui yang diduga dan diasumsikan merupakan fungsi yang kontinu diferensiabel. Dalam regresi nonparametrik Spline, penduga kurva regresi diperoleh dari optimasi PLS atau Penalized Likelihood (PL). Namun untuk menduga kurva regresi yang diperoleh dari optimasi Likelihood dapat menjadi pilihan yang cukup baik karena secara matematik mudah dan sederhana.
2.2 Metode Maksimum Likelihood Metode maksimum likelihood adalah suatu teknik yang sering digunakan pada model parametrik baik untuk mencari penduga parameter maupun kontruksi statistik uji. Metode ini pada. perkembangannya dapat digunakan pula pada model
Universitas Sumatera Utara
nonparametrik dengan pendekatan secara. empiris pada fungsi distribusinya, sehingga dinamakan metode empirical Likelihood. Dari dua metode tersebut, dapat digunakan untuk mengkontruksi statistik uji kesamaan dua mean pada model semiparametrik (situ Model parametrik dan model yang lain nonparametrik), yaitu dengan metode Maximum Semi — empirical Likelihood Rati test (kombinasi dari metode Likelihood clan metode empirical Likelihood ). Misalkan X 1 ,X 2 ,…,X n menyatakan peubah acak yang saling bebas dengan fungsi pada peluangnya dinyatakan oleh f(x i ,β) dengan β adalah parameter yang ditaksir
dengan metode maksimum likelihood, maka fungsi padat peluang
gabungannya adalah :
f (X 1 ,X 2 , …, X n :β) = f(X 1 ,β), f(X 2 ,β), …,f( X n ,β) n
=
∏ f ( Xi, β ) i =1
= L(β ǀ X 1 ,X 2 , …, X n ) Sedangkan metode maximum likelihood estimation adalah merupakan suatu metode untuk memilih estimator yang membuat probabilitas sampel yang diteliti menjadi maksimum.
Adapun Fungsi Likelihood yaitu: L=
( y1 − ( β 0 + β1 X 1 ))2 − X exp (2πσ 2 )0,5 2σ 2 1
Universitas Sumatera Utara
( y2 − ( β 0 + β1 X 2 )) 2 − X . . . X exp (2πσ 2 )0,5 2σ 2 1
( yn − ( β 0 + β1 X n )) 2 − . exp (2πσ 2 )0,5 2σ 2 1
L=
1 n exp − 2 ∑ ( yi − ( β 0 + β1 X i )) 2 2 0,5 n (2πσ ) 2σ i =1 1
. ln fungsi likelihood :
2 1 n ( y − ( β 0 + β 1 X i )) ln L = ln(2πσ 2 ) −0,5 n + − 2 ∑ i 2σ i =1
(σ 2 ) −1 n ∑ ( y i − ( β 0 + β 1 X i )) 2 = ln(2πσ 2 ) −0,5 n + − 2 i =1
Penurunan fungsi likelihood d ln L n 1 1 n =− − (−1) (σ 2 ) − 2 ∑ ( yi − ( β 0 + β1 X i )) 2 2 2 d (σ ) 2σ 2 i =1 =−
n 1 1 2 −2 n 2 − ( − 1 ) (σ ) ∑ (ε i ) = 0 2σ2 i =1 2
n n 1 1 −2 n 2 2 ˆ = maka ( ) (ε i ) 2 / n σ ε σ = ∑ ∑ i 2σ2 2 i =1 i =1
2.3 Estimasi Parameter Metode Maximum Likelihood Maximum likelihood Estimation adalah suatu metode pendugaan klasik yang paling popular untuk digunakan pada proses pendugaan parameter. Cryer (1986) MLE menggunakan keseluruhan informasi dari data pengamatan. Tahap penggunaan metode MLE terdiri dari tahap utama yaitu pengkontruksian fungsi likelihood (perkalian fungsi kepadatan peluang tiap-tiap amatan) dan memaksimumkan fungsi likelihoodnya.
Universitas Sumatera Utara
2.4 Distribusi Normal Multivariat Distribusi normal multivariat merupakan suatu distribusi yang diperoleh dari perluasan distribusi normal univariat, perbedaannya dapat dilihat pada dimensinya. Pada univariat dimensi yang digunakan adalah 1 (p=1), sedangkan untuk bivariat dimensi yang digunakan adalah 2 (p=2) dan untuk multivariate dimensi yang digunakan lebih dari 2 (p>2). Salah satu keuntungan yang diperoleh dari distribusi normal multivariat, adalah secara matematis mudah digunakan dan hasil yang diperoleh memuaskan dan baik serta serta menarik dalam pelaksanaannya (Johnson dan Wicher,2002). Meskipun demikian, distribusi normal multivariat dalam prakteknya digunakan untuk 2 alasan. Pertama, distribusi normal disajikan sebagai model populasi yang dapat dipercaya di beberapa hal. Kedua, distribusi sampel dari beberapa statistic multivariat secara pendekatannya adalah berdistribusi normal (Johnson danWichern,2002) Menurut Rencher (2002), beberapa sifat penting dari distribusi normal multivariat diantaranya adalah (1) distribusi dapat secara lengkap digambarkan hanya melalui rata-rata, variansi dan kovariansi; (2) plot bivariat dari data multivariat dapat menunjukkan trend linier; (3) fungsi linier dari variabel yang berdistribusi normal multivariat juga akan berdistribusi normal; Apabila X mempunyai distribusi normal multivariat dengan vektor ratarata μ dan matriks kovariansi Ʃ, maka fungsi densitas normal multivariatnya
Universitas Sumatera Utara
1
= f ( x)
( 2π )
p 2
.∑
1
ex 2
1 − p( x − µ )T ∑ −1 ( x − µ ) ; − ∞ < x < ∞ ; 2
Dengan p : banyaknya variabel Ʃ : matriks kovariansi µ : vector Variabel acak X dikatakan berdistribusi normal dengan rata-rata=µ, dan variansi =
,
dimana
> 0, jika fungsi kepadatan probabilitas dari X tertentu oleh
rumus
f(X)=
, untuk -∞ <X<∞
Grafik dari y= f(X) merupakan kurva atau garis lengkung, yang lazim dikatakan berbentuk lonceng (irisan bentuk lonceng). Pada situasi multivariate terlihat lebih dari satu variabel. Sekelompok variabel (X 1 ,X 2 ,…,X n ) dikatakan berdistribusi normal p-variate dengan vector ratarataµ= (µ 1 ,µ 2 ,…,µ n ) dan matriks kovarian atau matriks dispersi Ʃ.
Universitas Sumatera Utara