BAB II TINJAUAN PUSTAKA
2.1
Regresi Parametrik Regresi parametrik merupakan metode statistika yang digunakan untuk
mengetahui pola hubungan antara variabel prediktor dengan variabel respon, dengan asumsi bahwa telah diketahui bentuk fungsi regresinya. Secara umum bentuk regresi parametrik linier ditulis sebagai berikut: π¦π = π½0 + π½π ππ + ππ ,
π = 1,2, . . , π πππ π = 1,2, β¦ , π
(2.1)
atau dalam bentuk matriks dapat ditulis dengan: π = ππ½ + π , π~π(0, π 2 )
(2.2)
Menduga koefisien regresi π½ pada regresi sederhana dapat menggunakan metode kuadrat terkecil. Metode ini dilakukan dengan meminimumkan π π π terhadap π½. π π π = (π β ππ½)π (π β ππ½), kemudian π π π diturunkan terhadap π½ dan disamakan dengan nol sehingga diperoleh penduga : π½Μ = (π π π)β1 (π π π)
(2.3)
(Eubank,1998)
2.2
Regresi Nonparametrik Untuk n pengamatan yang independen, (π‘π , π¦π ) dimana π = 1,2, β¦ , π maka
model regresi secara umum dapat ditulis dengan : π¦π = π(π‘π ) + ππ
, π = 1,2, β¦ , π
5
(2.4)
6
π¦π adalah variabel respon ke-i, π(π‘π ) adalah fungsi regresi yang tidak diketahui bentuk kurva regresinya dan ππ adalah error random atau galat acak yang diasumsikan independen dan identik dengan rataan 0 dan keragaman π 2 . Menurut Eubank jika fungsi regresi π(π‘π ) tidak diketahui atau tidak tergantung pada asumsi bentuk kurva tertentu, maka fungsi regresi dapat diduga menggunakan regresi nonparametrik. Pendekatan nonparametrik digunakan untuk menduga kurva regresi yang tidak diketahui bentuk kurva regresinya dan tidak ingin terikat pada asumsi tertentu seperti pada regresi parametrik. Dalam regresi nonparametrik data diharapkan mencari sendiri bentuk pendugaanya, sehingga memiliki fleksibilitas yang tinggi. Kurva regresi hanya diasumsikan termuat dalam suatu ruang fungsi yang berdimensi tak hingga dan merupakan fungsi mulus (smooth). Menduga fungsi π(π‘π ) dilakukan berdasarkan data pengamatan dengan menggunakan teknik smoothing yang dapat digunakan antara lain penduga histogram, kernel, deret orthogonal, spline, k-NN, deret fourier, dan Wavelet (Eubank, 1988).
2.3
Regresi Semiparametrik Regresi semiparametrik merupakan gabungan antara regresi parametrik dan
regresi nonparametrik. Model regresi semiparametrik dapat ditulis sebagai berikut: π¦π = πππ π½ + π(π‘π ) + ππ , π = 1,2, β¦ , π
(2.5)
7
π¦π adalah variabel respon ke-i, ππ adalah komponen parametrik, π(π‘π ) adalah fungsi regresi yang tidak diketahui bentuk kurva regresinya dan ππ adalah galat acak dengan ππ ~π(0, π 2 ).
2.4
Penduga Densitas Kernel Misalkan suatu sampel random π‘1 , π‘2 , β¦ , π‘π dari suatu populasi dengan
fungsi densitas π(π‘) tidak diketahui. Berdasarkan sampel random ini akan diduga fungsi densitasnya. Metode yang paling sederhana adalah dengan membentuk histogram frekuensi relatif. Range data dibagi atas π interval dengan batas interval a1,a2, β¦,ak, sehingga a1οΌ a2οΌ β¦οΌ ak. Penduga densitas untuk suatu nilai π‘ yang berada dalam interval ππ < π‘ β€ ππ+1 , dinotasikan πΜβ (π‘), dinyatakan dengan formula berikut: πΜβ (π‘) =
banyak data pada interval ππ sampai dengan ππ+1 ππ
dengan lebar interval antara ai sampai dengan ai+1 disebut bin width yang dinotasikan dengan b (Wand dan Jones, 1995). Histogram yang kurang halus dapat diatasi dengan prosedur nonparametrik, salah satunya menggunakan penduga (estimator) kernel. Penduga densitas kernel merupakan pengembangan dari penduga histogram. Penduga kernel diperkenalkan oleh Rosenblatt dan Parzen sehingga disebut penduga densitas kernel RosenblattParzen. Rosenblatt memberi bobot pada setiap pengamatan, dengan memilih fungsi K , sehingga pengamatan yang lebih dekat ke π‘ akan memberi sumbangan
8
yang lebih besar terhadap πΜβ (π‘). Fungsi K ini merupakan fungsi pembobot yang dinamakan fungsi kernel (Hardle, 1994). Secara umum kernel K dengan bandwidth h (Wand dan Jones, 1995) didefinisikan sebagai: πΎβ (π‘) =
1 π‘ πΎ ( ) , untuk β β < π‘ < β dan β > 0 β β
(2.6)
serta memenuhi: (i)
πΎ(π‘) ο³ 0, untuk semua π‘
(ii)
β«ββ πΎ(π‘)ππ‘ = 1
β
β
(iii) β«ββ π‘ 2 πΎ(π‘)ππ‘ = π 2 > 0 β
(iv) β«ββ π‘πΎ(π‘)ππ‘ = 0 maka penduga densitas kernel untuk fungsi densitas π(π‘) adalah π
π
1 1 π‘ β π‘π πΜβ (π‘) = β πΎβ (π‘ β π‘π ) = βπΎ( ) π πβ β π=1
(2.7)
π=1
Pada persamaan (2.7) terlihat bahwa πΜβ (π‘) tergantung pada fungsi kernel K dan parameter h . Bentuk bobot kernel ditentukan oleh fungsi kernel K , sedangkan ukuran bobotnya ditentukan oleh parameter pemulus h yang disebut bandwidth. Peran bandwidth seperti lebar interval pada histogram. Beberapa jenis fungsi kernel (Hardle, 1990) antara lain: 1
a.
Kernel Uniform
:πΎ(π‘) = 2 I(|t| β€ 1)
b.
Kernel Triangle
: πΎ(π‘) = (1 β |π‘|)I(|π‘| β€ 1)
c.
Kernel Epanechnikov
: πΎ(π‘) = 4 (1 β π‘ 2 )I(|π‘| β€ 1)
d.
Kernel Quartic
: πΎ(π‘) = 16 (1 β π‘ 2 )2 I(|π‘| β€ 1)
3
15
9
35
e.
Kernel Triweight
: πΎ(π‘) = 32 (1 β π‘ 2 )3 I(|π‘| β€ 1)
f.
Kernel Gaussian
: πΎ(π‘) =
g.
Kernel Cosinus
: πΎ(π‘) = 4 cos ( 2 π‘) I(|π‘| β€ 1)
1 β2π π
1
exp (2 (βπ‘ 2 )) , ββ < π‘ β€ β π
Dengan I adalah fungsi indikator. Berikut disajikan bentuk kurva dari masing-masing fungsi kernel pada selang [-1,1] (Wikipedia) pada gambar 2.1:
Gambar 2.1(a) Kernel Uniform
Gambar 2.1(b) Kernel Triangle
Gambar 2.1(c) Kernel Epanechnikov
10
Gambar 2.1(d) Kernel Quartic
Gambar 2.1(e) Kernel Triweight
Gambar 2.1(f) Kernel Gaussian
Gambar 2.1(g) Kernel Cosinus
2.5
Regresi Nonparametrik Kernel Regresi kernel adalah teknik statistika nonparametrik untuk menduga fungsi
regresi π(π‘π ) pada model regresi nonparametrik π¦π = π(π‘π ) + ππ , ππππππ π = 1,2, β¦ , π. Secara teoritis fungsi regresi (Carmona, 2003) didefinisikan sebagai:
11
β
β
β« π¦ π(π‘, π¦)ππ¦ π(π‘) = πΈ(π|π = π‘) = β« π¦ π(π¦|π‘)ππ¦ = ββ π(π‘)
(2.8)
ββ
Fungsi densitas bersama π(π‘, π¦) tidak diketahui dan dapat diduga dengan kernel multiplikatif, yaitu: π
1 π‘ β π‘1 π¦ β π¦π πΜβ1 ,β2 (π‘, π¦) = βπΎ( )πΎ( ) πβ1 β2 β1 β2 π=1
π
1 π‘ β π‘1 π¦ β π¦π = β πΎβ1 ( ) πΎβ2 ( ) π β1 β2
(2.9)
π=1
sehingga diperoleh penduga fungsi regresi, yaitu: β
β« π¦πΜβ1 β2 (π‘, π¦)ππ¦ πΜ(π‘) = ββ πΜβ (π‘)
(2.10)
akan dihitung pembilang pada persamaan (2.10) β
β
ββ
ββ
π
1 β« π¦ πΜβ1 β2 (π‘, π¦)ππ¦ = β« π¦ β πΎβ1 (π‘ β π‘π )πΎβ2 (π¦ β π¦π )ππ¦ π π=1
π
π
1 = β πΎβ1 (π‘ β π‘π ) β« π¦ πΎβ2 (π¦ β π¦π )ππ¦ π π=1 π
π=1
β
1 π¦ π¦ β π¦π = β πΎβ1 (π‘ β π‘π ) β« πΎ( )ππ¦ π β2 β2 π=1
ββ
dengan memisalkan π¦ = π¦π + π§β2 β π
ππ¦ ππ§
= β2 β ππ¦ = β2 ππ§, sehingga:
β
1 π¦π + π§β2 π§β2 = β πΎβ1 (π‘ β π‘π ) β« πΎ( ) β2 ππ§ π β2 β2 π=1 π
ββ
β
1 = β πΎβ1 (π‘ β π‘π ) β« (π¦π + π§β2 )πΎ(π§)β2 ππ§ π π=1
=β
12
π
β
β
ββ
ββ
1 = β πΎβπ (π‘ β π‘π ) (π¦π β« πΎ(π§) ππ§ + β2 β« π§πΎ(π§)ππ§) π π=1
β
β
karena β«ββ πΎ(π§)ππ§ = 1 dan β«ββ π§ πΎ(π§)ππ§ = 0, maka diperoleh: β
π
1 β« π¦ πΜβ1 β2 (π‘, π¦)ππ¦ = β πΎβ1 (π‘ β π‘π )π¦π π
(2.11)
π=1
ββ
dengan mengganti pembilang dan penyebut pada (2.10) dengan (2.11) dan (2.7) maka diperoleh: 1 π βπ=1 πΎβ (π‘ β π‘π )π¦π π πΜ(π‘) = 1 π β (π‘ ) π π=1 πΎβ β π‘π πΜ(π‘) =
βππ=1 πΎβ (π‘ β π‘π )π¦π βππ=1 πΎβ (π‘ β π‘π )
(2.12)
(2.13)
π
πΜ(π‘) = β π€βπ (π‘) π¦π
(2.14)
π=1
Dengan 1 π‘ β π‘π π‘ β π‘π πΎ( ) πΎ( ) πΎβ (π‘ β π‘π ) β β β π€βπ (π‘) = π = = π‘βπ‘ π‘ β π‘π βπ=1 πΎβ (π‘ β π‘π ) 1 βπ πΎ( ) βππ=1 πΎ ( β π ) π=1 β β
(2.15)
Penduga (2.12) diusulkan oleh Nadaraya dan Watson, sehingga penduga ini sering disebut penduga Nadaraya-Watson (Hardle, 1994). Pada regresi kernel, ukuran penduganya ditentukan oleh bandwidth. Smoothing pada regresi kernel pendugannya saling melengkapi (Ryan,1996).
13
2.6
Pemilihan Bandwidth Optimal Permasalahan utama pada kernel smoothing bukan terletak pada pemilihan
fungsi kernel tetapi pada pemilihan bandwidth (Hastie dan Tibshirani, 1990). Bandwidth (h) adalah parameter pemulus (smoothing) yang berfungsi untuk mengontrol kemulusan dari kurva yang diduga. Bandwidth yang terlalu kecil akan menghasilkan kurva yang undersmoothing yaitu sangat kasar dan sangat fluktuatif (Gambar 2.2), dan sebaliknya bandwidth yang terlalu lebar akan menghasilkan kurva yang oversmoothing yaitu sangat mulus (Gambar 2.3), tetapi tidak sesuai dengan pola data (Hardle, 1994). Oleh karena itu perlu dipilih bandwidth yang optimal untuk menghasilkan kurva yang optimal (Gambar 2.4)
0 -50 -100
Percepatan (g)
50
Plot Estimasi Kernel Triangle
10
20
30
40
50
Waktu (milidetik)
Gambar 2.2. Kurva regresi dengan menggunakan bandwidth (h) yang terlalu kecil. (Sumber: Lestari (2010))
14
-100
-50
0
Percepatan (g)
50
Plot Estimasi Kernel Triangle
10
20
30
40
50
Waktu (milidetik)
Gambar 2.3. Kurva regresi dengan menggunakan bandwidth (h) yang terlalu besar. (Sumber : Lestari (2010))
0 -50 -100
Percepatan (g)
50
Plot Estimasi Kernel Triangle
10
20
30
40
50
Waktu (milidetik)
Gambar 2.4. Kurva regresi dengan menggunakan bandwidth (h) optimal (Sumber : Lestari (2010))
15
Suatu kriteria untuk β akan dibatasi pada kelas penduga linear, yang mana untuk setiap β ada matriks π»(β) berukuran π Γ π, π»(β) simetri dan semidefinit positif, sehingga πβ = π»(β)π dengan elemen-elemen π»(β) adalah: .
π‘ β π‘π ) β π€ππ = π‘ β π‘π βππ=1 πΎ ( ) β πΎ(
(2.15)
Salah satu metode untuk mendapatkan β optimal adalah dengan menggunakan kriteria Generalized Cross Validation (GCV) (Eubank, 1988), yang didefinisikan sebagai berikut: πππΈ
πΊπΆπ(β) =
2
(2.16)
1 (π π‘π(πΌ β π»(β))) dengan πππΈ:
π
1 πππΈ = β(π¦π β πβ (π‘π ))2 π π=1
2.7
Pertumbuhan Balita Pertumbuhan balita dapat dilihat dari perkembangan berat badan balita
tersebut. Pertumbuhan balita bisa dipantau dengan melihat grafik berat badan yang terdapat di kartu menuju sehat (KMS). Standar acuan pertumbuhan balita adalah Berat Badan menurut Umur (BB/U), Berat Badan menurut Tinggi Badan (BB/TB), dan Tinggi Badan menurut Umur (TB/U). Parameter Yang umum digunakan di Indonesia adalah Berat Badan menurut Umur (BB/U) sesuai dengan standar tabel WHO-NCHS (National Center of Health Statistics) dan parameter ini dipakai menyeluruh di Posyandu.
16
Klasifikasinya adalah normal, underweight (kurus) dan overweight (gemuk) (Masruri,2009) dalam Setyaningsih (2010).