A Y
A B A
R ANALISIS DATA KUALITATIF U S A (INTRODUCTION TO CATEGORICAL DATA P I N ANALYSIS) U A K I T
S I T TA
S
GANGGA ANURAGA S.Si, M.Si
Materi :
Tabel dua dimensi Tabel dimensi > 2 Pratikum Pratikum
Model logistik
Pratikum
S I T TA
Multinomial (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model)
Pratikum
Ordinal (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model)
S Model poisson (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian
K I T
Biner (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model)
A B A
R U
S A
P I N U A
Model log linier (Model dan Interpretasi)
A Y
Pendahuluan : Distribusi dalam dalam data diskret Tabel Kontingensi
Pratikum
model)
Pratikum
Kontrak kuliah No
Komponen
1
Partisipasi kuliah
2
Tugas-tugas
3
Kuis
4
Ujian Tengah Semester
5
Ujian Akhir Semester
K I T
N U A
Jumlah
S
S I T TA
A IP
A Y Bobot Nilai (10%) A B 10 A R 20 U 15 S 25 30 100
referensi A Y Agresti, Alan. 1996. An Introduction to Categorical A B Data Analysis. Wiley Series : New York A R U S A P I N U A K I T S I T A T S
Pendahuluan
A Hubungan antara variabel X dan Y, dimana Y Y adalah A B variabel diskret (Nominal, Ordinal) dan A X merupakan R variabel kontinyu atau diskret (Nominal, Ordinal, U S Interval dan rasio) A P I Tujuan ADK : N
U Digunakan pada data berbentuk kategori, terutama pada A K I variabel respon yang berbentuk diskret/kategori. T S I Contoh : T A T Y : partai S politik (Demokrat, Gerindra, Golkar)
X : pendidikan, pendapatan, dan jenis kelamin
Terdapat 2 jenis variabel kategori A Y
A B Contoh : jenis kelamin, jenis musik (rock,A pop, jazz) dll R U Ordinal S A P Contoh : tingkat pendidikan (SD, SMP, SMU, PT) I N U Selanjutnya yang akan menjadi perhatian penting adalah A K variabel biner (sukses – gagal). Dan perbedaan penting I T nominal-ordinal. S I T A T S
Nominal
Distribusi Probabilitas dalam Analisis Data Kualitatif (CDA) A Distribusi Binomial Y A B distribusi untuk proses bernoulli A R Karakteristik proses bernoulli U S Percobaan berlangsung n kali,A dalam cara dan kondisi P sama I N Setiap percobaan hanya ada 2 kejadian yang mungkin U A terjadi, yang mana saling asing dan independen. K I T Peluang / probabilitas dari satu percobaan ke percobaan S I adalah konstan. yangT lain A T 2 kejiadian tersebut umumnya dinotasikan sebagai kejadian Ssukses dan kejadian gagal
Lanjutan distribusi binomial P( Sukses), 1 P( gagal ) untuk setiap percobaan A
Y A dihitung Y munculnya atau jumlah sukses yang akan B A R Setiap percobaan saling asing dan independen U S n = jumlah percobaan A P I N Y berdistribusi binomial U A K I T S I T A T S
Contoh : A Suatu pemilihan umum / pemilu yang diikutiY oleh A B partai demokrat dan golkar, yang mana A R dilaksanakan dalam 3 putaran.SMisalkan peluang U A partai demokrat memenangkan pemilu adalah 0,5 P I N ( P( Demokrat ) = 0,5) .Berapa probabilitas partai U A demokrat memenangkan pemilu sebanyak 3 kali. K I T S Jawab : n T =I3, Y = munculnya atau jumlah sukses A partai demokrat. yang memilih T S
Lanjutan Contoh : A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
Catatan : A Y
E (Y ) n
A B A
(menunjukkan rata-rata kesuksesan dari sebuah percobaan) Var (Y ) n (1 ), n (1
R U
S (menunjukkan variansi/standar deviasi dari sebuah percobaan) A P I N Y U , p juga dilambangkan A n K I T e kesuksesan dari sebuah percobaan) (menunjukkan S persentas I T Y A E ( p) T S E n ^
(1 ) Y n n
A Y
A B Probabilitas kiriman paket dari suatu biro perjalanan A R akan sampai tepat waktu adalah 0,8. jika kita U S mengirim lewat biro tersebutA 10 kali, P I Berapa probabilitas bahwa 6 diantaranya akan sampai N U tepat waktu ? 0,0881 A K I Berapa rata-rata dan varians bahwa 6 diantaranya akan T S sampaiItepat waktu ? 8 dan 1,6 T A T S
Soal :
Pengujian Proporsi untuk Distr. Binomial
A Y
Untuk distribusi binomial, menggunakan estimator ML dalam inferensi statistik untuk parameter
A B A
R U
Estimator ML adalah proporsi sampel ( p ) Sampling distribusi dari proporsi sampel ( p), memiliki mean dan s tan dar error sbb :
S A
P I N pU statistik uji yang digunakan : z A (1 ) K I n T S I Hipotesis yang digunakan, H : vs H : T A Daerah kritis : dengan =0,05 (Z =1.96) T S p (1 p ) (1 ) E ( p) , ( p) n
0
0
0
0
0,025
Dan CI 95% adalah p 1,96
n
0
1
0
(satu arah)
Distribusi Multinomial
A Jika dalam setiap percobaan / eksperimen didapatkan Y A B peluang munculnya kesuksesan (possible A outcomes) > 2, R dengan beberapa kategori. Maka U dinamakan sebagai S distribusi multinomial (multinomial distribution). A P I Contoh : Beberapa percobaan yang memiliki lebih dari N U dua hasil yang mungkin. A K I T Misalnya, hasil untuk driver dalam kecelakaan mobil S I T dapat A terekam menggunakan kategori "tidak terluka," "cedera ST yang tidak memerlukan rawat inap," "cedera yang memerlukan rawat inap," "kematian."
Lanjutan Distribusi Multinomial A Y
A B A
R U
S A
c menunjukkan jumlahIkategori hasil P
N U 1 , 2 ,..., c peluang sukses (probability) A K I j j 1 IST T A T S n n j j
Contoh : Distribusi Multinomial A Y Dalam pemilihan umum sebuah negara besar, A B kandidat A mendapat 20% suara, calon B A R menerima 30% suara, dan kandidat C menerima U S A 50% suara. Jika enam pemilih yang dipilih secara P I N acak, berapakah probabilitas bahwa akan ada U A tepat satu pendukung calon A, dua pendukung K I T calon B dan tiga pendukung kandidat C dalam S I T sampel? A T S
A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
A Y
A B A R U CONTINGENCY TABLES S A P I (TABEL KONTINGENSI) N U A K I T
S I T TA
S
GANGGA ANURAGA S.Si, M.Si
Tabel Kontingensi A Berkaitan dengan hubungan antar variabelY A B kategori / diskret. A R U Menguji apakah kedua variabel tersebut (diskret) S A independent. P I N U A K I T S I T A T S
Syarat pada Tabel Kontingensi
A Homogen : setiap level atau kategori dalam suatu Y A variabel merupakan objek yang sama. B A R Independent (saling bebas) U S P(AB) P(A) P(B) A P I Skala nominal : skala yang digunakan untuk N U membedakan benda atau peristiwa yang satu dengan A K lainnya, misal : jenis kelamin (laki-laki, perempuan I T S I : skala yang digunakan untuk Skala ordinal T A membedakan dan mengurutkan data, misal tingkat T S pendidikan (SD, SMP, SMA, PT)
Tabel Kontingensi r x c Baris 1 2 . . . r
1 n11 n21 . . . nr1
2 n12 n22 . . . nr2
Lajur / Kolom . . . . . . . . . . . . . .
c n1c n2c . . . nrc
A B A
R U
S A
P I N U A
K I T
. . . . . . .
S I T A Tabel kontingensi berisi hitungan hasil n , T S ij
yang mana banyaknya individu yang termasuk
dalam sel ke ij, i = 1,2...r dan j = 1,2...c
A Y
Tabel Kontingensi 2 x 2
Misal hubungan antar jenis kelamin dengan YA A B kepercayaan bahwa ada kehidupan A setelam mati. Tabel
P I N U A
K I T
S I T TA
S
R U
S A
1:
Probabilitas Joint dan Marginal
A B A
Probabilitas join (Joint Probability) ij pij P X i, Y j
nij
A Y
R U
n S A baris ke-i dan kolom ke-j menyatakan peluang ( X , Y ) pada
P I N dinyatakan sebagai joi nt distribution dari X dan Y U A K 1TI S I T A T S ij
i, j
ij
A Y
Tabel probabilitas untuk kontingensi 2 x 2A Belief in Afterlife
Gender females Males Total
Yes π11 π21 π+1
S A
Total
No or Undecided π12 π1+ π22 π2+ π+2 π++
P I N U A
K I T
S I T TA
S
R U
B A
Tabel Probabilitas Tabel
A Y
Gender
Yes
Belief in Afterlife No or Undecided
K I T
π21= 398/1127 = 0,353
S I π T TA
Total
S misal :
+1 =
R U
S A
π = 116/1127 = 0,103 P I N U A
females π11= 509/1127 = 0,452 Males
A B A
2:
0,805
12
Total π1+ = 0,555
π22 = 104/1127 = 0,092
π2+ = 0,445
π+2 = 0,195
π++ = 1
n11 0, 452, 11 p11 n menyatakan peluang (joint probability) dari jenis kelamin perempuan yang mengatakan ya/percaya ada kehidupan setelah mati
A Probabilitas Marjinal (Marginal Probability)Y A B Merupakan total dari baris dan atau total kolom dari A R probabilitas join (joint probabiliy). U S A merupakan total dari probabilitas join (joint probability) dari baris ke-i P I N merupakan total dari probabilitas join (joint probability) dari kolom ke-j U A = 1, merupakanK total dari probabilitas marginal I T S I T A T S i
j
ij
Joint A Probability Y
Total A Yes No or UndecidedB A R U S females π = 509/1127 = 0,452 π = 116/1127 = 0,103 π = 0,555 A P I N U Males π = 398/1127 = A 0,353 π = 104/1127 = 0,092 π = 0,445 K I T S I T Total π = 0,805 π = 0,195 π =1 A ST Belief in Afterlife
Gender
11
12
1+
21
22
2+
+1
+2
++
Marginal Probability
Independensi A Y Untuk selanjutnya pandang Y sebagai variabel A B respon (belief in afterlife) dan X (Gender) sebagai A R variabel penjelas (explanatory variable). Dan U ij pij S A , jika X dan Y bebas (independen) maka : P I p p x p N U pA p p xK I T p IpS x p T pTA p x p S 11
1.
.1
12
1.
.2
21
2.
.1
22
2.
.2
( b a c a h a m p ir s a m a )
Uji Independensi (Chi-Squared dan Likelihood Ratio Test) H i p o t e s i s y a n g d i g u n a k a n a d a la h s e b a g a i b e r i k u t : A H : t i d a k a d a h u b u n g a n a n t a r a X d a n Y ( b e b a s ) a t a u (A Y ) t a uB( ) H : a d a h u b u n g a n a n t a r a X d a n Y ( t i d a k b e b a s ) aA R id e n tifik a s i : n n U m e r u p a k a n n i la i h a r a p a n d a r i n d e nS g a n a s u m s i in d e p e n d e n A nIP n n n ˆ np p n N n n n U A h a ra p a n ˆ e s t i m a s i n i la iK I S t a t i s t i k U j i : ST I T u n tu k ta b e l k o n tin g e n s i I x J , d e n g a n p e a rs o n A T d a n LS i k e li h o o d r a t i o t e s t G s e b a g a i b e r i k u t : 0
ij
1
ij
ij
i
ij
j
ij
ij
i
ij
j
i
j
i
j
ij
2
2
2 h itu n g
df
I
n
ij
ˆ i j ˆ i j
1 J 1
2
,G
2
2
n ij n i j lo g ˆ i j
i
j
i
j
Uji Chi-Squared A Yyang Uji Chi-Sqaured menuntut frekuensi-frekuensi A diharapkan tidak boleh terlalu kecil. AB R U bebas (db) Untuk uji Chi-Squared dengan S derajat A yang lebih besar 1, lebihIdari 20% selnya harus P N diharapkan lebih dari mempunyai frekuensiUyang A 5 dan tidak satu sel pun boleh memiliki K I T frekuensi yang diharapkan kurang dari satu. S I T A T S
Contoh uji independensi A Y
Gunakan pearson 2 dan Likelihood ratio G 2 sebagai statistik uji
S A
R U
K I T
P I N U A
S
S I T TA
A B A
Yates (1934) A Y Melakukan koreksi terhadap pearson Chi-Squared. A B A Frank Yates, ahli statistik Inggris, menyarankan R U koreksi untuk kontinuitas yang menyesuaikan rumus S A untuk uji chi-squared Pearson dengan mengurangi P I N masing-masing nilai 0,5 dari perbedaan U antara A yang diamati dan nilai yang diharapkan dari tabel K I T 2 × 2 kontingensi. S I T A T n ˆ 0,5 S ˆ 2
2 Yates
ij
ij
ij
Fisher A Y Digunakan pada sampel kecil, untuk nilai harapan A B < 5. A R U Nilai p_value langsung dapat dihitung, S A dibandingkan dengan signifikansi alpha (0,05). P I N U Langkah-langkah dalam uji fisher : A K I Mencari konfigurasi-konfigurasi tabel yang lebih T ekstrimTdari IS tabel yang diamati A nilai p, katakanlah p , p ,..., p Menghitung T S 1
Nilai
2
k
p dari tabel yang diamati adalah penjumlahan
p1 p2 ... pk
Fisher (Lanjutan 1) A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
Fisher (Lanjutan 2) A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
Fisher (Lanjutan 3) A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
Fisher (Lanjutan 4) A Y
R U
S A
P I N U A
A B A
Dengan alpha I=K0,05, maka dapat disimpulkan T S bahwa tidak I ada hubungan (independen) antara T Apsychotics dan neurotics dengan gejala gejala T S perasaan bunuh diri.
Risiko Nisbi (Relative Risk)
A Y
A B A
Merupakan perbandingan antara dua peluang yang sukses Menyatakan peluang terjadinya suatu kejadian (resiko) Nilai relative risk akan berkisar dari nol sampa tidak hingga Nilai relative risk yang sama dengan 1 atau mendekati 1 mengindikasikan tidak ada hubungan antara kedua variabel tersebut
S A
R U
P I N U A
K I T
n11 S I T 1 n1 A RRT S 2 n21
n2
Risiko Nisbi (Relative Risk) A Y
A B A
R U
S A
P I N P(perempuan percaya ada kehidupan setelah mati) U =509/625 =0,81 A K I T P(laki-laki percaya ada kehidupan setelah mati) =398/502 S =0,79 TI A T Didapatkan relative risk yang mendekati 1 mengindikasikan S tidak ada hubungan antara kedua variabel tersebut RR
0,81 1, 02 0, 79
Odds Ratio A Y Odds adalah peluang terjadinya suatu kejadian A B dibandingkan peluang tidak terjadinya kejadian A R tersebut. U S A P I N U Odds ratio adalah adalah perbandingan dari dua A K odds. I T S I T A T S
A Y
R U
S A
P I N U A
A B A
TABEL DIMENSI GANDA K I T
S
S I T TA
Gangga Anuraga
Uji kebebasan bersama-sama / mutual independence dalam tabel kontingensi 3 x 3
Hipotesis : H :p p p p
.. k
H :p p p p
.. k
0
0
ijk
i ..
ijk
. j.
i ..
. j.
A Y
(n E ) Statistik Uji : E r
c
l
2
ijk
ijk
P I N U A
i 1 j 1 k 1
ijk
dengan :
K I T
n n n ˆ E N df rcl r c l 2 i ..
. j.
.. k
S I T Ar T i 1, 2,..., S j 1, 2,..., c ijk
ijk
k 1, 2,..., l
2
R U
S A
2
A B A
Contoh :
Data perilaku kelas pada pada sekolah anak-anak
A Y Uji apakah terdapat hubungan antara perilaku kelas anak-anak A B (deviant, non deviant), kondisi sekolah (low, medium, high) dan A R indeks resiko yang terkait dengan kondisi tempat tinggal (not at U S risk, at risk) A P I N U A K I T S I T A T S
1.Tentukan terlebih dahulu n , n , dan n i ..
. j.
A Y
.. k
non deviant dan deviant n (16 7) (15 34) (5 3) 80 1..
R U
S A
n (1 1) (3 8) (1 3) 17 2..
P I N U A
not at risk dan risk n (16 1) (15 3) (5 1) 41 .1.
K I T
n (7 1) (34 8) (3 3) 56
S I T TA
.2.
condition school n (16 7) (1 1) 25 ..1
S
n (15 34) (3 8) 60 ..2
n (5 3) (1 3) 12 ..3
A B A
2. Tentukan nilai harapan masing-masing sel nn n E N 80 x 41 x25 E 8,72 97 x 97 80 x 56 x25 E 11,90 97 x 97 lanjutkan... i ..
ijk
. j.
A Y
A B A
.. k
2
111
S A
P I N U A
121
K I T
S
S I T TA
R U
A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
Statistik Uji :
A Y
(n E ) 17,30 E r
c
2
ijk
ijk
R U
i 1 j 1 k 1
ijk
df rcl r c l 2 df 7
2
14,07
A B A
2
l
S A
P I N U A
K I Kesimpulan : Karena tolak H maka T S I T perilaku kelas anak-anak (deviant, non deviant), A T S kondisi sekolah (low, medium, high) dan 7 ,0.05
0
indeks resiko (not at risk, at risk) tidak bebas bersama-sama
Jika ditanyakan apakah kondisi sekolah dan indeks resiko A independet berdasarkan perilaku kelas, maka : Y
S A
R U
P I N U A
K I T
S I T TA
S
10,78 dengan df = 2 2
A B A
TUGAS
A Y
R U
S A
K I T
P I N U A
A B A
Kombinasikan data untuk jenis kelamin sehingga menjadi 4 x 4 kemudian uji independensi dengan menggunakan pearson dan likelihood ratio test, interpretaasikan. Bandingkan 2 level pendapatan pertama terhadap kepuasan kerja dengan menggunakan likelihood ratio test, interpretaasikan. Bandingkan 2 level pendapatan terakhir terhadap kepuasan kerja dengan menggunakan likelihood ratio test, interpretaasikan.
S
S I T TA
A Y
R U
A B A
S A P I TERIMA KASIH N U A K I T
S
S I T TA
A Y
R U
S A
K I T
P I N U A
S
S I T TA
A B A
MODEL LOG LINIER Gangga Anuraga
MODEL LOG LINIER
Menyatakan hubungan antar variabel, dengan data yang A bersifat kualitatif (skala nominal atau ordinal). Y A B Dengan menggunakan pendekatan log linier bisa A R diketahui model matematikanya secara pasti serta level U S atau kelas mana yang cenderung menimbulkan adanya A P I hubungan atau dependensi. N U Dalam tabel kontingensi I x J, dikatakan independen A K apabila ij i T jI S I T Formula dalam model log linier menggunakan nilai A harapan ST ij n ij dan independen jika n ij
i
j
MODEL LOG LINIER UNTUK TABEL 2 X 2 M isalkan X sebagai variabel baris dan Y sebagai variabel kolom , m aka m odel log linier dapat dituliskan sebagai berikut : log X
ij
i
Y
...(1)
j
R U
S m enunjukkan efek utam a kategoriA P I ke-i variabel X . N m enunjukkan efek utam U a kategori ke-j A K variabel Y . I T dituliskan sebagai berikut : S dan m odel jenuhIdapat T log A ... (2) T S interaksi antara kategori ke-i peubah X = efek
dim ana : X
i
Y
j
X
ij
i
Y
j
XY
ij
XY
ij
dan kategori ke-j peubah Y untuk i= 1,2,3,...,I dan j= 1,2,3,...,J
A B A
A Y
log (terdapat hubungan antara log ij
ij
A Y ij
dengan n , sehingga n dapat digunakan BA ij
untuk menduga log )
S A
ij
J A K STI TI TA I J
I
j
ij
j 1
i
P I N U
ij
i 1
S
IJ
A R U
ij
I
J
i 1
j 1
ij
A Y
X
i
i
A B A
Y
j
j
S A
XY
ij
ij
i
j
S I T TA
P I N U A
K I T
S
R U
CONTOH KASUS
Hubungan partai dengan jenis kelamin jenis kelamin Laki-laki Perempuan Total
Partai konservatif buruh 222 115 240 185 300 462
Total
R U
A B A
S A
337 425 762
P I N U Ln nij hubungan partai dengan jenis kelamin A K eta(ij) I T Partai S jenis kelamin I eta(i+) buruh konservatif T A 5.40 Laki-laki 5.07 4.74 T S Perempuan eta(+j)
5.48 5.44
5.22 4.98
5.35 5.21
A Y
A Y
Sehingga : 5, 21 0,14
R U
X
S A
1
0,14 X
P I N U A
2
0, 23 Y
1
0, 23 Y
2
XY 11 XY 21
K I 0,10 T 0,10 S I T 0,10 0,10 A ST XY
12
XY
22
A B A
MODEL JENUH / SATURATED MODEL (MODEL 0) Didapat model penuh (saturated model) misal log v ij
ij
v
XY
v
XY
X
ij
i
Y
j
ij
S A
R U
A B A
P I N 5, 4 5, 21 0,14 0, 23 0,10 (mod el jenuh) U v IKA T S I 0, 23 0,10 (mod el jenuh) 5, 21 0,14 T A T df 0SG 0,000 X
11
1
1
X
21
2
2
Y
Y
1
11
XY
21
A Y
MODEL TANPA INTERAKSI (MODEL 1) XY
ij
Model 1 adalah interaksi antar 2 variabel dihilangkan A misal log v AY ij
v X
ij
i
ij
Y j
Untuk mengevaluasi interaksi
S A
R U
B A
P I N dapat dilakukan dengan membandingkan model U A Berikut hipotesis yang dibangun : K I T S H model 1I adalah model terbaik T A T H Smodel 0 (saturated model) adalah model terbaik XY
ij
0
1
Statistik Uji :
A Y
Dengan pearson 2 dan Likelihood ratio test G2 sebagai BAberikut :
A R n ˆ nSU , G 2n logA ˆ P I ˆ N U df I 1 J 1 A K I T 0,05 S I T 3,841 A T S 2
2 hitung
ij
ij
ij
ij
2 1:0,05
ij
2
ij
Tabel Frekuensi Harapan dan ln dari frekuensi harapan jenis kelamin
Partai
A B 337.00 A R U 425.00 S A
buruh
konservatif
Laki-laki
204.32
132.68
Perempuan
257.68
167.32
Total
462.00
K I T buruh S I T Laki-laki 5.32 A Perempuan 5.55 ST
P I N U APartai
jenis kelamin
Total
10.87
300.00
A Y
konservatif
Total
762.00 Total
4.89
10.21
5.12
10.67
10.01
20.88
ANALISIS DAN PEMBAHASAN
A Y
Perhitungan : nij G 2 nij log ˆ ij G 2 7, 003138 Keputusan : Tolak H 0 2
K I T
R U
S A
P I N U A
A B A
Sehingga dapat ditarik kesimpulan bahwa Model 0 (model lengkap) sebagai model terbaik. Jadi model log linier untuk hubungan antara kedua variabel tersebut adalah : vij
S I T TA
S
i
X
Yj ijXY
INTERPRETASI :
Interpretasi dari model adalah adanya hubungan A antara variabel jenis partai dengan variabel Jenis kelamin, Y A B dan dimana pengaruh efek utama variabel jenis A partai R variabel jenis kelamin juga masuk ke dalam model. U S Gunakan SPSS A
K I T
P I N U A
S
S I T TA
UJI K-WAY Uji K-Way
A Y
A B A
1. Pengujian interaksi pada derajat K atau lebih tinggi sama
dengan nol (Test that K - Way and higher order effect are zero)
R U
S A
Uji ini didasarkan pada hipotesis bahwa efek order ke-K dan
P I N U A
yang lebih tinggi sama dengan nol.
Pada model log linear hipotesisnya sebagai berikut. - Untuk K = 2
K I T
S I T A - Untuk T K=1 S H : Efek order ke-1 dan yang lebih tinggi = 0 H : Efek order ke-2 = 0 0
H : Efek order ke-2 0 1
0
H : Efek order ke-1 dan yang lebih tinggi 0 1
U ji K -w ay 2 . P en g u jian in terak si p ad a d erajat K sam a d en g an n o l (T est th a t K - W a y effect a re zero ) U ji in i d id asark an p ad a h ip o tesis efek o rd er k e-K sam a d en g an n o l. P ad a m o d el lo g li n ear h ip o tesisn ya seb ag ai b erik u t. - U n tu k K = 1 H : E fek o rd er k e-1 = 0
A B A
R U
S A
P I N U A
A Y
K I T
0
H : E fek o rd er k e-1 0
S I T TA
1
- U n tu k K = 2 H : E fek o rd er k e-2 = 0 0
S
H : E fek o rd er k e-2 0 1
S tatistik u ji yan g d ig u n ak an ad alah L ik elih o o d R atio T est (G ) K riteria p en o lak an G 2 > (d b ; ) m ak a to lah H 2
2
0
Output SPSS Uji K-Way
A Y
A B A
R U
S A
P I N Pada pengujian efek order ke-K atauU lebih sama dengan nol dijabarkan sebagai berikut. A Untuk K = 2 K I T Hipotesis : S I T H : Efek order A ke-2 = 0 T H : EfekS order ke-2 0 0
1
P_value yang kurang dari nilai = 5% yaitu 0,008.
Sehingga Hdidukung oleh data, artinya efek interaksi order kedua terdapat dalammodel. 1
Untuk K = 1 Hipotesis : H : Efek order ke-1 dan yang lebih tinggi = 0
A Y
0
H : Efek order ke-1 dan yang lebih tinggi 0 1
P_value = 0,000 yang kurang dari nilai = 5% .
R U
S A
P I N Pada pengujian efek order ke-K sama dengan nol U dijabarkan sebagai berikut. KA I T Untuk K = 1 S I Hipotesis : T Ake-1 = 0 H : Efek order T Sorder ke-1 0 H : Efek
A B A
Sehingga H didukung oleh data, artinya efek interaksi order kesatu dan yang lebih tinggi 1
terdapat dalam model.
0
1
Nilai P_value = 0,000 yang kurang dari nilai = 5%. Sehingga H didukung oleh data, artinya efek interaksi order ke-1 terdapat dalam model. 1
A Y
U n tu k K = 2 H ip o tesis : H : E fek o rd er k e-2 = 0 0
H : E fek o rd er k e-2 0 1
R U
S A
P I N U A
A B A
N ilai P _ valu e = 0 ,0 0 8 yan g k u ran g d ari n ilai = 5 % . S eh in g g a H d id u k u n g o leh d ata, artin ya 1
K I T
efek in terak si o rd er k e-2 terd a p at d alam m o d el.
S
S I T TA
Uji Asosiasi Parsial
A Y
A B A
P e n g u jia n in i m e m p u n y a i tu ju a n u n tu k m e n g u ji
s e m u a p a ra m e te r y a n g m u n g k in d a ri s u a tu m o d e l le n g k a p
R U
b a ik u n tu k s a tu v a ria b e l y a n g b e b a s m a u p u n u n tu k
S A
h u b u n g a n k e te rg a n tu n g a n b e b e ra p a v a ri a b e l y a n g
P I H ip o te s is n y a a d a la h s e bU a gN a i b e rik u t. - H : E fe k in te ra k K si A a n ta ra v a ria b e l 1 d a n v a ria b e l 2 = 0 I T H :H S I T - H : E fe k v a ria b e l 1 = 0 A HS :T H m e ru p a k a n p a rs ia l d a ri s u a tu m o d e l le n g k a p .
0
1
0
0
1
-H
0
0
: E fe k v a ria b e l 2 = 0
H :H 1
0
OUTPUT SPSS UJI PARSIAL
A Y
R U
S A
P I N (db;U ). A
A B A
Statistik uji yang digunakan adalah partial chi-squared dengan derajat bebas
2
K I T
tolak H yang berarti terdapat efek variabel jenis kelamin
S I T tolak HA yang berarti terdapat efek variabel jenis partai T S dalam model. 0
dalam model. 0
SELEKSI MODEL
Eliminasi Backward
A Y Seleksi model log linier dilakukan dengan metode Backward Elimination. A B Metode Backward Elimination pada dasarnya menyeleksi A model R U melihat dengan menggunakan prinsip hierarki, yaituS dengan A model terlengkap sampai dengan P I N model yang sederhana. U A Untuk memilih model terbaik menggunakan hipotesis sebagai berikut. K I T H : Model 1 adalah model terbaik S I T H : Model 0 (model jenuh) adalah model terbaik A ST 0
1
A Y
R U
A B A
S A
S
P I TERIMA KASIH N U A K I T S I T TA
A Y
R U
S A
P I N U A
A B A
MODELIK LOG LINIER (Lanjutan)
S
T S I T TA
Gangga Anuraga
CONTOH KASUS
Hubungan partai dengan jenis kelamin jenis kelamin Laki-laki Perempuan Total
Partai konservatif buruh 222 115 240 185 300 462
Total
R U
A B A
S A
337 425 762
P I N U Ln nij hubungan partai dengan jenis kelamin A K eta(ij) I T Partai S jenis kelamin I eta(i+) buruh konservatif T A 5.40 Laki-laki 5.07 4.74 T S Perempuan eta(+j)
5.48 5.44
5.22 4.98
5.35 5.21
A Y
A Y
Sehingga : 5, 21 0,14
R U
X
S A
1
0,14 X
P I N U A
2
0, 23 Y
1
0, 23 Y
2
XY 11 XY 21
K I 0,10 T 0,10 S I T 0,10 0,10 A ST XY
12
XY
22
A B A
MODEL JENUH / SATURATED MODEL (MODEL 0) Didapat model penuh (saturated model) misal log v ij
ij
v
XY
v
XY
X
ij
i
Y
j
ij
S A
R U
A B A
P I N 5, 4 5, 21 0,14 0, 23 0,10 (mod el jenuh) U v IKA T S I 0, 23 0,10 (mod el jenuh) 5, 21 0,14 T A T df 0SG 0,000 X
11
1
1
X
21
2
2
Y
Y
1
11
XY
21
A Y
MODEL TANPA INTERAKSI (MODEL 1) XY
ij
Model 1 adalah interaksi antar 2 variabel dihilangkan A misal log v AY ij
v X
ij
i
ij
Y j
Untuk mengevaluasi interaksi
S A
R U
B A
P I N dapat dilakukan dengan membandingkan model U A dibangun : Berikut hipotesis yang K I T S H modelT1I adalah model terbaik A T H Smodel 0 (saturated model) adalah model terbaik XY
ij
0
0
Statistik Uji :
A Y
Dengan pearson 2 dan Likelihood ratio test G2 sebagai BAberikut :
A R n ˆ nSU , G 2n logA ˆ P I ˆ N U df I 1 J 1 A K I T 0,05 S I T 3,841 A T S 2
2 hitung
ij
ij
ij
ij
2 1:0,05
ij
2
ij
Tabel Frekuensi Harapan dan ln dari frekuensi harapan jenis kelamin
Partai
A B 337.00 A R U 425.00 S A
buruh
konservatif
Laki-laki
204.32
132.68
Perempuan
257.68
167.32
Total
462.00
K I T buruh S I T Laki-laki 5.32 A Perempuan 5.55 ST
P I N U APartai
jenis kelamin
Total
10.87
300.00
A Y
konservatif
Total
762.00 Total
4.89
10.21
5.12
10.67
10.01
20.88
ANALISIS DAN PEMBAHASAN
A Y
Perhitungan : nij G 2 nij log ˆ ij G 2 7, 003138 Keputusan : Tolak H 0 2
K I T
R U
S A
P I N U A
A B A
Sehingga dapat ditarik kesimpulan bahwa Model 0 (model lengkap) sebagai model terbaik. Jadi model log linier untuk hubungan antara kedua variabel tersebut adalah : vij
S I T TA
S
i
X
Yj ijXY
PELUANG JIKA KATEGORI Y (JENIS PARTAI) SAMA H Peluang kategori B (jenis partai ) sama (model v )
A H Peluang kategori B (jenis partai ) tidak sama (model v A Y ) B A dengan statistik uji sbb : R U n S G 2 n log A P I ˆ N U A K I T S I T A T S A
0
ij
i
A
1
ij
2
ij
ij
ij
i
B
j
Tabel Frekuensi Harapan dan ln dari frekuensi harapan
Peluang jika kategori Y sama, model v Tabel frekuensi harapan ij
jenis kelamin Laki-laki Perempuan Total
Partai buruh 168.5 212.5 381
konservatif 168.5 212.5 381
S A 337
P I N U A
K I Tabel ln (frekuensi harapan) = eta ij T S I T jenis kelamin A buruh T S Laki-laki Perempuan Eta(+j)
5.127 5.359 5.243
Partai
konservatif 5.127 5.359 5.243
425 762
Eta(i+) 5.127 5.359 5.243
A Y
A B A
R U
Total
i
X
A , 5,127 dan 5, 359 Y A J B A R U S IJ A P I 1 N) ( U 4 A K I T 1 S I 5,127 5, 359 5, 359) 5, 243 (5,127 T 4 A T S 5,127 5, 243 0,116 0,12 ij
J
j 1
i
1
11
12
2
I
J
i 1
j 1
21
ij
22
X
1
i
5, 359 5, 243 0,116 0,12 X
2
i
Didapatkan model :
v ij
A Y
i
v 5, 243 0,116 dan statistik uji G 41,71
P I N U A
2
K I T
S I T TA
R U
S A
ij
S
A B A
X
PELUANG JIKA KATEGORI X (GENDER) SAMA
Peluang jika kategori X sama, model v ij
Y j
A Y
A B Av H Peluang kategori X (gender ) tidak sama (model R U S dengan statistik uji sbb : A P I n N G 2 n log U ˆ A K I T S I T A T S H Peluang kategori X (gender) sama (model v ) Y
0
ij
1
j
ij
2
ij
ij
ij
i
X
) Y
j
Tabel Frekuensi Harapan dan ln dari frekuensi harapan
Peluang jika kategori X sama, model v A Tabel frekuensi harapan AY Y
ij
jenis buruh kelamin Laki-laki 231 Perempuan 231 Total 462
Partai konservatif 150 150 300
Total
P I N U A
K I Tabel ln (frekuensi harapan) = eta ij T S I T TA buruh
jenis kelamin Laki-laki Perempuan eta(+j)
S
5.442 5.442 5.442
Partai konservatif 5.011 5.011 5.011
eta(i+) 5.227 5.227 5.227
B A
R U
S A 381 381 762
j
log (terdapat hubungan antara log denga n ij
ij
ij
B A
R U , 5, 442 dan 5,011 S I A P I N 5, 227 U IJ A K I T I
ij
i 1
1
Y
j
Y
Y
1
1
ij
sehingga n dapat digunakan untuk menduga A log ) ij
j
A Y
2
I
J
i 1
j 1
ij
S I AT 5, 442 5, 227 0, 215 0, 22 T S 5,011 5, 227 0, 216 0, 22 j
1
1
ij
v ij
A Y
Y j
v 5, 227 0, 22 ij
dan statistik uji G 17,19 2
S
S I T TA
1:0 ,05
P I N U A
K I T
R 3,841 U
S A
2
A B A
PELUANG KATEGORI (i,j) SAMA
A Y
H Peluang kategori i,j sama (model v ) 0
A B A
ij
dengan statistik uji sbb : n G 2 n log ˆ 2
ij
P I N U A
ij
K I T
S
S I T TA
R U
S A
ij
Tabel frekuensi harapan jenis kelamin Laki-laki Perempuan Total
buruh 190.5 190.5 381
Partai konservatif 190.5 190.5 381
Total
762
K I Tabel ln (frekuensi harapan) = eta ij T S I T jenis kelamin A buruh T S Laki-laki 5.250 Perempuan eta(+j)
5.250 5.250
Partai konservatif 5.250 5.250 5.250
A B A
R U 381
S A 381
P I N U A
A Y
v ij
eta(i+)
v 5, 25
5.250 5.250 5.250
G 51,89
ij
2
REKAPITULASI MODEL LOG LINIER G
v
51,89
ij
v
X
41,71
v
Y
17,19
ij
ij
i
v ij
i
Y j
v K X
Y
I T
XY
A B A
R U
S A
P I 7,003 N U A
j X
A Y
2
Model
0,00
S I T A : terjadi penurunan G , dimana sesuai dengan Interpretasi T S yang dibangun dalam perbandingan model didapatkan hipotesis ij
i
j
ij
2
model jenuh (saturated model) adalah model terbaik
Latihan Soal
Dalam suatu penelitian perusahaan, sejumlah data A dikumpulkan untuk menentukan apakah proporsi Y barang A B yang cacat (X) yang dihasilkan oleh karyawan sama untuk A R berikut giliran shift pagi, sore atau malam (Y). U Data S menggambarkan barang yang diproduksi yang cacat untuk A P I shift pagi, sore, dan malam.Tentukan estimasi parameter N U log linier dan berikan kesimpulan?
A K I T Shift
S I Pagi T A T Cacat 45 S
Kondisi Produk
Total
Siang
Malam
55
70
170
Tidak cacat
905
890
870
2665
Total
950
945
940
2835
TUGAS
A Y
Tingkat Pemanfaatan TIK Uraian Jarang
KadangKadang
Ketersedian Fasilitas Akse TIK Banyak
S I T TA
63
57
Sering
S A 45
P I N U 13 35 A K I T
Sedikit
R U
A B A Sangat
49
Sering 19 46
Tentukan estimasi parameter log linier dan berikan kesimpulan? Gunakan perhitungan manual.
S Lakukan analisis dan pembahasan sesuai dengan prosedur dalam Log Linier? Gunakan SPSS.
A Y
R U
A B A
S A
S
P I TERIMA KASIH N U A K I T S I T TA
A Y
R U
S A
P I N U A
A B A
REGRESI LOGISTIK BINER IK
S
T S I T TA
Oleh : Gangga Anuraga, S.Si M.Si
REGRESI LOGISTIK BINER
Menggambarkan hubungan antara variabel respon (berskala kategori biner yaitu mempunyai dua kategori nilai 0 dan 1)dan variabel prediktornya (kualitatif maupun kuantitatif).
A Y
A B A
S A
R U
Digunakan untuk memperkirakan apakah suatu kejadian akan terjadi atau tidak dengan diketahuinya satu atau beberapa variabel prediktor.
Model regresi logistik dapat pula digunakan untuk mengetahui seberapa besar pengaruh variabel prediktor terhadap variabel respon, sehingga dapat dikatakan bahwa, tujuan menggunakan model ini adalah mencari model terbaik yang menggambarkan hubungan antara variabel respon dengan variabel prediktornya.
K I T
P I N U A
S
S I T TA
DISTRIBUSI BERNOULLI
Variabel Y mengikuti distribusi Bernoulli dengan fungsi probabilitas sebagai berikut : f ( y) (1- ) dimana y = 0,1 y
1 y
jika y = 0, P( y 0 | x) 1 ( x),
A Y
R U
A B A
S yang mana merupakan peluang A untuk mendapatkan P I N hasil "gagal". U 1|A x) ( x), jika y = 1, P( y IK T yang manaIS merupakan peluang untuk mendapatkan T A hasil "sukses". T S x merupakan variabel prediktor yang dapat berupa kuantitatif maupun kualitatif.
MODEL REGRESI LOGISTIK BINER x E y | x
A Y merepresentasikan kondisional rata-rata (mean) A B dengan prediktor x diketahui. A R U M enurut Hosmer dan Lameshow S (2013), A model regresi logistik dapatIP dituliskan sbb : N e U x A 1 e K I T dan transformasi dari x atau logit transformation S I T A sbb : didefinisikan T S x 0 1 x
0 1 x
g x ln x 1 x 0
1
MODEL REGRESI LINIER Vs LOGISTIK
Perbedaan lain antara regresi linear dengan regresi logistik A adalah distribusi dari variabel respon. Y
A B Pada model regresi linear, variabel respon diasumsikanA R U sebagai y ( x) dan ( x) E y | x S dengan dinamakan error, ~ N(0,IP)A I N U A Pada regresi logistik biner, nilai error hanya terdiri dari dua kemungkinan, K I T 1 (x) dengan peluang (x) yaitu jika y = 1 Imaka S atau jika yA = 0Tmaka (x) dengan peluang 1 ( x) T S Jadi error mempunyai distribusi dengan mean sama dengan nol dan varians 2
(x) 1 (x)
PEMODELAN REGRESI LOGISTIK BINER
Data berpasanngan (xi , yi), i = 1,2,3…n, dan n merupakan A banyaknya sampel data. Y jika y = 1 dengan peluang ( x ) atau jika y = 0 dengan peluang 1 ( x)
R U
A B A
S A
P I y = 1 dengan peluang (U x )Ndan A y = 0 dengan peluang 1 (x ) K I T S Karena variabel respon dalam model reg resi logistik I T A distribusi Bernoulli, maka fungsi kepadatan peluang mengikuti T S karena data berpasangan x , y , maka i
i
i
i
i
i
adalah sbb (Hosmer dan Lemeshow, 2013): ( x ) 1 ( x )
1 yi
yi
i
i
FUNGSI LIKELIHOOD
A Y
Variabel respon diasumsikan bebas maka fungsi likelihood
A B A
dapat dituliskan sbb (Hosmer dan Lameshow, 2013) : l ( x ) 1 ( x ) n
i 1
1 yi
yi
i
R U
...(1)
i
S A
IP N . Dimana dengan me-ln kan memaksimumkan terhadap U dan A l . Berikut fungsi log-likelihood terlebih dahulu fungsi Ilikelihood K T S L ln l TI y ln ( x ) 1 y ln 1 ( x ) ...(2) A T turunkan S persamaan (2) terhadap dan .
estimasi / taksiran ˆ ˆ dan ˆ dapat dicari dengan 0
1
0
1
n
i 1
i
i
i
0
i
1
CONTOH KASUS
Sumber data : buku Hosmer dan Lameshow (2013) A tentang coronary heart disease dengan sampel sebanyak Y A B 100 A R Hubungan antara umur (x) dengan penyakit jantung U S koroner (y), y = 1 (terkena penyakit jantung koroner) dan A P I y = 0 (tidak terkena penyakit jantung koroner). N
K I T
U A
S
S I T TA
Hasil Estimasi SPSS
A Y
R U
S A
P I N U A
5 ,3 0 9 0 ,1 1 1* u m u r
e ˆ x 1 e TIK gˆ x T5I,S 3 0 9 0 ,1 1 1 * u m u r 5 ,3 0 9 0 ,1 1 1* u m u r
A T S
A B A
UJI SIGNIFIKANSI PARAMETER
A Y
H ip o te sis (U ji S e re n ta k ):
A B A
H : 0 0
1
H : 0 1
R U
1
n n G 2 ln ˆ a ta u
1
n
i 1
yi
i
n n 1 ˆ n1
n0
0
S A
P I N U A i
K I T
1 yi
S I yTln ˆ 1 y ln 1 ˆ G 2 TA S n ln n n ln n n ln n n
i
i 1
1
i
1
i
0
i
0
G 2 9 , 3 1 d ib a n d in g k a n d e n g a n
2 v ,
Uji parsial :
Uji Wald ˆ 0,111 W 4,61 0,024 se ˆ
A Y
P I dibandingkan dengan Z N U A K atau W dengan I T S I T A T S 1
2
2
1,
2
R U
S A
1
A B A
UJI KESESUAIAN MODEL
Uji kesesuaian parameter model regresi logistik adalah A Goodness of fit. Digunakan untuk mengetahui keefektifan Y A B model dalam menjelaskan variabel respon. A Hipotesisnya R adalah : U
S A
Ho : model sesuai (tidak ada perbedaan antara observasi dengan hasil kemungkinan prediksi hasil) H1 : model tidak sesuai (ada perbedaan antara observasi dengan hasil kemungkinan prediksi hasil)
P I N U A
K I T
Statistik uji (Hosmer IS dan Lameshow Test):
S
T TA
KETEPATAN KLASIFIKASI MODEL
A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
A Y
R U
A B A
S A P I TERIMA KASIH N U A K I T
S
S I T TA
A Y
R U
S A
P I N U A
A B A
K I T
REGRESI LOGISTIK BINER (DICHOTOMOUS INDEPENDENT VARIABLE)
S
S I T TA
Gangga Anuraga, M.Si
REGRESI LOGISTIK DENGAN INDIKATOR KATEGORI / KUALITATIF
A Y
Bila suatu variabel prediktor mempunyai p kategori, maka variabel dummy yang diperlukan adalah p-1. Diketahui model logit dari regresi logistik adalah
x g x ln xA IP 1 x N 0
1
1
A B A
S
R U
U Dimana X adalah variabel kualitatif gender (male = 1 A IK y adalah keputusan untuk dan female = 0)Tdan S I melanjutkan riset / penelitian (continue the research = 1 T Athe research = 0) dan stop T S Data ..\Pratikum\Logistic categorical.sav 1
MODEL REGRESI LOGISTIK
A Y
S A
R U
0 ,847 1,217* gender
P I N U A
e ˆ x 1 e gˆ x 0,847 1, 217 * gender
K I T
0 ,847 1,217* gender
S
S I T TA
A B A
ANALISIS DAN PEMBAHASAN UJI SERENTAK
A Y
A B A
R U
S A
P I N U A
Hipotesis (Uji Serentak): K H : 0 IS
I T
T A ada satu nilai H : minimal T S 0
1
i
i
0
Statistik Uji G dibandingkan dengan
2 v,
Uji Parsial Uji Wald ˆ W se ˆ
1
1
A Y
1, 217 4, 96 0, 245
S A
P I N atau W dibandingkan dengan Z U A K I T S I T A T S W dibandingkan dengan 2
R U
2
1,
2
A B A
UJI KESESUAIAN MODEL
Uji kesesuaian parameter model regresi logistik adalah A Goodness of fit. Digunakan untuk mengetahui keefektifan Y A B model dalam menjelaskan variabel respon. A Hipotesisnya R adalah : U
S A
H0 : model sesuai (tidak ada perbedaan antara observasi dengan hasil kemungkinan prediksi hasil) H1 : model tidak sesuai (ada perbedaan antara observasi dengan hasil kemungkinan prediksi hasil)
K I T
P I N U A
S
S I T TA
INTERPRETASI MODEL
Setelah didapatkan model yang sesuai maka selanjutnya A model tersebut diintepretasikan. Intepretasi model regresi Y A B logistik dapat dilakukan berdasarkan nilai odds ratio yang A R menunjukkan seberapa besar variabel-variabel yang U S melanjutkan signifikan berpengaruh terhadap A keputusan IP penelitian / riset.
K I T
N U A
S
S I T TA
A Y
0 ,847 1 ,217* gender
e ˆ x 1 e odds ˆ x e
A B A
0 ,847 1 ,217* gender
R U
0 ,847 1 ,217* gender
untuk x = 1 (male) odds e 1, 448
S A
P I N U 1, 448 1, 448 A 0, 59 maka : ˆ x K I 1, 448 2, 448 1T S I sehingga dapat diprediksi bahwa 59% dari laki-laki T A T akan S memutuskan melanjutkan penelitian / riset 0 ,847 1 ,217*1
A Y
untuk x = 0 (female) odds e 0, 429 0, 429 0, 429 0, 30 maka : ˆ x 1 0, 429 1, 429 sehingga dapat diprediksi bahwa 30% dari perempuan akan memutuskan melanjutkan penelitian / riset
A B A
0 ,847 1 ,217*0
S A
R U
K I T
P I N U A
S
S I T TA
Odds ratio adalah perbandingan dari dua odds.
A Y
A B Peluang laki-laki yang memutuskan untuk melanjutkan A R penelitian / riset lebih tinggi 3,376 daripada perempuan. U S Interpretasi odds dan odds ratio diatas dapat digambarkan A P I seperti tabel berikut : N U A K I T S I T A T S o d d s ra tio
1, 4 4 8 3, 3 7 5 0, 429
Tabel Prediksi Model Logistik decision continue the research (y = 1) stop the research (y = 0) Total
S
A B A
A Y
female (x = 0) 0,30 0,70 1,0
R U
S A
P I N U A
K I T
S I T TA
male (x = 1) 0,59 0,41 1,0
gender
KETEPATAN KLASIFIKASI
A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
A Y
R U
A B A
S A
P I TERIMA KASIH N
K I T
U A
S
S I T TA
A Y
A B A
REGRESI LOGISTIK R U MULTINOMIAL S GANGGA ANURAGA, M.SI
A IP
N U A
K I T
S I T TA
1
S
PENDAHULUAN Regresi logistik multinomial merupakan regresi logistik yang digunakan saat variabel dependen mempunyai skala yang bersifat polichotomous atau multinomial. Skala multinomial adalah suatu pengukuran yang dikategorikan menjadi lebih dari dua kategori.
A Y
A B A
S A
R U
Mengacu pada regresi logistik trichotomous (Hosmer dan Lemeshow, 2000) untuk model regresi dengan variabel dependen berskala nominal tiga kategori digunakan kategori variabel hasil Y diberi kode 0,1, dan 2.
P I N U A
K I T
Variabel Y terparameterisasi menjadi dua fungsi logit. Sebelumnya perlu ditentukan kategori hasil mana yang digunakan untuk membandingkan (kategori pembandin). Pada umumnya digunakan Y=0 sebagai pembanding.
S I T TA
2
S
MODEL REGRESI LOGISTIK MULTINOMIAL (1) Untuk membentuk fungsi logit, akan dibandingan Y=1 dan Y=2, terhadap Y=0. Bentuk model regresi logistik dengan p variabel prediktor seperti pada persamaan berikut.
A Y
( x)
exp( 0 1 x1 2 x2 p x p )
A B A
R U
S A
1 exp( 0 1 x1 2 x2 p x p )
P I N Menurut Hosmer dan Lemeshow (2000), dengan menggunakan U transformasi logit akanA didapatkan dua fungsi logit sebagai berikut. K I P(YST 1| x) I g ( x) ln T x x x ' P(Y 0 | x) A ST 1
10
11 1
1p
p
1
3
P(Y 2 | x) g 2 ( x) ln 20 21 x1 2 p x p x ' p P(Y 0 | x)
MODEL REGRESI LOGISTIK MULTINOMIAL (2) Berdasarkan kedua fungsi logit tersebut maka didapatkan model regresi logistik trichotomous sebagai berikut.
1 0 ( x) 1 exp g1 ( x) exp g 2 ( x)
A Y
1 ( x)
R U
S A
P I N U A
exp g1 ( x) 1 exp g1 ( x) exp g 2 ( x)
A B A
K I Texp g ( x)
S I T 1 exp g ( x) exp g ( x) A T
2 ( x)
S
2
1
2
4
dengan P (Y j | x) j ( x) untuk j = 0,1,2
MODEL REGRESI LOGISTIK MULTINOMIAL (3) Sehingga estimasi peluang untuk model regresi logistik multinomial dapat dituliskan sebagai berikut : j
J
1 e
1 e
dan e j
J
1 1 x
1 1 x
e ... e 1 ... e
J 1 J 1 x
K I T
S I T TA
S
R U
S A
P I N U A J 1 J 1 x
A B A
j jx
log x catatan : 1 j
j
j
J
j
5
A Y
j jx
A Y
A B A
R U S TERIMA KASIH A P I N U A K I T S I T TA
6
S
A Y
S A
R U
A B A
P I N U A REGRESI LOGISTIK ORDINAL K I T S IM.Si Gangga Anuraga, T A T S
PENDAHULUAN • Regresi logistik ordinal digunakan ketika variabel respon (dependen) yang mempunyai skala ordinal yang terdiri atas tiga kategori atau lebih. Variabel prediktor (independen) yang dapat disertakan dalam model berupa data kategori atau kontinu yang terdiri atas dua variabel atau lebih.
A Y
R U
S A
P I N U A
A B A
• Model logit dalam regresi logistik ordinal adalah cumulative logit models. Pada model logit ini sifat ordinal dari respon Y dituangkan dalam peluang kumulatif. Sehingga cumulative logit models merupakan model yang didapatkan dengan membandingkan peluang kumulatif yaitu peluang kurang dari atau sama dengan kategori respon ke-j pada p variabel prediktor yang dinyatakan dalam vektor X, P(Y≤ j | X), dengan peluang lebih besar dari kategori respon ke-j, P(Y > j | X). (Hosmer dan Lemeshow, 2000)
K I T
S
S I T TA
CUMULATIVE LOGIT MODELS Peluang kumulatif untuk variabel Y dengan kategori A j dapat dituliskan sbb : P Y j , j 1,..., J
Y A B
A R U
S A dimana P Y 1 P Y 2 P Y J 1 P I N sehingga model logitnya dapat dituliskan sbb : U A K I P Y j T logit P Y jIS log 1 P Y j log T A dengan STj 1,..., J 1 1
j
1
j 1
j
J
,
CUMULATIVE LOGIT MODELS
A Y
• Model regresi logistik ordinal yang terbentuk jika terdapat J = 3 kategori respon adalah :
logit P Y 1 log logit P Y 2 log jadi : 1
S A 01
3
1
K I T
3
2
R U
x x x x
P I N U A 2
A B A
02
1
1
p
1
p
1
S I T P Y j | X A logit T S P Y j | X log 1 P Y j | X
p
p
x p
0j
k 1
k
k
NILAI PELUANG PADA KATEGORI RESPON ORDINAL
A Y
S A
R U
K I T
P I N U A
S
S I T TA
A B A
NILAI PELUANG PADA KATEGORI RESPON ORDINAL
S A
R U
K I T
P I N U A
S
S I T TA
A B A
A Y
A Y
R U
A B A
S A
S
T TA
P I N TERIMA KASIH U A K I T S I
A Y
A B A
R U
Generalized Linear Models S A P I N U A
GANGGA ANURAGA
K I T
S
S I T TA
PEMODELAN (MODELING) • Mengapa dibutuhkan model dari suatu data ?YA
A B – Model mendeskripsikan hubungan atau asosiasi dalam data. A R – Inferensi parameter dalam model digunakan sebagai cara untuk U mengevaluasi hubungan antara variabel independen dengan variabel S A dependen. P I – Estimasi paramater dalam model menunjukkan tingkat kekuatan N (strength) dan kepentinganU (importance) dari suatu hubungan atau A asosiasi. K I T – Model sebagai prediksi menyediakan estimasi yang baik terhadap S I T variabel respon. A T S
Review Ordinary Linear Regression
• Variabel respon (Y) kontinu dengan prediktor Y (X)A A B adalah kontinu/diskrit A E Yi i
S A
• Ingat : asumsi residual IIDNIP
N U A
Y E Y
K I T
• Estimator
S I TX Y ˆ X XA T S Aplikasi pemodelan linier : analisis regresi, anova dll. '
•
R U
1
'
PENGANTAR GLMs • • • •
A OLS bergantung pada distribusi dari Y (normal) Y A B Data kategori, asumsi normal menjadi sulit A dipenuhi R U GLMs digunakan pada data diskrit dan count. S A Tiga komponen dalam GLMIP N U – Variabel respon Y random dan memiliki dist. Natural A eksponensial IK T – SistematikIS komponen (desain perkalian matrik oleh vektor T parameter) Y E Y , f ( E ( y )) A ST – Link function g(.)
PENGANTAR GLMs • Normal General Linear Model (Regresi Linier)YA yi 0 1 x1i 2 x2i i – Link function E Yi i
• Data binomial
K I T
P I N U A
S
S I T TA
S A
R U
A B A
PENGANTAR GLMs
A Y
A B A
• Data Poisson
S A
R U
K I T
P I N U A
S
S I T TA