MULTI DIMENSIONAL SCALING (MDS) Irlandia Ginanjar Statistika FMIPA ITS
TUJUAN ANALISIS peta/konfigurasi g p posisi objek j dalam Membuat p ruang berdimensi rendah (umumnya 2 dimensi) berdasarkan data jarak antar objek atau data multivariate yang sebelumnya diubah dulu menjadi matriks jarak
KEGUNAAN ANALISIS Mendapatkan p p posisi relatif suatu objek j dibandingkan objek lain. Dalam banyak kasus strategi bisnis, digunakan untuk menentukan pesaing dan benchmarking. benchmarking | Melakukan pengelompokan objek, salah satu alternatif untuk cluster analisys |
SEKILAS MDS
Data multivariate
Matriks Jarak
X1
X2
…
Xp
A
B
C
D
E
A
X11
X12
…
X1p
A
0
dAB
dAC
dAD
dAE
B
X21
X22
…
X2p
B
dBA
0
dBC
dBD
dBE
C
X31
X32
…
X3p
C
dCA
dCB
0
dCD
dCE
D
X41
X42
…
X4p
D
dDA
dDB
dDC
0
dDE
E
X51
X52
…
X5p
E
dEA
dEB
dEC
dED
0
Konfigurasi Obyek
MULTIDIMENSIONAL SCALING (MDS) JARAK EUCLIDEAN Adalah jjarak antara dua objek j yang y g dibandingkan. g Jika dimisalkan objek 1 adalah x' = ( x1 , x 2 ,..., x p )' dan objek 2 y ' = ( y1 , y 2 ,..., y p )' adalah Maka k jarak k Euclidean-nya ld adalah: d l h d ( x, y ) =
( x1 − y 1 ) 2 + ( x 2 − y 2 ) 2 + ... + ( x p − y p ) 2
Dimana :
xi= objek ke-1 ke 1 pada pengamatan ke-i ke i yi= objek ke-2 pada pengamatan ke-i p= banyaknya pengamatan p Atau dalam notasi matrik, rumus jarak Euclidean-nya menjadi: d ( x, y ) = ( x − y )' ( x − y )
MULTIDIMENSIONAL SCALING (MDS) JENIS MDS Berdasarkan skala datanya, MDS dapat dibagi menjadi : 9 MDS metrik jika skala datanya interval atau rasio 9 MDS nonmetrik jika skala datanya nominal atau ordinal
MATRIKS JARAK Berdasarkan rumus jarak Euclidean, diperoleh Matriks Jarak yang menyatakan jarak antara pasangan objek yang mungkin ki terjadi. t j di ⎡ d .d ...d ⎤ 11
12
1n
nDn = ⎢⎢M M O M ⎥⎥ ⎢⎣ d n1 .d n 2 ...d nn ⎥⎦
JENIS MDS (PENSKALAAN DIMENSI GANDA) Penskalaan METRIK : jjarak dianggap gg p bertipe p rasio. Jika dAB = 2 dBC, maka begitu juga pada jarak di peta (konfigurasi). | Penskalaan P k l NON-METRIK NON METRIK : jarak j k dianggap di bertipe ordinal. Jika dAB > dBC, maka begitu juga pada jarak di peta. Asalkan urutannya benar, walaupun rasionya tidak sesuai maka masih diperbolehkan. |
ANALISIS MULTIDIMENSIONAL SCALING Hitung matriks jarak D dengan menggunakan rumus jarak Euclidean
d 2 i. =
1 n
Hitung
;
∑ d 2 ij d 2 . j = j
MDS Metrik
1 n
∑d
2
; ij
d 2.. =
i
1 n2
∑d
2
ij
ij
Hitung matrik B dengan elemen-elemen
(
b i j = − 12 d 2 i j − d 2 i. − d 2 . j + d 2 ..
)
Cari nilai eigenvalue dan eigenvector det(B-λI) = 0 ; (B det(B (B-λI)E λI)E = 0 Bentuk koordinat objek:
~ 12 F = EΛ
~e = e i i
a
ei ' ei b
ANALISIS MULTIDIMENSIONAL SCALING b
a
ˆ ) yang merupakan jarak Hitung disparities ( D Euclidean dari koordinat terbentuk Hitung g nilai stress
MDS Non Metrik Non-Metrik
(
⎛ n ⎜ ∑ d ij − dˆ ij ⎜ i≠ j S=⎜ n ⎜ ∑ d 2 ij ⎜ i≠ j ⎝
)
2
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Stress sesuai kriteria
Ya Titik koordinat akhir
Tidak
MDS METRIK
Centering dengan: H = [ I – (1/n) J ] dengan J = 1 1’ SD : (-1/2) HDH = E Λ ET Dimana E matiks yang kolomnya corresponding eigenvectors (eigenvectors yang dinormalisasi) (Johnson, 2007) yang bersesuaian dengan eigenvalue λ dari (-1/2) HDH dan Λ adalah matrik diagonal dengan diagonal utamanya adalah λi Konfigurasi pada ruang dimensi 2 adalah : nHnXp = nE2 Λ1/2p Metric MDS is identical to principal components analysis
UKURAN KESESUAIAN Untuk MDS Metrik berdasarkan Inertia Persentase keragaman (inertia) yang digunakan sebagai ukuran kualitas pemetaan dihitung dengan cara:
τ = (1' λ ) × λ −1
Semakin besar nilai inertia akan memberi indikasi bahwa semakin kecil error antara jarak dan nilai kemiripan dari ruang yang disajikan. Untuk MDS Metrik berdasarkan Stress Adalah suatu ukuran y yang g digunakan g untuk menilai suatu konfigurasi g dari objek sebagai titik-titik dalam dimensi q sudah baik atau belum. Dalam perhitungan komputer ALSCAL (Alternatif Least Square Scaling) stress adalah ukuran kesalahan (Lack of fit or error). Semakin kecil nilai stress akan memberi indikasi bahwa semakin kecil error antara jarak dan nilai kemiripan dari ruang yang disajikan.
Kebaikan Hasil MDS Stress
Kriteria
≥ 20 % 10 % - 20 % 5 % - 10 % 2.5 % - 5 % < 2.5 %
Kurang K Cukup Baik Sangat baik sempurna
Contoh kasus 1 : ANALISIS KEDEKATAN / KEMIRIPAN KOTA-KOTA BESAR DI INDONESIA BERDASARKAN KEADAAN GEOGRAFISNYA
DENGAN METODE ANALISIS MULTIDIMENSIONAL SCALING (MDS) ( )
LATAR BELAKANG : Indonesia adalah negara g kepulauan, p , sehingga gg mempunyai keadaan geografis yang beraneka ragam antar daerah atau kota. | Sulit S lit melihat lih t perbedaan b d d dan k kesamaan d darii d data t mentah dengan variabel-variabel yang menyertainya. |
TUJUAN : |
Untuk mengetahui g p posisi atau kedekatan antara kota-kota besar di Indonesia, dimana nantinya akan nampak bagaimana kemiripan kota-kota tersebut dilihat dari faktor-faktor faktor faktor geografisnya (kondisi alam).
SUMBER DATA : diperoleh p dari buku terbitan BPS ((Badan Pusat Statistik) berjudul “Statistik Indonesia 2003” yang terbit pada tahun 2003. b i i tentang berisi t t keadaan k d geografis fi kota-kota k t k t b besar di Indonesia, semua data bersumber pada Badan Meteorologi dan Geofisika.
Data kondisi geografis : Kota
Ketinggian
Suhu Minimum
Kecepatan Angin
Kelembapan Udara
Curah Hujan
aceh
21
24,9
11,8
69,7
5,5
medan
25
25 8 25,8
98 9,8
70 3 70,3
80 3 80,3
padang
3
25,8
11,8
68,9
178,5
jambi
25
26,7
,3
69,5
147,1
bengkulu g
16 6
26,8 6,8
12,6 ,6
66,8
400,6 00,6
2
25,3
15,3
77,3
404,5
740
27,1
18,5
73,6
168
3
25,3
14,2
73,8
301,5
107
25,7
7,9
73,6
364,4
surabaya
3
28,4
17,6
69,7
216,8
denpasar
1
25,6
11,1
74,2
294,2
kupang
108
25,5
7,3
75,2
136,3
samarinda
230
20,3
5,2
76,3
145,8
manado
80
25,7
8,9
74,8
158
ambon
12
25 9 25,9
71 7,1
72 2 72,2
60 4 60,4
jayapura
99
27
11,8
74,6
115,8
jakarta bandung semarang yogyakarta
1. MASUKAN DATA DENGAN OBYEK PENELITIAN SEBAGAI KOLOM DAN VARIABEL PENDUKUNG SEBAGAI BARIS
2. UNTUK ANALISIS MULTIDIMENSIONAL SCALING, PILIH MENU ANALYZE - SCALE – MULTIDIMENSIONAL SCALING
3. MASUKKAN SEMUA OBYEK PENELITIAN KE KOTAK VARIABLES
Hitung jarak Euclidean dari data
4. DARI GAMBAR 3 KLIK MODEL, KEMUDIAN CENTANG RATIO (KARENA DATANYA BERSKALA RASIO) – KLIK CONTINUE
KLIK OPTION, KEMUDIAN PADA KOTAK DISPLAY CENTANG SEMUA PILIHAN KLIK CONTINUE
–
Apabila semua pilihan pada kotak Display dicentang, dicentang hasil output SPSS terpotong, maka disarankan dipilih satu-persatu.
SETELAH ITU KEMBALI DAN KLIK OKE.
ANALISIS DATA DAN PEMBAHASAN
PETA KONFIGURASI DUA DIMENSI : S-stress = 0.0004
ANALISIS BERDASARKAN KUADRAN Pada p peta konfigurasi g kota diatas dapat p dilihat pola kedekatan antar kota sebagai berikut : | Kelompok I : Jakarta, Bengkulu, Y Yogyakarta, k Semarang, S Denpasar, D Surabaya. S b | Kelompok II : Bandung. | Kelompok K l k III : Samarinda, S i d Kupang, K Jayapura. | Kelompok IV : Padang, Padang Manado Manado, Jambi Jambi, Medan, Ambon, Aceh Pengelompokan kota kota-kota kota pada peta konfigurasi diatas didasarkan pada kelima variabel kondisi geografisnya.
BERDASARKAN JARAK (RELATIF) j jika tanpa p melihat kuadran,, misal surabaya y dan padang mempunyai jarak yang dekat pada peta konfigurasi, ini menujukkan adanya kemiripan / kedekatan antar keduanya. keduanya
CONTOH KASUS 2 ‘Analisis Analisis Positioning & Segmentasi Pemirsa Televisi Swasta Nasional Berdasarkan Preferensinya Terhadap Program Acara’ Tujuan : untuk mengetahui kemiripan stasiun televisi swasta nasional berdasarkan program acaranya. Variabel pengamatan ada 11
VARIABEL PENGAMATAN
D1 :Tayangan informasi – informasi aktual termasuk news, dokumenter, dsb D2 :Tayangan olah raga, baik tayangan langsung maupun tidak langsung termasuk informasi tentang atlit dan olahraganya D3 :Tayangan tentang musik pop, rock, jazz, dsb juga informasi perkembangannya dan pemutaran lagu D4 :Tayangan musik dangdut serta informasi perkembangannya D5 :Tayangan berbagai gosip; penayangan sisi kehidupan selebritis dan rumornya D6 :Talk Show; acara – acara diskusi / dialog yang menghadirkan tokoh/pakar yang membahas suatu topik D7 :Variety Show; berbagai macam hiburan yang disajikan sekaligus seperti bintang tamu, kuis interaksi dengan pemirsa dsb D8 :Tayangan y g film p produksi negara g Asia ((Mandarin,, India,, Indonesia)) D9 :Tayangan film barat; merupakan produksi luar negara – negara Asia D10 :Tayangan berbagai macam sinetron dan telenovela D11 :Reality Show; biasanya bersifat sosial, misteri, maupun kehidupan sehari – hari beserta ajang pencarian bakat
RATA - RATA ATRIBUT POSITIONING TIAP-TIAP STASIUN TELEVISI D1
D2
D3
D4
D5
D6
D7
D8
D9
D10
D11
7
3,66
3,34
2,11
3,8
3,61
3,6
3,66
4,14
3,33
4,04
2
3,4
3,19
2,35
3,72
3,74
3,46
3,66
4
3,57
3,6
1
2,52
2,75
3,46
2,97
2,82
3,02
3,15
2,97
2,72
3,42
6
3,14
2,87
2,36
2,79
2,9
2,95
2,84
2,87
2,59
3,05
8
2,71
3,4
2,68
3,71
3,45
3,69
3,8
4,05
3,52
3,7
8
2,84
3,46
2,44
3,83
3,82
4,01
3,74
4,15
3,13
3,61
9
2,75
4,35
2,45
2,92
2,91
3,09
2,96
3,5
2,68
2,94
4
2,91
2,82
1,98
2,59
3,56
2,91
2,73
2,95
2,27
2,69
6
3,44
2,74
2,09
3,1
2,84
2,99
3,06
3,34
2,8
2,87
5
2,6
2,56
2,08
2,79
2,75
2,72
2,91
3,06
2,56
2,84
3,4 RCTI 3,8 SCTV 2,7 TPI 2,6 ANTV INDOSIA R
3 2 3,2 3,4
TRANS 2,6 GLOBAL 4,0 METRO 2,8 TV7 2,5 LATIVI
OPERASIONAL DENGAN SPSS 13.0
METODOLOGI Analyze > Scale > Multidimensional scaling (ALSCAL)
Analyze
Multidimensional Scaling (ALSCAL) S l Scale
METODOLOGI
Objek yang diamati Data belum berupa Data Jarak
METODOLOGI
Skala data Yg digunakan
Model
Jarak Euclid
METODOLOGI
Pilihan output t t option
ANALISA PEMBAHASAN Stress
Stress values For matrix Stress = .16502 RSQ = .90932 Dimana nilai stress ini adalah 0. Di il i i i d l h 0 16502 atau 16.502% 16 502% berdasarkan garis pedoman kriteria masuk ke dalam kategori cukup.
Perceptual Map
ANALISA PEMBAHASAN Dilihat dari plot secara keseluruhan terdapat tiga k l kelompok k stasiun i televisi l i i yang memiliki iliki kemiripan k i i antar anggotanya tetapi berbeda dengan anggota kelompok p lainnya. y Ketiga kelompok itu adalah: 9 RCTI, SCTV, INDOSIAR dan TRANSTV 9 TPI dan GLOBALTV 9 METROTV, LATIVI, TV7 dan ANTV P Pengelompokan l k ini i i didasarkan did k pada d program acara yang ditayangkan.
ANALISA PEMBAHASAN Kemiripan K i i antara stasiun i televisi l i i juga j dapat d dilihat dilih dari d i jarak (distance) antara dua stasiun televisi yang dibandingkan. g Semakin KECIL jarak maka semakin MIRIP dua stasiun televisi yang dibandingkan. Dari semua pasangan stasiun televisi yang mungkin ada dalam plot, terdapat dua pasang stasiun televisi yang mempunyai p y jjarak y yang g kecil. Pasangan g tersebut adalah TPI-GlobalTV dan RCTI-SCTV Tetapi jika dilihat lebih jelas lagi, jarak antara RCTISCTV llebih bih k kecil il daripada d i d jarak j k TPI-GlobalTV, TPI Gl b lTV ini i i berarti, dari sekian banyak pasangan stasiun televisi yang dibandingkan, stasiun televisi SCTV paling mirip dengan stasiun televisi RCTI.
ANALISA PEMBAHASAN o
o
Dari semua stasiun televisi yang diamati, RCTI dan SCTV merupakan dua stasiun televisi yang paling mirip jika dilihat dari jarak (distance) antar keduanya. RCTI sebagai stasiun televisi swasta favorit memiliki beberapa p kompetitor p dalam hal program acara yang disenangi masyarakat yaitu Indosiar, SCTV dan TransTV. Namun dari ketiga kompetitor tersebut, SCTV merupakan kompetitor terberat RCTI karena program acaranya yang paling mirip dengan RCTI