8
BAB 2
LANDASAN TEORI
2.1 Latar Belakang
2.1.1 Definisi Prestasi Siswa
Prestasi belajar adalah hasil pencapaian yang maksimal menurut kemampuan siswa pada waktu tertentu pada sesuatu yang dipelajari, dikerjakan, dimengerti dan diterapkan.Seluruh pelaku pendidikan yaitu siswa, orang tua dan guru tentu ingin tercapainya sebuah prestasi belajar yang baik. Prestasi belajar yang baik adalah salah satu indikator akan keberhasilan proses belajar. Pada umumnya prestasi belajar dinyatakan dalam angka atau huruf untuk membandingkan dengan satu kriteria. Prestasi belajar adalah kemampuan bagi murid dalam pencapaian berfikir yang tinggi. Harus dimiliki tiga aspek dalam prestasi belajar yaitu kognitif, aspek afektif dan aspek psikomotor. Tapi kenyataannya tidak semua siswa bisa mendapat prestasi belajar yang baik dan ada siswa yang mendapatkan prestasi belajar yang buruk. Baik dan buruknya prestasi belajar yang diperoleh murid dipengaruhi oleh berbagai faktor.
2.1.2 Faktor-faktor yang Mempengaruhi Prestasi Siswa
Faktor-faktor yang mempengaruhi antara lain : 1. Minat Peserta Didik Minat menurut Gie (1998)
adalah sibuk, tertarik, atau terlihat
sepenuhnya dengan sesuatukegiatan karena menyadari pentingnya
Universitas Sumatera Utara
9
kegiatan itu. Dengan demikian, minat belajar adalah keterlibatan sepenuhnya seorang siswa dengan segenap kegiatan pikiran secara penuh perhatian untuk memperoleh pengetahuan dan mencapai pemahaman tentang pengetahuan ilmiah yang dituntutnya disekolah. Minat besar pengaruhnya terhadap aktifitas belajar. Minat merupakan salah satu faktor pokok untuk meraih sukses dalam studi. Penelitianpenelitian di Amerika Serikat mengenai salah satu sebab utama dari kegagalan studi para pelajar menunjukkan bahwa penyebabnya adalah kekurangan minat.
2. Tingkat Disiplin Disiplin adalah kesadaran untuk melakukan sesuatu pekerjaan dengan tertib dan teratur sesuai dengan peraturan-peraturan yang berlaku dengan penuh tanggung jawab tanpa paksaan dari siapa pun. Dalam hal belajar disiplin sangat penting karena berkualitas atau tidaknya belajar siswa sangat dipengaruhi oleh kedisiplinan orang tersebut. Salah satu contohnya adalah kedisiplinan seorang siswa untuk mengatur waktunya untuk belajar.
3. Fasilitas Belajar Mengajar Menurut H. M Daryanto (2006:51) secara etimologi (arti kata) fasilitas yang terdiri dari sarana dan prasarana belajar, bahwa sarana belajar adalah alat langsung untuk mencapai tujuan pendidikan, misalnya lokasi/tempat, bangunan dan lain-lain, sedangkan prasarana adalah alat yang tidak langsung untuk mencapai tujuan pendidikan, misalnya ruang, buku, perpustakaan, laboratorium dan sebagainya. Berdasarkan pengertian diatas dapat disimpulkan bahwa fasilitas belajar adalah sarana dan prasarana yang digunakan untuk menunjang kegiatan belajar untuk mencapai tujuan pendidikan.
Universitas Sumatera Utara
10
4. Tingkat Kinerja Guru Salah satu yang mempengaruhi tingkat prestasi siswa adalah guru, yang merupakan faktor eksternal sebagai penunjang pencapaian hasil belajar yang optimal. Untuk mencapai hasil belajar yang optimal diperlukan peran guru, terutama tingkat kinerja guru dalam proses belajar mengajar. Kinerja guru dalam proses pembelajaran betulbetul diperlukan guna menemukan nilai-nilai ajaran pada anak didik. Maka segala kegiatan pembelajaran yang dilakukan seorang guru harus menyatu, menjiwai, dan menghayati tugas tugas yang relevan dengan tingkat kebutuhan, minat, bakat dan tingkat kemampuan peserta didik serta kemampuan guru dalam mengorganisasi materi pembelajaran dengan penggunaan ragam teknologi yang memadai.
5. Tingkat Ekonomi Keluarga Lingkungan keluarga merupakan lingkungan pendidikan yang pertama. Anak-anak pertama kali mendapatkan didikan dan bimbingan didalam keluarga dan setelah itu barulah seseorang menerima pendidikan diluar keluarga yaitu belajar mengajar disekolah, akan tetapi hasil belajar yang baik akan sulit diperoleh dengan hanya mengandalkan keteranganketerangan yang diberikan oleh guru di depan kelas, tetapi membutuhkan juga alat-alat yang memadai seperti buku tulis, pensil, peta, pena dan terlebih lagi buku bacaan. Sebagian besar alat-alat pelajaran itu harus disediakan sendiri oleh murid-murid yang bersangkutan. Bagi orang tua yang keadaan ekonominya kurang memadai sudah barang tentu tidak dapat memenuhi kebutuhan-kebutuhan anak secara memuaskan. Apabila keadaan ini terjadi pada orang tua siswa, maka siswa yang bersangkutan akan menanggung resiko-resiko yang tidak diharapkan oleh seorang siswa tersebut.
Universitas Sumatera Utara
11
2.2 Data
Menurut Kuswadi dan E. Mutiara, Data adalah kumpulan informasi yang diperoleh
dari
suatu
pengamatan,
dapat
berupa
angka,
lambing,
sifat.(http://www.definisi-pengertian.com)
2.2.1 1.
Data Menurut Cara Memperolehnya
Data Primer Data primer adalah data yang diperoleh secara langsung dari objek yang diteliti, baik dari objek individual (responden) maupun dari suatu instansi yang mengolah data untuk keperluan dirinya sendiri. Contoh: hasil wawancara dengan responden, hasil perhitungan suara dari masyarakat yang melaksanakan pemilihan kepala desa atau lainnya, data jumlah mahasiswa yang diperoleh dari lembaga pendidikan yang bersangkutan, dan lainnya.
2.
Data Sekunder Data sekunder adalah data yang diperoleh secara tidak langsung untuk mendapatkan informasi (keterangan) dari objek yang diteliti, biasanya data tersebut diperoleh dari tangan kedua baik dari objek secara individual (responden) maupun dari suatu badan (instansi) yang dengan sengaja melakukan pengumpulan data dari instansi-instansi atau badan lainnya untuk keperluan penelitian dari para pengguna. Badan yang biasa mengumpulkan data tersebut antara lain BPS (Badan Pusat Statistik), misal data mengenai laju inflasi, statistik penduduk, statistik pertanian, statistik ekonomi, data tingkat kemajuan pembangunan suatu daerah yang diperoleh dari BAPPEDA setempat, dan sebagainya.
Universitas Sumatera Utara
12
2.3 Variabel
Variabel adalah suatu sebutan yang dapat diberi angka (kuantitatif) atau nilai mutu (kualitatif). Variabel merupakan pengelompokkan secara logis dari dua atau lebih atributdari objek yang diteliti. Misalnya: tidak sekolah, tidak tamat SD, tidak tamat SMP, dan sebagainya. Maka variabelnya adalah tingkat pendidikan dari objek penelitian itu.Variabel tingkat pendidikan merangkum semua atribut tadi.
Variabel merupakan suatu istilah yang berasal dari kata vary dan able yang berarti “berubah” dan “dapat”. Jadi, kata variabel berarti dapat berubah-ubah.Nilai itu berupa nilai kuantitatif maupun kualitatif.Dilihat dari segi nilainya, variabel dibedakan atas 2, yaitu variabel diskrit dan variabel kontiniu.Variabel diskritnya nilai kuantitatifnya selalu berupa bilangan bulat, sedangkan variabel kontiniu nilai kuantitatifnya bisa berupa pecahan.(http://rakim-ypk.blogspot.com).
Variabel penelitian pada dasarnya adalah segala sesuatu yang berbentuk apa saja yang ditetapkan oleh peneliti untuk dipelajari sehingga diperoleh informasi tentang hal tersebut, kemudian ditarik kesimpulannya, (Sugiyono, 2007).
Menurut hubungan antara suatu variabel dengan variabel lainnya, variabel terbagi atas beberapa yaitu : 1.
Variabel bebas (independent variable) yaitu variabel yang menjadi sebab terjadinya atau terpengaruhnya variabel tak bebas.
2.
Variabel tak bebas (dependent variable) yaitu variabel yang nilainya dipengaruhi oleh variabel bebas.
3.
Variabel moderator yaitu variabel yang memperkuat atau memperlemah hubungan antara suatu variabel bebas dengan tak bebas.
Universitas Sumatera Utara
13
4.
Variabel intervening, seperti halnya variabel moderator, tetapi nilainya tidak dapat diukur, seperti kecewa, marah, gembira, senang, sedih, dan lain sebagainya.
5.
Variabel control, yaitu variabel yang dapat dikendalikan oleh peneliti.
2.4 Matriks
Matriks adalah suatu kumpulan angka-angka yang juga sering disebut elemenelemen yang disusun secara teratur menurut baris dan kolom sehingga berbentuk persegi panjang, dimana panjang dan lebarnya ditunjukkan oleh banyaknya kolom dan baris serta dibatasi tanda “[ ]” atau “( )” (Anton, 1987). Matriks A yang berukuran dari n baris dan p kolom (𝑛𝑛 × 𝑝𝑝) adalah: 𝑎𝑎11 𝑎𝑎21 𝐴𝐴 = � ⋮ 𝑎𝑎𝑛𝑛1
𝑎𝑎12 𝑎𝑎22 ⋮ 𝑎𝑎𝑛𝑛2
… 𝑎𝑎1𝑝𝑝 … 𝑎𝑎2𝑝𝑝 ⋮ � ⋮ … 𝑎𝑎𝑛𝑛𝑛𝑛
(2.1)
Entri 𝑎𝑎𝑖𝑖𝑖𝑖 disebut elemen matriks pada baris ke-i dan kolom ke-j.
2.4.1 Nilai Eigen (Eigen Value) Misalkan A adalah matriks persegi berukuran 𝑝𝑝 × 𝑝𝑝 dan I adalah matriks identitas berukuran 𝑝𝑝 × 𝑝𝑝. Skalar 𝜆𝜆1 , 𝜆𝜆2 , … , 𝜆𝜆𝑝𝑝 yang memenuhi
persamaan: |A - 𝜆𝜆I| = 0 disebut nilai eigen atau akar karakteristik. Dan
suatu matriks A berukuran 𝑝𝑝 × 𝑝𝑝 dan 𝜆𝜆 adalah nilai eigen dari matriks A
Universitas Sumatera Utara
14
jika terdapat suatu vektor x tak nol sedemikian sehingga Ax = 𝜆𝜆x, maka x
disebut vektor eigen atau vektor karakteristik dari matriks A yang
bersesuaian dengan nilai eigen 𝜆𝜆. Untuk mencari nilai eigen matriks A yang berukuran 𝑝𝑝 × 𝑝𝑝, dapat ditulis kembali sebagai suatu persamaan homogen |A - 𝜆𝜆I| = 0. Dengan I adalah matriks identitas yang berukuran
𝑝𝑝 × 𝑝𝑝 sama dengan matriks A. 2.5 Pengujian Data
2.5.1 Sampel dan Uji Kecukupan Sampel
Sampel adalah sebagian anggota dari populasi yang dipilih dengan menggunakan prosedur tertentu sehingga diharapkan dapat mewakili populasinya. Untuk menentukan jumlah sampel dari suatu populasi dapat menggunakan rumus Slovin, sebagai berikut:
n=
𝑁𝑁
1+𝑁𝑁𝑒𝑒 2
(2.2)
Dengan: n
= Jumlah sampel
N
= Jumlah populasi
e
= Batas toleransi kesalahan
2.5.2 Teknik Penarikan Sampel
Teknik penarikan sampel atau teknik sampling adalah suatu cara mengambil sampel yang representatif dari populasi. Pengambilan sampel harus dilakukan sedemikian rupa, sehingga diperoleh sampel yang benar-benar dapat mewakili dan menggambarkan keadaan populasi yang sebenarnya. Ada dua macam teknik penarikan sampel, yaitu:
Universitas Sumatera Utara
15
1.
Probability Sampling
Probability sampling adalah teknik sampling untuk memberikan peluang yang sama pada setiap anggota populasi untuk dipilih menjadi anggota sampel. Ada beberapa jenis probability samplingyang banyak digunakan, antara lain:
1)
Sampel Acak Sederhana (Simple Random Sampling) Sampel acak sederhana adalah cara pengambilan sampel dari anggota populasi dengan menggunakan acak tanpa memperhatikan strata (tingkatan) dalam anggota populasi tersebut. Untuk itu dapat menggunakan dua cara: a. Cara undian, yaitu dilakukan dengan memberi nomor-nomor pada seluruh anggota populasi, kemudian secara acak dipilih nomor-nomor sesuai dengan banyaknya jumlah sampel yang dibutuhkan. b. Cara tabel bilangan random adalah suatu tabel yang terdiri dari bilanganbilangan yang disajikan dengan sangat tidak berurutan.
2)
Sampel Acak Stratifikasi (Stratified Random Sampling)
3)
Area Sampel (Cluster Sampling)
4)
Sampel Sistematis (Systematic/ Quasi Random Sampling)
5)
Sampel Bertahap (Multistage Sampling)
2.
Non Probability Sampling
Dalam non probability sampling, setiap unsur dalam populasi tidak memiliki kesempatan atau peluang yang sama untuk dipilih sebagai sampel, bahkan probabilitas anggota populasi tertentu untuk terpilih tidak diketahui. Beberapa jenis non probability sampling yang sering dijumpai: 1) Quota Sampling 2) Accidental Sampling 3) Purposive Sampling (Judgmental Sampling) 4) Snowball Sampling
Universitas Sumatera Utara
16
2.5.3 Uji Validitas
Validitas merupakan alat ukur untuk melihat atau mengetahui apakah kuesioner dapat digunakan untuk mengukur keadaan responden sebenarnya (Azuar Juliandi 2013). Untuk menguji validitas keadaan responden digunakan rumus korelasi product moment pearsons, yaitu :
r=
𝑛𝑛 (∑ 𝑋𝑋𝑋𝑋)− (∑ 𝑋𝑋 ∑ 𝑌𝑌)
(2.3)
�[𝑛𝑛 ∑ 𝑋𝑋 2 −(∑ 𝑋𝑋)2 ][𝑛𝑛 ∑ 𝑌𝑌 2 −(∑ 𝑌𝑌)2 ]
Dengan: r
= Koefisien Korelasi
n
= Jumlah sampel
X
= Variabel bebas (Skor Pertanyaan)
Y
= Variabel Terikat (Skor Total) Jika nilai 𝑟𝑟ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ≥𝑟𝑟𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 maka kuesioner dinyatakan valid danjika nilai
𝑟𝑟ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 <𝑟𝑟𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 maka kuesioner dinyatakan tidak valid . 2.5.4 Uji Reliabilitas
Reliabilitas adalah indeks yang menunjukkan sejauh mana alat ukur dapat dipercaya atau diandalkan dan sejauh mana hasil pengukuran konsisten bila dilakukan dua kali atau lebih terhadap gejala yang sama, dengan alat ukur yang sama. Untuk mengukur reliabilitas alat ukur digunakan teknik Cronbach Alpha. Rumus yang digunakan adalah : 𝑘𝑘
𝛼𝛼 = �𝑘𝑘−1� �1 − Dengan:
∑ 𝑆𝑆𝑗𝑗2 𝑆𝑆𝑥𝑥2
�
= reliabilitas instrumen
k
= banyaknya butir pertanyaan
(2.4)
Universitas Sumatera Utara
17
∑ 𝑆𝑆𝑗𝑗2 𝑆𝑆𝑥𝑥2
= jumlah varian variabel = varian total
Suatu konstruk atau variabel dikatakan reliabel jika memberikan nilai Cronbach Alpha > 0,60.
2.6 Transformasi Data Ordinal menjadi Interval
Mentransformasi data ordinal menjadi data interval gunanya untuk memenuhi sebagian dari syarat analisis parametrik yang mana data setidaknya berskala interval. Pada penelitian ini variabel yang digunakan berskala ordinal. Oleh karena itu, untuk pemenuhanasumsi pada analisis diskriminan bahwa variabel independen harus berskala interval, maka terlebih dahulu data ordinal ditransformasikan menjadi data interval menggunakan Method of Successive Interval (MSI). Langkah-langkah transformasi data ordinal ke data interval adalah: 1.
Pertama perhatikan setiap butir jawaban responden dari angket yang disebar,
2.
Pada setiap butir ditentukan berapa orang yang mendapat skor 1, 2, 3, dan 4 yang disebut sebagai frekuensi,
3.
Setiap frekuensi dibagi dengan banyaknya responden dan hasilnya disebut proporsi, 𝑃𝑃𝑖𝑖 =
𝑓𝑓 𝑖𝑖 ∑ 𝑓𝑓 𝑖𝑖
(2.5)
Dengan:
𝑃𝑃𝑖𝑖 = proporsi pada skor i
𝑓𝑓𝑖𝑖 = frekuensi pada skor i
∑ 𝑓𝑓𝑖𝑖 = jumlah total frekuensi 4.
Tentukan nilai proporsi kumulatif dengan jalan menjumlahkan nilai proporsi secara berurutan perkolom skor.
Universitas Sumatera Utara
18
5.
Gunakan tabel distribusi normal, hitung nilai Z untuk setiap proporsi kumulatif yang diperoleh,
6.
Menghitung nilai densitas dari nilai Z yang diperoleh dengan cara memasukkan nilai Z tersebut kedalam fungsi densitas normal baku sebagai berikut: 𝑓𝑓(𝑧𝑧) =
Dengan:
1
√2𝜋𝜋
1 2 �
exp�−2𝑧𝑧
(2.6)
𝜋𝜋 = 3,141593
exp = 2,718282 7.
Tentukan nilai skala dengan menggunakan rumus: (𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 = (𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
)−(𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
)
)−(𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 )
(2.7)
Menghitung skor (nilai transformasi) untuk setiap kategori dengan rumus: 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 = 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 + [1 + |𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑚𝑚𝑚𝑚𝑚𝑚 |]
(2.8)
𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑚𝑚𝑚𝑚𝑚𝑚 artinya adalah nilai scale value absolut (tanpa memperhatikan tanda positif atau negatif) paling kecil.
2.7 Analisis Korelasi
Analisis korelasi adalah alat statistik yang dapat digunakan untuk mengetahui derajat hubungan linear antara satu variabel dengan variabel yang lain. Dalam ilmu statistika, istilah korelasi diartikan sebagai hubungan linier antara dua variabel atau lebih. Hubungan antara dua variabeldikenal dengan istilah bivariate correlation, sedangkan hubungan antar lebih dari dua variabel disebut multivariate correlation.
Universitas Sumatera Utara
19
Formula untuk menghitung koefisien korelasi dengan menggunakan teknik koefisien korelasi Product Moment Correlation dari Karl Pearson. Penggunaan teknik koefisien korelasi dari Karl Pearson untuk variabel-variabel dengan tingkat skala pengukuran interval.Untuk menghitung koefisien korelasiproduct moment pearsons antara dua variabel dapat digunakan rumus: r=
𝑛𝑛 (∑ 𝑋𝑋𝑋𝑋)− (∑ 𝑋𝑋 ∑ 𝑌𝑌)
(2.9)
�[𝑛𝑛 ∑ 𝑋𝑋 2 −(∑ 𝑋𝑋)2 ][𝑛𝑛 ∑ 𝑌𝑌 2 −(∑ 𝑌𝑌)2 ]
Dengan r
= Koefisien korelasi antara X dan Y
X
= Variabel bebas
Y
= Variabel terikat
Nilai r selalu terletak antara -1 dan 1, sehingga nilai r tersebut dapat ditulis : -1≤ r ≤+1. Untuk r = +1, berarti ada korelasi positif sempurna antara X dan Y, sebaliknya jika r = -1, berarti korelasi negatif sempurna antara X dan Y, sedangkan r = 0, berarti tidak ada korelasi antara X dan Y. Jika kenaikan didalam suatu variabel diikuti dengan kenaikan didalam variabel lain, maka dapat dikatakan bahwa kedua variabel tersebut mempunyai korelasi yang positif. Tetapi jika kenaikan didalam suatu variabel diikuti oleh penurunan didalam variabel lain, maka dapat dikatakan bahwa variabel tersebut mempunyai korelasi yang negatif. Dan jika tidak ada perubahan pada variabel walaupun variabel lainnya berubah maka dikatakan bahwa kedua variabel tersebut tidak mempunyai hubungan. Interpretasi harga r akan disajikan dalam tabel berikut:
Universitas Sumatera Utara
20
Tabel 2.1 Interpretasi Koefisien Korelasi R
Interpretasi
0
Tidak ada korelasi
0,01 – 0,20
Sangat rendah
0,21 – 0,40
Rendah
0,41 – 0,60
Agak Rendah
0,61 – 0,80
Cukup
0,81 – 0,99
Tinggi
1
Sangat tinggi (korelasi sempurna)
Sumber : Hartono, M.Pd Statistik untuk penelitian
Hubungan antara variabel dapat dikelompokkan menjadi tiga jenis: 1.
Korelasi Positif Terjadinya korelasi positif apabila perubahan antara variabel yang satu diikuti oleh variabel lainnya dengan arah yang sama (berbanding lurus). Artinya variabel yang satu meningkat, maka akan diikuti peningkatan variabel lainnya.
2.
Korelasi Negatif
Terjadinya korelasi negatif apabila perubahan antara variabel yang satu diikuti oleh variabel lainnya dengan arah yang berlawanan (berbanding terbalik). Artinya apabila variabel yang satu meningkat, maka akan diikuti penurunan variabel lainnya.
3.
Korelasi Nihil
Korelasi nihil artinya tidak adanya korelasi antara variabel.
Universitas Sumatera Utara
21
2.8 Analisis Diskriminan
2.8.1 Pengertian Analisis Diskriminan
Analisis diskriminan merupakan teknik menganalisis data dimana variabel tak bebas merupakan kategorik (non-metrik, nominal atau ordinal, bersifat kualitatif) sedangkan variabel bebas sebagai prediktor merupakan metrik (interval atau rasio, bersifat kuantitatif). (J. Supranto 2004).
Tujuan analisis diskriminan adalah membuat suatu fungsi diskriminan dari variabel independen yang bisa mendiskriminasi atau membedakan kelompok variabel dependen artinya mampu membedakan suatu objek masuk kelompok yang mana. (Yasril & Heru subaris 2009). Dengan kata lain, analisis dikriminan digunakan untuk mengklasifikasikan individu kedalam salah satu dari dua kelompok atau lebih.
Teknik analisis diskriminan dibedakan menjadi 2 yaitu analisis diskriminan
dua
kelompok/kategori,
jika
variabel
tak
bebas
Y
dikelompokkan menjadi 2. Diperlukan satu fungsi diskriminan. Kalau variabel tak bebas dikelompokkan menjadi lebih dari 2 kelompok disebut analisis diskriminan berganda (multiple discriminant analysis) diperlukan fungsi diskriminan sebanyak (k - 1) kalau memang ada k kategori. (J. Supranto 2004).
Model analisis diskriminan berkenaan dengan kombinasi linier yang disebut juga fungsi diskriminan bentuknya sebagai berikut :
(2.10)
𝐷𝐷𝑖𝑖 = 𝑏𝑏0 + 𝑏𝑏1 𝑋𝑋𝑖𝑖1 + 𝑏𝑏2 𝑋𝑋𝑖𝑖2 + 𝑏𝑏3 𝑋𝑋𝑖𝑖3 + ⋯ + 𝑏𝑏𝑗𝑗 𝑋𝑋𝑖𝑖𝑖𝑖
Dengan: 𝐷𝐷𝑖𝑖
= Nilai (skor) diskriminan dari responden (objek) ke-i.
Universitas Sumatera Utara
22
i
= 1,2, ..., n. D merupakan variabel dependen. 𝑏𝑏0 𝑏𝑏𝑗𝑗
= Intersep = koefisien atau timbangan diskriminan dari variabel independen ke-
j.
𝑋𝑋𝑖𝑖𝑖𝑖 = Variabel independen ke-j dari responden ke-i. 2.8.2 1.
Tujuan Analisis Diskriminan Membuat suatu fungsi diskriminan atau kombinasi linier dari prediktor atau variabel bebas yang bisa mendiskriminasi atau membedakan kategori variabel tak bebas atau criterion atau kelompok, artinya mampu membedakan suatu objek masuk kelompok kategori yang mana.
2.
Menguji apakah ada perbedaan signifikan antara kategori/kelompok, dikaitkan dengan variabel bebas atau prediktor.
3.
Menentukan prediktor/variabel bebas yang mana yang memberikan sumbangan terbesar terhadap terjadinya perbedaan antar kelompok.
4.
Mengklarifikasi/mengelompokkan
objek/kasus
kedalam
suatu
kelompok/kategori didasarkan pada nilai variabel bebas. 5.
2.8.3
Mengevaluasi keakuratan klasifikasi.
Asumsi Analisis Diskriminan Asumsi-asumsi yang harus dipenuhi untuk analisis diskriminan adalah:
1.
Variabel
independen
(MultivariateNormality),
seharusnya jika
data
berdistribusi tidak
normal
berdistribusi
multivariat normal,akan
menyebabkan masalah pada ketepatan fungsi (model) diskriminan. 2.
Matriks varians kovarians grup dari semua variabel independen seharusnya sama.
Universitas Sumatera Utara
23
3.
Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan
4.
Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel independen
mempunyai
multikolinieritas,
untuk
korelasi mengetahui
yang
kuat,dikatakan
adanya
multikolinieritas
terjadi dapat
dilakukan dengan melihat korelasi antar variabel independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.
2.8.4 1.
Langkah-langkah Analisis Diskriminan
Pemilihan variabel dependen dan independen
Variabel dependen merupakan variabel kategorik sedangkan variabel independen merupakan variabel numerik. Analisis diskriminan dibedakan menjadi dua yaitu :
a)
Analisis diskriminan dua kategori/kelompok, dimana variabel dependen dikelompokkan menjadi 2 (dikotomi), diperlukan satu fungsi diskriminan.
b) Analisis diskriminan berganda (Multiple Discriminant Analysis/MDA), dimana variabel dependen dikelompokkan menjadi 1. lebih dari 2 kelompok (multikotomi), diperlukan fungsi diskriminan sebanyak (k-1) kalau ada k kategori.
2.
Melakukan uji equality Untuk memenuhi asumsi bahwa semua variabel independen harus equal dilihat pada significancy dari Wilk’s Lambda jika nilai p > 0,05 menunjukkan bahwa variabel equal. Untuk melihat bahwa variabel tersebut equal, juga dilihat dari group covariance adalah relative sama
3.
Pembentukan fungsi diskriminan
a)
Pembentukan Fungsi Linier ( teoritis)
Universitas Sumatera Utara
24
Fungsi diskriminan merupakan fungsi atau kombinasi linier peubahpeubah asal yang akan menghasilkan cara terbaik dalam pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompok. Apabila fungsi diskriminan yang terbentuk sebanyak lebih dari satu fungsi, maka dapat dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya. Misalnya ada kelompok/kategori sebanyak G, dimana masingmasing kelompok terdapat sebanyak n objek (elemen atau responden) sebagai sampel maka: 𝑔𝑔
1 � 𝑥𝑥𝑖𝑖𝑖𝑖 (2.11) 𝑥𝑥̅𝑖𝑖 = 𝑛𝑛𝑖𝑖 𝑗𝑗 =1
Dengan: 𝑥𝑥̅𝑖𝑖 = vektor rata-rata sampel dalam kelompok ke-i 𝑛𝑛𝑖𝑖 = banyaknya elemen objek ke-i
𝑥𝑥𝑖𝑖𝑖𝑖 = menyatakan variabel x ke-j dalam kelompok ke-i Kemudian dengan mendefinisikan vektor rata-rata keseluruhan. 𝑔𝑔
1 𝑥𝑥 = � 𝑥𝑥̅𝑖𝑖 (2.12) 𝑔𝑔 𝑖𝑖=1
Dengan: 𝑥𝑥 = vektor rata-rata keseluruhan 𝑔𝑔 = banyaknya kelompok
𝑥𝑥̅𝑖𝑖 = vektor rata-rata sampel dalam kelompok ke-i Maka didapat:
𝑔𝑔
𝑩𝑩 = �(𝑥𝑥̅𝑖𝑖 − 𝑥𝑥)(𝑥𝑥̅𝑖𝑖 − 𝑥𝑥 )′(2.14) 𝑖𝑖=1
Universitas Sumatera Utara
25
Dengan: 𝑩𝑩 = metrik jumlah kuadrat dan jumlah cross products antar kelompok 𝑥𝑥̅𝑖𝑖 = vektor rata-rata sampel dalam kelompok ke-i
𝑥𝑥 = vektor rata-rata keseluruhan
(𝑥𝑥̅𝑖𝑖 − 𝑥𝑥)′ = transpos dari (𝑥𝑥̅𝑖𝑖 − 𝑥𝑥) Sehingga: 𝑔𝑔
𝑔𝑔
𝑛𝑛 𝑖𝑖
𝑊𝑊 = �(𝑛𝑛𝑖𝑖 − 1)𝑆𝑆𝑖𝑖 = � ��𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅𝑖𝑖 ��𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅𝑖𝑖 � (2.14) 𝑖𝑖=1 𝑗𝑗 =1
𝑖𝑖=1
Dengan:
𝑊𝑊 = matriks sampel dalam grup
𝑆𝑆𝑖𝑖 = matriks varians kovarians kelompok ke-i Matriks varians kovarians untuk sebuah sampel ukuran n yang terdiri atas p buah variabel 𝑋𝑋1 , 𝑋𝑋2 , 𝑋𝑋3 , … , 𝑋𝑋𝑝𝑝 disusun dalam sebuah matriks yang disebut dengan matriks varians-kovarians (S) dengan bentuk sebagai berikut: 𝑆𝑆11 ⎛𝑆𝑆21 𝑆𝑆 = ⎜𝑆𝑆31 ⎜ .. . 𝑆𝑆 ⎝ 𝑝𝑝1
𝑆𝑆12 𝑆𝑆22 𝑆𝑆32 .. . 𝑆𝑆𝑝𝑝2
𝑆𝑆13 𝑆𝑆23 𝑆𝑆33 .. . 𝑆𝑆𝑝𝑝3
… 𝑆𝑆1𝑝𝑝 … 𝑆𝑆2𝑝𝑝 ⎞ … 𝑆𝑆3𝑝𝑝 ⎟ .. .. ⎟ . . … 𝑆𝑆𝑝𝑝𝑝𝑝 ⎠
(2.15)
Dimana 𝑛𝑛
1 𝑆𝑆𝑖𝑖𝑖𝑖 = ��𝑥𝑥𝑗𝑗𝑗𝑗 − 𝑥𝑥̅𝑖𝑖 ��𝑥𝑥𝑗𝑗𝑗𝑗 − 𝑥𝑥̅ 𝑘𝑘 � 𝑛𝑛 − 1
Matriks
𝑗𝑗 =1
varians-kovarians
gabungannya
dapat
(2.16)
dihitung
dengan
menggunakan rumus sebagai berikut:
Universitas Sumatera Utara
26
𝑆𝑆𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 =
(𝑛𝑛 1 − 1)𝑆𝑆1 +(𝑛𝑛 2 − 1)𝑆𝑆2 +(𝑛𝑛 3 − 1)𝑆𝑆3 +⋯+(𝑛𝑛 𝑙𝑙 − 1)𝑆𝑆𝑙𝑙 𝑛𝑛 1 +𝑛𝑛 2 +𝑛𝑛 3 +⋯+𝑛𝑛 𝑔𝑔 −𝑔𝑔
Atau
𝑆𝑆𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 =
(2.17)
𝑊𝑊
(2.18)
(𝑛𝑛1 +𝑛𝑛2 +⋯+𝑛𝑛𝑔𝑔 −𝑔𝑔)
Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa Fisher’s Sample Linear Discriminant Function (persamaan linier) yaitu:
Dengan:
𝑌𝑌 = 𝐚𝐚�′ 𝑋𝑋
(2.19)
a = Vektor koefisien pembobot fungsi diskriminan 𝐚𝐚�′= tranpose 𝐚𝐚�
Y = Variabel terikat (skor diskriminan) X = Variabel bebas (Vektor variabel acak yang dimasukkan ke dalam fungsi diskriminan).
Agar
dapat
mendiskriminasi
kelompok
secara
maksimal,
fungsi
diskriminan Y harus diestimasi untuk memaksimumkan variabel antar kelompok. Koefisien 𝑎𝑎 dihitung dengan membuat 𝜆𝜆 maksimum, yaitu: 𝐚𝐚�′𝐁𝐁𝐚𝐚�
= 𝐚𝐚�′𝐖𝐖𝐚𝐚�
𝑔𝑔
𝐚𝐚�′ �∑𝑖𝑖=1 (𝑥𝑥̅ 𝑖𝑖 −𝑥𝑥)(𝑥𝑥̅ 𝑖𝑖 −𝑥𝑥 )′𝐚𝐚��
(2.20)
𝑛𝑛 𝑖𝑖 𝑔𝑔 �𝑥𝑥 𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ 𝑖𝑖 ��𝑥𝑥 𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ 𝑖𝑖 �𝐚𝐚� 𝐚𝐚�′ ∑𝑖𝑖=1 ∑𝑗𝑗 =1
Biarkan𝜆𝜆̂1 + 𝜆𝜆̂2 + ⋯ + 𝜆𝜆̂𝑔𝑔 > 0menunjukkan 𝑠𝑠 ≤ min(𝑔𝑔 − 1, 𝑝𝑝) eigenvalue dari
matriks
𝑊𝑊 −1 B
dan
𝑒𝑒̂1 , ⋯ , 𝑒𝑒̂𝑠𝑠 menjadi
eigen
vektor.
Untuk
menyelesaikan 𝑠𝑠 ≤ min(𝑔𝑔 − 1, 𝑝𝑝) eigenvalue dari matriks 𝑊𝑊 −1 B, dengan menggunakan rumus:
(𝑊𝑊 −1 𝐵𝐵 − 𝜆𝜆𝐼𝐼)𝐚𝐚� = 0
(2.21)
Nilai 𝜆𝜆maksimum merupakan nilai eigen value terbesar dari matriks 𝑊𝑊 −1 B dan 𝐚𝐚�′ adalah associated eigenvektors. Elemen a, seperti 𝑎𝑎1 sampai dengan
Universitas Sumatera Utara
27
𝑎𝑎𝑘𝑘 merupakan koefisien fungsi diskriminan, berasosiasi dengan fungsi
diskriminan pertama. Pada umumnya, dimungkinkan untuk mengestimasi sampai eigen value terkecil yaitu yang ke (G-1) atau k fungsi diskriminan masing-masing
dengan
eigenvaluenya.
Maksudnya,
setiap
fungsi
diskriminan mempunyai nilai eigenvalue dan nilai eigen value ini semakin mengecil dari fungsi ke fungsi.
b) Fungsi Linier (dengan bantuan SPSS) Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagian Unstandardized diaktifkan.
c)
Menghitung Discriminant Score (nilai diskriminan) Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya.
d) Perhitungan Hit Ratio Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi. Misalkan ada sebanyak n observasi, akan dibentuk fungsi linier dengan observasi sebanyak n-1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbedabeda, sehingga fungsi linier yang dibentuk ada sebanyak n. Inilah yang disebut dengan metode Leave One Out.
e)
Kriteria Posterior Probability Aturan pengklasifikasian yang ekivalen dengan model linier Fisher ialah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x)
Universitas Sumatera Utara
28
berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option probabilities of group membership pada bagian Save di kotak dialog utama.
f)
Akurasi Statistik Dapat di uji secara statistik apakah klasifikasi yang dilakukan (dengan menggunakan fungsi diskriminan) akurat atau tidak. Uji statistik tersebut ialah prees-Q Statistik. Ukuran sederhana ini membandingkan jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitunngan kemudian dibandingkan dengan nilai kritis (critical velue) yang diambil dari tabel Chi-Square dan tingkat keyakinan sesuai yang diinginkan. Statistik Q ditulis dengan rumus:
Dengan:
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 − 𝑄𝑄 =
[𝑁𝑁−(𝑛𝑛𝑛𝑛 )]2 𝑁𝑁(𝑘𝑘−1)
(2.22)
N= jumlah populasi n = jumlah sampel k = jumlah grup
Universitas Sumatera Utara