BAB 2 TINJAUAN TEORITIS
2.1
Data
Data merupakan kumpulan keterangan atau fakta yang diperoleh dari satu populasi atau lebih. Data yang baik, benar dan sesuai dengan model menentukan kualitas kebijakan atau keputusan yang akan diambil terhadap suatu masalah dari populasi yang akan dikaji. Dengan kata lain, data adalah suatu bahan mentah yang jika diolah dengan baik melalui berbagai analisis dapat melahirkan berbagai informasi.
2.1.1 Pembagian data Dalam berbagai aplikasi, data dibedakan atas beberapa bagian.
2.1.1.1 Menurut sifatnya Menurut sifatnya, data dibedakan atas: a. Data kualitatif
Data kualitatif adalah serangkaian observasi dimana setiap observasi yang terdapat dalam sampel atau populasi tergolong dalam salah satu kelas-kelas yang saling lepas dan yang tidak dapat dinyatakan dalam angka atau bilanganbilangan (non-numerik). Atau bisa juga dikatakan bahwa data kualitatif adalah data yang dikategorikan menurut lukisan kualitas dari objek yang dipelajari. Contoh: Status perkawinan misalnya ada tiga, yaitu belum menikah diberi angka 1, menikah diberi angka 2, dan duda/janda diberi angka 3. Angka yang diberikan ini bukan berarti kekuatan. Angka tersebut hanya sebagai label belaka. b. Data kuantitatif Data kuantitatif adalah serangkaian observasi atau pengukuran yang disajikan dalam bentuk bilangan-bilangan. Data kuantitatif merupakan data yang memiliki harga yang berubah-ubah atau bersifat variabel. Contoh: 1. Jumlah mahasiswa S1 setiap propinsi, misalnya di Sumatera Utara 79.459 mahasiswa, di Riau 43.227, dan sebagainya. 2. Data pengeluaran harian tiap keluarga di Kelurahan Padang Bulan, misalnya, Rp. 40.000, Rp. 49.000, dan sebagainya.
2.1.1.2 Menurut sumbernya Menurut sumbernya data dapat dibagi menjadi dua bagian, yaitu: a. Data internal Data internal merupakan data yang dikumpulkan oleh unit kerja tertentu dalam lingkungannya untuk keperluan unit kerja itu sendiri.
Contohnya: 1. Catatan hasil produksi 2. Catatan inventaris perusahaan 3. Catatan penjualan, dan lain-lain. b. Data eksternal Data eksternal merupakan data yang diambil atatu diperoleh dari luar instansi. Contoh: Untuk menghitung atau memproses data terkait jumlah mahasiswa di Sumatera Utara, Badan Pusat Statistik (BPS) mengambil data dari tiap universitas atau lembaga pendidikan tinggi di Sumatera Utara.
2.1.1.3 Menurut cara memperolehnya Menurut cara memperolehnya data dibagi atas dua, yaitu: a. Data primer Data primer merupakan data yang diperoleh langsung dari lapangan oleh orang yang berkepentingan atau orang yang akan menggunakan data tersebut. Data yang diperoleh seperti hasil wawancara atau pengisian kuesioner yang biasa dilakukan peneliti. Dalam metode pengumpulan data primer, peneliti melakukan sendiri penelitian di lapangan maupun di laboratorium. Pelaksanaannya dapat berupa survei atau percobaan. b. Data sekunder Data sekunder merupakan data yang secara tidak langsung dikumpulkan oleh peneliti atau orang yang berkepentingan atas data tersebut. Data sekunder pada
umumnya digunakan sebagai gambaran tambahan atau pelengkap dalam penelitian untuk diproses lebih lanjut. Data sekunder didapat dari hasil-hasil penelitian lembaga atau instansi, seperti Badan Pusat Statistik, media massa, lembaga pemerintahan atau swasta, dan sebagainya. Yang menjadi perhatian dalam penggunaan data sekunder adalah sumber data, batasan konsep yang digunakan, serta tingkat ketelitian dalam pengumpulan data.
2.1.1.4 Menurut waktu Menurut waktu data dibedakan atas dua, yaitu: a. Data silang. Data silang merupakan data yang dikumpulkan dalam waktu yang sifatnya temporer. Misalnya data hasil penelitian pemasaran kain jadi di Jakarta tahun 2010. b. Data berkala Data berkala merupakan data yang dikumpulkan setiap periode tertentu. Misalnya jumlah impor mobil mewah menurut tahun, dari tahun 1985 sampai dengan tahun 2004.
2.1.1.5 Menurut jenis Menurut jenisnya, data dibagi menjadi dua bagian, yaitu: a. Data kontinu Data kontinu merupakan data yang diperoleh dari hasil pengukuran.
Contoh: Tinggi badan, kecepatan sebuah mobil, volume suatu kaleng, luas lapangan bola, dan lain sebagainya. b. Data diskrit Data diskrit merupakan data yang diperoleh dari hasil perhitungan. Contoh: Jumlah mahasiswa Program Studi D-III Statistika FMIPA USU Angkatan 2010 adalah 96 orang.
2.1.2 Tujuan pengumpulan data Secara umum tujuan pengumpulan data meliputi: a. Memperbaiki atau menyederhanakan teori atau hipotesis yang ada b. Menciptakan teori atau hipotesis yang baru c. Mengetahui keadaan atau hipotesis yang ada d. Memecahkan masalah yang mencakup inter-relasi antara beberapa kasus (kelompok data).
2.1.3 Teknik pengumpulan data Teknik pengumpulan data meliputi: a. Pengumpulan langsung
Pengumpulan data secara langsung dilakukan dengan cara mengamati dan mencatat semua hasil pengamatan dari sumber pertama. Pengumpulan data secara langsung dilakukan dengan cara percobaan, survei dan observasi. b. Pengumpulan tak langsung Pengumpulan data tak langsung dulakukan dengan cara menghimpun data yang diperlukan dari orang-orang atau unit-unit kerja yang lain yang telah mengumpulkan data tersebut secara langsung.
2.1.4 Skala pengukuran Semua hasil pengukuran atau pengamatan tercatat yang belum diolah secara statistik disebut data mentah (raw data). Hasil pengukuran tersebut dinyatakan dalam satuansatuan dengan menggunakan skala pengukuran atau skala penilaian. Menurut S.S Steven (1976), skala pengukuran dibagi atas 4 bagian: a. Skala nominal (klasifikasi) Skala nominal adalah skala pengukuran yang paling sederhana yang dilambangkan dengan kata-kata, huruf simbol atau bilangan. Pada skala nominal hasil pengukurannya bisa dibedakan tetapi tidak bisa diurutkan mana yang lebih tinggi, mana yang lebih rendah, atau mana yang harus dikesampingkan. Skala nominal digunakan untuk pengukuran yang hanya memperhatikan golongan, seperti anggota kelompok, agama, suku bangsa, dan lain-lain. b. Sakal ordinal (rangking) Skala ordinal adalah skala pengukuran yang selain mempunyai ciri untuk membedakan juga mempunyai ciri untuk mengurutkan pada rentang tertentu.
Dengan menggunakan skala ordinal, objek-objek juga dapat digolongkan dalam kategori tertentu. Angka atau huruf yang diberikan mengandung tingkatan, sehingga dari kelompok yang terbentuk dapat dibuat peringkat yang menyatakan hubungan lebih atau kurang menurut aturan penataan tertentu. c. Skala selang atau interval Skala selang adalah skala pengukuran yang selain mempunyai ciri untuk membedakan dan memberikan urutan, juga mempunyai ciri jarak yang sama. d. Skala rasio (nisbah) Skala rasio adalah skala yang mempunyai 4 ciri, yaitu membedakan, mengurutkan, memberi jarak, dan mempunyai nilai nol tulen (titik nol yang berarti), sehingga dapat menghitung rasio atau perbandingan diantara setiap nilai. Semua ciri skala interval menjadi ciri skala rasio. Perbedaan antara nilainilai diketahui dan bernilai tetap, kategori-kategori nilai juga bersifat saling lepas. Hanya saja skala rasio mempunyai titik nol yang berarti dan rasio (perbandingan) antara dua nilai juga berarti. Misalnya, Siregar mempunyai uang Rp. 0, artinya Siregar tidak mempunyai uang.
2.1.5 Kriteria data Telah diketahui bahwa data merupakan keterangan-keterangan atau fakta-fakta yang dikumpulkan dari satu populasi atau lebih yang akan digunakan untuk menerangkan ciri-ciri dari populasi yang bersangkutan. Agar data tersebut dapat menerangkan ciri dari populasi induknya dengan benar, maka data tersebut harus dapat memenuhi klriteria-kriteria sebagai berikut:
1. Objektif. Data yang bersifat objektif adalah data yang benar-benar sama dengan keadaan yang sebenarnya (apa adanya) 2. Mewakili populasi 3. Galat baku (standard error) kecil 4. Tepat waktu 5. Relevan.
2.1.6 Pemeriksaan data Data yang telah terkumpul perlu diperiksa apakah data tersebut sudah memenuhi kriteria-kriteria yang diperlukan ataukah belum. Selain itu masih ada beberapa hal yang perlu diperhatikan dan dikaitkan dengan pemeriksaan data, yaitu: 1. Konsistensi, keseragaman, kelengkapan, dan ketelitian 2. Sumber data. Pemeriksaan sumber data mencakup bias, relevansi, kecukupan, dan faktualisasi 3. Waktu, data tidak kadaluarsa.
2.2
Analisis Regresi
Metode analisis yang telah dibicarakan hingga sekarang adalah analisis terhadap data mengenai sebuah karakteristik atau atribut (data kualitatif) dan mengenai sebuah variabel, diskrit maupun kontinu (data kuantitatif). Tetapi, sebagaimana diketahui, banyak persoalan yang meliputi lebih dari sebuah variabel.
Bila ada data yang terdiri atas dua atau lebih variabel, perlu dipelajari bagaimana variabel-variabel itu berhubungan. Hubungan yang didapat pada umumnya dinyatakan dalam bentuk persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel. Studi yang menyangkut masalah ini yang dikenal dengan analisis regresi. Regresi pertama kali dikenalkan oleh seorang ahli yang bernama Francis Dalton pada tahun 1886. Menurutnya, analisis regresi berkenaan dengan memperkirakan nilai rata-rata dari suatu variabel yang dinamakan “peubah bergantung=dependent variable” dengan diketahuinya nilai-nilai dari variabel-variabel yang lainnya yang dinamakan “peubah bebas=independent variable”. Hubungan yang terdapat dalam analisis regresi pada umumnya dinyatakan dalam bentuk persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel bebas (independent variabel) dan variabel tak bebas (dependent variabel). Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan memodelkan hubungan diantara variabel-variabel. Analisis regresi berguna dalam menelaah hubungan dua variabel atau lebih, dan terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan sempurna, sehingga dalam penerapannya lebih bersifat eksploratif.
2.2.1 Regresi linier sederhana Regresi linier sederhana adalah regresi yang melibatkan hubungan antara satu variabel tak bebas dihubungkan dengan satu variabel bebas. Variabel tak bebas adalah variabel
yang nilainya selalu bergantung dari nilai variabel lain, dalam hal ini variabel tak bebas nilainya selalu dipengaruhi oleh variabel bebas, sehingga sering disebut variabel terikat, sedangkan variabel bebas adalah variabel yang nilainya tidak tergantung dari variabel lain. Biasanya variabel tak bebas dinotasikan dengan Y dan variabel tak bebas dinotasikan dengan X. hubungan-hubungan itu bila dinyatakan dalam model matematis akan memberikan persamaan-persamaan tertentu. Model matematis dalam menjelaskan hubungan antar variabel dalam analisis regresi menggunakan persamaan regresi. Persamaan regresi adalah suatu persamaan matematis yang mendefinisikan hubungan antara dua variabel. Persamaan regresi digunakan untuk membuat taksiran mengenai variabel tak bebas yang disebut dengan persamaan regresi estimasi. Bentuk umum dari regresi linier sederhana yang menunjukkan hubungan antara dua variabel, yaitu variabel X sebagai variabel bebas dan variabel Y sebagai variabel tak bebas adalah: Y = α + βX + ε Dimana: Y=
variabel tak bebas
X=
variabel bebas
α=
intercept (konstanta) yang merupakan titik potong kurva terhadap sumbu Y
β=
koefisien arah = koefisien regresi = besarnya pengaruh X terhadap Y, kalau X naik 1 unit. Sering disebut slope coefficient.
ε=
nilai kesalahan (error)
2.2.2 Regresi linier berganda Regresi linier berganda adalah analisis regresi yang melibatkan pengaruh dari dua atau lebih variabel bebas dengan variabel tak bebas. Ada kalanya persamaan regresi dalam menganalisis hubungan antar variabel tidak hanya dipengaruhi oleh satu faktor atau peubah bebas tapi dapat pula dipengaruhi oleh dua atau lebih faktor. Maka, regresi yang mengandung lebih dari satu peubah bebas digunakan regresi linier berganda. Jadi model ini dikembangkan untk mengetimasi nilai variabel tak bebas Y dengan menggunakan lebih dari satu variabel ( X1, X2, …, Xn). Model regresi linier berganda merupakan suatu model yang dapat dinyatakan dalam persamaan linier yang memuat peubah atau parameter. Parameter ini umumnya tidak diketahui atau dapat ditaksir. Hubungan lebih dari dua variabel bila dinyatakan dalam bentuk persamaan matematis adalah: Y = α + β1 X1 + β2 X2 + β3 X3 +……….+ βi Xi + ε dengan i = 1,2,3,….,n Dimana: Y=
variabel tak bebas
Xi =
variabel bebas ke-i
α=
intercept atau konstanta yang merupakan titik potong terhadap sumbu Y
β1 =
koefisien regresi parsial, mengukur besarnya pengaruh X1 terhadap Y kalau X1 naik 1 unit dan X2 konstan
β2 =
koefisien regresi parsial, mengukur besarnya pengaruh X2 terhadap Y kalau X2 naik 1 unit dan X3 konstan
βi =
koefisien regresi parsial, mengukur besarnya pengaruh Xi terhadap Y kalau Xi naik 1 unit dan variabel-variabel X lainnya tetap
εi =
nilai kesalahan (error)
2.2.3 Uji regresi linier ganda Uji regresi linier ganda perlu dilakukan karena untuk mengetahui apakah sekelompok variabel bebas secara bersamaan mempunyai pengaruh terhadap variabel tak bebas. Pada dasarnya pengujian hipotesa tentang parameter koefisien regresi secara keseluruhan atau pengujian persamaan regresi menggunakan statistik F yang dirumuskan sebagai berikut:
= ( −
− 1)
Dengan: F
= Statistik F yang menyebar mengikuti distribusi F dengan derajat bebas V1=k dan V2 = n-k-1 = Jumlah Kuadrat Regresi = b1 ∑y1x1 + b2 ∑y1x2 + …+ bk ∑yixi x1 = X1 - 1, x2 = X2 –
2
…..xi = Xi -
dengan derajat kebebasan (dk) = k
i,
yi = Yi -
= Jumlah Kuadrat Residu (sisa) = Σ( −
)
dengan derajat kebebasan (dk) = n – k -1 Persamaan penduganya adalah: =
+
+
+. . +
Langkah-langkah yanbg dibutuhkan untuk pengujian hipotesa ini adalah sebagai berikut: 1. H0 : β0 = β1 = …. = βk = 0 H1 = minimal satu parameter koefisien regresi yang ≠ 0 2. Pilih taraf nyata α yang diinginkan 3. Hitung statistik Fhit dengan menggunakan formula di atas 4. Keputusan :
tolak H0 jika Fhit > Ftabel : k : n - k - 1 terima H0 jika Fhit < Ftabel : k : n - k – 1
dimana b0, b1, … , bi merupakan penduga bagi parameter β0, β1, …. , βi dengan keputusan :
H0 ditolak jika Fhit > dari Ftabel : k: n - k – 1 H0 diterima jika Fhit < dari Ftabel : k: n - k – 1
2.3
Analisa Korelasi
Analisa korelasi adalah metode statistika yang digunakan untuk menentukan kuatnya atau derajat hubungan garis lurus (linier) antar dua variabel atau lebih. Dengan dua variabel, semakin kuat atau tinggi derajat hubungan garis lurus (linier) antara kedua variabel tersebut. Ukuran untuk derajat garis lurus ini dinamakan koefisien korelasi (the correlation coefficient).
Berdasarkan regresi linier ganda
=
+
+
+. . +
maka nilai
R dapat ditentukan terlebih dahulu mencari nilai R2 (koefisien determinasi) yang digunakan untuk mengukur proporsi keragaman total dalam variabel total dalam variabel tak bebas Y yang dapat dijelaskan atau diterangkan oleh variabel-variabel penjelas yang ada dalam model regresi secara bersama. Nilai R2 dapat ditentukan dengan rumus: =
Σ
Dengan: JKreg = Jumlah Kuadrat Regresi ∑Yi2 = ∑ (Y - )2
2.4
Regresi dengan Variabel Dummy
Variabel bebas (X) dalam regresi yang bertipe kualitatif maka digunakan variabel dummy. Bahwa variabel kualitatif, atau yang sering disebut variabel dummy, membuat model regresi menjadi alat yang fleksibel sehingga mampu menangani banyak masalah yang menarik yang sering dijumpai dalam studi empiris Dengan rumus: =
+
+
Y
= Variabel tak bebas (dependent variable) bersifat kuantitatif
X
= Variabel bebas (independent variable) bersifat kuantitatif
D
= Variable dummy (dummy variable) bersifat kualitatif
Dengan mengasumsikan bahwa unsur gangguan (disturbance) memenuhi asumsi yang biasa dari model regresi linier klasik
dengan: E(Y│D = 0) =
+
dan +
E(Y│D = 1) =
+
Misalkan: Regresi atas satu variabel kuantitatif dan dua variabel kualitatif Teknik variabel dummy dapat dengan mudah diperluas untuk menangani lebih dari satu variabel kualitatif. Contohnya dalam regresi gaji pengajar perguruan tinggi tetapi diasumsikan sebagai tambahan terhadap pendapatan dan jenis kelamin, warna kulit dari pengajar juga penentu (determinan) penting dari gaji. Untuk menyederhanakan, asumsikan bahwa kulit mempunyai dua kategori : Hitam dan Putih. Kemudian, rumuskan sebagai berikut: Yi = α0 + α1D1 + α2D2 + βXi + εi dimana Yi dan Xi D1
D2
=
gaji tahunan dan tahun pengalaman mengajar
=
1, jika laki-laki
=
0, jika lainnya
=
1, jika kulit putih
=
0, jika lainnya
Bahwa tiap variabel kualitatif, jenis kelamin da warna kulit, mempunyai dua kategori dan karenanya memerlukan satu variabel dummy untuk masing-masing. Dengan mengasumsikan E(εi) = 0, dapat diperoleh regresi sebagai berikut: Rata-rata gaji untuk pengajar wanita berkulit hitam: E(Yi│D1 = 0, D2 = 0, Xi) = α0 + βXi
Rata-rata gaji untuk pengajar laki-laki berkulit hitam: E(Yi│D1 = 1, D2 = 0, Xi) = (α0 + α1) + βXi Rata-rata gaji untuk pengajar wanita berkulit putih: E(Yi│D1 = 0, D2 = 1, Xi) = (α0 + α2) + βXi Rata-rata gaji untuk pengajar laki-laki berkulit putih: E(Yi│D1 = 1, D2 = 1, Xi) = (α0 + α1 + α2) + βXi Sekali lagi, diasumsikan bahwa regresi seperti di atas berbeda hanya dalam koefisien intersep, tetapi tidak dalam koefisien kemiringan.