BAB 2
LANDASAN TEORI
2.1 Pengertian Statistik
Menurut Sofyan (2013) pengertian statistik berasal dari bahasa Latin, yaitu status yang berarti negara dan digunakan untuk urusan negara. Pada mulanya, statistik hanya digunakan untuk menggambarkan keadaan dan menyelesaikan masalah yang berhubungan dengan kenegaraan saja, seperti perhitungan banyaknya penduduk, pembayaran pajak, gaji pegawai, dan lain sebagainya. Seiring dengan perkembangan zaman, maka pengertian statistik semakin berkembang, antara lain: 1. Statistik adalah kumpulan data yang disajikan dalam bentuk tabel/daftar, gambar, diagram, atau ukuran-ukuran tertentu, misalnya statistik penduduk, statistik kelahiran, dan statistik pertumbuhan ekonomi. 2. Statistik adalah pengetahuan mengenai pengumpulan data, klasifikasi data, penyajian data, pengolahan data, penarikan kesimpulan, dan pengambilan keputusan berdasarkan masalah tertentu. 3. Statistik matematik/statistik teoritik adalah statistik yang diturunkan, bagaimana menciptakan model-model teoritis dan matematis.
Universitas Sumatera Utara
4. Statistik terapan/teknik analisis data adalah statistik yang membahas caracara penggunaan statistik, antara lain untuk penelitian. Pengelompokkan statistik berdasarkan cara pengolahan datanya, maka terbagi menjadi empat cara, yaitu: 1. Statistik Deskriptif Statistik deskriptif adalah statistik yang berkenaan dengan bagaimana cara mendeskripsikan, menggambarkan, menjabarkan, atau menguraikan data agar mudah dipahami. Adapun cara yang digunakan antara lain: a. Menentukan ukuran dari data, seperti nilai modus, rata-rata, dan nilai tengah (median). b. Menentukan ukuran variabilitas data, seperti variasi (varian), tingkat penyimpangan (deviasi standar), dan jarak (range). c. Menentukan ukuran bentuk data, seperti kemiringan (skewness), keruncingan (kurtosis), dll.
2. Statistik Inferensial (Statistik Induksi) Statistik Inferensial adalah serangkaian teknik yang digunakan untuk mengkaji, menaksir, dan mengambil kesimpulan berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik atau ciri dari suatu populasi. Berdasarkan ruang lingkupnya, statistik inferensial mencakup: a. probabilitas atau teori kemungkinan, b. distribusi teoritis, c. sampling dan sampling distribusi, d. pendugaan populasi atau teori populasi,
Universitas Sumatera Utara
e. uji hipotesa rerata, f. analisis korelasi dan uji signifikansi, g. analisis regresi untuk peramalan, h. analisis varian dan kovarian.
Pengelompokkan statistik berdasarkan bentuk parameternya sebagai berikut: 1. Statistik Parametrik Statistik
parametrik
adalah
statistik
yang
mempertimbangkan
jenis
sebaran/distribusi data yang berdistribusi normal dan memiliki varian homogen. Pada umumnya, data yang digunakan pada statistik parametrik ini bersifat interval dan rasio. Uji statistik yang dapat digunakan pada statistik parametrik, antara lain: a. uji-z (1 atau 2 sampel), b. uji-t (1 atau 2 sampel), c. korelasi sederhana dan berganda, d. one or two way anova test, e. analisis regresi sederhana dan berganda, dll.
2. Statistik Nonparametrik Statistik Nonparametrik merupakan bagian statistik yang parameter populasi atau datanya tidak mengikuti suatu distribusi tertentu atau memiliki distribusi yang bebas dari persyaratan (free-distribution procedures), dan variannya tidak perlu homogen. Statistik nonparametrik biasanya digunakan untuk melakukan analisis pada data berjenis nominal atau ordinal. Adapun analisis statistik nonparametrik adalah sebagai berikut:
Universitas Sumatera Utara
a. uji tanda peringkat Wilcoxon dan uji Mann-Withney (untuk 1-2 kelompok), b. uji Kruskal-Wallis (untuk kelompok lebih dari 2), c. uji Korelasi Rank Spearman dan Kendall Tau, d. uji Friedman, e. uji Chi-Kuadrat, dll.
Untuk pembahasan pada tugas akhir ini penulis menggunakan statistik inferensial dan statistik parametrik.
2.2 Analisis Regresi
Istilah regresi pertama kali digunakan oleh Francis Galton. Dalam papernya yang terkenal
Galton
menemukan
bahwa
meskipun
terdapat
tendensi
atau
kecenderungan bahwa orang tua yang tinggi akan mempunyai anak yang tinggi dan orang tua yang pendek akan mempunyai anak yang pendek juga, tetapi ratarata tinggi badan anak yang lahir dari orang tua dengan tinggi badan tertentu cenderung bergerak atau regress ke arah rata-rata tinggi badan anak seluruh populasi tersebut (Hakim Abdul, 2004). Analisis regresi (regression analysis) merupakan suatu teknik (technique) untuk membangun persamaan garis lurus dan menggunakan persamaan tersebut untuk membuat perkiraan (prediction). Model matematis dalam menjelaskan hubungan antarvariabel dalam analisis regresi menggunakan persamaan regresi.
Universitas Sumatera Utara
Persamaan regresi (regression equation) adalah suatu persamaan matematis yang mendefenisikan hubungan antar dua variabel. (Algifari, 2000). Variabel bebas adalah variabel yang nilai-nilainya tidak bergantung pada variabel lainnya, biasanya disimbolkan dengan X. Variabel ini digunakan untuk meramalkan atau menerangkan nilai dari variabel yang lain. Sedangkan variabel terikat adalah variabel yang nilai-nilainya bergantung pada variabel lainnya, biasanya disimbolkan dengan Y. Variabel itu merupakan variabel yang diramalkan atau menerangkan nilainya (Hasan, 1999). Untuk mempelajari hubungan-hubungan antara beberapa variabel analisis regresi dapat dilihat dari dua bentuk yaitu : 1. Analisis Regresi Linier Sederhana (Simple Analysis Regression) 2. Analisis Regresi Linier Berganda (Multiple Analysis Regression).
2.2.1 Regresi Linier Sederhana(Simple Analysis Regression).
Regresi linier sederhana merupakan suatu prosedur untuk menunjukkan dua hubungan matematis dalam bentuk persamaan antara dua variabel, yaitu variabel bebas (X) variabel terikat (Y).Bentuk umum persamaan regresi linier sederhana adalah : &
... (2.1)
Keterangan : = nilai estimasi Y
Universitas Sumatera Utara
a
= intersep (titik potong kurva terhadap sumbu Y)
b
= kemiringan atau slop kurva linier
X
= Variabel bebas (variable independent).
Persamaan (2.1) dapat digunakan untuk menaksir nilai
jika nilai a, b,
dan X diketahui. Nilai a pada persamaan (2.1) merupakan nilai Y yang dipotong oleh kurva linier pada sumbu vertikal Y. Atau dengan kata lain, a adalah nilai Y jika X=0. Nilai b adalah kemiringan (slope) kurva linier yang menunjukkan besarnya perubahan nilai Y sebagai akibat dari perubahan setiap unit nilai X. Besarnya a dan b konstan sepanjang kurva linier. Menurut Sudjana (2005) untuk menentukan nilai a dan bdapat diperoleh dengan menggunakan metode kuadrat terkecil (least squares method) di bawah ini: a. Mencari nilai konstanta a & =
... (2.2)
b. Mencari nilai konstanta b
=
... (2.3)
2.2.2 Regresi Linier Berganda(Multiple Analysis Regression)
Regresi linier berganda merupakan suatu linier yang menjelaskan ada tidaknya suatu hubungan fungsional dan meramalkan pengaruh dua variabel bebas (X) atau
Universitas Sumatera Utara
lebih terhadap variabel terikat (Y). Bentuk umum persamaan regresi linier berganda adalah:
... (2.4) Keterangan: = nilai estimasi Y = nilai Y pada perpotongan antara garis linier dengan sumbu vertikal Y = slope yang berhubungan dengan variabel
,
, dan
= nilai variabel bebas (independent).
Persamaan regresi linier berganda dengan dua variabel bebas dapat dibentuk dengan persamaan berikut:
... (2.5)
Untuk menentukan besarnya
dan
yang terdapat pada persamaan
tersebut dapat menggunakan metode skor deviasi berikut :
... (2.6)
... (2.7)
... (2.8)
... (2.9)
Universitas Sumatera Utara
... (2.10)
... (2.11)
... (2.12)
... (2.13)
... (2.14)
Selanjutnya hasil perhitungan tersebut dimasukkan ke dalam rumus di bawah ini: a. Menghitung nilai konstanta b1
=
... (2.15)
b. Menghitung nilai konstanta b2
=
... (2.16)
c. Menghitung nilai konstanta b0
=
... (2.17)
Setelah menentukan persamaan liniernya langkah selanjutnya adalah menentukan kekeliruan baku (standard error). Menurut Hasan (1999) kekeliruan baku (standard error) adalah angka atau indeks yang digunakan untuk menduga
Universitas Sumatera Utara
ketepatan suatu penduga atau mengukur jumlah variasi titik-titik observasi di sekitar garis regresi. Rumus untuk menghitung standard error adalah:
'
(
')
#
*
+ ,
- . /
... (2.18)
Keterangan: ')
=kekeliruan baku (standard error)
n
=jumlah data
k
=jumlah variabel bebas.
2.3 Uji Keberartian Regresi Linier Berganda
Uji keberartian digunakan untuk mengetahui apakah sekelompok variabel bebas secara bersamaan mempunyai pengaruh terhadap variabel terikat. Pada dasarnya pengujian hipotesa tentang parameter koefisien regresi secara keseluruhan adalah dengan menggunakan uji F. Uji linieritas garis regresi juga dilakukan dengan menghitung nilai F, yaitu dengan mempergunakan hipotesis nol 0 . Jika nilai Fhitung
Universitas Sumatera Utara
2.3.1 Uji F (Simultan)
Menurut Nurgiyantoro (2002) dalam analisis regresi yang dianalisis adalah varians garis regresi, hasil perhitungan analisis regresi juga menghasilkan bilangan atau rasio F, atau lengkapnyaFregresi(disingkatFreg) atau Fhitung. Rasio F diperoleh dengan membandingkan antara rata-rata hitung garis residu (RKres). Adapun rumus untuk memperolehFregadalah sebagai berikut: 12)3 =
45678
... (2.19)
45679
Keterangan: Freg
= bilangan F garis regresi
RKreg
=rata-rata hitung kuadrat garis regresi
RKres
=rata-rata hitung kuadrat garis residu.
Maka besar kecilnya bilangan Fregakan ditentukan oleh besar kecilnya rata-rata hitung kuadrat garis regresi (RKreg) dan rata-rata hitung kuadrat garis residu (RKres). Jika (RKreg) > (RKres) maka akan menghasilkan Freg yang signifikan dan juga sebaliknya.Langkah-langkah untuk menghitung nilai Freg adalah:
•
Penghitungan Jumlah Kuadrat Total (JKT) Jumlah kuadrat total (JKT) dihitung dengan rumus sebagai berikut: :;<
•
... (2.20)
Penghitungan Jumlah Kuadrat Regresi (JKreg)
Universitas Sumatera Utara
Rumus yang yang digunakan adalah sebagai berikut: :;2)3 •
... (2.21)
Penghitungan Jumlah Kuadrat Residu (JKres) Rumus yang yang digunakan adalah sebagai berikut: :;2)=
•
:;<
:;2)3
... (2.22)
Penghitungan Rata-rata Hitung Kuadrat Regresi (RKreg) dan Residu (RKres) Rumus yang digunakan adalah sebagai berikut:
•
>;2)3
?5678
... (2.23)
>;2)=
?5679
... (2.24)
Penghitungan Nilai F Regresi (Freg)
12)3
>;2)3 >;2)=
Makalangkah-langkah dalam pengujian hipotesis adalah sebagai berikut: 1. Menentukan formulasi hipotesis 0 : @A
B
0 : @A C B di mana : @A
koefisien yang akan diuji.
Universitas Sumatera Utara
2. Menentukan taraf nyata H
dan 1DEF)G dengan derajat kebebasan H
. dan
n-k-1
3. Menentukan kriteria pengujian 0 diterima bila 1I DJ 0 ditolak bila 1I DJ
3
3
K 1DEF)G
L 1DEF)G
4. Menentukan nilai statistik Fhitung dengan rumus: 12)3 =
45678 45679
5. Membuat kesimpulan apakah 0 diterima atau ditolak.
2.4 Analisis Korelasi
Analisis korelasi adalah alat statistik yang dapat digunakan untuk mengetahui derajat hubungan linier antara satu variabel dengan variabel lain. Umumnya analisis korelasi digunakan dalam hubungannya dengan analisis regresi untuk mengukur ketepatan garis regresi dalam menjelaskan (explaining) variasi nilai variabel terikat (dependent). Untuk statistik yang dapat menggambarkan hubungan antara suatu variabel dengan variabel lain adalah koefisien determinasi dan koefisien korelasi. Koefisien determinasi diberi simbol r2atau R2dan koefisien korelasi diberi simbol ratau R(Algifari, 1997).
2.4.1 Koefisien Determinasi
Universitas Sumatera Utara
Koefisien determinasi adalah salah satu nilai statistik yang dapat digunakan untuk mengetahui apakah ada hubungan pengaruh antara dua variabel. Nilai koefisien determinasi menunjukkan persentase variasi nilai variabel terikat (dependent)yang dapat dijelaskan oleh persamaan regresi yang dihasilkan. Adapun besarnya koefisien determinasi (r2) dapat juga dicari dengan menggunakan rumus di bawah ini: >
=
?5
678
... (2.25)
"
2.4.2 Koefisien Korelasi
Koefisien korelasi adalah bilangan yang menyatakan kekuatan hubungan antara dua variabel atau lebih, juga dapat menentukan arah hubungan dari kedua variabel. Nilai korelasi
!
/KBK/
untuk kekuatan hubungan nilai
koefisien korelasi berada di antara -1 sampai 1 sedangkan untuk arah dinyatakan dalam bentuk positif (+) dan negatif (-). Dilambangkan dengan r, koefisien korelasi adalah akar koefisien determinasi atau secara matematis dapat ditulis sebagai berikut: >
M>
... (2.26)
Menurut Hasan (1999) koefisien korelasi yang terjadi dapat berupa : 1. Korelasi positif adalah korelasi dari dua variabel, yaitu apabila variabel yang satu (X) meningkat maka variabel lainnya (Y) cenderung meningkat pula.
Universitas Sumatera Utara
2. Korelasi negatif adalah korelasi dari dua variabel, yaitu apabila variabel yang satu (X) meningkat maka variabel yang lainnya (Y) cenderung menurun. 3. Tidak ada terjadinya korelasi apabilakedua variabel (X dan Y) tidak menunjukkanadanya hubungan. 4. Korelasi sempurna adalah korelasi dua variabel, yaitu apabila kenaikan atau penurunan variabel yang satu (X)berbanding dengan kenaikan atau penurunan variabel yang lainnya (Y). Selain diturunkan dari koefisien determinasi (R2), koefisien korelasi (r) berdasarkan sekumpulan data (Xi dan Yi) berukuran n dapat pula ditentukan dengan menggunakan rumus:
! =
#$
" " "
"
%$
"
" "
"
%
... (2.27)
Keterangan : !
= koefisien korelasi
n
= jumlah data = variabel bebas (independent) = variabel terikat (dependent).
Korelasi antara variabel dibedakan atas tiga jenis, yaitu : 1. Korelasi Positif
Universitas Sumatera Utara
Perubahan antara variabel berbanding lurus, artinya apabila variabel yang satu meningkat, maka variabel yang lainnya juga mengalami peningkatan. 2. Korelasi Negatif Perubahan antara variabel berlawanan, artinya apabila variabel yang satu meningkat, maka variabel yang lain mengalami penurunan. 3. Korelasi Nihil Terjadi apabila perubahan pada variabel yang satu diikuti pada perubahan yang lain dengan arah yang tidak teratur.
Tabel 2.1 Interpretasi Koefisien Korelasi Nilai r
Interval Koefisien
Tingkat Hubungan
0
Tidak ada korelasi
0,01 – 0,19
Sangat rendah
0,20 – 0,39
Rendah
0,40 – 0,59
Agak rendah
0,60 – 0,79
Cukup
0,80 – 0,99
Tinggi
1
Sangat tinggi (korelasi sempurna)
2.5Uji t (Parsial)
Tujuan dilakukan uji signifikansi secara parsial dua variabel bebas (independent) terhadap variabel terikat (dependent) adalah untuk mengukur secara terpisah dampak yang ditimbulkan dari masing-masing variabel bebas terhadap variabel terikat. Adapun rumus untuk mencari thitung adalah:
Universitas Sumatera Utara
NI DJ
3
=
F"
... (2.28)
OP"
Keterangan: bi
= nilai konstanta
Sbi
=standard error.
Sebelum menghitung nilai thitung terlebih dahulu mencari nilai Sbi (standard error). Adapun nilai Sbidapat dicari dengan tahapan sebagai berikut: 1. Menghitung nilai Standar Error (Sbi) •
Standard errorSb1 'F =
#RS
•
(
OQ
Q
TUR
2Q
... (2.29)
U
Q
Standard errorSb2 'F =
(
#RS
OQ
Q
TUR
2Q
Q
U
... (2.30)
2. Menghitung nilai standar deviasi regresi linier berganda (SX1X2) •
Menentukan nilai varian '
•
=
RF
VF
... (2.31)
Menentukan nilai deviasi standar '
, = #' /
,
... (2.32)
Keterangan : '
/ ,
= standar deviasi regresi berganda
Universitas Sumatera Utara
n
= jumlah data
k
= jumlah variabel bebas.
Langkah-langkah dalam pengujian hipotesis adalah sebagai berikut : 1. Menentukan formulasi hipotesis 0 : @A
B
0 : @A C B di mana : @A
koefisien yang akan diuji.
2. Dilakukan uji dua sisi dengan taraf nyata yaitu n – 2 maka di peroleh N
WX Y
= 0,05 dan nilai ttabel dengan dk
.
3. Menentukan kriteria pengujian 0 diterima bila NDEF)G K NI DJ 0 ditolak bila NI DJ
3
3
K NDEF)G
L NDEF)G
4. Menentukan nilai statistik thitung dengan rumus :
NI DJ
3
F"
OP"
5. Membuat kesimpulan apakah 0 diterima atau ditolak.
Universitas Sumatera Utara