BAB 1 PENDAHULUAN A. Hakikat Statistika 1. Asal Kata •
Kata statistika berasal dari kata “status” atau “statista” yang berarti negara
•
Tulisan Aristoteles “Politeia” menguraikan keadaan dari 158 negara yakni sumber dari kata “statistika”
•
Pada awalnya, status atau statista mencatat data dari berbagai negara
2. Pemantapan Kata Statistika Pada abad ke-17 dan ke-18 ada tiga istilah yang bersaing •
Political arithmetic (di Inggris abad ke-17)
•
Publisistika
•
Statistika
(oleh
Achenwall
dari
Jerman
pada
pertengahan abad ke-18, dan di-turuti oleh Sir John Sinclair di Inggris) Yang bertahan adalah kata “statistika” Pada saat ini kita mengenal statistika yang teoretik serta statistika terapan. Statistika yang teoretik dikenal juga sebagai statistika matematik •
Statistika Teoretik (Matematik)
•
Statistika Terapan
Di sini kita membahas statistika terapan dengan memanfaatkan rumus statistika yang diperoleh dari statistika teoretik 1)
Kuliah 1.
[email protected]
1
Apa Yang dimaksud Statistik dan Statistika ? Statistik adalah kumpulan data atau fakta yang umumnya berupa angka, yang disajikan dalam bentuk tabel, diagram dan atau grafik, yang menggambarkan suatu persoalan tertentu. Statistika adalah Ilmu pengetahuan yang mempelajari tentang cara-cara pengumpulan data, penyajian dan pengolahan data, analisis data sehingga dapat dibuat kesimpulan dan keputusan yang dapat dipertanggung jawabkan. 3. Ruang Lingkup ” STATISTIKA” Statistika adalah Ilmu Pengetahuan yang perolehan Informasinya berasal dari data numerik , definisi di atas mengandung makna bahwa bahan baku statistika adalah data. INGAT : STATISTICS IS THE SCIENCE Pada dasarnya statistika dibagi menjadi dua ruang lingkup seperti pada bagan berikut :
EXPLORATORY DATA ANALYSIS (descriptive statistics)
BOX PLOT
STATISTICS STEMPLOT
CONFIRMATORY DATA ANALYSIS (statistical inference) (inductives statistics)
Sebagai alat bantu untuk Mengetahui distribusi data Estimation Hypotesis Testing
Kuliah 1.
[email protected]
2
SIFAT- SIFAT DATA NUMERIK
NUMERICAL DATA PROPERTIES
CENTRAL TENDENCY
SHAPE
VARIATION Mean Median Mode Midrange Midhinge
Range Interquartile Range Variance Standard Deviation Coefficient of Variation
BOX-and – WHISKER PLOT
Kuliah 1.
[email protected]
3
DALAM STATISTIKA Data Statistik dibagi dalam empat kelompok besar , yaitu : 1. Data ditinjau dari sudut sifat a. Data Kualitatif : data yang dinyatakan dalam bentuk kategori Contoh : data kecelakaan lalu lintas : luka sedang ringan, dll b. Data Kuantitatif : data yang dinyatakan dalam bentuk bilangan Contoh : 165 cm, 45 kg, 12 mahasiswa.
2. Data ditinjau dari sudut nilai a. Data diskrit : data yang diperoleh dari hasil penghitungan contoh : 12 mahasiswa, ciri berbentuk bilangan bulat b. Data Kontinu : data yang diperoleh dari hasil mengukur contoh : Tinggi badan (165 cm) ciri dalam bentuk interval
3. Data ditinjau dari sudut sumber a. Data Intern : data yang diperoleh dari lingkungan sendiri b. Data ekstern : data yang diperoleh dari luar lingkungan. Contoh : mahasiswa kimia UNPAD, Mhsw. Kimia ITB.
4. Data ditinjau dari sudut memperoleh a. Data primer : data yang diperoleh dari hasil penelitian sendiri / data yang diperoleh responden langsung. b. Data sekunder : data yang diperoleh dari hasil penelitian orang lain
Populasi Dan Sampel
Populasi : totalitas semua hasil yang mungkin , baik dalam menghitung maupun dalam mengukur, kuantitatif maupun kualitatif mengenai karakteristik tertentu dari
Kuliah 1.
[email protected]
4
semua anggota kumpulan yang lengkap dan jelas yang ingin dipelajari sifatnya. Contoh : Semua masyarakat Kota Bandung dan mempunyai KTP Kota Bandung.
Sampel : Bagian dari populasi yang diambil dengan metode tertentu Contoh : metode random ,kluster , ciri : diambil secara acak.
Sensus Dan Sampling Sensus : cara mengumpulkan data yang anggota populasi diteliti Sampling : cara mengambil sampel
Penyajian Data
a. Diagram / Grafik - Diagram lingkaran , diagram batang, diagram lambang dsb
S-2 dan S-3 SMU S-1
40 30 20 10 0 Januari Kuliah 1.
[email protected]
sayur buah daging
Maret 5
b. Daftar/ Tabel Tabel baris kolom , Tabel kontingensi, Tabel Distribuís Frekuensi.
Tabel 1 Bentuk Umum Tabel Baris-Kolom
Judul
Judul Kolom
Baris
l
...
j
...
k
A
Sel (Al)
...
Sel (Aj)
...
Sel (Ak)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A
Sel (Al)
...
Sel (Aj)
...
Sel (Ak)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B
...
...
Sel (Bj)
...
Sel (Bk)
Catatan
: Sumber Data
Keterangan
: Warna atau yang lainnya.
Kuliah 1.
[email protected]
6
Tabel Kontingensi Adalah Tabel Baris-Kolom dimana, sel tabel merupakan frekuensi irisan antara taraf baris dengan taraf kolom. Bentuk umum tabel ini adalah seperti berikut.
Tabel 2 Tabel Kontingensi Taraf Faktor 2
Jumlah
Taraf Faktor 1
l
...
j
...
k
Baris
1
O1l
...
O1j
...
O1k
n10
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i
Oil
...
Oij
...
Oik
ni0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
b
Obl
...
Obj
...
Obk
nb0
Jumlah Kolom
n01
...
n0j
...
n0k
n00
Daftar distribusi Frekuensi Adalah Daftar /Tabel Baris-Kolom dengan Bentuk umum sebagai berikut : Tabel 3 Daftar Distribusi Frekuensi Kelas Interval
Frekuensi
B1 – A1 f1 . . .
. . .
Bi – Ai
fi
. .
. . .
Bk - Ak
fk
Jumlah
n
Kuliah 1.
[email protected]
7
Tabel 4 DDF Untuk Perhitungan
Kelas Interval
Batas Kelas
Titik Tengah
Frekuensi
fx
B1 – A1
BB1 – BA1
x1
f1
x1f1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Bi - Ai
Bbi - BAi
xi
fi
xifi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Bk - Ak
BBk - BAk
xk
fk
xkfk
Jumlah
-
-
n
N
Tabel 5 DDF Relatif
f1 n
B1 – A1
f1
B1 – A1
f1
.
.
.
.
.
.
.
.
Bi – Ai
fi
.
.
.
.
.
.
Bk - Ak
fk
f1 n
Jumlah
n
1.00
Kuliah 1.
[email protected]
f1 n
f1 n
.
. . .
8
Tabel 6 DDF Kumulatif Kurang Dari
Nilai B
F kumulatif
< B1
0
.
.
.
.
.
.
< Bi
fi ; i = 1,2,...i-j
.
.
.
.
.
.
< Bk + p
fi ; i = 1,2,... k
Tabel 7 DDF Kumulatif Lebih atau sama
Nilai B
F kumulatif
B1
fi ; i = 1,2,... k
.
.
.
.
.
.
Bi
fi ; i = 1,2,...i-1
.
.
.
.
.
.
Bk + p
0
Kuliah 1.
[email protected]
9
Daftar Distribusi Frekuensi , dibuat dengan langkah-langkah berikut :
1. Hitung Range (R) atau jangkauan dari n data yang ada, yaitu selisih antara data terbesar (xmax) dengan data terkecil (xmin). Jadi , R = xmax - xmin 2. Tentukan banyak kelas interval, yaitu dengan : 3. Aturan Sturges : K = 1 + 3,3 log n 4. Atau dipilih sembarang dalam interval 5 ≤ K ≤ 15 5. Hitung Panjang kelas, yaitu p = {R/K} dan dalam DDF akan tampak sebagai : –
Selisih antara dua ujung bawah / atas yang berdekatan
–
Selisih antara dua batas bawah / atas yang berdekatan
–
Selisih antara batas atas dengan batas bawah yang berada dalam satu kelas
–
Selisih antara dua titik tengah yang berdekatan.
6. Tentukan ujung bawah kelas pertama, yaitu : 7. B1 = data terkecil atau data terkecil dikurangi sebuah bilangan yang lebih kecil dari p. 8. Lengkapi DDF dengan bantuan aturan-aturan berikut : - Selisih antara ujung atas sebuah kelas dengan ujung bawah kelas berikutnya adalah : 9. 1,0 jika data bulat; 0,1 jika data terdiri dari desimal; dan seterusnya. - Batas bawah adalah ujung bawah dikurangi : 0,5 jika data bulat ; 0,05 jika data terdiri dari 1 desimal ; dan seterusnya. - Batas atas adalah ujung atas ditambah : 0,5 jika data bulat ; 0,05 jika data terdisri dari 1 desimal; dan seterusnya. Aturan untuk menentukan banyak kelas, tidaklah merupakan aturan yang sangat ketat karena, ada suatu kesepakatan antara para ahli bahwa banyak kelas yang dibuat harus menghasilkan kelas-kelas dengan frekuensi tidak nol (kosong).
Ukuran Statistik Dalam Statistik terdapat 3 kelompok besar a. Ukuran Central (Pemusatan) b. Ukuran Letak c. Ukuran Variasi ( penyebaran)
Kuliah 1.
[email protected]
10
1. Ukuran Central (Ukuran Pemusatan)
Terdiri dari : Rata-rata Hitung, Rata-rata Ukur, Rata-rata Harmonis, dan Modus.
a. Rata-rata Hitung (kalau datanya Stationer)
Misal x1, x2, .... xn adalah n buah data (diskrit atau kontinu) yang belum disajikan dalam DDF (ungrouped data), yang diambil dari sebuah populasi berukuran N dengan data x1, x2, ..., xN. Maka rata-rata (µ : populasi ,
: sampel) dihitung dengan
Mean /Avarage( The Arithmetic Mean)
1 n Xi ni1
X
fi xi
X
…
(1.1)
…
(1.2)
…
( 1.3)
fi 1 N
N
xi i 1
Contoh : Ditentukan data sebagai berikut : 8, 5, 10, 4, 7 hitunglah rata-ratanya ? Jawab :
x
8 5 10 4 7 5
Kuliah 1.
[email protected]
11
Sedangkan jika data tersebut telah disajikan di dalam DDF (grouped data), rata-rata hitung dengan rumus (1.4) dan (1.5) berikut.
1 N
Cara Panjang, (1.4) ...
Cara Pendek, (1.5) …
x
N
fi xi Dan
fi xi
X
fi
i 1
p n
x0
k
fi ci i 1
Xi : Titik Tengah ; x0 : Xi yang sekelas dengan Ci = 1/p (Xi - x0 ) = 0. Untuk menghitung µ dengan cara pendek, ganti n pada (1.5) dengan N. Dan, melihat (1.5) maka tabel (4) harus ditambah kolom C dan fC.
X n 1 , jika n ganjil X
Median
2
1 Xn Xn 2 2 2
1
, jika n genap
Mode : Yˆ Midrange
1 Xs Xl 2
MidHinge
1 Q1 Q3 2
Ukuran-ukuran dalam Statistika Lainnya Q1 = Q (0.25) : disebut Lower Quartile atau Lower Hinge Q3 = Q (0.75) : disebut Upper Quartile atau Upper Hinge
X = Mean = Point of Balance X = Q2 = Q (0.50) = Half Position Xˆ = Peak point
Kuliah 1.
[email protected]
12
2. Ukuran Dispersi Yang akan dibahas disini adalah simpangan baku , varians, Koefisien Variasi karena tiga ukuran dispersi ini yang paling sering digunakan. Hubungan antara simpangan baku dengan variansi adalah ”Varians = Kuadrat dari Simpangan baku ”. Notasi yang umum digunakan untuk simpangan bakuadalah : (tou, sigma) untuk simpangan baku populasi dan s untuk simpangan baku sampel. Ukuran ini merupakan ukuran statistik yang menunjukkan sampai sejauh mana variabilitas data yang terkumpul. Makin kecil nilai ukuran ini, menunjukkan variabilitas data makin rendah atau dapat dikatakan bahwa data relatif seragam, dan sebaliknya. Misal x1, x2, .... xn
adalah n buah data ( diskrit atau kontinu) yang belum
disajikan dalam DDF (ungrouped data). Yang diambil dari sebuah populasi berukuran N dengan data x1, x2, ..., xN . Maka varians (σ2 : populasi , s2 : sampel ) dihitung dengan rumus :
Ukuran Keragaman (Measures of Variation) : Range Xl - Xs Interquartile Range Quartiles spread/ MidSpread/H-Spread IQR = H – SPRAD = Q3 – Q1 Variansi / Ragam (Variance) n
S2
2
i 1
n 1 N
2
X1 X
X1
2
i 1
N
Kuliah 1.
[email protected]
13
Dapat dibuktikan bahwa : n
S2
X1
X
2
i 1
n 1
E S2
1 n 1
X i2 n X
E
2
E X i2
1 n 1
2
1 n 1
1 n 1
E (S 2 )
n 1 n 1
2
2
n
2
n.E X
2
n
2
2
2
n
2
n
2
2
Rumus : Ungrouped Data : N
N 2
xi
xi
i 1
=
2
N
2
n
i 1
N
dan
2
n
s2 =
xi
2
n
2
xi
i 1
i 1
n(n 1)
Grouped Data : “Cara Panjang “ N
N 2
fi xi
n
i 1
N
N
=
p2 x
fi C i
s =
fi xi
i 1
i 1
n(n 1)
n
fi C i
i 1
fi xi
i 1
dan
N2
s2 =
2
n
2
2
N
2
1 X : titik tengah, f frekuensi, dan Ci = p
Kuliah 1.
[email protected]
2
dan
N2
Cara Pendek 2
n
fi xi
i 1
=
2
N
2
n p2 x
fi C i i 1
2
2
n
fi C i i 1
n(n 1)
(xi – x0)
14
Koefisien Variasi (coefficient of variation)
CV
S 100% X
Simpangan Baku (Deviasi standard)
S=
xi
x
2
n 1
3. Bentuk Distribusi (Shape ) Bentuk Distribusi (Shape ) adalah : Suatu Pola, Dimana Data didistribusikan
Symmetrical (Zero-Skewed)
Distribution of The Data
Not Symmetrical (Asymmetrical/Skewed)
X
X
Right-Skewed (Positive)
X X Left – Skewed (Negative)
X
X
Pengukuran kadar ion nitrat pada contoh :1 hanya mempunyai nilai diskrit tertentu, karena dibatasi oleh cara pengukurannya. Namun dalam teori, kadar dapat mempunyai sebarang nilai, sehingga untuk melukiskan bentuk populasi dari sample diperlukan kurva kontinu. Model matematika yang biasanya dipakai adalah sebaran normal atau dikenal sebaran Gauss yang digambarkan oleh :
Kuliah 1.
[email protected]
15
y
1 exp 2
2
x 2
2
Contoh : Hasil 50 penentuan kadar ion nitrat μg/ ml 0.51
0.51
0.51
0.50
0.51
0.49
0.52
0.53
0.50
0.47
0.51
0.52
0.53
0.48
0.49
0.50
0.52
0.49
0.49
0.50
0.49
0.48
0.46
0.49
0.49
0.48
0.49
0.49
0.51
0.47
0.51
0.51
0.51
0.48
0.50
0.47
0.50
0.51
0.49
0.48
0.51
0.50
0.50
0.53
0.52
0.52
0.50
0.50
0.51
0.51
Sajikan data tersebut ke dalam Daftar Distribuís Frekuensi dan hitunglah : a. Rata-rata Hitung dengan cara pendek dan cara panjang b. Hitunglah variansi dan simpangan baku. c. Hitunglah Koefisien Variasi. d. Buatlah Histogram , Poligon dan Ogive. Histogram
Kuliah 1.
[email protected]
16
14
12
Frequency
10
8
6
4
2 Mean = 0.4998 Std. Dev. = 0.01647 N = 50 0 0.46
0.47
0.48
0.49
0.50
0.51
0.52
0.53
x
Statistics x N Mean Std. Error of Mean Median Mode Std. Deviation Variance Range Minimum Maximum Sum Percentiles
Valid Missing
25 50 75
Kuliah 1.
[email protected]
50 0 .4998 .00233 .5000 .51 .01647 .000 .07 .46 .53 24.99 .4900 .5000 .5100
17
x
Frequency Valid
Percent
Valid Percent
Cumulative Percent
.46
1
.47
3
6.0
6.0
8.0
.48
5
10.0
10.0
18.0
.49
10
20.0
20.0
38.0
.50
10
20.0
20.0
58.0
.51
13
26.0
26.0
84.0
.52
5
10.0
10.0
94.0
.53
3
6.0
6.0
100.0
50
100.0
100.0
Total
2.0
2.0
2.0
x .46 .47 .48 .49 .50 .51 .52 .53
Kuliah 1.
[email protected]
18
Kuliah 1.
[email protected]
19