9/22/2009
Materi 2
Outline Graphical Techniques
Penyajian Data
Numerical Techniques
1
9/22/2009
• Teknik Grafik (Graphical Techniques) Secara visual, grafis merupakan gambar-gambar yang menunjukkan data berupa angka yang biasanya dibuat berdasarkan tabel yang telah ada sebelumnya
2
9/22/2009
Pie Chart digambarkan dengan suatu lingkaran yang sektorsektornya menggambarkan proporsi variabel yang berbeda
Pie Chart Suara Partai C, 8.07,
Data Hasil Pemilihan Umum
8% Partai
Jumlah Suara
% jumlah suara
A
501
38.90
B
683
53.03
C
104
8.07
A, 38.90, 39%
B, 53.03, 53%
Bar Chart (Grafik Batang) digambarkan menggunakan sumbu x dan y dimana sumbu x menunjukkan variabel yang digunakan sedangkan sumbu y menunjukkan jumlah kejadian Bar Chart Pe ne rim aan Mahas is w a Baru
Jumlah Penerimaan Mahasiswa Baru Jurusan
Jumlah
180
160
160
Arsitektur
160
Sipil
120
Geodesi
30
140
120
120 100 80
Planologi
60
Lingkungan
40
60
60
40
30
40 20 0 Arsitektur
Sipil
Geodesi
Planologi
Lingkungan
3
9/22/2009
Histogram dan Poligon Frekuensi grafik yang mencerminkan distribusi frekuensi. Diperlukan sumbu x untuk menyatakan interval kelas dan sumbu y untuk menyatakan frekuensi kelas
Kelas Interval
Frekuensi
Frekuensi Relatif
9,5 - 14,5
3
0,1
14,5 - 19,5
10
0,33
19,5 - 24,5
7
0,23
24,5 - 29,5
5
0,17
29,5 - 34,5
2
0,07
34,5 - 39,5
2
0,07
39,5 - 44,5
1
0,03
Histogram 12 14, 5 - 19, 5
10 8
19, 5 - 24, 5
6 4
24, 5 - 29, 5 9,5 - 14, 5 29, 5 - 34, 5
2
34, 5 - 39, 5 39, 5 - 44,5
0
Ogive (Poligon Frekuensi Kumulatif) merupakan grafik dari distribusi frekuensi kumulatif lebih dari atau kurang dari.
Ogive Lebih Dari
Ogive Kurang Dari 200 180 160
200 180 160
140 120 100 80 60
140 120 100 80 60
40 20 0
40 20 0 22.5 27.5 32.5 37.5 42.5 47.5 52.5 57.5 62.5 67.5 72.5
22.5 27.5 32.5 37.5 42.5 47.5 52.5 57.5 62.5 67.5 72.5
4
9/22/2009
Steam and Leaf Plot Metode ini diperkenalkan pada tahun 1977 oleh John Tuckey data dirangkum dalam bentuk batang dan daun (steam and leaf) Jika datanya banyak, steam dapat dibuat menjadi 2 baris
Contoh :
18 31 17 18 14
17 20 20 20 42
30 14 37 17
15 29 10 19
22 21 14 27
26 20 25 22
17 26 17 36
Dibuat dalam bentuk : 1
8 7 5 7 4 7 0 4 7 8 7 9 4
2
2 6 0 9 1 0 6 0 5 0 7 2
3
0 1 7 6
4
2
5
9/22/2009
Box Plot digunakan untuk melihat apakah pada data tersebut terdapat outlier (data yang mempunyai nilai ekstrim) atau tidak
Untuk membuat Box Plot, ada beberapa data yang harus diketahui yaitu : • • • • • • • • • •
Nilai data minimum Nilai data maksimum Median (Q2 = kuartil ke 2) Lower Quartile (Q1 = kuartil ke 1) Upper Quartile (Q3 = kuartil ke 3) IQR (Inter Quartile Range) = selisih Q3 - Q1 LIF (Lower Inner Fence) = Q1 – 1,5 IQR UIF (Upper Inner Fence) = Q3 + 1,5 IQR LOF (Lower Outer Fence) = Q1 – 3 IQR UOF (Upper Outer Fence) = Q3 + 3 IQR
6
9/22/2009
Contoh : Data sebagai berikut : 5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8 6,2 4,0 7,1 3,7 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1 n = 22 ; nilai minimum = 2,6 ; nilai maksimum = 15,8 Data diurut : 2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0 4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
Lokasi Median = Md =
n + 1 23 = = 11,5 2 2
4 ,0 + 4 ,0 = 4 ,0 2
Mean = 5,36 ≈ 5,4 Lokasi Q1 =
lokasi median dibulatkan kebawah + 1 11 + 1 = =6 2 2
(data ke
6 dari data minimum)
Q1 = 3,4 Lokasi Q3 =
lokasi median dibulatkan kebawah + 1 11 + 1 = =6 2 2
(data ke
6 dari data maksimum) Q3 = 6,2
7
9/22/2009
IQR (Inter Quartile Range) IQR = Q3 – Q1 = 6,2 – 3,4 = 2,8 LIF = Q1 – 1,5 IQR = 3,4 – 1,5.(2,8) = - 0,8 UIF = Q3 + 1,5 IQR = 6,2 + 1,5.(2,8) = 10,4 LOF = Q1 – 3 IQR = 3,4 – 3.(2,8) = - 5 UOF = Q3 + 3 IQR = 6,2 + 3.(2,8) = 14,6 Data yang terletak antara LIF dan UIF bukan outlier. Data yang terletak diluar LIF dan UIF adalah outlier yang dibedakan menjadi 2 yaitu mild outlier dan extreem outlier
bukan outlier Mild outlier
Mild outlier
Extreme outlier
Extreme outlier
-5
-0,8
3,4
4,0
5,4
6,2
10,4
14,6
Apa Artinya ?? • • •
Bila semua data terletak antara LIF dan UIF maka data tidak memiliki outlier Data terletak antara IF dan OF disebut mild outlier Data yang terletak diluar OF disebut extreme outlier
8
9/22/2009
Outline Graphical Techniques
Penyajian Data
Numerical Techniques
Distribusi Frekuensi Jika n banyak
Data dikelompokkan ke dlm kelas2
Frekuensi data tiap kelas
DISTRIBUSI FREKUENSI
9
9/22/2009
Istilah dalam Distribusi Frekuensi Interval Kelas (Class Interval)
Batas Kelas (Class Limit) Batas Nyata Kelas (Class Boundary)
Distribusi Frekuensi
Lebar Interval Kelas (Width of Interval Class) Nilai Tengah Kelas (Class Midpoint)
Penyusunan Distribusi Frekuensi : 1.
Interval kelas harus dipilih dgn ketentuan - seluruh data harus disertakan - data harus dimasukan sekali, hanya di satu kelas
1.
2.
Umumnya jumlah interval kelas antara 5 sampai 20
3.
Lebar interval kelas dianjurkan sama (biasanya kelipatan angka 5) Sebagai perkiraan awal lebar interval kelas gunakan rumus :
R c= k
Dimana : c = lebar interval kelas R = kisaran data (range) k = jumlah interval kelas
10
9/22/2009
Interval kelas dapat dihitung dengan rumus Sturge Dimana : k = jumlah interval kelas n = jumlah data
k = 1+ 3,3. log n
R = data terbesar - data terkecil 4. Dihindari interval kelas terbuka karena untuk keperluan analisis statistik tidak bisa digunakan 5. Jika mungkin, interval kelas dipilih sedemikian rupa sehingga nilai tengah kelasnya bersesuaian dengan nilai dimana data aktual terkonsentrasi
Contoh Distribusi Frekuensi • Diketahui data nilai ujian statistika untuk 80 orang mahasiswa sebagai berikut: 79 80 70 68 90 92 80 70 63 76
79 84 71 72 35 93 91 74 60 63
48 90 92 85 83 76 61 99 83 88
74 70 38 51 73 71 72 95 82 70
81 91 56 65 74 90 97 80 60 66
98 93 81 93 43 72 91 59 67 67
87 82 74 83 86 67 88 71 89 79
80 78 73 86 88 75 81 77 63 75
11
9/22/2009
•
Data terbesar = 99 ; Data terkecil = 35 Rentang = 99 – 35 = 64
•
Banyak kelas = 1 + (3,3) log n = 1 + (3,3) log 80 = 1 + (3,3) (1,9031) = 7,2802 (7 atau 8)
•
P = rentang / banyak kelas = 64 /7 = 9,14 (gunakan 9 atau 10)
•
Pilih batas bawah kelas interval pertama. Bisa diambil sama dengan data terkecil atau nilai data yang lebih kecil dari data terkecil tetapi selisihnya harus kurang dari panjang/lebar kelas yang telah ditentukan.
•
Dengan p=9, dan mulai dengan data yang lebih kecil dari data terkecil, dipilih 31, maka kelas interval pertama 31-40, 41-50, dst.
•
Buatlah tabel untuk memasukkan kelas-kelas interval yang sudah dibentuk.
12
9/22/2009
• Dari hasil di atas, sdh dapat dibuat : – Histogram Frekuensi – Poligon Frekuensi – Distribusi Frekuensi Kumulatif : • Kurang dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih kecil daripada batas atas nyata interval kelas • Lebih Dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih besar daripada atau sama dengan batas bawah nyata interval kelas
13
9/22/2009
Ukuran Pemusatan (Tendency Central) Rata-Rata
Median Tendency Central Modus
Kuantil
Rata-Rata (Average) adalah nilai khas yang mewakili sifat tengah atau posisi pusat dari suatu kumpulan nilai data Beberapa ukuran yang termasuk rata-rata :
• Mean Aritmatik n
∑x
Data Tidak Berkelompok x=
untuk suatu sampel i
i =1
n N
∑x
i
µx =
untuk suatu populasi
i =1
N
14
9/22/2009
k
Data Berkelompok
k
∑fx
∑fx
i =1
i =1
i m ,i
x=
=
k
∑f
untuk sampel
i m ,i
n
i
i =1
K
∑ f .x
i =1
i =1
i
µx =
K
∑ f .x K
∑ fi
m ,i
i
=
m ,i
untuk populasi
N
i =1
Keterangan : xi : nilai dari data k : jumlah interval kelas dlm suatu sampel K : Jumlah interval kelas dlm suatu populasi n : banyaknya data x dari suatu sampel N : banyaknya data x dari suatu populasi fi : frekuensi atau jumlah pengamatan dlm sati interval kelas xm,i : nilai tengah dari interval kelas
15
9/22/2009
• Mean Aritmatik Terbobot merupakan mean aritmetik yang diperoleh dari nilai yang n diberi pembobotan
∑ w .x i
xw =
i
i =1 n
∑w
i
i =1
dimana : wi
: faktor pembobotan
• Mean Geometrik
n G = ∏ xi i =1
1
n
= n ( x1 , x2 , x3 ,..., xn )
• Mean Harmonik H
=
1 1 n
n
∑ i=1
1 xi
=
n n
∑ i=1
1 xi
16
9/22/2009
Median/Nilai Tengah menyatakan posisi tengah dari nilai data terjajar (data array) n − (∑ f )l Median = Li + 2 f median
.c
dimana : Li n (∑fi)l fmed c
: batas bawah nyata kelas dari kelas median : banyaknya data : jmlh frekuensi seluruh kelas yang lebih rendah dari kelas median : frekuensi kelas median : lebar interval kelas median
Modus nilai yang paling sering muncul atau yang frekuensinya terbesar
∆1 .c Modus = Li + ∆ + ∆ 2 1 dimana : Li ∆1 ∆2 c
: batas bawah nyata kelas dari kelas modus : selisih frekuensi kelas modus dengan kelas sebelumnya : selisih frekuensi kelas modus dengan kelas sesudahnya : lebar interval kelas median
17
9/22/2009
Kuantil : Kuartil, Desil, Persentil nilai-nilai yang membagi suatu jajaran data (data array) menjadi bagian-bagian yang sama. K
dimana : Ll,j n r
i
= L l ,i
i . n − (∑ f r + f kuantil , i
)
l ,i
.c
: batas bawah nyata kelas dari kelas kuantil ke-i : banyak data (semua frekuensi) : konstanta untuk kuartil = 4, desil = 10, persentil = 100 (∑f)l,i : jmlh frekuensi seluruh kelas yang lebih rendah daripada kelas kuantil ke-i f kuantil,i : frekuensi kelas kuantil ke-i c : lebar interval kelas kuantil
Ukuran Penyebaran Deviasi Standart Varians Koefisien Variasi Tendency Central
Jangkauan/Range Simpangan Kuartil Simpangan Mutlak Rata-Rata
18
9/22/2009
Deviasi Standart/Simpangan Baku Data Tidak Berkelompok n
∑ (x − x )
2
i
i =1
sx =
n −1
n 2 n n. ∑ xi − ∑ xi i =1 i =1 = n.(n − 1)
N
∑ (
f i . xi − x
i =1
σx =
N
)
2
2
sampel
N 2 ∑ xi 2 = i =1 − µ x N
populasi
Data Berkelompok k
∑ f .(x i
sx =
n −1
K
∑ σx =
−x
m ,i
i =1
)
2
k k n. ∑ f i .xm2 ,i − ∑ f i .xm ,i i =1 i =1 = n.(n − 1)
f i .(xm ,i − µ x )
2
i =1
N
K ∑ f i .xm2 ,i −µ 2 = i =1 x N
2
sampel
populasi
19
9/22/2009
Varians merupakan kuadrat dari standart deviasi/simpangan baku sehingga dinyatakan sebagai sx2 dan σx2
20