Metode Statistika (STK211) Statistika Deskriptif (1)
Dr. Ir. Kusman Sadik Dept. Statistika IPB, 2015 1
2
3
4
5
Statistika Deskripsi dan Eksplorasi • Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Tabel Tehnik Penyajian Grafik
Ukuran Pemusatan : Rata-rata, median, dsb. Peringkasan Data Ukuran Penyebaran : Ragam (variance), jangkauan (range) 6
Tipe Data
7
Penyajian Data • Tabel Data Kualitatif Data Kuantitatif • Gambar/Grafik Data Kualitatif • Pie Chart • Bar Chart
Data Kuantitatif • • • • • •
Histogram Diagram Dahan Daun Diagram Kotak Garis Plot Garis Scatter Plot Survival Plot 8
Penyajian Data dengan Tabel
9
• Menyajikan statistik menurut group sesuai keperluan penelitian • Tampilan tabel jelas dan ringkas Kunci dalam membuat Tabel Tabel harus memberikan informasi yang dapat dimengerti oleh pembaca
10
Penyajian Tabel Data Kualitatif
11
Data yang digunakan (Data 1) No
Sex
Tinggi
Berat
Agama
1
1
167
63
Islam
2
1
172
74
Islam
3
0
161
53
Kristen
4
0
157
47
Hindu
5
1
165
58
Islam
6
0
167
60
Islam
7
1
162
52
Budha
8
0
151
45
Katholik
9
0
158
54
Kristen
10
1
162
63
Islam
11
1
176
82
Islam
12
1
167
69
Islam
13
0
163
57
Kristen
14
0
158
60
Islam
15
1
164
58
Katholik
16
0
161
50
Islam
17
1
159
61
Kristen
18
1
163
65
Islam
19
1
165
62
Islam
20
0
169
59
Islam
21
1
173
70
Islam 12
Tabel Frekuensi • Sajikan data kualitatif (kategorik) dalam bentuk FREKUENSI • Jika jumlah data mencukupi tampilkan pula percentasenya Rekapitulasi menurut Agama Agama
Rekapitulasi menurut Sex
Frekuensi
Persen
13
61.90
Sex
Kristen
4
19.05
Laki-laki
Katholik
2
9.52
Hindu
1
4.76
Budha
1
4.76
Islam
Perempuan
Frek .
Perse n
12
57.14
9
42.86
13
Tabel Kontingensi • Digunakan untuk melihat distribusi dari dua data kategorik atau lebih • Bisa dalam bentuk %baris, % kolom, % total, sesuai dengan kebutuhan
Agama Sex Laki-laki
Budha
Islam
Katholik
Kristen
9
1
1
12
1
4
1
3
9
1
13
2
4
21
1
Perempuan Total
Hindu
1
Total
14
Penyajian Tabel Data Kuantitatif
15
Tabel Sebaran Frekuensi Kelompok • Digunakan untuk membuat pengelompokkan data kuantitatif
• Isi tabel terdiri dari selang kelas, frekuensi masing-masing kelas, frekuensi relatif masing-masing kelas • Cara membuat tabel distribusi frekuensi kelompok Tentukan jumlah kelas (Sturges' rule ): k =3.3 log (n)+1 Tentukan lebar kelas : l = (Xmax- Xmin)/k Tentukan batas atas dan batas bawah dari masingmasing kelas Tentukan tepi batas kelas List jumlah pengamatan pada masing-masing kelas Frekuensi Relatif : cari proporsi dari masing-masing kelas
16
Ilustrasi Data- Berat Badan Data 2 58
57
50
56
44
59
43
52
55
49
43
43
49
55
58
48
46
42
44
48
40
40
42
Data 3 58
57
50
56
44
59
43
52
55
49
43
43
49
55
58
48
46
42
44
48
40
40
42
69
69
79
80
75
70
68
69
70
67
65
77
69
67
76
73
65
17
Ilustrasi Data 2 •
Jumlah kelas: k = 1+ 3.3 log (23) =5.49 6
•
Lebar kelas: l = (59-40)/6 = 3.16 4 Selang kelas
Tengah Kelas
38-41
39.5
42-45
43.5
46-49
Tepi Batas kelas
Turus
Frekuensi
Frekuensi Relatif
Presentase
37.5 - 41.5
||
2
0.09
8.70%
41.5 - 45.5
|||| ||
7
0.30
30.43%
47.5
45.5 - 49.5
|||I
5
0.22
21.74%
50-53
51.5
49.5 - 53.5
||
2
0.09
8.70%
54-57
55.5
53.5 - 57.5
||||
4
0.17
17.39%
58-61
59.5 3
0.13
138-41 3.04%
23
1
100.00%
57.5 - 61.5
Total
|||
18
Tabel Ringkasan • Sajikan RINGKASAN STATISTIK jika memungkinkan. Ringkasan statistik yang digunakan adalah jumlah data, rataan, median, standar deviasi, minimum, dan maksimum. Hindarkan pemberian banyak informasi dalam kapasitas yang terbatas Peubah
Jenis Kelamin
Tinggi
Perempuan Laki-laki
Berat
Perempuan Laki-laki
N
Rataan
StDev
Minimum
Median
Maximum
9
160.56
5.43
151
161
169
12
166.25
5.07
159
165
176
9
53.89
5.62
45
54
60
12
64.75
8.04
52
63
82
19
Penyajian Data dengan Grafik
20
• Grafik mengungkapkan banyak informasi dibandingkan dengan seribu kata-kata • Grafik yang disajikan harus dapat dimengerti oleh pembaca
• Jika pembaca mempertanyakan apa maksudnya maka grafik yang disajikan “belum baik” • Gunakan “nalar” dalam membuat grafik.
21
Penyajian Data dengan Grafik Data Kualitatif
22
Pie Chart (Diagram Kue) • Digunakan untuk menampilkan data kategorik khususnya data nominal • Menunjukkan distribusi data dalam group (total 100%) • Disajikan dalam bentuk %, terkadang perlu menyajikan pula jumlah data 1; 5% 1; 5% 2; 10%
9; 43% 4; 19%
Islam
Kristen
12; 57%
13; 61%
Katholik
Hindu
Budha
Laki-laki Perempuan
23
Bar Chart (Diagram Batang) • Berguna untuk menampilkan data kategorik • Dapat pula digunakan untuk menyajikan data dari tabel kontingensi / tabel ringkasan data Jenis Kelamin 12
Rata-rata
8 6 4 2
Perempuan
150.00 100.00 50.00 0.00
11.1%
8.3%
0%
Tinggi
Perempuan
Perempuan
Laki-laki
Laki-laki
Jumlah
10
0
Laki-laki
200.00
10%
44.4%
11.1%
33.3%
75.0%
20%
30%
40%
Budha
Hindu
50% Islam
Berat
8.3% 8.3%
60% Katholik
70% Kristen
80%
90%
100%
24
Cara Membuat Pie Chart dan Bar Chart • Lihat : Mendenhall (Example 1.3), hal. 12
25
Penyajian Data dengan Grafik Data Kuantitatif
26
Histogram Sebuah grafik dari suatu sebaran frekuensi Bisa distribusi dari frekuensi-nya atau frekuensi relatif-nya Digunakan untuk melihat distribusi dari data: Melihat ukuran penyebaran dan ukuran pemusatan data Melihat adanya data outlier (pencilan) Mendeteksi ada bimodus/tidak
27
Teknik Menginterpretasikan Grafik First, check the horizontal and vertical scales, so that you are clear about what is being measured.
Examine the location of the data distribution. Where on the horizontal axis is the center of the distribution? If you are comparing two distributions, are they both centered in the same place?
Examine the shape of the distribution. Does the distribution have one “peak,” a point that is higher than any other? If so, this is the most frequently occurring measurement or category. Is there more than one peak? Are there an approximately equal number of measurements to the left and right of the peak?
Look for any unusual measurements or outliers. That is, are any measurements much bigger or smaller than all of the others? These outliers may not be representative of the other values in the set. (Lihat: Mendenhal, hal. 22) 28
Histogram of data1, data2 -6 data1
40
Histogram of data1, data3 -2
0
2
4
-2
data2
0
1
2
3
4
data3 20
20 15
10
10
15
Frequency
20
15 10
10
5
5
5
-6
-4
-2
0
2
4
0
0
Ukuran Pemusatan relatif sama namun ukuran penyebaran relatif berbeda
-2
-1
0
1
2
3
4
0
Ukuran Pemusatan relatif berbeda namun ukuran penyebaran relatif sama Histogram of C14 30
bimodus
25 20
outlier
Frequency
0
-1
data1
25
20
30
Frequency
-4
15 10 5
?
0
-2
-1
0
1
2 C14
3
4
5
29
Bentuk (shape) Grafik
A distribution is symmetric if the left and right sides of the distribution, when divided at the middle value, form mirror images.
A distribution is skewed to the right (menjulur ke kanan, right tail) if a greater proportion of the measurements lie to the right of the peak value. Distributions that are skewed right contain a few unusually large measurements. 30
Bentuk (shape) Grafik A distribution is skewed to the left (menjulur ke kiri, left tail) if a greater proportion of the measurements lie to the left of the peak value. Distributions that are skewed left contain a few unusually small measurements.
A distribution is unimodal if it has one peak; a bimodal distribution has two peaks.
Bimodal distributions often represent a mixture of two different populations in the data set. (Lihat: Mendenhal, hal. 22) 31
Histogram – Mengukur bentuk sebaran Skewed to Left
FREQUENCY
Symmetric
FREQUENCY
FREQUENCY WEIGHT
Skewed to Right
WEIGHT
WEIGHT
32
Interpretasi bentuk (shape) grafik • Lihat : Mendenhall (Example 1.9), hal. 23
33
Kembali ke Ilustrasi—Data 2 • Berdasasarkan tabel sebaran frekuensi tersebut maka tampilan histogramnya sebagai berikut: 7 6
Frequency
5 4 3 2 1 0
40
44
48
52
56
60
Sebagain besar berusia kurang dari 50 tahun, sedangkan frekuensi paling banyak berada pada usia 44 tahun. Bentuk sebaran tidak simetrik, terdapat dua kelompok usia (kurag dari 50 tahun dan lebih dari 50 tahun) bimodus
34
7
7
6
6
5
5
4
Frequency
Frequency
Variasi berbagai bentuk histogram dari Data 2
3
4 3
2
2
1
1
0
40
44
48
52
56
0
60
40
45
50
55
60
7 6
Bentuk histogram tidak unik pemilihan tergantung informasi yang diperlukan
Frequency
5 4 3 2 1 0
40
45
50
55
60
35
Frekuensi Relatif Histogram vs Pemulusan 9 8 7
5 4 3
Histogram of C1
2 9
1
8
0
-3.6
-2.4
-1.2
0.0
1.2
2.4
7
3.6
Percent
6 5 4 3
Histogram of C1 9
2
8
1
7
0
6 Percent
Percent
6
-3.6
-2.4
-1.2
0.0
1.2
2.4
3.6
5 4 3 2 1 0
-3.6
-2.4
-1.2
0.0
1.2
2.4
3.6
C1
36
Histogram of C4 7 6
Percent
5 4
Histogram of C4
3
Gamma
7
2
6
1
4.886 3.073 10000
5
0
8
16
24
32
40
48
56
Percent
0
Shape Scale N
4 3 2
Histogram of C4 Gamma
1
7
Shape Scale N
6
4.886 3.073 10000
0
0
8
16
24
32
40
48
56
Percent
5 4 3 2 1 0
0
8
16
24
32
40
48
56
37
Diagram Dahan Daun (Stem and Leaf) • Sebuah diagram yang menampilkan distribusi dari data kuantitatif yang sudah terurut dari terkecil dan terbesar • Sesuai dengan namanya diagram dahan daun terdiri dari bagian dahan dan bagian daun. Bagian daun selalu terdiri dari satu digit. Bagian dahan terletak di sebelah kiri dan bersesuaian dengan bagian daun (jika ada) di sebelah kanan • Secara visual,diagram dahan daun hampir sama dengan bar chart dimana kategori-kategorinya didefinisikan dengan struktur desimal dari bilangan yang ada
38
Cara Membuat Diagram Dahan Daun
Proses pembuatan diagram dahan daun dan interpretasinya Lihat : Mendenhal (Example 1.8), hal. 21 39
Manfaat diagram dahan daun • Melihat distribusi dari data Melihat ukuran penyebaran dan ukuran pemusatan data Melihat adanya data outlier Mendeteksi ada bimodus/tidak Stem-and-leaf of Contoh1
N
= 20
Leaf Unit = 1.0
pusat
1 4 7 (4) 9 5 3 1
2 3 4 5 6 7 8 9
5 579 138 0445 5569 36 12 3
Terlihat distribusi dari data aslinya
40
Ilustrasi
Output MINITAB
Stem-and-leaf of Contoh1 N = 20 Informasi satuan Leaf Unit = 1.0 dari daun satuan 1 2 5 4 3 579 7 4 138 (4) 5 0445 Bagian daun 9 6 5569 5 7 36 3 8 12 1 9 3 Frekuensi kumulatif dari jumlah daun pada masing-masing dahan. Dihitung dari atas dan bawah sampai ketemu di posisi median
Bagian dahan 41
Buatlah diagram dahan daun untuk data berikut ini:
42
Membuat diagram dahan daun • Pisahkan bagian dahan dan daun. Untuk contoh diatas misalkan dahan berupa puluhan dan daunnya berupa satuan • Bagian dahan urutkan dari terkecil sampai terbesar 2 3 4 5 6 7 8 9 43
• Plot daun sesuai dengan dahan yang tersedia. Sebagai langkah awal untuk memudahkan pekerjaan identifikasi secara berurutan dari data yang ada 2 3 4 5 6 7 8 9
5 795 183 4405 5569 63 21 3
• Urutkan bagian daun dari terkecil sampai yang terbesar
2 3 4 5 6 7 8 9
5 579 138 0445 5569 36 12 3
44
Output MINITAB 0t f
3 45
s 77
. 1* t f s . 2* t f s
899 0011 223 4455 67 8
7
Stem-and-leaf of Contoh3
N
= 23
Leaf Unit = 1.0
1 3 5 8 (4) 11 8 4 2 1 1 1 1
0 0 0 0 1 1 1 1 1 2 2 2 2
3 45 77 899 0011 223 4455 67 8
7
Aturan banyaknya dahan yang digunakan : antara 4-12 dahan
Sesuaikan dengan informasi yang diperoleh berkaitan dengan bentuk sebaran, ukuran pemusatan dan penyebaran data
45
46
Latihan untuk Responsi/Praktikum • Mendenhall (Exercise : 1.18), hlm. 30
• Mendenhall (Exercise : 1.19), hlm. 30 • Mendenhall (Exercise : 1.37), hlm. 33
47
Terima Kasih Materi ini bisa di-download di: kusmans.staff.ipb.ac.id 48