STATISTIKA DESKRIPTIF Wenny Maulina, S.Si., M.Si
Statistika Deskripsi
Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Tabel Teknik Penyajian Data
Gambar Ukuran Pemusatan Teknik Peringkasan Data
(Median, Modus, Mean, dll) Ukuran Penyebaran
Kuartil,
(Range, Interquartile Range, Ragam)
Penyajian Data
Tabel Data Kualitatif Data Kuantitatif
Gambar Data Kualitatif Pie Chart Bar Chart Data Kuantitatif Histogram Diagram Dahan Daun Diagram Kotak Garis Plot Garis Scatter Plot Survival Plot
Penyajian Data dengan Tabel
Menyajikan
statistik
menurut
group
sesuai
keperluan penelitian
Penyajian Tabel jelas dan ringkas
Kunci dalam membuat Tabel
Tabel harus memberikan informasi yang dapat dimengerti oleh pembaca
Gunakan “COMMON SENSE” untuk membuat tabel
Penyajian Tabel Data Kualitatif
Tabel Frekuensi
Sajikan data kualitatif (kategorik) dalam bentuk FREKUENSI
Jika jumlah data mencukupi tampilkan pula percentasenya
Rekapitulasi menurut Agama Rekapitulasi menurut Sex
Agama
Frekuensi
Persen
Islam
13
61,90
Sex
Frekuensi
Persen
Kristen Katolik
4
19,05
Laki-laki
12
57,14
Kristen Protestan
2
9,52
Perempuan
9
42,86
Hindu
1
4,76
Budha
1
4,76
Tabel Kontingensi
Digunakan untuk melihat distribusi dari dua data kategorik atau lebih
Bisa dalam bentuk %baris, %kolom, %total, sesuai dengan kebutuhan Agama
Sex
Budha
Laki-laki
1
Perempuan Total
1
Hindu
Islam
Kristen Katolik
Kristen Protestan
Total
9
1
1
12
1
4
1
3
9
1
13
2
4
21
Penyajian Tabel Data Kuantitatif
Tabel Distribusi Frekuensi Kelompok
Digunakan
untuk
membuat
pengelompokkan
data
kuantitatif
Isi tabel terdiri dari selang kelas, frekuensi masing-masing kelas, frekuensi relatif masing-masing kelas
Cara membuat tabel distribusi frekuensi kelompok
Tentukan jumlah kelas (Sturgis’ rule) : k =3.3 log (n) +1
Tentukan lebar kelas : I = (Xmax – Xmin)/k
Tentukan Batas atas dan Batas Bawah dari masingmasing kelas
Tentukan tepi batas kelas
List jumlah pengamatan pada masing-masing kelas
Frekuensi relatif: cari proporsi dari masing-masing kelas
Ilustrasi Data-Berat Badan Data 1 58
57
50
56
44
59
43
52
55
49
43
43
49
55
58
48
46
42
44
48
40
40
42
Data 2 58
57
50
56
44
59
43
52
55
49
43
43
49
55
58
48
46
42
44
48
40
40
42
69
69
79
80
75
70
68
69
70
67
65
77
69
67
76
73
65
Ilustrasi Data 1
Jumlah kelas: k = 1+ 3.3 log (23) =5.49 6 Lebar kelas: l = (59-40)/6 = 3.16 4 Selang kelas
Tengah Kelas
38-41
39.5
42-45
43.5
46-49
Tepi Batas kelas
Turus
Frekuensi
Frekuensi Relatif
Presentase
38.5 - 41.5
||
2
0.09
8.70%
42.5 - 45.5
|||| ||
7
0.30
30.43%
47.5
46.5 - 49.5
|||I
5
0.22
21.74%
50-53
51.5
50.5 - 53.5
||
2
0.09
8.70%
54-57
55.5
54.5 - 57.5
||||
4
0.17
17.39%
58-61
59.5
58.5 - 61.5
|||
3
0.13
13.04%
23
1
100.00%
Total
Tabel Ringkasan
Sajikan
RINGKASAN
STATISTIK
jika
memungkinkan.
Ringkasan Statistik yang digunakan adalah jumlah data, rataan, median, standar deviasi, minimum dan maksimum.
Hindarkan pemberian banyak informasi dalam kapasitas yang terbatas
Peubah
Jenis kelamin
N
Mean
StDev
Minimum
Median
Maksimum
Tinggi
Perempuan
9
160,56
5,43
151
161
169
Laki-laki
12
166,25
5,07
159
165
176
Perempuan
9
53,89
5,62
45
54
60
Laki-laki
12
64,75
8,04
52
63
82
Berat
Penyajian Data dengan Grafik
Grafik
mengungkapkan
banyak
informasi
dibandingkan dengan seribu kata-kata
Grafik yang disajikan harus dapat dimengerti oleh pembaca
Jika pembaca mempertanyakan apa maksudnya maka grafik yang disajikan “belum baik”
Gunakan “nalar” dalam membuat grafik
Penyajian Data dengan Grafik
Data Kualitatif
Pie Chart (Diagram Pia) Data digambarkan dengan suatu lingkaran yang sektor-sektornya menggambarkan proporsi variabel yang berbeda Digunakan untuk menampilkan data kategorik khususnya data nominal Menunjukkan distribusi data dalam group (total 100%) Disajikan dalam bentuk %, terkadang perlu menyajikan pula jumlah data
Bar Chart (Diagram Batang)
Data digambarkan menggunakan sumbu X dan Y, dimana sumbu X menunjukkan variabel yang digunakan sedangkan sumbu Y menunjukkan banyaknya kejadian. Berguna untuk menampilkan data kategorik Dapat pula digunakan untuk menyajikan data dari tabel kontingensi/tabel ringkasan data
Penyajian Data dengan Grafik
Data Kuantitatif
Histogram
Data diringkas dalam bentuk grafik yang mencerminkan distribusi frekuensi. Diperlukan sumbu X untuk menyatakan interval kelas dan sumbu Y untuk menyatakan frekuensi kelas. Sebuah grafik dari suatu sebaran frekuensi Bisa distribusi dari frekuensinya atau frekuensi relatifnya
Digunakan untuk melihat distribusi dari data: Melihat ukuran penyebaran dan ukuran pemusatan data Melihat adanya data outlier Mendeteksi ada/tidaknya bimodus
Histogram of data1, data2 -6 data1
40
Histogram of data1, data3 -2
0
2
4
-2
data2
0
1
2
3
4
data3 20
20 15
10
10
15
Frequency
20
15 10
10
5
5
5
-6
-4
-2
0
2
4
0
0
Ukuran Pemusatan relatif sama namun ukuran penyebaran relatif berbeda
-2
-1
0
1
2
3
4
0
Ukuran Pemusatan relatif berbeda namun ukuran penyebaran relatif sama Histogram of C14 30
bimodus
25 20
outlier
Frequency
0
-1
data1
25
20
30
Frequency
-4
15 10 5
?
0
-2
-1
0
1
2 C14
3
4
5
Histogram – Mengukur bentuk sebaran
Miring
Skewed Miring to Left Ke kiri
FREQUENCY
SIMETRIK Symmetric
FREQUENCY
FREQUENCY WEIGHT
Skewed Keto KANAN Right
WEIGHT
WEIGHT
Kembali ke Ilustrasi—Data 1 Berdasasarkan tabel sebaran frekuensi tersebut maka tampilan histogramnya sebagai berikut: 7 6 5
Frequency
4 3 2 1 0
40
44
48
52
56
60
Sebagain besar berusia kurang dari 50 tahun, sedangkan frekuensi paling banyak berada pada usia 44 tahun. Bentuk sebaran tidak simetrik, terdapat dua kelompok usia (kurang dari 50 tahun dan lebih dari 50 tahun) bimodus
Frekuensi Relatif Histogram vs Pemulusan 9 8 7
Percent
6 5 4 3
Histogram of C1
2
9
1
8 7
0
-2.4
-1.2
0.0
1.2
2.4
3.6
6
Percent
-3.6
4 3
Histogram of C1
2
9 8
1
7
0
6
Percent
5
5 4 3 2 1 0
-3.6
-2.4
-1.2
0.0 C1
1.2
2.4
3.6
-3.6
-2.4
-1.2
0.0
1.2
2.4
3.6
Histogram of C4 7 6
Percent
5 4 3 2
Histogram of C4 Gamma
1 7
0
0
8
16
24
32
40
48
56
Shape Scale N
6
Percent
5 4 3 2
Histogram of C4
1
Gamma
7
Shape Scale N
6
Percent
5 4 3 2 1 0
0
8
16
24
32
40
48
56
4.886 3.073 10000
0
0
8
16
24
32
40
48
56
4.886 3.073 10000
Stem and Leaf Plot (Diagram Batang dan Daun)
Diperkenalkan oleh John Tuckey (1977) Data dirangkum dalam bentuk batang dan daun (stem and leaf). Jika ukuran data besar maka stem dapat dibuat menjadi dua baris
Stem and Leaf Plot (Diagram Batang dan Daun)
Sebuah diagram yang menampilkan distribusi dari data kuantitatif yang sudah terurut dari terkecil dan terbesar
Sesuai dengan namanya diagram dahan daun terdiri dari bagian dahan dan bagian daun. Bagian daun selalu terdiri dari satu digit. Bagian dahan terletak di sebelah kiri dan bersesuaian dengan bagian daun (jika ada) di sebelah kanan
Secara visual,diagram dahan daun hampir sama dengan bar chart dimana kategori-kategorinya didefinisikan dengan struktur decimal dari bilangan yang ada
Manfaat diagram dahan daun
Melihat distribusi dari data Melihat ukuran penyebaran dan ukuran pemusatan data Melihat adanya data outlier Mendeteksi ada bimodus/tidak Stem-and-leaf of Contoh1
N
= 20
Leaf Unit = 1.0
pusat
1 4 7 (4) 9 5 3 1
2 3 4 5 6 7 8 9
5 579 138 0445 5569 36 12 3
Terlihat distribusi dari data aslinya
Contoh
Output MINITAB Stem-and-leaf of Contoh1 N = 20 Informasi satuan Leaf Unit = 1.0 dari daun satuan 1 2 5 4 3 579 7 4 138 (4) 5 0445 Bagian daun 9 6 5569 5 7 36 3 8 12 1 9 3
Frekuensi kumulatif dari jumlah daun pada masing-masing dahan. Dihitung dari atas dan bawah sampai ketemu di posisi median
Bagian dahan
Cara membuat diagram dahan daun Pisahkan bagian dahan dan daun. Untuk contoh diatas misalkan dahan berupa puluhan dan daunnya berupa satuan Bagian dahan urutkan dari terkecil sampai terbesar
2 3 4 5 6 7 8 9
Plot daun sesuai dengan dahan yang tersedia. Sebagai langkah awal untuk memudahkan pekerjaan identifikasi secara berurutan dari data yang ada 2 3 4 5 6 7 8 9
5 795 183 4405 5569 63 21 3
• Urutkan bagian daun dari terkecil sampai yang terbesar
2 3 4 5 6 7 8 9
5 579 138 0445 5569 36 12 3
Dahan terbagi dalam 2 dahan Aturan main: dahan 1 untuk digit 0-4 dan dahan 2 untuk digit 5-9 Perhatikan data berikut:
Stem-and-leaf of Contoh2 Leaf Unit = 1.0 3 7 (6) 11 6 3 2 1 1 1
0 1 1 2 2 3 3 4 4 5
899 0223 566779 01344 689 1 8
3
N
= 24
Aturan banyaknya dahan yang digunakan :
Sesuaikan dengan informasi yang diperoleh berkaitan dengan bentuk sebaran, ukuran pemusatan dan penyebaran data
Box Plot (Diagram Kotak Garis)
◦ Informasi yang Peringkasan data diperoleh dari diagram menggunakan kotak garis diagram kotak untuk Melihat ukuran menggambarkan penyebaran dan apakah data ukuran pemusatan data mempunyai outlier Melihat adanya data (data ekstrim) atau pencilan tidak
Sebagai alat pembandingan sebaran dua kelompok data atau lebih
Penyajian Dengan Box-plot Boxplot of data 1
Q1
Q2
Q3
Min
Max
Interquartli Range
40
45
50 data 1
55
60
Cara membuat box plot
Me Q1
Q3
Hitung Statistik lima serangkai
Hitung Pagar Dalam Atas (PDA) : Q3 +1.5(Q3-Q1)
Hitung Pagar Dalam Bawah (PDB): Q1-1.5(Q3-Q1)
Identifikasi data. Jika data < PDB atau data > PDA maka data
Min
Max
dikatakan outlier
Gambar kotak dengan batas Q1 dan Q3
Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan tarik garis dari Q3 sampai data terbesar
Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum pencilan
Pencilan digambarkan dengan asterik
Ilustrasi (1)
Statistik 5 serangkai dari data sbb: Me Q1 Min
Q3 Max
48 43
55
40
59
PDA = 55 + 1.5 (55 – 43) = 73 PDB = 43 – 1.5 (55 - 43) = 25 Tidak ada pencilan
Boxplot of data 1
40
45
50 data 1
55
60
Sebaran data tidak simetrik, karena nilai median lebih dekat ke Q1 miring ke kanan Tidak ada pencilan
Thank you see you next week