Statistik Bisnis 1 Week 3 Visualizing Data
Agenda Time 15 Minutes 55 Minutes 30 Minutes
Activity Attendance check Discussion Class exercise
Objectives By the end of this class, students will: • Be able to visualize categorical data • Be able to visualize numerical data • Understand how to make conclusion based on the data visualizations (charts and graphs)
DISCUSSION
Visualizing Data Categorical Variable • Visualizing one variable • Bar chart, Pie chart an Pareto chart • Visualizing two variables • Side-by-side bar chart Numerical Variable • Visualizing one variable • Stem-and-leaf display • Histogram, polygon and ogive • Visualizing two variables • Scatter plot and time-series plot
Visualizing Data Categorical Variable • Visualizing one variable • Bar chart, Pie chart an Pareto chart • Visualizing two variables • Side-by-side bar chart Numerical Variable
Graphical Errors
• Visualizing one variable • Stem-and-leaf display • Histogram, polygon and ogive • Visualizing two variables • Scatter plot and time-series plot
CATEGORICAL VARIABLE
Visualizing Data Categorical Variable
one variable (Summary table)
Bar chart
Pie chart
two variables (Contingency table)
Pareto chart
Side-by-side bar chart
Bar Chart Provinsi Asal Mahasiswa Statistika Bisnis 1 tahun 2014 Sumatera Barat Bali
Provinsi Asal
Banten Sulawesi Selatan
Sulawesi Tengah Sumatera Selatan
Sumatera Utara Jawa Timur Jakarta Jawa Barat 0.00%
10.00%
20.00% 30.00% Persentase
40.00%
50.00%
Pie Chart Provinsi Asal Mahasiswa Statistika Bisnis 1 tahun 2014 Sumatera Barat Bali 4% 4% Banten 4%
Sulawesi Selatan 18% Sulawesi Tengah 4% Sumatera Selatan Sumatera Utara 3% 3% Jawa Timur 7%
Jawa Barat 46%
Jakarta 7%
Pareto Chart • A Pareto chart has the capability to separate the “vital few” from the “trivial many,” enabling you to focus on the important categories. • In situations in which the data involved consist of defective or nonconforming items, a Pareto chart is a powerful tool for prioritizing improvement efforts.
Pareto Chart
Persentase
Provinsi Asal Mahasiswa Statistika Bisnis 1 tahun 2014 100.00% 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00%
Provinsi Asal
Side-By-Side Bar Chart
Invoice Size Split Out By Errors & No Errors Errors
No Errors
0.0%
10.0%
20.0% Large
30.0%
40.0%
Medium
Small
50.0%
60.0%
70.0%
Side-By-Side Bar Chart
NUMERICAL VARIABLE
Visualizing Data Numerical Variable
One variable
Frequency & Cumulative distribution
Ordered Array
Stem-and-Leaf Display
Two variables
Histogram
Polygon
Ogive
Scatter Plot
Time-Series Plot
Stem-and-Leaf Display Stem (Batang) Leaf (Daun) 15 024555555788899 16 000000123555 17 0
Histogram Tinggi Badan Mahasiswa Statistika Bisnis 1 Tahun 2014 14 12
Frekuensi
10 8 6 4 2 0 152.5
157.5
162.5 Tinggi Badan
167.5
172.5
Percentage Polygon
Persentase
Tinggi Badan Mahasiswa Statistika Bisnis 1 Tahun 2014 45.00% 40.00% 35.00% 30.00% 25.00% 20.00% 15.00% 10.00% 5.00% 0.00% 152.5
157.5
162.5 Tinggi Badan
167.5
172.5
Percentage Polygon
Cumulative Percentage Polygon (Ogive) Persentase Kumulatif
Tinggi Badan Mahasiswa Statistika Bisnis 1 Tahun 2014 100.00% 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 150
155
160 165 Tinggi Badan
170
175
Cumulative Percentage Polygon (Ogive)
Note! • When you construct polygons or histograms, the vertical (Y) axis should show the true zero, or “origin,” so as not to distort the character of the data.
Scatter Plot Volume vs. Cost per Day 250
200
Cost
150
100
50
0 0
10
20
30
40 Volume
50
60
70
Time Series Plot Number of Franchises 120
Number of Franchises
100 80 60 40 20 0 1995
1996
1997
1998
1999
2000 Year
2001
2002
2003
2004
2005
Principles of Excellent Graphs • The graph should not distort the data. • The graph should not contain unnecessary adornments (sometimes referred to as chart junk). • The scale on the vertical axis should begin at zero. • All axes should be properly labeled. • The graph should contain a title. • The simplest possible graph should be used for a given set of data.
Graphical Errors: Chart Junk Bad Presentation
Good Presentation
Minimum Wage 1960: $1.00
$
Minimum Wage
4
1970: $1.60
2 1980: $3.10
0 1990: $3.80
1960
1970
1980
1990
Graphical Errors: No Relative Basis
Bad Presentation A’s received by students.
Freq.
Good Presentation A’s received by students.
% 30%
300 200
20%
100
10%
0
0%
FR
SO
JR
SR
FR
SO
JR
FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
SR
Graphical Errors: Compressing the Vertical Axis Bad Presentation
Good Presentation
Quarterly Sales
200
$
Quarterly Sales
50
100
25
0
0 Q1
Q2
Q3
Q4
$
Q1
Q2
Q3
Q4
Graphical Errors: No Zero Point on the Vertical Axis Bad Presentation
$
Monthly Sales
$
Monthly Sales
45
45
42 39 36
42
39 36
Good Presentations
J
F
M
A
M J
Graphing the first six months of sales
0
J
F
M
A
M
J
EXERCISE
2.28 Tabel berikut menunjukkan persentase konsumsi listrik rumah tangga di Amerika Serikat yang disusun berdasarkan jenis alat elektronik pada tahun 2012:
2.28 Jenis Alat Elektronik AC Pengering pakaian Mesin cuci Komputer Alat memasak Pencuci Piring Freezer Penerangan Kulkas Penghangat ruangan Pemanas Air TV dan perangkatnya
Persentase (%) 18 5 24 1 2 2 2 16 9 7 8 6
2.28 a. Gambarkan bar chart, pie chart, dan Pareto chart untuk data tersebut. b. Grafik manakah yang paling cocok menurut anda untuk menggambarkan data tersebut?
2.37 Berikut data biaya per ons ($) dari sampel 14 batang cokelat pekat:
0,68 0,57
0,72 1,51
0,92 0,57
1,14 0,55
1,42 0,86
0,94 1,41
0,77 0,90
a. Urutkanlah data tersebut. b. Buatlah diagram batang-daun. c. Mana yang memberikan lebih banyak informasi, data yang telah diurutkan atau diagram batang-daun? Diskusikan. d. Disekitar nilai apakah, jika ada, biaya cokelat pekat batangan tersebut terkonsentrasi? Jelaskan.
2.38 Berikut data biaya listrik pada bulan juli 2010 dari sampel acak 50 apartemen dengan satu kamar tidur di kota besar: 96 157 141 95 108
171 185 149 163 119
202 90 206 150 183
178 116 175 154 151
147 172 123 130 114
102 111 128 143 135
153 148 144 187 191
197 213 168 166 137
127 130 109 139 129
82 165 167 149 158
2.38 a. Buatlah histogram dan percentage polygon. b. Buatlah cumulative percentage polygon (ogive). c. Pada nilai berapakah biaya listrik bulanan tersebut terkonsentrasi?
ANSWER
2.28
Negara
Persentase Kosumsi Alat Elektronik Rumah Tangga di Amerika Serikat TV dan perangkatnya Pemanas Air Penghangat ruangan Kulkas Penerangan Freezer Pencuci Piring Alat memasak Komputer Mesin cuci Pengering pakaian AC 0%
5%
10%
15% 20% Persentase
25%
30%
2.28 Persentase Kosumsi Alat Elektronik Rumah Tangga di Amerika TV dan Serikat perangkatnya 6% Pemanas Air 8% AC Penghangat 18% ruangan Pengering 7% pakaian 5% Kulkas 9% Mesin cuci Penerangan 24% 16% Pencuci Piring 2%
Freezer 2%
Alat memasak 2%
Komputer 1%
2.28 Persentase Kosumsi Alat Elektronik Rumah Tangga di Amerika Serikat 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
2.37 Data yang telah disusun: 0,55 0,57 0,57 0,68 0,72 0,77 0,86 0,90 0,92 0,94 1,14 1,41 1,42 1,51
2.37 Diagram Batang-Daun: 5 6 7 8 9 1 11 12 13 14 15
577 8 27 6 024 4
12 1
Catatan: 5|7 artinya: 0,57
2.38 Biaya Listrik pada bulan Juli 2010 untuk apartement satu kamar tidur di kota besar 14
12 Frekuensi
10 8
6 4 2 0 90
110
130 150 170 Biaya listrik (dalam $)
190
210
2.38 Biaya Listrik pada bulan Juli 2010 untuk apartement satu kamar tidur di kota besar 30.00%
Persentase
25.00%
20.00% 15.00% 10.00% 5.00% 0.00%
90
110
130 150 170 Biaya Listrik (dalam $)
190
210
2.38
Persentase Kumulatif
Biaya Listrik pada bulan Juli 2010 untuk apartement satu kamar tidur di kota besar 100.00% 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 70
90
110
130 150 170 Biaya Listrik (dalam $)
190
210
HOMEWORK
1 Majalah SWA online merilis hasil dari beberapa survei di lamannya, http://swa.co.id/category/business-research. Kunjungi website tersebut dan bacalah salah satu artikel yang anda sukai. a. Deskripsikan populasi dari penelitian tersebut. b. Deskripsikan sampel yang dikumpulkan. c. Deskripsikan parameter yang digunakan. d. Deskripsikan statistik yang digunakan untuk mendeskripsikan parameter pada poin (c).
2 • Kunjungi salah satu online shop/mall (amazon, lazada.com, dan lain-lain.) • Kumpulkan data kategori DAN data numerik (minimal satu jenis data untuk masingmasingnya). Buat rekapan data yang telah dikumpulkan. • Susunlah data tersebut dalam tabel yang sesuai. • Visualisasikan juga data tersebut dalam grafik/gambar yang sesuai.
THANK YOU