Depok, 2011
Kesalahan-kesalahan di Statistik Penyusun:
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Lingkup bahasan • • • • • •
Kesalahan di Statistik Kesalahan di Sampling Kesalahan Analisis Data Penggunaan Kata--kata Multi Tafsir Kesimpulan yang Salah Kesalahan Visualisasi
Naskah ini disusun lebih mirip sebagai suatu ringkasan diktat dengan tujuan agar mahasiswa dapat menggunakannya untuk belajar mandiri. Isi naskah berupa kalimat-kalimat pendek sebagai pokok atau kunci materi sehingga mahasiswa dapat cepat mempelajari dan mudah mengingatnya. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
2
Kesalahan di Statistik
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
3
Kesalahan di Statistik: Ketidaktahuan atau Kesengajaan? • • •
• • •
Statistik sangat bermanfaat bagi kita untuk mengetahui suatu kenyataan atau memprediksi suatu kejadian sehingga dapat memberikan kita bekal yang baik dalam mengambil keputusan. Meskipun demikian terkadang kita jumpai ada kesalahan di statistik. Kesalahan ini dapat terjadi di setiap tahapan ketika kita bekerja dengan data, mulai dari mengumpulkan, mengorganisasi, menganalisis, mempresentasikan, dan menyimpulkan data. Pada umumnya kesalahan ini disebabkan oleh kekeliruan, ketidaktahuan, atau kekurangtelitian dalam bekerja. Walaupun begitu tidak dapat disangkal, beberapa kesalahan di statistik terjadi karena adanya unsur kesengajaan yang didasari oleh berbagai kepentingan, misalnya kepentingan individu, kelompok, bisnis, iklan, politik praktis, dll. Oleh sebab itu, ketika menanggapi suatu hasil atau pernyataan statistik, kita harus hati-hati dan teliti sebelum memutuskan menerima data atau fakta tersebut.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
4
Jenis Kesalahan di Statistik
•
Kesalahan-kesalahan di statistik secara umum dapat dikelompokkan dalam: Kesalahan pemilihan metode sampling. Kesalahan dalam pengolahan dan analisis data. Kesalahan dalam pemilihan kata ketika memberikan pernyataan untuk menafsirkan data. Kesalahan dalam meyimpulkan suatu hasil statistik. Kesalahan dalam memvisualisasikan data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
5
Kesalahan di Sampling
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
6
Pemilihan Sampel dan Jumlah Sampel Contoh 1: Pernyataan statistik “Lebih dari 70% mahasiswa UI suka mengendarai sepeda di lingkungan kampus.” • Sebelum kita menerima hasil atau kenyataan ini, kita perlu bersikap kritis, misalnya dengan mengemukakan pertanyaan: Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja? Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel? Berapa jumlah mahasiswa yang dijadikan sampel? Di statistik, kesalahan yang sering terjadi ketika sampling adalah metode pemilihan sampel dan jumlah sampel. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
7
Pemilihan Sampel dan Jumlah Sampel (lanjutan) Analisis kritis Contoh 1: Pernyataan statistik “Lebih dari 70% mahasiswa UI suka mengendarai sepeda di lingkungan kampus.” • Marilah kita analisis setiap pertanyaan di atas: Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja? Jika survei dilakukan untuk semua mahasiswa UI, maka data tersebut akurat (di sini kita asumsikan kuisioner yang digunakan sudah baik). Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel?
Sampel yang baik adalah yang representatif. Sampel yang buruk adalah sampel bias. Berapa jumlah mahasiswa yang dijadikan sampel? Tidak ada aturan jumlah sampel minimum. Jumlah sampel yang baik adalah yang mencukupi untuk menggambarkan sifat dan karakter populasi yang diwakilinya. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
8
Contoh 2: Pemilihan Sampel dan Jumlah Sampel Sebuah perusahaan permen karet mengeluarkan pernyataan: “ Empat dari lima dokter gigi merekomendasikan permen karet bebas gula untuk pasien yang suka mengunyah permen.” Analisis: Berapa jumlah dokter gigi yang disurvei? Seandainya hanya 5 atau mungkin 10 dokter gigi yang disurvei, fakta ini belum dapat diterima. Sangat mungkin hasilnya akan berbeda jika ada 100 dokter yang disurvei. Sebuah produsen sepak bola mengklaim, bolanya (bola A) lebih baik dari pada bola B (produk perusahaan saingannya), karena setelah diuji dengan menendangnya, bola A dapat meluncur lebih cepat dan jauh dibandingkan dengan bola B. Analisis: Klaim ini terlalu ceroboh, sebab hanya diuji untuk satu bola saja. Disamping itu kecepatan meluncur dan jangkauan luncur bola dipengaruhi oleh banyak faktor, seperti kekasaran permukaan lapangan, arah angin, apakah tendangan untuk kedua bola identik, dll. Sehingga agar datanya akurat perlu dilakukan eksperimen yang berulang, agar diperoleh data statistik yang representatif. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
9
Kesalahan Analisis Data
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
10
Analisis nilai rata-rata Sebuah perusahaan mengeluarkan pernyataan: “Gaji rata-rata karyawan di perusahaan kami adalah lebih dari 3 juta per bulan.” • Kita perlu bersikap kritis terhadap pernyataan ini, misalnya perlu dipertanyakan: Bagaimana pengolahan datanya, apakah sudah benar atau ada ketidaktelitian dalam perhitungannya? Apa yang dimaksud dengan rata-rata di sini? Apakah mean, median, atau mode?
Pada kasus ini kita tidak perlu mempermasalahkan metode samplingnya, sebab setiap perusahaan pasti mempunyai daftar gaji yang lengkap, sehingga data yang digunakan adalah populasi. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
11
Contoh 3: Analisis nilai rata-rata Marilah kita analisis peryataan di atas: “Gaji rata-rata karyawan di perusahaan kami adalah lebih dari 3 juta per bulan.” • Seandainya data gaji perusahaan tsb adalah sbb: Jabatan Jumlah karyawan Direksi 2 Manager 4 Staf 10 Pembantu 5
Gaji (Rp.)/bulan 10.000.000 5.000.000 2.000.000 750.000
• Jika dilakukan perhitungan untuk data di atas, diperoleh: nilai mean = 3,035 juta, median = 2 juta, dan mode = 2 juta. • Jadi pernyataan di atas telah menggunakan mean untuk menyatakan gaji rata-rata. Apakah nilai mean ini representatif untuk gaji karyawan? Jumlah karyawan adalah 21 dan mayoritas berkedudukan staf dengan gaji 2 juta. Nilai mean sangat sensitif dipengaruhi oleh gaji Direksi dan Manager yang ekstrim besar. Jika kita tinjau nilai median yang 2 juta, nilai inilah yang mewakili gaji kebanyakan karyawan.
• Kesimpulannya, gaji rata-rata ini sebaiknya dinyatakan dengan median bukan mean. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
12
Analisis nilai deviasi Sebuah perusahaan A mengeluarkan pernyataan: “Layar LCD kami mempunyai waktu hidup 80.000 jam, lebih unggul dari pada layar LCD lainnya yang rata-rata hanya punya waktu hidup 75.000 jam.”
Kita sebagai konsumen tidak boleh serta-merta mempercayai peryataan ini dan langsung memutuskan perusahaan A mempunyai layar LCD yang lebih lama hidup dari pada perusahaan lainnya, misalnya B. Kita perlu bersikap kritis, misalnya mempertanyakan bagaimana metode pengujian dan analisis datanya sampai mendapatkan angka waktu hidup. Bagaimana dengan sebaran datanya? Berfikir kritis untuk Contoh kasus seperti ini dapat lebih difokuskan pada sebaran datanya. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
13
Contoh 4: Analisis nilai deviasi Sebaran data dari suatu eksperimen sangat penting, sebab informasi ini menentukan kualitas dari data. Sebagai contoh untuk kasus di atas, seandainya kita mendapatkan distribusi data eksperimennya, maka dapat diambil keputusan yang tepat. Misalnya:
Kondisi 1
LCD-B =75.000
Kondisi 2
LCD-A =80.000
LCD-B=75.000
LCD-A=80.000
Kita dapat langsung memutuskan LCD-A lebih baik dibandingkan LCD-B jika sebaran datanya seperti kondisi 1. Tidak ada satupun LCD –B yang lebih baik dari LCD-A. Jika sebaran datanya seperti kondisi 2, maka LCD-B, lebih baik dari pada LCD-A. Dijumpai beberapa LCD-A lebih buruk dari pada LCD-B. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
14
Contoh 5: Analisis nilai deviasi Pada waktu kampanye politik sering diungkapkan berbagai macam hasil survei atau poling untuk tujuan mendapatkan simpati atau dukungan masa yang lebih banyak. Sebagai contoh, sebuah lembaga survei menampilkan grafik hasil surveinya untuk beberapa partai menjelang pemilu. Lembaga tersebut membuat pernyataan: “Partai A akan memenangkan pemilu dengan suara 40%, sesuai dengan hasil survei terakhir ini.” Kita perlu kristis dalam membaca hasil survei ini.
Bagaimana dengan deviasi datanya. Seandainya survei mempunyai deviasi 2%, maka Partai A dapat mempunyai suara 38% - 42%, sedangkan Partai C mendapatkan suara 35% - 39%. Secara statistik suara Partai A dan C tidak berbeda karena ada daerah data yang bertindih (overlap), sehingga ada kemungkinan Partai C yang menang. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
15
Penggunaan Kata--kata Multi Tafsir
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
16
Kata-kata Multi Tafsir Kita sering menjumpai pernyataan statistik yang menggunakan kata-kata multi tafsir. Pada umumnya kata-kata ini dipilih untuk tujuan propaganda atau iklan. Contoh 6: Sebuah perusahaan super market menyatakan: “ABC adalah super market terbesar di Indonesia.” Analisis: kata terbesar mempunyai banyak tafsir, apakah terbesar karyawannya, labanya, jumlah tokonya, pengunjungnya, dll.
Contoh 7: Sebuah perusahaan mie instan menyatakan: “DEF adalah mie terlezat di Indonesia.” Analisis: kata terlezat sangat relatif. Rasa lezat tidak dapat didefinisikan dengan pasti karena mengandung unsur subyektif. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
17
Kata-kata Multi Tafsir Ketika menjumpai kata-kata multi tafsir yang dikaitkan dengan data kuantitatif, kita harus hati-hati dan kritis. Pernyataan pada contoh 6 dan 7, mungkin didukung dengan data yang benar, tetapi penyampaiannya dalam bentuk pernyataan mempunyai maksud propaganda menggiring opini masyarakat untuk maksud tertentu. Analisis lanjutan Contoh 6 dan 7: Bisa jadi supermarket ABC mempunyai jumlah karyawan terbesar di antara semua supermarket yang ada di Indonesia. Informasi jumlah karyawan sengaja tidak disebutkan untuk mencapai tujuan tertentu. Survei yang dilakukan oleh perusahaan mie DEF dan melibatkan mie merek lainnya menunjukkan mie DEF yang paling disukai. Walaupun demikian selera/rasa lezat dari setiap orang bisa berbeda, demikian juga faktor lainnya yang mempengaruhi hasil survei misalnya penyajian, metode memasak, dll. belum dipertimbangkan. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
18
Kesimpulan yang Salah
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
19
Pengambilan Kesimpulan Yang Tidak Tepat Contoh 8: Sebuah perusahaan desinfektan melakukan eksperimen, produknya mampu membunuh 5000 kuman di laboratorium hanya dalam waktu 5 detik. Kemudian ia mengeluarkan pernyataan: “Gunakanlah desinfektan A untuk mencegah flu.” • Kita perlu bersikap kritis terhadap pernyataan ini. Memang benar banyak kuman yang dapat dibunuh oleh desinfektan ini, tetapi apakah kuman flu yang ada disekitar kita termasuk yang diujicobakan di laboratorium? • Perusahaan tersebut telah mengambil kesimpulan yang salah terhadap hasil uji laboratoriumnya. Tidak semua kuman flu telah mereka uji, sehingga tidak boleh diambil kesimpulan yang bersifat umum. • Kesalahan dalam pengambilan kesimpulan ini dapat terjadi karena kekurangfahaman seseorang terhadap permasalahan atau mungkin disebabkan oleh kekurangan penalaran berlogika. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
20
Pengambilan Kesimpulan Yang Tidak Tepat Contoh 9: Sebuah perusahaan mengeluarkan pernyataan: “Handuk Q lebih berat dari pada handuk lainnya, sehingga dapat menyerap air lebih banyak.” Analisis: Berat handuk tidak ada kaitannya dengan kemampuan handuk menyerap air. Kemampuan serapan air ditentukan oleh absorbansi bahan handuk, bukan beratnya. Sebagai analogi: Batu lebih berat dari pada sepon, tetapi sepon mudah sekali menyerap air dibandingkan batu.
Contoh 10: Sebuah perusahaan iklan asuransi menyatakan: ”Pada bulan lalu 452 orang memindahkan asuransi kecelakaannya ke Asuransi Z.” Analisis: Iklan ini memberikan kesan perusahaan asuransi lainnya telah memberikan layanan yang kurang baik, sehingga banyak orang yang pindah ke asuransi Z mungkin karena lebih dipercaya dan memberikan pelayanan lebih prima. Data 452 orang yang pindah ke asuransi Z adalah benar, tetapi data jumlah orang yang pindah dari asuransi Z ke perusahaan asuransi lainnya tidak diinformasikan. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
21
Kesalahan Visualisasi
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
22
Visualisasi Dapat Memberikan Kesan Positif atau Negatif Contoh 11: 80 70 60 50
54
40 30 2004 2005 2006 2007 2008 2009 2010
Tahun
•
•
Produksi Sepeda Motor Z Motor (x1000)
Motor (x1000)
Produksi Sepeda Motor Z 53 52 51
50 2004 2005 2006 2007 2008 2009 2010
Tahun
Data yang digunakan untuk menggambar kedua grafik di atas adalah sama. Tetapi, kesan yang diberikan berbeda. Grafik sebelah kiri mengesankan pertumbuhan produksi motor dari tahun 2005 – 2010 tetap, tetapi grafik disebelah kanan memberikan kesan terjadi kenaikan produksi yang cukup besar. Perbedaan kedua grafik terletak pada skala sumbu tegaknya. Grafik kiri mempunyai skala antara 30 – 80 sedangkan grafik kanan 50 – 54, sehingga perubahan sedikit yang ada di grafik kanan dapat menimbulkan kesan perubahan yang besar.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
23
Visualisasi Dapat Memberikan Kesan yang Salah Contoh 11 menunjukkan bahwa visualisasi dapat memberikan kesan terhadap hasil, bahkan bisa menyebabkan kesimpulan yang salah pada data. Pada pembahasan ini akan kita diskusikan beberapa kesalahan yang dapat disebabkan oleh visualisasi data, antara lain: Pemilihan skala Visualisasi 2D atau 3D
Perbandingan bentuk Kesalahan persentasi data Keakuratan grafik MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
24
Pemilihan Skala Pertumbuhan Sel
8.E+07 7.E+07 6.E+07 5.E+07
1.E+06
Jumlah sel
Jumlah sel
Contoh 12:
Pertumbuhan Sel
1.E+08
4.E+07 3.E+07 2.E+07
1.E+04 1.E+02
1.E+07 0.E+00
1.E+00
0
1
2
3
4
5
6
7
Hari
• •
8
9
0
1
2
3
4
5
6
7
8
9
Hari
Data yang digunakan kedua grafik di atas adalah sama. Tetapi, kesan yang diberikan berbeda. Grafik sebelah kiri menggunakan skala linear pada sumbu tegaknya, sedangkan grafik sebelah kanan menggunakan skala logaritmik pada sumbu tegaknya. Kesan pola grafik yang sangat berbeda ini dapat menjerumuskan kita pada suatu kesimpulan yang salah, jika kurang cermat dan berhati-hati.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
25
Visualisasi 2D atau 3D Contoh 13:
•
•
Data yang digunakan oleh kedua grafik di atas adalah sama. Grafik 3D sebelah kiri memberikan kesan Grup B mempunyai persentasi hasil investasi yang lebih baik dari pada Grup A pada 4 tahun terakhir. Di pihak lain, grafik 2D sebelah kanan menunjukkan dengan jelas tahun 1, 3, dan 4, Grup A mempunyai persentasi hasil investasi yang lebih baik dari B. Kesimpulan yang dapat diambil dari sini adalah, kita harus berhati-hati dalam visualisasi 3D. Efek 3D indah dilihat tetapi dapat memberikan kesan yang salah. Grafik 2D memberikan visualisasi yang lebih akurat.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
26
Perbandingan Bentuk Contoh 14: $1 Tahun ini
• •
$2 Tahun depan
$1 Tahun ini
$2 Tahun depan
Suatu perusahaan mengiklankan: “Jika anda investasi tahun ini 1 Dolar, akan mendapatkan 2 Dolar di tahun depan.” Gambar di atas ingin memvisualisasikan peningkatan jumlah Dolar dari tahun ini ke tahun depan. Peningkatan nilai 1 Dolar ke 2 Dolar digambarkan dengan menambah panjang sisi-sisi kotak dari satu satuan ($1) ke dua satuan ($2) panjang. Kesan yang ditimbulkan oleh gambar di atas lebih pada proporsional gambar bujur sangkar atau kubusnya, bukan pada nilai/angka Dolarnya. Untuk bujur sangkar, tahun depan sama dengan 4 kali tahun ini, sedangakan pada kubus, tahun depan sama dengan 8 kali tahun ini. Padahal sebenarnya peningkatan tahun ini ke tahun depan hanya 2 kali.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
27
Perbandingan Bentuk Contoh 15: Gambar di samping menunjukkan perbandingan bentuk yang tidak proporsional. Bentuk batang yang ditampilkan adalah 2D, jadi proporsional yang dilihat adalah lebar dan tinggi batang.
•
Jika kita bandingkan batang angka 204% dan 283%, perbandingan bentuk batang tidak sesuai dengan perbandingan persentase angkanya. Batang 283% mempunyai lebar dan tinggi yang tidak berbanding linear dengan batang 204%. http://208.56.75.34/tfintro.html
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
28
Kesalahan Persentasi Data
Contoh 16:
•
Grafik di samping menunjukkan persentasi makanan pokok yang disukai oleh penduduk daerah Z. Visualisasi grafik pie menuntut penampilan data dalam persentase, sehingga total data harus bernilai 100%. Grafik di samping, jika kita hitung total persentasi data adalah 106%. Jadi ada kesalahan dalam analisis data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Makanan pokok yang disukai penduduk daerah Z 5%
Padi
9%
Kentang
14% 11%
67%
Ubi
Kedelai Lain-lain
29
Keakuratan Grafik Contoh 17:
•
•
Grafik pola konsumsi beras 30 tahun terakhir ditunjukkan oleh gambar di sebelah kiri. Gambar ini memberi pelajaran bahwa 20 tahun pertama konsumsi beras rata-rata relatif stabil. Kemudian ada beberapa tahun di periode tsb konsumsi beras menurun tajam. Tetapi konsumsi beras sepuluh tahun terakhir meningkat sangat tajam. Ketika hanya diambil 4 data saja dan kemudian ditarik garis lengkung, maka tampilan grafik jadi berbeda (grafik sebelah kanan). Kita lebih terpengaruh oleh pola kenaikan konsumsi beras. Keakuratan data menjadii sangat berkurang.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
30
Kesimpulan • • •
Statistik sangat bermanfaat untuk mempelajari dan memprediksi suatu keadaan, walaupun kadangkala menampilkan suatu kesalahan. Pada umumnya kesalahan ini disebabkan oleh kekeliruan, ketidaktahuan, atau kekurangtelitian dalam bekerja. Walaupun begitu tidak dapat disangkal, beberapa kesalahan di statistik terjadi karena adanya unsur kesengajaan yang ditunggangi oleh berbagai kepentingan. Kesalahan-kesalahan di statistik secara umum dapat dikelompokkan dalam: Kesalahan pemilihan metode sampling. Kesalahan dalam pengolahan dan analisis data. Kesalahan dalam pemilihan kata ketika memberikan pernyataan untuk menafsirkan data.
Kesalahan dalam meyimpulkan suatu hasil statistik. Kesalahan dalam memvisualisasikan data.
Akhir kata kita harus hati-hati dan teliti sebelum memutuskan menerima data atau fakta statistik. MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
31
Daftar Pustaka •
Angel, R.A, Abbott, D.C, Runde, C.D. 2009, A Survey of Mathematics with Application, Ed. Ke-8, Boston, Pearson Addison Wesley.
•
Blitzer, R. 2008, Thinking mathematically, Ed. Ke-4, New Jersey, Pearson Addison Wesley.
•
Miller, D.C, Heeren, E.V, Hornsby, J, Morrow, L.M, Newenhizen, V.J, 2008, Mathematical Ideas, Ed. Ke-11, Boston, Pearson Addison Wesley.
•
Pirnot, L.T, 2007, Mathematics All Around, Ed.Ke-3, Boston, Pearson Addison Wesley.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
32
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia