Azimmatul Ihwah
• Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. • Ada cara yg lebih baik untuk menginterpretasi data yg akan dibahas kali ini.
• Salah satu ukuran sebaran data (variabilitas) adalah jangkauan. • Jangkauan disebut juga range / rentangan. • Menghitung jangkauan adalah sangat mudah, yaitu mengurangkan nilai tertinggi dengan nilai terendah dari data. • Contoh skor dr salah 1 pemain mempunyai jangkauan = 13 – 7 = 6
• Temukan mean, nilai terendah, nilai tertinggi dan jangkauan dari data di bawah ini 1.
2.
• Perhitungan mean, nilai terendah, nilai tertinggi dan jangkauan dari kedua data diatas menghasilkan nilai yg sama
• Jangkauan pada data menghasilkan nilai yg sama, tetapi perhatikan histogram dr kedua data. Kalau dicermati lagi ternyata data tersebar secara berbeda. • Pada histogram data kedua, ternyata terjadi ‘loncatan’ dari skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9 dan 11 mempunyai frekuensi 0. • Jangkauan hanya mendeskripsikan lebar dari data, namun tidak bisa menunjukkan apakah terdapat jarak dari skor data satu ke data berikutnya.
• Banyak data mempunyai jangkauan yg sama, namun dari jangkauan kita hanya bisa tahu seberapa jauh jarak antara nilai terendah dan nilai tertinggi. Sehingga banyak informasi dari data yg tidak terjelaskan. • Jadi jangkauan merupakan cara yg paling mudah atau cara yg paling dasar untuk mengetahui sebaran data, namun sangat terbatas sekali untuk memberikan informasi mengenai sebaran yg sesungguhnya dalam data.
• Salah satu cara untuk membuat mini range adalah mengurutkan data kemudian membagi menjadi 4 bagian yang sama. • Contoh • Kita dapat mengonstruksikan jangkauan dengan cara terlebih dahulu mencari nilai diantara dua bagian data
• Kuartil adalah nilai yg memisahkan antar bagian data. • Kuartil terendah dinamakan kuartil pertama (𝑄1 ) dan kuartil tertinggi dinamakan kuartil ketiga (𝑄3 ). Sedangkan kuartil tengah (𝑄2 ) merupakan median karena membagi data menjadi dua bagian yg sama. • Jangkauan dari nilai dalam kuartil terendah dan kuartil tertinggi dinamakan jangkauan interkuartil • Jangkauan interkuartil = 𝑄3 - 𝑄1
Jika banyak data n, maka • Mencari letak kuartil terendah : Pertama hitung n : 4. Selanjutnya, 1. Jika hasilnya bilangan bulat, nyatakan dgn k, maka mencari kuartil terendah adalah dgn mencari rata-rata dari data ke-k dan data ke-(k+1). 2. Jika hasilnya bukan bilangan bulat, maka bulatkan ke atas. Posisi kuartil terendah adalah pada hasil pembulatan tersebut. Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas menjadi 3. Jadi kuartil terendah adalah data ke-3
• Mencari letak kuartil tertinggi : Pertama hitung 3n : 4. Selanjutnya, 1. Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m, maka nilai kuartil tertinggi adalah dengan mencari ratarata data ke-m dan data ke-(m+1). 2. Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan hasilnya ke atas. Posisi kuartil tertinggi adalah pada hasil pembulatan tersebut.
• Determine range, lower and upper quartile, and interquartile range from the data below
• Jika data disajikan dalam tabel distribusi frekuensi data berkelompok, maka kuartil ke-i dicari dgn rumus
• 𝐾𝑢𝑎𝑟𝑡𝑖𝑙 𝑘𝑒 − 𝑖 = 𝑏 + 𝑙
𝑖 𝑁−𝐹 4
𝑓
, 𝑖 = 1,2,3
dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i, f adalah frekuensi kelas kuartil dan N adalah banyaknya data.
• Hitung 𝑄1 , 𝑄2 , 𝑄3 dan jangkauan interkuartil dari data di bawah ini
• Box Plot pertama kali dikenalkan oleh American Statistician, John Tukey, pada tahun 1977 yg berguna untuk menampilkan lima summary dalam data yaitu median, kuartil , data maksimum dan minimum.
• Boxplot merupakan diagram yg terdiri dari box dan whiskers, sehingga biasa disebut juga dgn box and whisker plot.
• Box Plot dapat digambarkan dalam posisi vertical maupun horizontal.
Interpretasi Boxplot: • Box mengandung 50% dari data. Tepi atas dari box disebut Q3 (75% dari data) dan tepi bawah dari box disebut Q1(25 % dari data). • Garis yang terdapat pada box disebut dengan median data (Q2). • Titik terakhir dari garis vertical merupakan nilai maksimum dan minimum. • Titik yang berada di luar garis tersebut disebut dengan outlier. Outlier yaitu data yang terletak diluar jarak 1.5 * jangkauan interkuartil dari kuartil pertama dan ketiga. • Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil), dan titik ujung garis whisker kanan adalah nilai tertinggi dari
• Apabila jarak antara tepi bawah dan tepi atas ke median data tidak sama, berarti distribusi data tersebut tidak simetris (skewed).
• Misal berikut ini terdapat data tinggi badan siswa dalam cm: 148.7 149.8 147.9 152.1 152.1 147.9 150.4 160.0 150.5 150.4 147.3 142.6 153.4 149.3 153.8 144.7 154.9 152.7 150.5 151.0 149.2 154.0 152.7 147.2 145.8 149.9 151.2 148.0 148.0 153.0 146.3 149.2 149.3 153.0 150.7 152.2 148.7 148.7 146.8 148.9 155.1 151.5 148.9 152.3 156.2 153.3 151.6 154.1 150.3 142.4 Dari data tersebut diperoleh beberapa statistik: Mean : 150.37 cm Median : 150.38 cm SE Mean: 0.46 St. Dev: 3.31 Nilai minimum: 142.4 cm Nilai maximum: 160 cm Q1: 148.49 cm Q3: 152.69 cm
• Boxplot untuk data diatas adalah
(Data maks < Q3+1.5xIQR) – Q3
(Data min > Q1-1.5XIQR)Q1
• Terdapat 1 outlier yaitu 160, karena 160 > 𝑄3 + 1.5 x 4.2
• Ketiga kuartil adalah nilai-nilai yg membagi sekumpulan data menjadi 4 bagian. • Persentil merupakan nilai yg membagi data dalam persentase dalam cara yg sama dgn kuartil. • Persentil ke-k disimbolkan dgn 𝑃𝑘 adalah nilai pada k% dari data.
• Jadi 𝑄1 adalah persentil ke-25, 𝑄2 adalah persentil ke-50 dan 𝑄3 adalah persentil ke-75
Jika ingin mencari nilai persentil ke-k dgn banyak data n, 𝑛 pertama hitung 𝑘 , selanjutnya 100
1. Jika hasilnya bilangan bulat, nyatakan dgn i, maka persentil ke-k adalah rata-rata dari data ke-i dan ke(i+1). 2. Jika hasilnya bukan bilangan bulat, maka posisi persentil adalah pada hasil pembulatan bilangan tersebut. Contoh kita punya 125 data. Untuk mencari persentil ke-10 125 hitung 10 = 12.5. Maka persentil ke-10 adalah data 100
ke-13
• Salah satu cara untuk mengetahui variabilitas data adalah melalui variansi. • Variansi juga adalah salah satu cara untuk mengukur sebaran data. • Variansi pada populasi disimbolkan dengan 𝜎 2 , dihitung dengan menggunakan rumus. 𝑓 𝑥−𝜇 2 𝑁
untuk data pada tabel distribusi frekuensi data
tunggal 𝑓 𝑥𝑖 −𝜇 2 𝑁
untuk data pada tabel distribusi frekuensi data berkelompok, dgn 𝑥𝑖 merupakan titik tengah tiap kelas f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data.
Untuk penyederhanaan penghitungan, variansi dapat dihitung menggunakan rumus •
𝑓𝑥 2 𝑁
−
𝑓𝑥 2 , 𝑁
untuk data pada tabel distribusi frekuensi
data tunggal
•
𝑓𝑥𝑖2 𝑁
−
𝑓𝑥𝑖 2 , 𝑁
untuk data pada tabel distribusi frekuensi
data berkelompok, dengan 𝑥𝑖 adalah titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data.
Variansi pada sampel disimbolkan dgn 𝑠 2 , dihitung dengan rumus. •
𝑓 𝑥−𝑥 2 𝑛−1
untuk data pada tabel distribusi frekuensi data
tunggal
•
𝑓 𝑥𝑖 −𝑥 2 𝑛−1
untuk data pada tabel distribusi frekuensi data berkelompok, dgn 𝑥𝑖 merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n adalah ukuran sampel.
Penyederhanaan rumus variansi pada sampel
•
𝑛
𝑓𝑥 2 − 𝑓𝑥 2 , 𝑛 𝑛−1
untuk data pada tabel distribusi frekuensi
data tunggal. •
𝑛
𝑓𝑥𝑖2 − 𝑛 𝑛−1
𝑓𝑥𝑖 2
, untuk data pada tabel distribusi frekuensi
data berkelompok, dengan 𝑥𝑖 merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai/tiap kelas, n merupakan ukuran sampel.
• Perhatikan bahwa variansi adalah rataan kuadrat jarak tiap nilai dari mean. • Ukuran yg benar-benar menyatakan jarak nilai dari mean adalah standar deviasi. • Standar deviasi merupakan akar dari variansi. • Standar deviasi pada populasi disimbolkan dengan 𝜎 dan pada sampel disimbolkan dengan s. 𝜎 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑠𝑖
• Menunjukkan seberapa nilai menyimpang dari rataannya. • Standard scores atau bilangan baku merupakan ukuran yg bersifat individual. • Bilangan baku untuk setiap nilai/skor 𝑥𝑖 pada sampel dilambangkan dengan 𝑧𝑖 dicari dgn menggunakan rumus 𝑥𝑖 − 𝑥 𝑧𝑖 = 𝑠
• Hitung dan bandingkan standard scores dari kedua pemain basket berikut
• Berikut standard scores dari kedua pemain dalam kurva
• Jika skor kedua pemain distandardize, maka skor dari pemain kedua lebih tinggi dari pemain pertama. • Jadi meskipun pencapain skor pemain pertama lebih tinggi pada suatu pertandingan, tetapi dikatakan bahwa track record pencapaian prestasi pemain kedua relatif lebih baik dr pemain pertama.