BAB 2
LANDASAN TEORI
Pada bab ini akan diuraikan beberapa konsep dan metode yang menjadi dasar penulisan tugas akhir ini.
2.1. Pengurutan
2.1.1. Pengertian Pengurutan
Pengurutan data secara umum dapat dikatakan sebagai suatu proses untuk menyusun kembali himpunan objek menggunakan aturan tertentu. Pengurutan data merupakan satu dari banyak pekerjaan komputer yang dilakukan, yang diteliti secara luas, dan memiliki banyak algoritma yang berbeda yang dibangun.
Pengurutan adalah proses menyusun kembali data menggunakan suatu aturan tertentu, sehingga susunan data menjadi lebih teratur dibandingkan dengan susunan awal data.
2.1.2. Jenis-Jenis Pengurutan
Pada umumnya terdapat 2 jenis pengurutan, yaitu : 1.
secara urut naik (ascending) yaitu diurutkan dari data terkecil menuju data terbesar. Bila data yang diurutkan berbentuk teks, data akan diurutkan dari abjad A sampai abjad Z. Bila data yang diurutkan berbentuk angka, data akan diurutkan dari angka yang terkecil menuju data yang terbesar.
Universitas Sumatera Utara
7
2.
secara urut turun (descending) yaitu diurutkan dari data terbesar menuju data terkecil. Bila data yang diurutkan berbentuk teks, data akan diurutkan dari abjad Z sampai A. Bila data yang diurutkan berbentuk angka, data akan diurutkan dari angka yang terbesar menuju data yang terkecil.
2.1.3 Keuntungan Pengurutan
Dalam proses pengurutan, kecepatan merupakan faktor yang penting untuk mempercepat proses data tersebut. Misalnya dalam menentukan berupa daftar hadir yang diurutkan berdasarkan nomor induk, proses pengurutan data dimulai dari yang kecil ke yang besar (ascending) melakukan proses pengurutan.
Ada banyak alasan dan keuntungan dengan mengurutkan data. Data yang terurut dengan baik juga mudah untuk dihapus jika sewaktu-waktu data tersebut tidak diperlukan lagi. Selain itu, dengan mengurutkan data maka kita semakin mudah untuk menyisipkan data atapun melakukan penggabungan data. Disisi lain, pengurutan data juga mempermudah untuk mendapatkan peringkat, misalnya dalam menentukan objek unggulan, dan lain sebagainya.
2.2. Kuantil
Menurut Sudjana (2011), kuantil termasuk ke dalam ukuran letak. Beberapa macam ukuran letak adalah median, kuartil, desil, dan persentil. Jika sekumpulan data dibagi menjadi empat bagian yang sama banyak, sesudah disusun menurut urutan nilainya, maka bilangan pembaginya disebut kuartil. Ada tiga buah kuartil, yaitu kuartil pertama, kuartil kedua, kuartil ketiga yang masing-masing disingkat dengan ܭଵ , ܭଶ , ܭଷ . Jika sekumpulan data itu dibagi menjadi 10 bagian yang sama, maka didapat sembilan pembagi dan tiap pembagi dinamakan desil. Karena ada sembilan buah desil, yaitu desil pertama, desil kedua, ⋯, desil kesembilan yang
Universitas Sumatera Utara
8
disingkat dengan ܦଵ , ܦଶ , ⋯ , ܦଽ . Jika data itu dibagi menjadi 100 bagian yang sama akan menghasilkan 99 pembagi yang berturut-turut dinamakan persentil pertama, persentil kedua, ⋯, persentil ke-99. Simbol yang digunakan berturutturut adalah ܲଵ , ܲଶ , ⋯ , ܲଽଽ Kemudian, menurut Darnius (2014), kuantil merupakan ukuran letak yang merupakan bentuk umum dari ukuran letak yang selalu dibahas dalam statistika dasar, seperti median, kuartil, desil, dan persentil. Jika ݍ menyatakan kuantil ke dengan 0 < < 1 dari suatu peubah acak ܺ dengan distribusi )ݔ(ܨ, maka sebanyak (1 − )bagian dari data nilainya lebih kecil atau sama dengan ݍ . Dengan kata lain peluang peubah acak ܺ lebih kecil atau sama dengan ݍ sama atau lebih besar dari 1 − . Dalam notasi matematika ܲ൫ܺ ≤ ݍ ൯ ≥ 1 −
(2.1)
2.3. Bahasa R
Bahasa R adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik. Bahasa R dibuat oleh Ross Ihaka dan Robert Gentlement di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh R Development Core Team, dimana Chambers merupakan anggotanya. Bahasa R dinamakan setelah nama dua pembuatnya (Robert Gentleman dan Ross Ihaka), dan sebagian dari nama bahasa S.
Bahasa R menyediakan berbagai teknik statistika (pemodelan linier dan nonlinier, uji statistik klasik, analisis deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik. Bahasa R sebagaimana bahasa S, dirancang sebagai bahasa komputer sebenarnya, dan mengizinkan penggunanya untuk menambah fungsi tambahan dengan mendefinisikan fungsi baru. Kekuatan besar dari Bahasa R yang lain adalah fasilitas grafiknya, yang menghasilkan grafik dengan kualitas publikasi yang dapat memuat simbol matematika.
Universitas Sumatera Utara
9
2.3.1 Cara Kerja Bahasa R
Verzani (2002) mengemukakan bahwa keuntungan-keuntungan yang diperoleh bila menggunakan bahasa R untuk pengolahan data dan statistik antara lain : Bahasa R dapat diakses gratis dan dapat dijalankan pada berbagai sistem operasi (UNIX, Windows, MacOS), sintaksnya mudah dipelajari dan memiliki banyak sekali fungsi-fungsi statistik terpasang. Disamping keuntungan tersebut, Verzani (2002) juga mengemukakan kelemahan utama bahasa R adalah tidak adanya dukungan komersial.
Bahasa R merupakan sebuah paket dan sekaligus bahasa pemrograman untuk analisis data dan grafik. Bahasa R merupakan bahasa pemrograman tingkat tinggi (hight level pemrogramming). Bahasa R dapat digunakan secara interaktif sehingga hasil perhitungan segera dapat dilihat, tetapi apabila perhitungannya kompleks maka perintah-perintah bahasa R ditulis lebih dahulu dalam text editor, kemudian dipanggil dengan fungsi source. Bahasa R dapat diperoleh dari http://www.r-project.org dan sebagaimana halnya program open source, bahasa R
dirancang secara voluntary oleh ahli-ahli statistik dan pemrograman di seluruh dunia, sehingga perkembangannya sangat pesat.
Bahasa R juga dilengkapi dengan package (add-in) yang memberikan kemampuan tambahan, misalnya perhitungan teknik-teknik statistik yang canggih, interface, dan lain-lain. Packages ini juga dapat diakses gratis. Secara periodik muncul package-package baru yang menarik yang dapat dipilih sesuai kebutuhan. Semua package ini dapat diperoleh gratis di http://cran.r-project.org/. Bahasa R dan juga bahasa S merupakan bahasa yang dirancang untuk komputasi statistik, grafik dan matriks.
Universitas Sumatera Utara
10
2.3.2 Kelebihan Bahasa R
Bahasa R mempunyai kelebihan-kelebihan antara lain bahasa R merupakan perangkat lunak yang termasuk dalam lisensi GNU General Public Licence yang berarti merupakan suatu perangkat lunak free. Free disini pengertiannya lebih ke arah freedom (kebebasan) tidak sekedar dari sisi harga / gratis (GNU, 2011). Dengan demikian para pemakai mempunyai : a. Kebebasan dalam menjalankan program bahasa R dengan tujuan apapun. b. Kebebasan untuk mempelajari bagaimana program bahasa R dan mengubahnya sesuai dengan harapan. Dalam hal ini pemakai mempunyai kebebasan untuk mengakses source code dari bahasa R. Hal ini menunjukkan bahwa bahasa R sebagai Open Source Software. c. Kebebasan untuk menggandakan program bahasa R. d. Kebebasan untuk menggandakan hasil modifikasi program ke pihak lain.
2.3.3 Kekurangan Bahasa R
Selain kelebihan, bahasa R mempunyai beberapa kelemahan yang dapat mempengaruhi penggunaannya. Kekurangan dari sisi kemampuan perhitungan dalam bahasa R dikaji dalam (Ihaka, 2010), dimana bahasa pemrograman R merupakan bahasa pemrograman berbasis interpreter, sehingga eksekusi suatu aplikasi/fungsi yang ditulis dengan bahasa R terutama aplikasi/fungsi yang membutuhkan program code yang panjang akan membutuhkan waktu yang relatif lama. Seperti yang telah dikaji sebelumnya, package tambahan selain package dasar yang terdapat di bahasa R mempunyai ketergantungan dengan versi bahasa R yang digunakan dan package lainnya. Secara operasional, apabila pengguna tidak melakukan verifikasi tentang ketergantungan versi tersebut atau dengan perkataan lain menggunakan suatu package versi tertentu yang tidak sesuai dengan versi bahasa R dan package terkait yang digunakan, maka program tidak dapat digunakan sebagaimana mestinya tanpa suatu peringatan yang menunjukkan letak kesalahannya. Akibatnya penggguna perlu melakukan verifikasi secara trial
Universitas Sumatera Utara
11
and error (coba-coba) untuk mengetahuinya. Disamping itu, dalam penggunaan bahasa R untuk menganalisis data statistik melalui RGui yang berbasis CLI, pengguna diharuskan mengetahui sintaks fungsi dan cara menggunakannya secara benar. Bahasa R sensitif dalam penggunaan huruf besar dan huruf kecil, sehingga jika terdapat kesalahan dalam penulisan, maka akan timbul peringatan kesalahan. Hal ini tentunya menjadi masalah tersendiri bagi pengguna yang tidak mengetahui bentuk perintah atau fungsi yang ada dalam bahasa R.
Universitas Sumatera Utara