BAB I PENDAHULUAN
1.1. Latar Belakang Masalah Perkembangan yang cepat dalam teknologi pengumpulan dan penyimpanan data telah memudahkan organisasi untuk mengumpulkan sejumlah data berukuran besar sehingga menghasilkan gunung data. Ekstraksi informasi yang berguna dari gunung data menjadi pekerjaan yang cukup menantang. Seringkali alat dan teknik analisis data tradisional tidak dapat digunakan dalam mengekstrak informasi dari data berukuran besar. Data mining adalah teknologi yang merupakan campuran metode-metode analisis data dengan algoritma-algoritma untuk memproses data berukuran besar. Perkembangan teknologi ini telah menarik penulis untuk melakukan penelitian pada bidang klimatologi dan bidang pertanian menggunakan teknologi Data mining dalam menangani permasalahan produktifitas hasil panen komoditas pangan yang selama ini masih belum didasarkan pada data yang aktual berdasarkan curah hujan yang terjadi pada suatu daerah tertentu. Penentuan model iklim dan cuaca yang tepat bagi suatu daerah sangat penting untuk menjadi pertimbangan dalam menentukan kebijakan dan strategi. Cuaca dan iklim merupakan dua hal yang berbeda. Cuaca merupakan salah satu variabel yang menentukan kondisi iklim. Cuaca adalah keadaan rata -rata udara pada periode waktu sesaat. Iklim adalah keadaan rata-rata cuaca pada periode waktu tertentu. Salah satu faktor yang berpengaruh langsung terhadap tipe atau variasi iklim adalah curah hujan. Curah hujan adalah ketinggian air hujan yang terkumpul dalam tempat yang datar, tidak menguap, tidak meresap dan tidak mengalir. Berdasarkan data curah hujan dapat dilakukan penggolongan iklim menurut perbandingan antara jumlah ratarata bulan kering dengan jumlah rata-rata bulan basah. Prediksi cuaca mengacu pada rangkaian aktivitas yang dilakukan untuk menghasilkan sekumpulan informasi mengenai kondisi iklim dan unsur - unsurnya.
1
Informasi ini berguna dalam banyak hal salah satunya adalah untuk prakiraan curah hujan yang besar pengaruhnya terhadap segala macam aktifitas kehidupan. Seperti misalnya, para petani sangat membutuhkan informasi mengenai prakiraan musim hujan agar mereka dapat mempersiapkan masa tanam dengan lebih baik. Bidang lain yang membutuhkan informasi atau prediksi cuaca dan iklim antara lain: pariwisata, perikanan, pelayaran, perkebunan, kehutanan, pembangunan gedung, penataan wilayah, dan kesehatan. Dari penjelasan di atas, maka diperlukan suatu sistem yang dapat menghasilkan pola dan hubungan kondisi iklim di Indonesia terhadap hasil produktifitas komoditas pangan. Informasi iklim berupa curah hujan yang diberikan secara berkala (bulanan, tahunan), selalu diperbaharui (update), dan saat itu juga (real time).
1.2. Tujuan Penelitian Penyusunan tugas akhir ini dimaksudkan untuk memenuhi syarat kelulusan program Strata-1 (S1) Program Studi Statistika, Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA), Universitas Gadjah Mada. Sedangkan tujuan dari penulisan skipsi ini adalah sebagai berikut: 1. Sebagai salah satu syarat untuk memperoleh gelar sains di Program Studi Statistika FMIPA UGM. 2. Mengetahui aturan yang terjadi berupa hubungan antar item pada komponen data cuaca. 3. Memodelkan pola dan hubungan data cuaca untuk memprediksi tingkat curah hujan. 4. Mengenal
dan
memahami
pola
tingkat
curah
hujan
yang
dapat
mempengaruhi produktifitas hasil komoditas pangan.
1.3. Manfaat Penelitian Berdasarkan berbagai informasi yang diperoleh, penyusunan tugas akhir ini diharapkan dapat memberikan manfaat-manfaat sebagai berikut: 1. Mengaplikasikan ilmu statistika pada teknik data mining.
2
2. Memperluas pengetahuan mengenai aplikasi statistika dalam pembentukan aturan asosiasi. 3. Memperoleh model untuk memprediksi pola curah hujan sehingga akan sangat bermanfaat bagi bidang terkait pada tiap tahunnya. 4. Menambah wacana ilmu pengetahuan yang selanjutnya dapat dikembangkan ketingkat yang lebih lanjut.
1.4. Batasan Masalah Pada penulisan tugas akhir ini, pembatasan masalah diperlukan guna menjamin keabsahan dalam kesimpulan yang diperoleh. Pembatasan permasalah yang jelas akan memudahkan dalam perancangan dan pelaksanaan penulisan, sehingga informasi yang diperoleh sesuai dengan harapan. Sehingga tidak terjadi penyimpangan dari tujuan semula dan pemecahan masalah lebih terkonsentrasi, maka pembahasan akan difokuskan pada penggunaan Aturan-Asosiasi dan Analisis Regresi Logistik Kernel untuk mengetahui hubungan data cuaca. Tugas akhir ini menekankan pada pencarian pola dan hubungan dengan memanfaatkan teknik Data Mining.
1.5. Tinjauan Pustaka Penelitian mengenai pemanfaatan data mining menggunakan teknik aturan asosiasi (association rule) dan regresi logistik kernel (kernel regression logistic) sudah dilakukan selama bertahun-tahun dan berbagai metodologi telah dicoba diberbagai bidang. Penelitian-penelitian tesebut tentunya akan memberikan informasi yang bermanfaat mengenai perkembangan dari permasalahan pada penelitian ini. Berikut berbagai penelitian-penelitian dan aplikasi terkait dengan data mining. 1. Subekti Mujiasih (2011) membuat sebuah tulisan berjudul “Utilization Of Data Mining For Weather Forecasting” penelitian tersebut menjelaskan model prediksi menggunakan beberapa teknik data mining diantaranya teknik aturan asosiasi (Association rules) dan Classification.
3
2. Ji Zhu and Trevor Hastie (2004) dalam tulisannya bejudul “Kernel Regression Logistik and The Import Vector Machine” membahas mengenai metode
pembentukan
model
menggunakan
inner
product
sehingga
menghasilkan bobot untuk variabel-variabel prediktor. 3. Woro Estiningtyas, Elza Surmaini dan Kharmila Sari Hariyanti (2008) dalam penelitiannya
yang
berjudul
Berdasarkan
Prakiraan
Curah
“Penyusunan hujan
Skenario
Disentra
Masa
Produksi
Tanam Pangan”
menjelaskan mengenai aplikasi skenario masa tanam dan model prakiraan hujan yang didukung dengan data tanah dan tanaman.
1.6. Metode Penelitian Metode penulisan yang digunakan penulis adalah studi literatur yang diperoleh dari buku, jurnal ilmiah, dan sumber-sumber lain yang mendukung penulisan tugas akhir ini. Sedangkan dalam pengolahan data bertujuan mendapatkan solusi, penulis menggunakan software RapidMiner dan Microsoft Excel. Dalam rangka mempraktekkan metode agar penerapan yang lebih nyata dengan dunia klimatologi dan pertanian, maka penulis menggunakan data yang berasal dari Badan Meteorologi Klimatologi dan Geofisika serta Badan Pusat Statistik.
1.7. Sistematika Penulisan Penulisan tugas akhir ini disusun dengan sistematika sebagai berikut : BAB I :
PENDAHULUAN Bab ini berisi tentang latar belakang dan permasalahan, tujuan penelitian, manfaat penelitian, pembatasan masalah, tinjauan pustaka, metode penelitian dan sistematika penulisan yang memberikan arah terhadap penulisan tugas akhir ini.
BAB II :
LANDASAN TEORI Bab ini berisi tentang teori dasar yang menunjang pembahasan mengenai pemodelan statistika dalam teknik data mining.
4
BAB III :
ATURAN ASOSIASI DAN REGRESI LOGISTIK KERNEL Bab ini membahas mengenai kaitan-kaitan antar metode, rumus dan teknik dari data mining. Bab ini akan membahas secara lebih detail proses suatu hubungan dan pembentukan pola.
BAB IV :
STUDI KASUS Bab ini berisi tentang contoh kasus dari teknik yang digunakan dengan memberikan pembahasan sejauh mana hasil tersebut dapat dijadikan sebagai bahan kesimpulan.
BAB V :
KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan-kesimpulan yang diperoleh dari pemecahan masalah dan saran sebagai akibat dari kekurangan dan kelebihan dari hasil tugas akhir yang dilakukan.
5