..::Data Mining::.. Prediksi Mata Kuliah Data warehouse Univ. Darma Persada Oleh: Adam Arif Budiman 2012 Data Mining-Prediksi-Adam AB
Prediksi • Dalam estimasi kita memperkirakan suatu hal misalnya rata-rata populasi dari sampel. • Estimasi dilakukan berdasarkan sampel yang ada di tangan kita • Prediksi?
Data Mining-Prediksi-Adam AB
2
Prediksi (lanj) • Dalam prediksi kita menggunakan data yang ada di tangan kita untuk memprediksi hasil dari satu hal baru yang akan muncul selanjutnya. • Jadi estimasi dilakukan untuk memperkirakan hal yang tidak kita ketahui (rata-rata populasi, varians populasi) • Prediksi memperkirakan hasil dari hal yang belum terjadi. Kita dapat menunggu hingga hal tersebut terjadi untuk membuktikan seberapa tepat prediksi kita. Data Mining-Prediksi-Adam AB
3
Prediksi (lanj) • Dalam statistika dikenal dua cara untuk memprediksi yaitu dengan cara regresi linear dan regresi linear berganda
Data Mining-Prediksi-Adam AB
4
Regresi linear • Bila diketahui data sbb: • Berapa lama waktu yang diperlukan untuk mengantarkan pesanan yang ke 26 dengan jarak sekian kilometer?
Data Mining-Prediksi-Adam AB
5
Regresi Linear (lanj) • Terdapat dua jenis regresi yaitu: 1. Regresi linear sederhana hanya melibatkan satu variabel pemberi pengaruh 2. Regresi linear berganda melibatkan lebih dari satu variabel pemberi pengaruh
Data Mining-Prediksi-Adam AB
6
Regresi (lanj) • Variabel: besaran yang berubah nilainya • Variabel variabel pemberi pengaruh (sebab) •
variabel terpengaruh (akibat)
• Contoh: jarak toko dan waktu tempuh jarak sebagai sebab, waktu yang diperlukan sebagai akibat.
Data Mining-Prediksi-Adam AB
7
Regresi Linear Sederhana (lanj) • Grafik pada data pada slide 5 bila digambarkan akan seperti di bawah ini. • Bagaimana kecenderungan titik di grafik tersebut? jarak vs w aktu 80 70
w aktu
60 50 40 30 20 10 0 0
2
4 jarak
Data Mining-Prediksi-Adam AB
6
8
8
Regresi linear sederhana (lanj) jarak vs w aktu 80 70
w aktu
60 50 40 30 20 10 0 0
2
4
6
8
jarak
Data Mining-Prediksi-Adam AB
9
Regresi linear sederhana (lanj) • Regresi linear sederhana merupakan yang menggunakan garis lurus untuk menggambarkan hubungan diantara dua variabel atau lebih. • Dari kasus ini variabel tersebut adalah jarak dan waktu, dengan jarak sebagai sumbu x (dalam km), waktu sebagai sumbu y (dalam menit) Data Mining-Prediksi-Adam AB
10
Regresi linear sederhana (lanj) • Kita mencari garis yang mendekati titik-titik sehingga garis tersebut dapat dijadikan acuan untuk prediksi titik berikutnya • Secara umum garis tersebut dapat dituliskan dalam bentuk persamaan garis Y = β0 + β1X
Data Mining-Prediksi-Adam AB
11
Regresi linear Sederhana (lanj) • • • •
Y = variabel terpengaruh β0 = konstanta β1 = gradient garis X = variabel pemberi pengaruh
Data Mining-Prediksi-Adam AB
12
Regresi linear sederhana (lanj) • Bagaimana cara mencari garis regresi yang paling baik? • Menghitung konstanta (β0) dan gradient (β1) dengan rumus: jarak vs w aktu 80 70
waktu
60 50 40 30 20 10 0 0
2
4
6
8
jarak
Data Mining-Prediksi-Adam AB
13
Regresi linear sederhana (lanj) • Dengan rumus di atas, maka hasil perhitungan pada tabel jarak dan waktu menjadi:
Data Mining-Prediksi-Adam AB
14
Regresi linear sederhana (lanj) 2745.81- (752.42) (82.94) 25 β1 = = 4.35 2 353.18 - (82.94) 25
β0 = 29.02 – 4.35 (3.32) = 14.58 • Sehingga persamaan regresinya adalah : Y = 14.58 + 4.35x
Data Mining-Prediksi-Adam AB
15
Regresi linear sederhana (lanj) • Pengetahuan apa yang bisa diperoleh dari pengolahan data di atas? Kita bisa memprediksikan waktu tempuh pengiriman pesanan sama dengan 14.58 menit ditambah 4.35 kali jarak rumah pelanggan Misal, pelanggan ke 26 berjarak 1.5 km maka waktu tempuh adalah Y = 14.58 + (4.35) (1.5) = 21.1 (menit) Data Mining-Prediksi-Adam AB
16
Regresi linear berganda • Bagaimana bila variabel masukan/pemberi pengaruh lebih dari satu? • k buah variabel • Y = β0 + β1X1 + β2X2 + … + βkXk • Bila kita memiliki (k+1) buah persamaan sementara variabel yang tidak kita ketahui juga sebanyak (k+1) maka persamaan di atas bisa menjadi …. Data Mining-Prediksi-Adam AB
17
Regresi linear berganda (lanj)
Data Mining-Prediksi-Adam AB
18
Regresi linear berganda (lanj) • Y = β0 + β1X1 + β2X2 + … + βkXk • Bila kita isikan data pada tabel di atas maka akan diperoleh persamaan • 25β0 + β1(206) + β2(82.94) = 725.42 • β0(206) + β1(2396) + β2(771.77) = 8001.67 • β0(82.94) + β1(771.77) + β2(353.18) = 2745.81 • Ketiga persamaan di atas diselesaikan sehingga diperoleh nilai β0 = 2.31, β1 = 2.74, β2 = 1.24 Data Mining-Prediksi-Adam AB
19
Regresi linear berganda (lanj) • Sehingga persamaan umum model di atas adalah : Y = 2.31 + 2.74X1 + 1.24X2 • Pengetahuan apa yang bisa diperoleh? • Kita bisa memprediksi bahwa bila kita mengantarkan pesanan maka akan diperoleh waktu sama dengan 2.31 menit ditambah 2.74 kali banyaknya lampu merah yang ditemui dan ditambah 1.24 kali jarak rumah pelanggan Data Mining-Prediksi-Adam AB
20
Regresi linear berganda (lanj) • Bila jarak rumah pelanggan ke – 26 adalah 1.5 dari restoran dan akan melewati lampu merah 1 buah maka waktu hantar adalah 6.91 menit
Data Mining-Prediksi-Adam AB
21
Lampiran 1 menyelesai kan persamaan regresi
Data Mining-Prediksi-Adam AB
22
Data Mining-Prediksi-Adam AB
23
Data Mining-Prediksi-Adam AB
24
latihan • Buatlah persamaan regresi dan simpulkan pengetahuan yang diperoleh
Data Mining-Prediksi-Adam AB
25
referensi
Data Mining-Prediksi-Adam AB
26