PREDIKSI KAPASITAS PRODUKSI, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT UNTUK PEMILIHAN SUPPLIER DENGAN METODA DATA MINING
oleh :
EKO JUNIANTO 9107201611 DOSEN PEMBIMBING : Ir. BUDI SANTOSA MSc. Ph.D
1
Latar Belakang Permasalahan
Situasi Global, Perusahaan :
TUNTUTAN PROFIT SEBESAR BESARNYA OPTIMALISASI PROSES BISNIS, SANGAT DIPENGARUHI PEMILIHAN BAHAN BAKU DENGAN SPESIFIKASI BERVARIASI (BECKER, 1989) TARGET PERUSAHAAN SESUAI BAHAN BAKU YANG DIPILIH (LIU, JIAFU DAN SONG, 2006) DAN PERLU PERENCANAAN DAN PENGENDALIAN BAHAN BAKU (RIANE DKK, 2001) PERMINTAAN PUPUK BERBASIS PHOSPHATE SEBAGAI MATERIAL PENTING DALAM PRODUKSI PERTANIAN (NOTHOLT, 1991) , MAKA KETERSEDIAAN, KUALITAS ASAM PHOSPHATE SEBAGAI POINT PENTING PENENTUAN TARGET PRODUKSI. METODE PEMILIHAN PHOSPHATE ROCK PEMBUATAN ASAM PHOSPHATE MENJADI POINT SERIUS KERENA VARIASI SPESIFIKASI TAMBANG DUNIA , DENGAN METODE DATA MINING AKAN MEMBANTU UNTUK PREDIKSI PRODUK YANG DIHASILKAN (TSENG DKK, 2006) PENELITIAN MENGGUNAKAN DATA MINING DENGAN MENGKLASIFIKASI SPESIFIKASI POSPHATE ROCK, PRODUKSI ASAM PHOSPHATE, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT DAPAT DIGUNAKAN UNTUK MEMPREDIKSI SUPPLIER PHOSPHAT E ROCK PADA P ROSES PRODUKSI ASAM PHOSPHATE 2
PERMASALAHAN :
BAGAIMANA CARA MENENTUKAN SUPPLIER PHOSPHATE ROCK TERBAIK DILIHAT DARI PRODUK ASAM PHOSPHATE, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT PADA PROSES PRODUKSI ASAM PHOSPHATE ?
DENGAN MODEL KLASIFIKASI APA YANG SESUAI DENGAN TEKNIK DATA MINING YANG DIPILIH ? 3
Tujuan Penelitian MENDAPATKAN
MODEL PREDIKSI YANG AKURAT UNTUK KAPASITAS PRODUK ASAM PHOSPHATE, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT.
MENERAPKAN MODEL UNTUK MENGKLASIFIKASI PHOSPHATE ROCK SESUAI DENGAN KARAKTERISTIK YANG TERKANDUNG DALAM PHOSPHATE ROCK SUPPLIER IDENTIFIKASI FAKTOR-FAKTOR YANG BERPENGARUH DALAM PEMILIHAN SUPPLIER PHOSPHATE ROCK 4
Manfaat Penelitian DENGAN MODEL YANG DIDAPATKAN AKAN DENGAN MUDAH DITENTUKAN SUPPLIER PHOSPHATE ROCK UNTUK PROSES PRODUKSI ASAM PHOSPHATE YANG TERBAIK DAPAT MEMBERIKAN INFORMASI KEPADA PENGAMBIL KEPUTUSAN SERTA MEMPERKENALKAN ALAT BANTU PENGAMBILAN KEPUTUSAN YANG RASIONAL DALAM PEMILIHAN SUPPLIER PHOSPHATE ROCK
5
BATASAN DAN ASUMSI 1. PENELITIAN DILAKSANAKAN DI PABRIK ASAM PHOSPHATE PT PETROKIMIA GRESIK. 2. JENIS PROSES PABRIK ASAM PHOSPHATE ADALAH HEMIDI HYDRATE PROCESS. 3. DATA YANG DIPERLUKAN DIAMBILKAN DARI DATA PROSES PABRIK ASAM PHOSPHATE PT PETROKIMIA GRESIK. 4. DATA PEMAKAIAN BAHAN PHOSPHATE ROCK, PRODUKSI DAN KONSUMSI PHOSPHATE ROCK DAN ASAM SUFAT DITENTUKAN BERDASARKAN PENGGUNAAN SELAMA 6 TAHUN SEJAK TAHUN 2004. 5. PHOSPHATE ROCK YANG DITELITI ADALAH PERSEDIAAN INCOMING MATERIAL (BUKAN PERSEDIAAN BARANG SETENGAH JADI & BARANG JADI/PRODUK). 6. PLANT RELIABILITY PABRIK ASAM PHOSPHATE PT PETROKIMIA GRESIK PADA KONDISI BAIK. 6
TINJAUAN PUSTAKA DAN KAJIAN TEORITIS
Variasi bahan baku phosphate rock mempengaruhi pemilihan teknologi proses pembuatan asam phosphate (Becker, 1989)
Menurut Haksever dan Moussourakis (2005) jumlah dan kapan order bahan baku agar produk didapatkan optimal karena variasi kualitas dan variasi harga phosphate rock yang dipasok 7
DATA SUPPLIER PHOSPHATE ROCK
Becker P., (1989)
% BPl = konversi P2O5 dalam Ca3(PO4)2 dibagi 2,183
8
PENDEKATAN METODA DATA MINING o TEKNIK DATA MINING SANGAT MEMBANTU MENEMUKAN SOLUSI YANG BAIK PADA DUNIA BISNIS DI ERA GLOBALISASI TERUTAMA DALAM PENGAMBILAN KEPUTUSAN MANAJEMEN (ÇOBAN A., DKK., 2006), (TZUNG DKK., 2009) o METODA DATA MINING ATAU JUGA SERING DISEBUT KNOWLEDGE DISCOVERY IN DATABASE (KDD) ADALAH SUATU KEGIATAN MELIPUTI PENGUMPULAN DATA, PEMAKAIAN DATA HISTORIS UNTUK MENEMUKAN KETERATURAN, POLA ATAU HUBUNGAN SET DATA BERUKURAN BESAR. DAN INI TELAH DILAKUKAN OLEH PENELITI SEBELUMNYA, MISALNYA OLEH MASTROGIANIS DKK. (2009), GERARDO DAN LEE (2009), LEE DKK, LI DAN SUN (2009), CHEN DKK.(2009), YANG DKK. (2008), SHINHA DAN ZHAO, (2008), SERTA TSENG DKK. (2006) DAN LAINNYA. o SANTOSA (2007), PETRY DAN ZHAO (2009), DAT A MINING ERAT KAITANNYA DENGAN MACHINE LEARNING ATAU KECERDASAN BUATAN YANG BERHUBUNGAN DENGAN TEKNIK-TEKNIK YANG BISA DIPROGRAMKAN DAN BELAJAR DARI DATA MASA LALU 9
KONSEP/PENDEKATAN DATA MINING
UNSUPERVISED
1. 2.
CIRI-CIRI VARIABEL DATA TANPA DATA TRAINING TANPA DATA LABEL (OUTPUT)
TEKNIK DATA MINING
SUPERVISED
1. 2. 3.
CIRI-CIRI VARIABEL DATA ADA DATA TRAINING ADA DATA TESTING ADA DATA LABEL (OUTPUT)
10
KONSEP DATA MINING PARTISIONING PENGELOMPOKAN OBJEK DALAM JUMLAH K KLASTER
UNSUPERVISED
• K – MEANS KLASTER FUZZY CLUSTER MEANS (FCM)
KLASTERING
HIRARKI TIDAK PERLU JUMLAH KLASTER DIAWAL. SETIAP TITIK MENJADI KLASTER LALU DIGABUNG DENGAN TITIK LAIN TERDEKAT UNTUK MEMBENTUK KLASTER YANG LEBIH BESAR
11
KONSEP DATA MINING LINIER KLASIFIKASI
NON LINIER LINIER MULTIVARIATE
SUPERVISED
REGRESI LOGISTIK BACK PROPAGASI
RECURRENT NET WORK
NEURAL NETWORK LEARNING VECTOR QUANTIZATION
12
DUA KELAS ANALISIS DISKRIMINAN LINIER (LDA)
KLASIFIKASI
METODE KERNEL
MULTI KELAS
SUPPORT VECTOR MACHINE (SVM) SVM MULTI KELAS
TEOREMA BAYES PENGENALAN POLA DIDASARKAN KUANTIFIKASI TRADE OFF ANTARA BERBAGAI KEPUTUSAN KLASIFIKASI
DECISION TREE MENGKLASIFIKASIKAN OBYEK DENGAN URUTAN PERTANYA-AN UNTUK MENENTUKAN KELOMPONYA, SEHINGGA ADA SIMPUL –AKAR DAN JAWABAN DIKEMUKAKAN PADA CABANG-CABANG.
NAIVE BAYES ASUMSI PENYEDERHANAAN BAHWA NILAI ATRIBUT SECARA KONDISIONAL SALING BEBAS JIKA DIBERIKAN NILAI OUTPUT
CLASSIFIER AND REGRESSION TREE( CART) INDUCER DECISION TREES (ID3) C 4.5
SETIAP SIMPUL DIPECAH MENJADI 2 CABANG, SEBAGAI UKURAN IMPURITY DIGUNAKAN INDEKS GINI
MENGGUNAKAN KRITERIA INFORMATION GAIN UNTUK MEMILIH ATRIBUT PADA PEMISAHAN OBYEK
13
METODA DATA MINING
5. BAYES CLASSIFIER YOUN , JEONG., (2009), MITCHEL, (1997) MENYATAKAN SECARA TEORITIS SEBUAH OPTIMAL CLASSIFIER BAYES ADALAH MEMINIMALKAN ERROR RATE EXISTS DAN MAPPING OF EQUIVALENT
14
METODA DATA MINING mapping of equivalent adalah :
Dimana P(y = -1 I X=x) adalah kondisional probability hasil klas adalah negatif diberikan sebuah atribut vektor khusus.
15
METODA DATA MINING Kaidah probaility ini equivalent untuk :
Dimana P(X = x I y = -1) adalah kondisional probability hasil klas adalah negatif diberikan sebuah atribut vektor khusus, dan P(y=-1) adalah probability utama hasil klas adalah negatif.
16
METODA DATA MINING KLASIFIER NAIVE BAYES Salah satu penerapan bayes theorem dalam klasifikasi adalah Naïve Bayes Classifier.
Vnb = argmax vj ∈ V P (vj) ∏ P (ai vj) dimana Vnb adalah output klasifikasi naïve bayes dengan nilai atribut a1, a2, a3, ……. an Estimasi P (ai | vj), menggunakan m estimasi :
nc + mp P (ai vj) = n+m Dimana n = jumlah datatraining untuk v = vj nc = jumlah data training untuk v = vj dan a = aj p = pior estimate untuk P (ai | vj)
17
METODA DATA MINING DECISION TREE Salah satu alat/tool dan mudah diimplementasikan untuk klasifikasi adalah decision tree, ini sangat cocok untuk kasus dimana nilai atribut dan outputnya berupa nilai diskrit. (Santosa, 2007) Aplikasi Metode Decision Tree : 1. Classification and regression Trees (CART) 2. Inducer of Decision Trees (ID3) Decisison tree bisa dilakukan dengan 2 cara yakni 1. Top-down tree construction Pada start, semua contoh training adalah akar Contoh-contoh pemisah diulang dengan memilih 1 atribut setiap waktu 2. Bootom up tree pruning Hilangkan substrees atau ranting dengan cara bottom-up untuk memperbaiki akurasi pada kasus baru 18
METODA DATA MINING DECISION TREE
Pemilihan pemisahan atribut 1. setiap node, menggunakan fungsi goodness Atribut yang ada dievaluasi dalam basis pemisahan kelas dari contoh training 2. Tipikal fungsi goodness ada 3 yakni information gain A (ID3/C. 45), information gain ratio dan gini index. 3. Informasi diukur dalam bits, sebuah probability distribusi, info dibutuhkan untuk mempredik pada sebuah event adalah distribusinya entropy 19
METODA DATA MINING DECISION TREE Komputasi information gain = information sebelum split – informasi setelah split. Entropy (p1,p2,p3 ..........pn) = -p1 log p1 – p2 log p2 ............. pn log pn Gain (y,A) = entropy (y) - ∑ c ∈ nilai A
yc entropy (yc) y
Dimana nilai A adalah semua nilai mungkin dari atribut A dan Yc adalah subset dari y dimana A mempunyai nilai c. entropy (p,q,r): entropy (p,q,r)(p,q + r) + (q + r) x ( Intricic Info (S, A) (Split Information) = -
si
∑ s log2
q r , ) q+r q+r
si s
Yaitu untuk menghitung gain ratio, dimana s adalah s1 ………. sc dan c adalah sub set yang dihasilkan dari pecahan s dengan menggunakan atribut A yang mempunyai sebanyak c nilai. 20
METODA DATA MINING DECISION TREE
Gam ratio (S, A) =
Gain ( S , A) insitiansic info (s, A)
Indek Gini, jika kelas objek dinyatakan dengan k, k-1,2,3, ........c adalah jumlah kelas untuk variable/output dependen y, maka untuk cabang A dihitung seperti dibawah ini : c
IG (A) = 1 − ∑ P k2 k =1
21
MEMBANDINGKAN MODEL
1. Tidak ada model terbaik untuk semua kasus data mining untuk memprediksi atau klasifikasi yang harus dipilih, karena biasanya untuk satu kasus diterapkan beberapa teknik atau parameter yang berbeda 2. Cara membandingkan model - Membandingkan nilai error yang dihasilkan - Model yang mempunyai hasil nilai error terkecil itulah model yang dipilih (Santosa, 2007). 3. Menurut Sivakumasi S., (2009), atribut ranking method digunakan untuk mengevaluasi C4.5 (Decision tree) dan naive bayes
22
METODOLOGI PENELITIAN MULAI TAHAP I : PENGUMPULAN DATA TAHAP II : IDENTIFIKASI PARAMETER DATA TAHAP III : PENGOLAHAN DATA MODEL NAIVE BAYES
MODEL DECISION TREE AKURASI DECISION TREE
AKURASI NAIVE BAYES DIBANDINGKAN
PEMILIHAN MODEL A
23
A
ANALISIS DAN KESIMPULAN
SELESAI
24
TAHAP I : PENGUMPULAN DATA SUMBER DATA SUBJECT DATA WAKTU
: UNIT ASAM PHOSPHATE PT PETROKIMIA GRESIK : ANALISA PHOSPHATE ROCK, PRODUK ASAM PHOSPHATE, KONSUMSI PHOSPHATE ROCK DAN ASAM SULFAT : JANUARI 2005 - DESEMBER 2009
TAHAP II : IDENTIFIKASI PARAMETER DATA
1. Kelompok/variabel input atau variable x, yakni variabel independent/prediktor - Supplier/asal negara phosphate rock - Kualitas phosphate rock : P2O5, CaO, SiO2, CO2, Fe2O3, Al2O3, F, K2O, MgO, Na2O3, SO3, Cl2, Moisture, Organic Carbon 25
TAHAP II : IDENTIFIKASI PARAMETER DATA 2. Kelompok/variabel output atau variabel y, yakni variabel dependent/respons terdiri atas 3 label yakni - Produksi asam phosphate : Produksi <610 t/jam, label rendah Produksi 610 – 630 t/jam, label sedang Produksi >630 t/jam, label tinggi -
Konsumsi phosphate rock Konsumsi phospahte rock (ton/ton produk) > 3,4, label rendah Konsumsi phospahte rock (ton/ton produk) 3,21-3,4 , label sedang Konsumsi phospahte rock (ton/ton produk) < 3,21, label tinggi
-
Konsumsi asam sulfat Konsumsi asam sulfat (ton/ton produk) > 3,0, label rendah Konsumsi asam sulfat (ton/ton produk) 2,9 -3,0, label sedang Konsumsi asam sulfat (ton/ton produk) <2,9 , label tinggi 26
TAHAP III : PENGOLAHAN DATA MODEL NAIVE BAYES
dimana x adalah variabel indpenden kualitas phosphate rock : P2O5, CaO, SiO2, CO2, Fe2O3, Al2O3, F, K2O, MgO, Na2O3, SO3, Cl2, Moisture, Organic Carbon adalah variabel dependen prediksi output produksi asam phosphate y1, konsumsi phophate rock y2 dan konsumsi asam sulfat y3.
Dengan memasukan varabel x akan diperoleh y1, y2 dan y3 yang merupakan nilai probabilitas dengan kesimpulan rendah, sedang atau tinggi. 27
TAHAP III : PENGOLAHAN DATA MODEL DECISION TREE
KAP. PRODUKSI
P.R. MESIR P.R. MAROKO
- TINGGI - SEDANG - RENDAH
- TINGGI - SEDANG - RENDAH
P.R. YORDAN
- TINGGI - SEDANG - RENDAH
28
TAHAP III : PENGOLAHAN DATA MODEL DECISION TREE
KONSUMSI PH. ROCK
P.R. MESIR P.R. MAROKO
- TINGGI - SEDANG - RENDAH
- TINGGI - SEDANG - RENDAH
P.R. YORDAN
- TINGGI - SEDANG - RENDAH
DENGAN CARA YANG SAMA DIBUAT KONSUMSI ASAM SULFAT 29
TAHAP III : PENGOLAHAN DATA MODEL DECISION TREE Masukan variable x dari kualitas phospahate rock kedalam rumus-rumus dibawah ini untuk mendapatkan probabilitas variabel y (y1, y2dan y3), Entropy (p1, p1, p1 .............pn) = -p1log p1 – p2log p2 .................................. pnlog pn
dimana nilai A adalah semua nilai mungkin dari atribut A dan yc adalah subset dari y dan A mempunyai nilai c.
30
log2
TAHAP III : PENGOLAHAN DATA MODEL DECISION TREE Intricic Info (S, A) (Split Information) = -
Gain Ratio :
si
∑ s log2
si s
dimana s adalah s1........sc dan c adalah sub set yang dihasilkan dari pemecahan s dengan menggunakan atribut A yang mempunyai sebanyak c nilai. Gam ratio (S, A) =
Gain ( S , A) insitiansic info (s, A)
Indek ini, jika kelas obyek dinyatakan dengan k, k-1,2,3,......c adalah jumlah kelas untuk variable/output dependen y, maka gini untuk cabang A dihitung seperti dibawah ini : c
IG (A) = 1 − ∑ P k2 k =1
31
TAHAP IV : PEMILIHAN MODEL KLASIFIKASI Untuk membandingkan model naive bayes dan decision tree dengan melihat Error terkecil atau melalui kriteria dibawah ini :
Akurasi
Jumlah prediksi benar = -------------------------- , Jumlah total Prediksi
atau
Jumlah prediksi salah Error rate = ------------------------Jumlah total prediksi
32
TAHAP V : ANALISIS DAN KESIMPULAN
• MENGUJI MODEL , APAKAH MODEL KLASIFIKASI PADA METODE
DATA MINING DENGAN YANG DIKEMBANGKAN SUDAH BISA MENJAWAB PERMASALAHAN DALAM TOPIK PENELITIAN • MELAKUKAN ANALISIS KE SELURUH PROSES PENELITIAN SERTA MENYUSUN KESIMPULAN SARAN ,SERTA UNTUK MENJADI PERSPEKTIF PENELITIAN DIKEMUDIAN HARI..
33
PENGOLAHAN DATA MENENTUKAN ERROR RATE/TINGKAT AKURASI 1. MODEL NAÏVE BAYES MULAI BACA DATA FILE EXCELL .xls
Data analisa phosphate rock th. 2004-2009 Y1(Prod. As. Phosphate) Rendah Y2 (Kons. Phosp.Rock) Sedang Y3 (Kons. Asam Phosp.) Tinggi
KLASIFIKASI OUT PUT (Y)
DATA X 100
Menentukan level output Y
HITUNG PROBABILITAS OUTPUT (Y)
P(Y) = Y/JUMLAH DATA
HITUNG PROBABILITAS Xn Y UNTUK SETIAP KONDISI OUTPUT
Y1(Prod. As. Phosphate) Y2 (Kons. Phosp.Rock) Y3 (Kons. Asam Phosp.)
KLASIFIKASI INPUT (X)
DATA X 100
Rendah Sedang Tinggi
DESKRIT, DIKLASIFIKASI MENJADI 10 RANGE UNTUK MEMUDAHAKAN PERHITUNGAN DENGAN MATLAB
A
34
∏
A HITUNG PROBABILITAS Xn Yj UNTUK SETIAP KONDISI JENIS X DAN Y
MATRIX PROB. (3 X 137) TIAP UNSUR X DARI PHOSP. ROCK
ESTIMASI OUTPUT Y1,Y2 DAN Y3 P(Yj) . P (Xi │Yj)
MATRIX PROB. (3 X 137) UNTUK OUTPUT Y1 Y2 DAN Y3
MENGKOMPARASI ESTIMASI OUTPUT Y
MEMBANDINGKAN MASING OUTPUT Y1, Y2 DAN Y3
∏
MEMBANDINGKAN ESTIMASI OUPUT DENGAN O UTPUT DATA ASLI
SELESA I
MEMBANDINGKAN ESTIMASI OUPUT DENGAN O UTPUT DATA ASLI, ERROR RATE DAPAT DIKETAHUI
2. DECISION TREE (CART) 2. DECISION TREE MULAI
OUTPUT
LABELISASI OUTPUT (Y) PADA DATA .xl
BACA DATA FILE EXCELL .xls
IMPLEMENTASI ALGORITMA CART DALAM MATLAB
Metode Klasifikasi
Metode Regresi
SELESAI
Y1(Prod. As. Phosphate) Y2 (Kons. Phosp.Rock) Y3 (Kons. Asam Phosp.)
LABEL
1 = Rendah 2 = Sedang 3 = Tinggi
Data analisa phosphate rock th. 2004-2009
Set Training input (x) dan output (Y) Set Testing input (P) dan output (T) Set data diambil keseluruhan (137 data) MEMBUAT DEC. TREE BERDASAR PREDIKTOR X DAN RESPON Y (TREEFIT) DAN MMBUAT TAMPILAN DECISION TREE. TEST HASIL DEC. TREE BERDASAR PREDIKTOR X (TREEVAL) SELANJUTNYA DIBANDINGKAN UNTUK MENGETAHUI ERROR RATENYA.
MEMBANDINGKAN MODEL
PEMILIHAN MODEL MODEL NAÏVE BAYES
MODEL DECISION TREE METODE KLASIFIKASI MODEL DENGAN ERROR RATE TERRENDAH M0DEL DECISION TREE METODE REGRESI
Tabel 4-1 Perbandingan Model Respons/ Output Error rate Naïve Bayes (%)
Error rate Decision Klasifikasi (%)
Tree
Error rate Decision Tree Regresi (%)
Produk Asam Phosphate (Y1)
11,68
7,30
20,44
Konsumsi Phosphate Rock (Y2)
28,71
12,41
40,88
Konsumsi Asam Sulfat (Y3)
19,46
16,06
57,66
ANALISA DARI TABEL 4-1, ERROR RATE MODEL NAÏVE BAYES DAN DECISION TREE (CART) BERBEDA HASILNYA, DALAM PENELITIAN INI DECISION TREE (METODE KLASIFIKASI) LEBIH BAIK UNTUK MEMPREDIKSI OUTPUT 1. Decision tree cara pengelompokan objek lebih mudah dan disetiap atribut ditanyakan disimpul dan jawaban dari atribut dinyatakan dalam cabang sampai akhir ditemukankat katagori dari suatu objek disimpul terakhir 2. Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara kondisional adalah saling bebas jika diberikan nilai input atau diberikan nilai output, probabilitas mengamati secara bersamaan adalah produk dari probabilitas dari individu
ANALISA ERROR RATE OUTPUT MODEL NAÏVE BAYES DAN DECISION TREE (ERROR RATE TIDAK BISA 0%) 1. OUTPUT Y1, PRODUKSI ASAM PHOSPHATE PRODUK ASAM PHOSPHATE = DENSITAS AS. PHOSPHATE X FLOW RATE - ERROR BISA TERJADI KARENA KESALAHAN ANALISA, FLOW MMETER PRODUK ASAM PHOSPHATE ERROR 2. OUTPUT Y2, KONSUMSI PHOSPHATE ROCK (ton Ph. Rock/ton Produk) - KESALAHAN PENGUKURAN PRODUK ASAM PHOSPHATE - KALIBRASI WEIGHER PHOSPHATE ROCK YANG HARUS DIKOREKSI DENGAN PENGUKURAN FISIK PHOSPHATE ROCK DI STORAGE 3. OUTPUT Y1, KONSUMSI ASAM SULFAT (ton As. Sulfat/ton Produk) - KESALAHAN PENGUKURAN PRODUK ASAM PHOSPHATE - ERROR BISA TERJADI KARENA KESALAHAN ANALISA AS. SULFAT, FLOW MMETER ERROR
ANALISA ERROR RATE OUTPUT MODEL DECISION TREE METODE REGRESI DAN KLASIFIKASI Level Pruning Decision Tree
Respons/ Output
Metode Klasifikasi (%)
Metode Regresi (%)
Produk Asam Phosphate (Y1)
7
14
Konsumsi Phosphate Rock (Y2)
9
18
Konsumsi Asam Sulfat (Y3)
7
15
LEVEL PRUNING DECISION TREE METODE KLASIFIKASI LEBIH BAIK DARI METODE REGRESI, MAKA DECISION TREE METODE KLASIFIKASI BISA DI GUNAKAN UNTUK PREDIKSI KASUS INI
TESTING PREDIKSI DECISION TREE METODE KLASIFIKASI : MULAI MASUKAN NILAI PREDIKTOR
PILIH SALAH SATU INPUT X/PREDIKTOR DARI DATA EXCEL, MISAL PADA BARIS 11
X=dat(1:137,2:16);
MASUKAN BARIS 11 PADA TESTING UNTUK INPUT DAN OUTPUT
Y1=dat(1:137,20); Y2=dat(1:137,21); Y3=dat(1:137,22); P=dat(11 :11,2:16);
JALANKAN PROGRAM MATLAB
Respons/ Output Label/Prediksi T1=dat(11:11,20);
Label/DataExcell/ awal
T2=dat(11:11,21);
BANDINGKAN DATA OUTPUT AWAL DAN OUTPUT HASIL PREDIKSI SELESAI
Produk Asam 3 (tinggi) T3=dat(11:11,22); Phosphate (Y1)
3 (tinggi)
Konsumsi Phosphate Rock (Y2)
2 (sedang)
2 (sedang)
Konsumsi Asam Sulfat (Y3)
3 (tinggi)
3 (tinggi)
KESIMPULAN MODEL DECISION TREE (CART)
MODEL NAÏVE BAYES
METODE CLASIFICATION METODE REGRESSION
ERROR RATE DIBANDINGKAN
MODEL DECISION TREE (CART) METODE CLASIFICATION
1.CART dapat melakukan eksplorasi data untuk penyusunan metode klasifikasi yang melibatkan banyak predictor maupun respon dengan ukuran besar dan kompleks. Eksplorasi data ini dapat dilakukan dengan lebih mudah untuk melihat hubungan antara respon kontinu dengan prediktornya
KESIMPULAN 2.Decision Tree metode klasifikasi pada metode data mining yang dikembangkan bisa menjawab permasalahan pemilihan supplier phosphate rock unit asam phosphate yang menjadi permasalahan dalam topik penelitian. 3.Bila dibandingkan antara Model Naïve Bayes, Decision Tree metode regresi maupun decision tree metode klasifikasi berdasar error rate, maka yang paling tepat untuk bisa menjawab supplier phosphate rock di unit asam phosphate yang dipilh adalah model decision tree metode klasifikasi 4. Diperlukan data analisa phosphate rock dari supplier : P2O5, CaO, SiO2, CO2, Fe2O3, Al2O3, F, K2O, MgO, Na2O3, SO3, Cl2, Moisture, Organic Carbon sebagai input untuk mempermudah manajemen perusahaan memilih supplier phosphate rock berdasar prediksi yang diperoleh 5. Dengan mencoba menjalankan “coba_decision_tree”untuk testing prediksi terbukti hasilnya bisa dipakai untuk memprediksi.
SARAN Pada penelitian ini terdapat saran saran yang bisa memberikan manfaat bagi pihak perusahaan PT Petrokimia Gresik atau pihak lain yang berkepentingan terhadap penelitian ini, seperti dibawah ini : 1. Dari analisis perlu dikembangkan lebih lanjut penelitian penelitian terhadap hal hal yang mempengaruhi error rate untuk prediksi respons/output memprediksi kapasitas produksi asam phosphate, konsumsi phosphate rock dan konsumsi asam sulfat dengan memperbaiki kesalahan-kesalahan analisa maupun sistem kalibrasi alat ukur seperti weigher phosphate rock dan fow meter produk asam phosphate maupun asam sulfat 2. Penelitian ini bukanlah merupakan hasil akhir, melainkan awal dari penelitian penelitian selanjutnya mengenai metode data mining dalam manajemen industry seperti minimilisai cost, sehingga proses pemilihan supplier phosphate rock bisa lebih muda dilakukan.
TERIMA KASIH ATAS PERHATIANNYA
45
JADUAL PENELITIAN
46