KATALOG BPS: 1202031 ISSN: 2086–4132
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK TAHUN 6, VOLUME 2, DESEMBER 2014
Kajian Penghitungan Nilai Tukar Petani Tanaman Pangan (NTPP) di Jawa, Bali, dan Nusa Tenggara Tahun 2011 – 2013 EKARIA dan ATIKA NASHIRAH HASYYATI Metode C-Means Cluster dan Fuzzy C-Means Cluster pada Kasus Pengelompokan Desa Menurut Status Ketertinggalan (Studi di Kota Metro dan Kabupaten Lampung Timur) SUKIM
Pengaruh Foreign Direct Investment (FDI) terhadap Pertumbuhan Ekonomi 10 Negara ASEAN AISYAH FITRI YUNIASIH Daya Saing dan Variabel yang Memengaruhi Ekspor Batubara Indonesia di Delapan Negara Tujuan Ekspor Tahun 2002-2012 HARIANTO SARDY PURBA dan FITRI KARTIASIH Framework untuk Mendeteksi Pemalsuan Data pada Mobile Survey IBNU SANTOSO Pengembangan Sistem Web Crawler Sebagai Sarana Riset Media Secara Otomatis (Studi di Subdit Neraca Rumah Tangga dan Institusi Nirlaba) ENGGELIN GIACINTA WONGKAR dan YUNARSO ANANG SULISTIADI
UNIT PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT SEKOLAH TINGGI ILMU STATISTIK (UPPM-STIS)
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK Journal of Statistical Application & Statistical Computing No Publikasi / Publication Number: 02700.1004 Katalog BPS / BPS Catalogue: 1202031 No ISSN / ISSN Number: 2086-4132 Ukuran Buku / Book Size: 14,8 cm x 21,5 cm Jumlah Halaman / Number of Pages: 139 + v Diterbitkan oleh / Published by: Sekolah Tinggi Ilmu Statistik STIS-Statistics Institute Boleh dikutip dengan menyebut sumbernya May be cited with reference to the source
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK Pelindung
: Dr. Hamonangan Ritonga, M.Sc.
Pemimpin Umum Redaksi
: Ir. Ekaria, M.Si.
Mitra Bestari
: Prof. Dr. Abuzar Asra Dr. Hari Wijayanto
Dewan Editor
: Dr. Budiasih Dr. Said Mirza Pahlevi Dr. Muchammad Romzi Dr. I Made Arcana Dr. Setia Pramana
Sekretaris Redaksi
: Retnaningsih, M.E.
Disain Grafis
: Ribut Nurul Tri W, M.S.E.
Alamat Redaksi
: Sekolah Tinggi Ilmu Statistik Jl. Otto Iskandardinata 64C Jakarta Timur 13330 Telp. 021-8191437
TAHUN 6, VOLUME 2, DESEMBER 2014
KATALOG BPS: 1202031 ISSN: 2086-4132
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK Kajian Penghitungan Nilai Tukar Petani Tanaman Pangan (NTPP) di Jawa, Bali, dan Nusa Tenggara Tahun 2011 – 2013 EKARIA dan ATIKA NASHIRAH HASYYATI
1-18
Metode C-Means Cluster dan Fuzzy C-Means Cluster pada Kasus Pengelompokan Desa Menurut Status Ketertinggalan (Studi di Kota Metro dan Kabupaten Lampung Timur) SUKIM
19-51
Pengaruh Foreign Direct Investment (FDI) terhadap Pertumbuhan Ekonomi 10 Negara ASEAN AISYAH FITRI YUNIASIH
52-68
Daya Saing dan Variabel yang Memengaruhi Ekspor Batubara Indonesia di Delapan Negara Tujuan Ekspor Tahun 2002-2012 HARIANTO SARDY PURBA dan FITRI KARTIASIH Framework untuk Mendeteksi Pemalsuan Data pada Mobile Survey IBNU SANTOSO Pengembangan Sistem Web Crawler Sebagai Sarana Riset Media Secara Otomatis (Studi di Subdit Neraca Rumah Tangga dan Institusi Nirlaba) ENGGELIN GIACINTA WONGKAR dan YUNARSO ANANG SULISTIADI
69-93
94-114
115-139
PENGANTAR REDAKSI Syukur Alhamdulillah, di akhir tahun 2014 “Jurnal Aplikasi Statistika dan Komputasi Statistik” tahun 6, volume 2, Desember 2014 dapat diterbitkan. Jurnal kampus STIS ini dapat terwujud atas partisipasi Bapak/Ibu dosen di STIS beserta mahasiswa bimbingan skripsinya yang telah mengirimkan artikel kepada redaksi, serta peran dari para editor jurnal. Untuk atensi dan kerjasama yang baik guna keberlangsungan terbitnya jurnal ini redaksi mengucapkan terimakasih. Artikel yang dimuat dalam edisi jurnal kali ini menyajikan berbagai variasi penggunaan metode statistika yang diterapkan di bidang ekonomi, dan penggunaan teknologi komputasi dalam pengumpulan data statistik. Semoga artikel dalam jurnal ini dapat menambah pengetahuan para pembaca tentang penggunaan metode statistika serta komputasi statistik pada berbagai jenis data. Redaksi terus menunggu artikel-artikel ilmiah selanjutnya dari Bapak/Ibu guna dapat menghasilkan publikasi yang menjadi salah satu sarana untuk memberikan sosialisasi statistika bagi masyarakat.
Jakarta, Desember 2014 Salam,
Ekaria
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
KAJIAN PENGHITUNGAN NILAI TUKAR PETANI TANAMAN PANGAN (NTPP) DI JAWA, BALI, DAN NUSA TENGGARA TAHUN 2011 – 2013
Ekaria Dosen Sekolah Tinggi Ilmu Statistik
Atika Nashirah Hasyyati Staf Badan Pusat Statistik
Abstract This research was aimed to examine the relevance of the Farmers’ Term of Trade (FTT) formula (Modified Laspeyres) by comparing with the Modified Laspeyres Plus and the Fisher-WM formulas. The result presented that FTT of Food Crop applying Fisher-WM had nearly similar patterns with the Modified Laspeyres, while the Modified Laspeyres Plus tended to fluctuative patterns. The FTT Fisher-WM had
similar pattern with share of nonfood
expenditure, farmers’ purchasing power, and farming cost. Foreasting of FTT (Fisher-WM) showed nearly similar result with FTT of BPS-Statistics Indonesia published in October and November 2013. The welfare quality of the food crop farmers in West Java, Banten, and DIY provinces was categorized as high welfare level; in Central and East Java provinces was categorized as middle welfare level; in Bali, West and East Nusa Tenggara provinces was categorized as low welfare level. Based on the results, the Modified Laspeyres formula has been still relevant to be applied, except in revealing the seasonal pattern of food crop production as shown by the Fisher-WM.
Keywords: FTT, Modified Laspeyres, Modified Laspeyres Plus, Fisher-WM, welfare
I.
PENDAHULUAN
Nilai Tukar Petani (NTP) yang dikeluarkan Badan Pusat Statistik (BPS) sering menuai kritik karena dianggap kurang dapat mewakili kesejahteraan petani Indonesia sesungguhnya. Pada intinya, permasalahan tersebut ada karena kelemahan NTP yang di antaranya adalah penggunaan kesamaan kuantitas produksi antarwaktu, melalui NTP tidak dapat diketahui seluruh pendapatan yang diterima petani sesungguhnya, dan NTP hanya memandang TAHUN 6, VOLUME 2, DESEMBER 2014
1
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
kesejahteraan petani dari segi kuantitatif. Walaupun demikian, NTP telah memuat separuh informasi tentang pendapatan petani sehingga disebut proxy kesejahteraan petani secara near real time dengan asumsi kesamaan kuantitas produksi antarwaktu (Tim Subdit Statistik Harga Perdesaan dan Unit Kerja Pimpinan BPS1, 2013). Kesamaan kuantitas produksi antarwaktu digunakan dengan terlebih dahulu menentukan waktu dasar yang selanjutnya data kuantitas tersebut digunakan selama beberapa waktu ke depan. Penggunaan kesamaan kuantitas produksi antarwaktu dinilai kurang relevan karena dengan kuantitas tetap berarti NTP tidak mengakomodasikan kemajuan produktivitas pertanian, kemajuan teknologi dan pembangunan. Sebagaimana diketahui bahwa kemajuan produktivitas pertanian sebagai kunci penentu kenaikan produksi yang mana produksi setiap tahunnya berbeda – beda. Ditambah lagi, tidak terakomodasinya kemajuan teknologi dan input produksi yang menggambarkan pembiayaan usaha tani mengakibatkan tidak dapat diketahui naik atau turunnya kesejahteraan petani pada tahun berjalan. Lagi pula, penggunaan tahun dasar dibandingkan dengan tahun berjalan berpotensi menjadi sumber kesalahan dalam menghasilkan indeks (Erickson, 1996). Di samping itu, melalui NTP tidak dapat diketahui seluruh pendapatan yang diterima petani sesungguhnya. Hal ini disebabkan oleh komponen penyusun NTP yang tidak memuat pendapatan di luar usaha tani, padahal hasil SPP 2013 menunjukkan bahwa pendapatan dari usaha di sektor pertanian hanya mencakup 46,7 persen dari total pendapatan rumah tangga pertanian. Apabila hanya mengandalkan usaha pertanian, petani akan sulit terbebas dari kemiskinan. Kemiskinan petani tergambar dari rendahnya pengeluaran nonmakanan dibandingkan dengan pengeluaran makanan. Oleh karena itu, pengembangan pendapatan di luar usaha tani akan sangat membantu peningkatan kesejahteraan petani seperti dengan mengolah hasil produk pertanian sehingga memiliki nilai tambah. Berdasarkan paparan di atas, NTP penting untuk dikaji salah satunya dengan mengkaji relevansi
formula
NTP
(Modified
Laspeyres)
yang
dapat
dilakukan
dengan
membandingkannya dengan formula yang mengakomodasi penggunaan kuantitas periode berjalan. Penelitian ini dibatasi pada NTP subsektor tanaman pangan di Jawa, Bali, dan Nusa Tenggara. Hal ini disebabkan oleh subsektor tanaman pangan mendominasi subsektor pertanian di Indonesia (berdasarkan ST 2013, dari 31,7 juta petani di Indonesia, sebanyak 20,4 juta petani adalah petani tanaman pangan). Subsektor tanaman pangan yang mendominasi pertanian di Indonesia sebagian besar rumah tangga usaha pertaniannya berada di wilayah Jawa, Bali, dan Nusa Tenggara. Rumah tangga usaha tanaman pangan di delapan provinsi di 1
Disampaikan oleh Sasmito Hadi Wibowo, Deputi Bidang Statistik Distribusi dan Jasa BPS RI, pada 28 Maret 2013.
2
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Jawa, Bali, dan Nusa Tenggara mencapai sekitar 69 persen dari seluruh rumah tangga tanaman pangan di Indonesia (ST 2013). Selain itu, wilayah Jawa, Bali, dan Nusa Tenggara dipilih karena memiliki pola hujan monsoon (Daryatno, 2013) yang akan berpengaruh terhadap produksi tanaman pangan di wilayah tersebut. Adapun tujuan khusus dari penelitian ini yaitu: (1) melakukan perbandingan NTPP Modified Laspeyres (publikasi BPS) dengan Modified Laspeyres Plus dan Fisher-WM di Jawa, Bali, dan Nusa Tenggara periode Januari 2011 – September 2013; (2) mempelajari kemiripan NTPP dengan ukuran kesejahteraan lain (pengeluaran nonmakanan, daya beli petani, dan pembiayaan usaha tani); (3) mengetahui kesesuaian penghitungan NTPP dibandingkan dengan NTPP publikasi BPS; (4) mengetahui tingkat kesejahteraan petani di Jawa, Bali, dan Nusa Tenggara berdasarkan NTPP.
II.
METODOLOGI
Kesejahteraan Petani Badan Pusat Statistik (2010) menggunakan delapan indikator kesejahteraan yaitu kependudukan, kesehatan dan gizi, pendidikan, ketenagakerjaan, taraf dan pola konsumsi, perumahan dan lingkungan, kemiskinan serta sosial lainnya yang menjadi acuan dalam upaya peningkatan kualitas hidup. Jadi, kesejahteraan dapat didefinisikan sebagai terpenuhinya beberapa aspek kehidupan seperti kesehatan, pendidikan, dan perumahan sesuai dengan standar kualitas hidup yang layak, yang dapat digambarkan pula melalui kemampuan memenuhi aspek – aspek kehidupan tersebut. Pada hakikatnya, pembangunan sektor pertanian diperlukan untuk meningkatkan kesejahteraan petani. Adapun kesejahteraan petani ditunjukkan melalui perkembangan struktur pendapatan, perkembangan pengeluaran untuk pangan, dan perkembangan nilai tukar petani (Burhansyah, 2012). Perkembangan struktur pendapatan menunjukkan perkembangan dari sumber pendapatan utama keluarga petani. Selanjutnya Burhansyah, (2012) menjelaskan bahwa perkembangan pengeluaran untuk pangan dapat dipakai sebagai salah satu indikator keberhasilan ekonomi perdesaan. Hal ini disebabkan oleh semakin besarnya pangsa pengeluaran untuk pangan menunjukkan bahwa pendapatan rumah tangga tani masih terkonsentrasi untuk memenuhi kebutuhan dasar (subsisten). Hukum Engel menyatakan bahwa dengan asumsi selera seseorang adalah tetap, proporsi pengeluaran rumah tangga untuk pangan akan semakin kecil seiring dengan semakin meningkatnya pendapatan (Susilowati, dkk., 2010). Selain perkembangan struktur pendapatan dan perkembangan pengeluaran untuk
TAHUN 6, VOLUME 2, DESEMBER 2014
3
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pangan, perkembangan nilai tukar petani secara konsepsi merupakan representasi tingkat kesejahteraan petani. Askari dan Cummings (1977: 258) yang membahas model Nerlove memberi suatu solusi bahwa harga riil dari output pertanian dapat ditentukan dari salah satu hal berikut: (a) the price of the crop actually received by farmers; (b) the ratio of the price of the crop received by farmers to some consumer price index; (c) the ratio of the price of the crop received by farmers to some price index of the farmers’ input; (d) the ratio of the price of the crop received by farmers to some index of the price of competitive crops (or the price of the most competitive crops). Poin (a) yang merupakan harga yang diterima oleh petani termasuk komponen dari NTP. Sementara itu, poin (b) identik dengan daya beli rumah tangga tani, dan poin (c) dapat dipandang sebagai pembiayaan usaha tani. Nilai Tukar Petani (NTP) merupakan salah satu proxy tingkat kesejahteraan petani di Indonesia. Berdasarkan konsep dan definisi Badan Pusat Statistik, Nilai Tukar Petani adalah angka perbandingan antara indeks harga yang diterima petani dengan indeks harga yang dibayar petani yang dinyatakan dalam persentase.
Formula Indeks Utama (Major Index Formula) Formula indeks utama adalah indeks Laspeyres, Paasche, dan Fisher. Indeks harga Laspeyres dengan kuantitas periode pertama (lebih awal) digunakan untuk mengetahui biaya yang diperlukan pada periode kedua, relatif terhadap periode pertama, untuk membayar keranjang barang dan jasa yang sama yang dibayar pada periode pertama (Pink, 2011). Pendekatan yang digunakan pada indeks Paasche adalah kuantitas periode kedua (periode yang lebih terkini). Hal ini untuk mengetahui biaya yang diperlukan pada periode pertama, relatif terhadap periode kedua, untuk membayar keranjang barang dan jasa dalam jumlah sama yang dibayar pada periode kedua (Pink, 2011). Indeks Fisher dengan kombinasi (rata – rata) dari kuantitas dua periode merupakan pendekatan yang digunakan untuk mengatasi beberapa kelemahan dalam penggunaan keranjang yang tetap pada kedua periode (Pink, 2011). Indeks Fisher diperoleh berdasarkan rata – rata geometrik dari perkalian antara indeks Laspeyres dan Paasche. Oleh karena itu, indeks Fisher dianggap sebagai indeks yang paling ideal. Selain itu, indeks Fisher dikatakan ideal karena hanya formula indeks Fisher yang memenuhi time reversal test (Afriat dan Milana, 2009). Ketika sejumlah barang harganya naik sangat cepat, konsumen akan memilih barang substitusi yang harganya naik lebih lambat atau harganya lebih murah. Pada kondisi seperti itu, indeks harga Fisher - Ideal akan lebih mencerminkan efek substitusi daripada indeks Laspeyres sehingga indeks harga Fisher - Ideal disebut indeks superlatif (McCully, Moyer, dan Stewart, 2007).
4
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Formula Indeks yang Dikembangkan BPS Untuk mengatasi permasalahan sering terjadinya perubahan kualitas dari jenis barang/jasa yang masuk dalam paket komoditas IHK, maka rumus indeks Laspeyres telah dimodifikasi (BPS, 2013). Modified Laspeyres Plus adalah modifikasi ulang dari formula Modified Laspeyres dengan tujuan indeks yang dihasilkan dapat lebih sensitif terhadap gejolak harga, namun memiliki standar error yang tinggi, formula ini dikembangkan BPS pada 2010 (Suprihartiningsih, 2012; Wibowo, 2013). Hal ini disebabkan oleh formula Laspeyres biasa hanya akan menghasilkan indeks yang representatif pada kondisi normal tanpa adanya perubahan harga yang ekstrem. Selain itu, untuk menghitung IHK pada 2011 BPS mengembangkan Fisher-WM yang memiliki tujuan sama dengan Modified Laspeyres Plus, namun memiliki standar error rendah (Wibowo, 2013). Hasil simulasi Herliati (2011), pada data empiris untuk penghitungan IHK, menyimpulkan bahwa indeks Fisher-WM merupakan indeks yang paling mendekati indeks Fisher.
Metode Analisis Formula NTP yang digunakan BPS (Modified Laspeyres) dalam penelitian ini dibandingkan dengan formula Modified Laspeyres Plus dan Fisher-WM. Cakupan wilayah penelitian adalah delapan provinsi di Jawa, Bali, dan Nusa Tenggara (kecuali DKI Jakarta) dengan menggunakan tahun dasar 2007 selama Januari 2011 – September 2013. Data dalam penelitian ini merupakan data sekunder (subround, bulanan, dan triwulanan) tahun 2011 – 2013 yang diperoleh dari Subdit Statistik Tanaman Pangan (luas panen dan produktivitas), Subdit Statistik Harga Perdesaan (NTP), dan Susenas Modul Konsumsi (jumlah konsumsi masing – masing komoditas). Penelitian ini membahas hasil penghitungan NTPP ketiga metode dengan grafik dan tabel. Adapun kemiripan NTPP dengan ukuran kesejahteraan lain (pengeluaran nonmakanan, daya beli petani, dan pembiayaan usaha tani) dilihat melalui koefisien korelasi. Untuk mengetahui kesesuaian NTPP digunakan metode Holt Winters’ Seasonal Additive. Selanjutnya, untuk mengetahui tingkat kesejahteraan petani tanaman pangan di Jawa, Bali, dan Nusa Tenggara digunakan analisis cluster.
Korelasi Alternatif koefisien korelasi adalah korelasi Rank Spearman (Siegel, 1986):
rs 1
6 d i2 n3 n
TAHUN 6, VOLUME 2, DESEMBER 2014
(1) 5
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Korelasi Rank Spearman ini digunakan untuk data yang minimal berskala ordinal. Selain itu, korelasi Pearson digunakan untuk data yang minimal berskala interval, korelasi ini cocok untuk sepasang data yang memiliki hubungan linier.
n X i Yi X i Yi
r
n X i2 X i
2
n Yi2 Yi
2
(2)
Makna kekuatan hubungan dari besaran koefisien korelasi adalah semakin mendekati -1 atau 1 maka terdapat hubungan yang sangat kuat, sebaliknya semakin mendekati nilai nol maka hubungan sangat lemah atau semakin kurang berarti. Holt Winters’ Seasonal Metode ini digunakan khusus untuk data dengan pola musiman (seasonal) yang tidak efektif apabila dimodelkan dengan regresi polynomial. Metode yang dikenal dengan metode Winters’, diperkenalkan oleh Holt pada 1957 dan Winters pada 1960. Metode ini dibagi menjadi dua seasonal adjustment yaitu additive dan multiplicative (Montgomery, Jennings, dan Kulahci, 2008). 1. Additive Seasonal Model Metode additive digunakan ketika terdapat trend linier dan pola musiman yang bersifat additive. Hyndman, dkk. (2008) menuliskan metode Holt-Winters’s additive sebagai berikut. Additive Seasonality (A, A Method) Level
: lt = l(yt - st-m) + (1 - etholt-1 + bt-1 )
(3)
Growth
: bt = β* (lt - lt-1 ) + (1 - β* ) bt-1
(4)
Seasonal
: st = so(yt - lt-1 - bt-1 ) + (1 - st-m
(5)
Forecast
: ŷ t+h|t = lt + bt h + st-m+h+m
(6)
2. Multiplicative Seasonal Model Model ini digunakan apabila pola musimannya bersifat multiplicative. Hyndman, dkk (2008) dalam Forecasting with Exponential Smoothing menuliskan persamaan dasar untuk metode Holt-Winters’ Multiplicative sebagai berikut: y
Level:
t lt = el s -m + (1 - berlt-1 + bt-1 )
(7)
Growth:
bt = β* (lt - lt-1 ) + (1 - +* ) bt-1
(8)
Seasonal:
st =
st-m
(9)
Forecast:
ŷ t+h|t = (lt + bt h) st-m+h+m
(10)
6
t
γ yt lt-1 + bt-1
+ (1 -
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Keterangan: m:
panjang seasonal (jumlah bulan musiman setahun)
lt :
level series
bt :
pertumbuhan
st :
komponen seasonal
ŷ t+h|t : peramalan pada periode h h+m =1, 2, . .., m Parameter (α,β* ,dan γ) nilainya berkisar antara 0 dan 1.
Analisis Cluster Pengelompokan berdasarkan analisis Cluster dilakukan melalui ukuran kemiripan (similarity) atau ketakmiripan (dissimilarity). Salah satu ukuran kemiripan adalah jarak Euclidean. Johnson dan Wichern (2007) menyebutkan bahwa jarak Euclidean (garis lurus) antara dua p-dimensi observasi (items) x' = [x1 , x2 , ..., xp ] dan y' = [y1 , y2 , ..., yp ] adalah 2
2
2
'
d(x,y) = √(x1 - y1 ) + (x2 - y2 ) + ala (xp - yp ) =√(x - y) (x - y)
(11)
Selain jarak Euclidean, jarak dari dua observasi berdimensi p dapat dihitung dengan jarak Mahalanobis. Jarak Mahalanobis dengan A = S-1 , dengan S yang memuat varian dan kovarian dari sampel. Dengan demikian, jarak Mahalanobis memperhitungkan korelasi antarvariabel. Jarak Mahalanobis dapat dihitung dengan rumus: '
d(x,y) = √(x - y) A (x - y)
1.
Metode Berhierarki
a.
Teknik Penggabungan (Agglomerative)
(12)
Teknik ini dimulai dari satu individu/objek dilanjutkan dengan penggabungan objek yang paling banyak memiliki kemiripan. Begitu seterusnya, penggabungan dilanjutkan berdasarkan kemiripannya. Ada beberapa metode yang menggunakan dasar kemiripan antarobjek, yaitu pautan tunggal (single linkage atau jarak minimum atau nearest neighbor), pautan lengkap (complete linkage atau jarak maksimum atau farthest neighbor), average linkage (jarak rataan), centroid (sentroid), median, dan metode ward’s. Menurut Seber (2004), metode median dan metode centroid memiliki kesamaan. Perbedaannya adalah pada metode median, cluster baru digantikan dengan rata-rata tidak tertimbang, x̅ =
1 2
(x̅ 1 + x̅ 2 ) (Gower
dalam Seber, 2004). Metode median digunakan untuk mengatasi kelemahan metode centroid, TAHUN 6, VOLUME 2, DESEMBER 2014
7
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
apabila kelompok yang kecil digabungkan dengan yang besar akan menghilangkan identitasnya dan sentroid baru akan ada di kelompok yang besar. b.
Teknik Pembagian (Divisive) Berbeda dengan teknik penggabungan, teknik pembagian bekerja dengan membagi
sebuah objek menjadi dua sedemikian rupa sehingga antarobjek tersebut terbentuk subkelompok yang “jauh dari” objek lainnya. Selanjutnya, subkelompok tersebut dibagi kembali menjadi subkelompok yang lebih kecil sehingga berbeda, begitu seterusnya. 2.
Metode Nonhierarki Jumlah cluster, K, ditentukan terlebih dahulu sebagai tahap awal dari prosedur
mengelompokkan dan biasanya metode ini lebih digunakan untuk mengelompokkan objek daripada variabel. Metode ini dapat dimulai dengan membagi objek ke dalam kelompokkelompok atau dengan membentuk pusat (nuclei) cluster terlebih dahulu.
Perbandingan Formula Indeks Data harga (Pt , P0 ) dan volume/kuantitas (Q0 ) diperlukan untuk menghitung NTPP telah tercakup dalam data diagram timbang penghitungan BPS. Penghitungan NTPP untuk indeks harga yang diterima petani (IT) dengan menggunakan data volume produksi tanaman pangan periode berjalan (bulanan) yang diperoleh dengan mengalikan luas panen (bulanan) dengan produktivitas (subround). Komoditas dalam IT dengan kuantitas periode berjalan adalah kacang tanah, kacang hijau, dan kedelai karena harganya yang fluktuatif selama periode penelitian. Indeks harga yang dibayarkan petani (IB) menggunakan periode berjalan (bulanan) untuk komoditas beras, cabai, dan bawang merah dalam Indeks Konsumsi Rumah Tangga (IKRT) dan periode dasar untuk Indeks Biaya Produksi dan Penambahan Barang Modal (BPPBM). Komoditas beras, cabai, dan bawang merah dipilih dengan mempertimbangkan fluktuasi harganya. Volume periode berjalan (bulanan) untuk IKRT diperoleh melalui nilai elastisitas permintaan setiap bulan Maret dan September di tahun yang bersangkutan dari data Susenas Triwulan I dan III. Nilai elastisitas permintaan suatu barang menggunakan rumus sebagai berikut (Pyndick dan Rubinfeld, 2008): Ep
ΔQ/Q ΔP/P
(13)
Dengan Q dan P adalah kuantitas dan harga, yang berarti bahwa persentase perubahan kuantitas barang yang diminta disebabkan oleh persentase peningkatan harga dari barang tersebut. Modified Laspeyres
8
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK k
I ML(t)
Pit
P i 1
Pi(t 1)Q i0
i(t 1)
(14)
k
P
i0
i 1
Q i0
I ML(t)
: Indeks Modified Laspeyres periode ke-t
Pit
: Harga komoditas ke-i periode ke-t
Pi(t 1)
: Harga komoditas ke-i periode ke-(t-1)
Pi(t 1)Q i0
: Nilai konsumsi komoditas ke-i, periode ke-(t-1)
k
: Jumlah jenis komoditas; k = 7 (IT), k = 361 (IB)
Modified Laspeyres Plus M r
I ML (t)
i 1
r
Pit
P
i(t 1)
Pi(t 1)Q io i 1
Pit Pi(t 1)Q it Pi(t 1)
M
P i 1
i0
(15)
Q i0
I ML (t)
: Indeks Modified Laspeyres Plus periode ke-t
Pit
: Harga komoditas ke-i, periode ke-t
Pi(t 1)
: Harga komoditas ke-i, periode ke-(t-1)
Pi(t 1)Qi0
: Nilai konsumsi komoditas ke-i, periode ke-(t-1) dengan kuantitas tahun dasar
Pi(t 1)Q it
: Nilai konsumsi komoditas ke-i, periode ke-(t-1) dengan kuantitas periode ke-t
Pi0 Qi0
: Nilai konsumsi di periode dasar
M-r
: Jumlah jenis komoditas yang dihitung dengan kuantitas periode dasar
r
: Jumlah jenis komoditas yang dihitung dengan kuantitas terkini
M
: Jumlah seluruh komoditas yang tercakup dalam penghitungan NTP
Fisher-WM M s
s
I F WM(t)
Pit Q i0 Pjt Q jt i 1
j1
s
M s
P i 1
i0
Q i0 Pj0 Q jt
(16)
j1
TAHUN 6, VOLUME 2, DESEMBER 2014
9
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
I F WM(t)
: Indeks Fisher-WM periode ke-t
M
: Jumlah seluruh komoditas yang tercakup dalam penghitungan NTP
s
: Jumlah seluruh komoditas yang dihitung dengan kuantitas periode dasar
M-s
: Jumlah seluruh komoditas yang dihitung dengan kuantitas periode berjalan.
III.
HASIL DAN PEMBAHASAN
Perkembangan NTPP di Jawa, Bali, dan Nusa Tenggara Tahun 2011 – 2013 NTPP yang dihitung dengan tiga formula di Jawa, Bali, dan Nusa Tenggara selama Januari 2011 – September 2013 tidak memiliki trend naik atau turun (Lampiran). NTPP Modified Laspeyres menunjukkan pola yang cenderung stabil, sedangkan NTPP Fisher-WM dan Modified Laspeyres Plus menunjukkan pola musiman. NTPP Fisher-WM terlihat turun pada setiap awal tahun sepanjang 2011 – 2013 yang dapat disebabkan oleh kegagalan panen akibat banjir yang dialami sebagian besar petani di Jawa, Bali, dan Nusa Tenggara atau musim panen yang menyebabkan rendahnya harga jual. Sementara itu, NTPP Modified Laspeyres Plus memiliki pola musiman yang bervariasi di setiap provinsi amatan. NTPP Fisher-WM lebih stabil daripada NTPP Modified Laspeyres Plus karena memiliki error yang lebih kecil di hampir setiap bulannya selama Januari 2011 – September 2013 dan hampir di seluruh provinsi. Selain itu, berdasarkan perbandingan erornya, varian error dari NTPP Fisher-WM terhadap NTPP Modified Laspeyres jauh lebih kecil daripada NTPP Modified Laspeyres Plus terhadap NTPP Modified Laspeyres. Rata – rata error dari NTPP Fisher-WM terhadap NTPP Modified Laspeyres tidak mengalami perubahan yang tajam di setiap provinsi dan cenderung berada di atas nilai nol. Rata – rata error yang berada di atas nol berarti bahwa nilai NTPP Fisher-WM relatif lebih besar daripada nilai NTPP Modified Laspeyres. Berbeda dengan NTPP Fisher-WM, nilai NTPP Modified Laspeyres Plus relatif lebih kecil dibandingkan dengan NTPP Modified Laspeyres. Dengan demikian, NTPP FisherWM lebih mendekati NTPP Modified Laspeyres dibandingkan dengan NTPP Modified Laspeyres Plus.
10
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 1. Perbandingan error NTPP Modified Laspeyres Plus dan NTPP Fisher-WM terhadap Modified Laspeyres Provinsi (1) 32 33 34 35 36 51 51 52 53
Modified Laspeyres Plus Rata-Rata Varian Error Error (2) (3) -6,1617 52,80258 -6,7864 67,3136 6,01361 2505,74 1,07903 60,60068 -6,6701 80,6071 -16,381 58,93031 -12,27 19,44458 0,30898 297,5408 -10,335 29,55026
Fisher-WM Rata-Rata Error
Varian Error
(4) 8,83 -0,12 -2,14 1,54 6,76 2,27 0,00 6,83 -3,50
(5) 70,56349 19,42405 33,25952 21,32397 74,36192 71,81524 11,5992 15,49777 28,10694
Kemiripan NTPP dengan Pengeluaran Nonmakanan, Daya Beli Petani, dan Pembiayaan Usaha Tani Pergerakan NTPP Fisher-WM sesuai dengan pergerakan pengeluaran nonmakanan, terutama di Provinsi Jawa Barat, Jawa Tengah, DIY, NTB, dan NTT. Hal ini diperkuat oleh koefisien korelasi yang secara umum dapat dikatakan bahwa terdapat korelasi yang kuat, korelasi yang sangat kuat terjadi di Provinsi Jawa Tengah dengan koefisien korelasi mencapai 0,746 (Tabel 2). Sementara itu, hanya di Provinsi Banten yang koefisien korelasinya bertanda negatif, namun memiliki kemiripan yang dibuktikan oleh kuatnya korelasi keduanya. Pola yang tidak menentu dari pengeluaran total dan pengeluaran makanan juga terjadi pada penelitian Purwantini dan Ariani (2008) yang diduga karena rumah tangga dalam menentukan jumlah dan jenis pangan yang dikonsumsi tidak selalu mengacu pada pendapatannya. Hal ini berarti bahwa terdapat aspek lain yang menentukan pola konsumsi seperti budaya. Adanya indikasi bahwa petani akan banyak mengeluarkan biaya untuk produksi ketika terancam gagal panen sehingga kualitas produksi rendah dan kesejahteraan petani menurun. Hal ini terbukti dari grafik yang menunjukkan deviasi dari pergerakan NTPP dengan pengeluaran nonmakanan, deviasi ini terjadi di saat – saat yang biasanya petani terancam gagal panen. Hal ini sebagaimana yang dinyatakan oleh Foster dan Rausser (1990) bahwa petani harus mengalokasikan biaya dalam menghadapi kemungkinan gagal panen yang semakin meningkat. Selain itu, dalam komponen NTP, bobot BPPBM lebih tinggi dibandingkan dengan bobot
) Bali tanpa cabai
TAHUN 6, VOLUME 2, DESEMBER 2014
11
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
perumahan, sandang, pendidikan dan rekreasi, transportasi. Hal ini berarti bahwa dalam NTP sangat diperhitungkannya bobot keperluan usaha tani. Pergerakan NTPP Fisher-WM memiliki kemiripan dengan pergerakan daya beli petani/Nilai Tukar Konsumsi Petani (NTKP) selama Januari 2011 – September 2013 di Jawa, Bali, dan Nusa Tenggara. Hal ini diperkuat oleh nilai koefisien korelasi yang terbilang kuat, bahkan sangat kuat di Provinsi Jawa Barat, Jawa Tengah, Jawa Timur, Bali, dan NTT karena koefisien korelasi yang lebih dari 0,8 (Tabel 2). NTPP Fisher-WM di Jawa, Bali, dan Nusa Tenggara memiliki kemiripan dengan kemampuan petani untuk membiayai usaha taninya. Hal ini ditunjukkan oleh pergerakan NTPP Fisher-WM dengan pembiayaan usaha tani/Nilai Tukar Faktor Produksi (NTFP) dan diperkuat oleh nilai koefisien korelasi yang menunjukkan hubungan kuat (Tabel 2). NTPP Fisher-WM paling mirip dengan NTFP di Provinsi Jawa Barat dengan nilai koefisien korelasi yang mencapai 0,908, sedangkan terendah di Provinsi Jawa Tengah sebesar 0,680. Kemiripan yang ditunjukkan oleh NTPP dengan tiga ukuran tersebut menunjukkan bahwa NTPP Fisher-WM dapat menggambarkan kesejahteraan petani dari sisi pengeluaran nonmakanan, daya beli petani, dan pembiayaan usaha tani. Tingginya pengeluaran nonmakanan, daya beli petani, dan pembiayaan usaha tani menandakan bahwa kesejahteraan petani tinggi.
Tabel 2. Kemiripan NTPP dengan pengeluaran nonmakanan, daya beli petani, dan pembiayaan usaha tani Provinsi (1) Jawa Barat Jawa Tengah DIY Jawa Timur Banten Bali NTB NTT
Pengeluaran Nonmakanan (2) 0,524 0,746 0,662 0,555 -0,591 0,406 0,648 0,553
Daya Beli Petani (3) 0,928 0,811 0,787 0,890 0,763 0,913 0,660 0,947
Pembiayaan Usaha Tani (4) 0,908 0,680 0,768 0,846 0,744 0,860 0,709 0,875
Peramalan Nilai NTPP Berdasarkan peramalan yang dilakukan terhadap NTPP Fisher-WM di masing – masing provinsi, diperoleh model dengan nilai MAPE di bawah 10 persen (Tabel 3). Hal ini berarti bahwa peramalan sangat sesuai dengan publikasi NTPP BPS. Akan tetapi, peramalan di 12
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Jawa Barat, Banten, dan NTB memiliki error yang paling besar di antara provinsi lainnya pada Oktober dan November 2013. Hasil peramalannya menunjukkan angka yang lebih tinggi dibandingkan dengan data publikasi BPS, tetapi tidak berbeda jauh dengan data publikasi BPS. Selang prediksi dari hasil peramalan masih menunjukkan bahwa perbedaan dengan data publikasi BPS tidak begitu besar. Rata – rata error pada Oktober 2013 sebesar -3,64, sedangkan rata – rata error pada November 2013 sebesar -4,8473. Hal ini menunjukkan bahwa peramalan NTPP di delapan provinsi tersebut memiliki nilai yang mendekati data publikasi BPS.
Tabel 3. Peramalan NTPP di Jawa, Bali, dan Nusa Tenggara Oktober dan November 2013 Provinsi (1) Jawa Barat Jawa Tengah DIY Jawa Timur Banten Bali NTB NTT
Forecast Okt’13 (2) 119,316 104,985 115,378 103,252 125,744 92,5715 102,336 90,9182
Nov’13 (3) 123,616 105,763 120,034 101,678 128,750 94,75 100,992 89,3757
MAPE (4) 1,7898 1,5129 1,7052 1,1734 1,8550 4,7305 2,5366 1,0194
Data Publikasi BPS Okt’13 (5) 108,27 107,34 115,46 105,64 114,27 90,51 88,39 95,48
Nov’13 (6) 108,81 106,81 114,57 104,83 115,97 90,98 88,88 95,33
Pengelompokan Provinsi di Jawa, Bali, dan Nusa Tenggara Berdasarkan Kesejahteraan Petani Tanaman Pangan Pembentukan tiga kelompok di Jawa, Bali, dan Nusa Tenggara menghasilkan provinsi dengan tingkat kesejahteraan petani tanaman pangan yang tinggi adalah Provinsi Jawa Barat, Banten, dan DIY. Provinsi yang tergolong dengan tingkat kesejahteraan petani tanaman pangan yang sedang adalah Provinsi Jawa Tengah dan Jawa Timur. Adapun provinsi yang tergolong dengan tingkat kesejahteraan petani tanaman pangan yang rendah adalah Provinsi Bali, NTB, dan NTT. Kesejahteraan petani tinggi di Jawa Barat, Banten, dan DIY dapat disebabkan oleh lebih banyaknya penerimaan petani karena tidak terjadinya keterlambatan masa tanam di wilayah tersebut. Keterlambatan masa tanam disebabkan oleh El Nino dan La Nina yang menurut Juaeni, dkk. dalam Satiadi, dkk., (2010) tidak berpengaruh pada wilayah – wilayah yang memiliki topografi dataran tinggi (nilai elevasi lebih besar dari 100 meter dari permukaan laut). Topografi dataran tinggi tersebut banyak terdapat di wilayah Jawa Barat, Banten, dan DIY sehingga terdapat kadar air tanah yang cukup. Sementara itu, petani tanaman pangan di TAHUN 6, VOLUME 2, DESEMBER 2014
13
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Jawa Tengah dan Jawa Timur kesejahteraannya tergolong sedang. Apabila dilihat dari segi topografinya, wilayah dengan ketinggian di atas 100 mdpl di Jawa Tengah kurang lebih sebesar 46,73 persen, sedangkan di Jawa Timur wilayah dengan ketinggian di atas 100 mdpl hanya meliputi Kabupaten Trenggalek, Blitar, Malang, Bondowoso, Magetan, Kota Blitar, Kota Malang, dan Kota Batu. Hal ini berarti beberapa wilayah di Jawa Tengah dan Jawa Timur mudah terpengaruh oleh El Nino dan La Nina. Lebih jauh lagi, bagian timur Pulau Jawa umumnya lebih kering daripada bagian barat sehingga awal musim kemarau bergerak dari bagian timur ke arah barat (Satiadi, dkk., 2010). Adapun kesejahteraan petani tanaman pangan yang rendah di Bali, NTB, dan NTT menunjukkan bahwa di ketiga provinsi tersebut, penerimaan petani masih rendah padahal petani harus memenuhi konsumsi rumah tangga dan input usaha tani dengan biaya yang tidak sebanding dengan penerimaannya. Wilayah Bali, NTB, dan NTT adalah wilayah yang umumnya berupa lahan kering beriklim kering dengan curah hujan <2000 mm/tahun dan masa tanam <6 bulan (Agus, Subagyono, dan Surmaini, 2003).
IV.
KESIMPULAN DAN SARAN
NTPP yang dihitung dengan formula Fisher-WM lebih mendekati NTPP Modified Laspeyres dibandingkan dengan NTPP Modified Laspeyres Plus yang sangat fluktuatif. NTPP Modified Laspeyres cenderung stabil, sedangkan NTPP Fisher-WM dan Modified Laspeyres Plus menunjukkan adanya pola musiman. Selain itu, NTPP Fisher-WM memiliki kemiripan dengan ukuran kesejahteraan lain (pengeluaran nonmakanan, daya beli petani, dan pembiayaan usaha tani). Adapun hasil peramalan NTPP Fisher-WM tidak berbeda jauh dengan NTPP publikasi BPS. Hasil penelitian menunjukkan pula bahwa NTPP Fisher-WM mampu menunjukkan tiga kelompok kesejahteraan petani tanaman pangan di Jawa, Bali, dan Nusa Tenggara. Petani tanaman pangan di Jawa Barat, Banten, dan DIY memiliki kesejahteraan yang tinggi, di Jawa Tengah dan Jawa Timur kesejahteraannya sedang, sedangkan di Bali, NTB, dan NTT kesejahteraannya rendah. Berdasarkan beberapa hasil tersebut, penghitungan NTPP dengan formula indeks Modified Laspeyres masih relevan digunakan, akan tetapi tidak menunjukkan adanya pola musiman produksi tanaman pangan sebagaimana yang ditunjukkan oleh indeks Fisher-WM sebagai formula indeks yang mendekati indeks ideal (indeks Fisher). BPS dapat menghitung NTP dengan Fisher-WM sebagai formula indeks yang mendekati ideal. Untuk menerapkan NTPP Fisher-WM perlu ada survei khusus untuk beberapa komoditas di indeks harga yang diterima dan indeks harga yang dibayarkan petani. Pertimbangan dari survey khusus tersebut adalah biaya yang diperlukan sehingga Fisher-WM
14
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
dapat menjadi kurang efisien (dari segi biaya) dibandingkan dengan Modified Laspeyres. Penelitian selanjutnya dapat menambah periode penelitian (kurangnya periode penelitian dapat menjadi penyebab kemiripan dari formula Modified Laspeyres dengan Fisher-WM), menggunakan tahun dasar terbaru (2012 = 100), mencakup seluruh subsektor pertanian, dan pada 33 provinsi di Indonesia.
DAFTAR PUSTAKA
Afriat, S.N. dan Milana, C. 2009. Economics and the Price Index. New York: Routledge. Agus, F., Subagyono, K., dan Surmaini, E. 2003. Teknologi Konservasi Air dan Irigasi Suplemen Untuk Optimasi Pertanian Lahan Kering. Prosiding Lokakarya Nasional Sistem Integrasi Kelapa Sawit – Sapi 2003. Bogor: Puslitbangnak. Askari, H. dan Cummings, J. T. 1977. Estimating Agricultural Supply Response with The Nerlove Model: A Survey. International Economic Review, Vol. 18 (2), 257-292. Badan Pusat Statistik. 2010. Indikator Kesejahteraan Rakyat 2009. Jakarta: Badan Pusat Statistik. Badan Pusat Statistik. 2013. Pedoman Pengolahan Nilai Tukar Petani. Jakarta: Badan Pusat Statistik. Badan Pusat Statistik. 2013. Statistik Nilai Tukar Petani di Indonesia. Jakarta: Badan Pusat Statistik. Burhansyah, Rusli. 2012. Dinamika Indikator Kesejahteraan Petani di Kabupaten Kubu Raya dan Sanggau, Provinsi Kalimantan Barat. Siantan Hulu: Balai Pengkajian Teknologi Pertanian Kalimantan Barat. Daryatno. 2013. Implikasi Perubahan Pola Curah Hujan Terhadap Waktu Tanam Jagung (Zea mays L.) pada Lahan Kering di Daerah Gerogak Kabupaten Buleleng. Tesis. Denpasar. Erickson, Timothy. 1996. Effects of Mismeasuring Base Period Prices When Estimating the Laspeyres Index: Some Idealized Cases. Bureau of Labor Statistics Working Paper, 284. Foster, William E. dan Rausser, Gordon C. 1990. Farmer Behavior Under Risk of Failure. Working Paper, 488. Herliati, Medya. 2011. Perbandingan Formula Penghitungan Indeks Harga Konsumen (Simulasi dan Studi Kasus pada Beras dan Cabai di DKI Jakarta Periode Januari 2010 – Maret 2011). Skripsi. Jakarta. Hyndman, Rob J., dkk. 2008. Forecasting with Exponential Smoothing: The State Space Approach. Berlin: Springer. TAHUN 6, VOLUME 2, DESEMBER 2014
15
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Johnson, Richard A. dan Wichern, Dean W. 2007. Applied Multivariate Statistical Analysis. New Jersey: Pearson Prentice Hall. McCully, Clinton P., Moyer, Brian C., dan Stewart, Kenneth J. 2007. A Reconciliation between the Consumer Price Index and the Personal Consumption Expenditures Price Index. Washington: Bureau of Economic Analysis and Bureau of Labor Statistics. Montgomery, Douglas C., Jennings, Cheryl L., dan Kulahci, M. 2008. Introduction to Time Series Analysis and Forecasting. New Jersey: John Wiley & Sons. Pink, Brian. 2011. Consumer Price Index: Concepts, Sources and Methods. Canberra: Australian Bureau of Statistics. Purwantini, Tri Bastuti dan Ariani, M. 2008. Pola Konsumsi Pangan pada Rumah Tangga Petani Padi. Dinamika Pembangunan Pertanian dan Perdesaan: Tantangan dan Peluang bagi Peningkatan Kesejahteraan Petani. Bogor: Departemen Pertanian. Pyndick, Robert S. dan Rubinfeld, Daniel L. 2008. Microeconomics, Seventh Edition. New Jersey: Pearson Education. Rachmat, Muchjidin. 2000. Analisis Nilai Tukar Petani Indonesia. Disertasi. Bogor. Rachmat, M., Rivai, Rudy S., dan Nuryanti, S. 2013. Analisa Nilai Tukar Petani (NTP) Sebagai Bahan Penyusunan RPJMN Tahun 2015-2019. Jakarta: BAPPENAS. Satiadi, D., dkk. 2010. Pengembangan Model Atmosfer Berbasis PC untuk Prediksi dan Simulasi Iklim Skala Provinsi. Bandung: Lembaga Penerbangan dan Antariksa Nasional. Seber, George A. F. 2004. Multivariate Observations. New Jersey: John Wiley & Sons. Siegel, Sidney. 1986. Nonparametric Statistics for the Behavioral Sciences (Terjemahan Zanzawi Suyuti dan Landung Simatupang dalam Koordinasi Peter Hagul). Jakarta: PT Gramedia Pustaka Utama. Simatupang, Pantjar dan Maulana, Mohamad. 2007. Kaji Ulang Konsep dan Perkembangan Nilai Tukar Petani Tahun 2003 – 2006. Bogor: Pusat Analisis Sosial Ekonomi dan Kebijakan Pertanian. Sunarti, Euis dan Ali Khomsan. 2012. Kesejahteraan Keluarga Petani Mengapa Sulit Diwujudkan http://demografi.bps.go.id/phpfiletree/bahan/kumpulan_tugas_mobilitas_pak_chotib/K elompok_11/Mobilitas_Penduduk_Kelompok_11/Daftar_pustaka_fix/Sunarti-JurnalKesejahteraan_Kelurga_Petani.pdf (Diakses 1 Februari, 2014). Suprihartiningsih, Erna. 2012. Perbandingan Formula Penghitungan Indeks Harga Konsumen (Simulasi dan Studi Kasus pada Beras dan Cabai di Samarinda dan Semarang Periode Januari 2010 – Desember 2011). Skripsi. Jakarta. Susilowati, S. H., dkk. 2010. Indikator Pembangunan Pertanian dan Pedesaan: Karakteristik Sosial Ekonomi Petani Padi. Jakarta: Departemen Pertanian.
16
TAHUN 6, VOLUME 2, DESEMBER 2014
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13 Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tim Subdit Statistik Harga Perdesaan dan Unit Kerja Pimpinan BPS. 2013. Nilai Tukar Petani. Jakarta: Badan Pusat Statistik.
Wibowo, Sasmito. 2013. Indeks Harga Konsumen dan SBH 2012. Jakarta: Badan Pusat Statistik.
LAMPIRAN
150.00
100.00
50.00
0.00
NTPP Jabar_Modified Laspeyres
NTPP Jateng_Modified Laspeyres
NTPP Jatim_Modified Laspeyres
NTPP DIY_Modified Laspeyres
TAHUN 6, VOLUME 2, DESEMBER 2014 NTPP Jabar Modified Laspeyres Plus
NTPP Jateng_Modified Laspeyres Plus
NTPP Jatim_Modified Laspeyres Plus
NTPP DIY_Modified Laspeyres Plus NTPP Jabar Fisher-WM
150.00
100.00
50.00
0.00
NTPP Jateng_Fisher-WM
150.00
100.00
50.00
0.00
NTPP Jatim_Fisher-WM
300.00
200.00
100.00
0.00
NTPP DIY_Fisher-WM
17
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13 Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
Jan'11 Feb'11 Mar'11 Apr'11 Mei'11 Juni'11 Juli'11 Ags'11 Sep'11 Okt'11 Nov'11 Des'11 Jan'12 Feb'12 Mar'12 Apr'12 Mei'12 Juni'12 Juli'12 Ags'12 Sep'12 Okt'12 Nov'12 Des'12 Jan'13 Feb'13 Mar'13 Apr'13 Mei'13 Juni'13 Juli'13 Ags'13 Sep'13
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK 150.00
100.00 50.00 0.00
NTPP Banten_Modified Laspeyres
NTPP Bali_Modified Laspeyres
NTPP NTB_Modified Laspeyres
NTPP NTT_Modified Laspeyres
18 NTPP Banten_Modified Laspeyres Plus
NTPP Modified Laspeyres Plus
NTPP Bali Tanpa Cabai_Modified Laspeyres
NTPP NTB_Modified Laspeyres Plus
NTPP NTT_Modified Laspeyres Plus
NTPP Banten_Fisher-WM
150.00
100.00
50.00
0.00
NTPP Fisher-WM
150.00 100.00 50.00 0.00
NTPP Bali Tanpa Cabai_Modified Laspeyres Plus
NTPP Bali Tanpa Cabai_Fisher-WM
150.00
100.00
50.00
0.00
NTPP NTB_Fisher-WM
150.00 100.00 50.00 0.00
NTPP NTT_Fisher-WM
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
METODE C-MEANS CLUSTER DAN FUZZY C-MEANS CLUSTER PADA KASUS PENGELOMPOKAN DESA MENURUT STATUS KETERTINGGALAN (STUDI DI KOTA METRO DAN KABUPATEN LAMPUNG TIMUR)
Sukim Dosen Sekolah Tinggi Ilmu Statistik
Abstract Cluster analysis is a multivariate analysis technique used to classify objects such that the objects in a cluster are very similar and the objects in different clusters are quite different. This study will discuss the non-hierarchical clustering methods. The methods are C-Means Cluster and Fuzzy C-Means Cluster.
These methods are suitable for large data and
continuous variables. This study would also present the application of the methods on the case of village grouping according to the underdevelopment status in two regions of level II (Kota Metro and Kabupaten Lampung Timur) in Lampung Province. The unit of observations in this study are
257 villages in Kota Metro (22 villages) and Kabupaten
Lampung Timur in Lampung Province obtained from the Village Potential Statistics (Podes Potensi Desa) 2008. The
results show that
the optimal cluster in Kota
Lampung
data is 4,
with a
minimum value of the Fukuyama-Sugeno validity index is at -45.4649. As for the data of Kabupaten Lampung Timur, the optimum number of clusters is 13, with a minimum value of the Fukuyama-Sugeno validity index is at 196.9629.
Keywords
: Analisis Cluster, C-Means Cluster, Fuzzy C-Means Cluster, Indeks Validitas.
I. PENDAHULUAN
Analisis cluster (cluster analysis) adalah salah satu analisis peubah ganda (multivariate analysis) yang digunakan untuk mengelompokkan objek-objek sedemikian rupa sehingga objek dalam satu cluster yang sangat mirip dan objek di berbagai cluster cukup berbeda. Analisis cluster banyak digunakan dalam penelitian-penelitian di bidang sosial, bidang kesehatan, bidang marketing, bidang akademik, dan bidang kewilayahan. Metode analisis cluster (clustering methods) dibedakan menjadi dua yaitu metode hierarki (hierarchical clustering methods) dan metode tak berhierarki (non hierarchical clustering methods). Metode hierarki dibedakan menjadi dua, yaitu metode penggabungan TAHUN 6, VOLUME 2, DESEMBER 2014
19
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
(agglomerative/bottom up) dan metode pemecahan (devisive/ topdown). Prosedur yang digunakan dalam metode hierarki adalah prosedur pautan tunggal (single linkage), pautan lengkap (complete linkage), dan pautan rata-rata (average linkage). Hasil clustering metode berhierarki secara umum membentuk diagram pohon (tree diagram) atau dendrogram yang menggambarkan pengelompokkan objek berdasarkan jarak. Metode tak berhierarki disebut juga metode partisi (partitional methods). Metode tak berhierarki yang banyak digunakan adalah metode C-Means Cluster. Proses clustering pada metode tak berhierarki (C-Means) pembentukan partisi dilakukan sedemikian rupa sehingga setiap objek berada tepat pada satu partisi. Akan tetapi pada suatu saat secara alami hal ini sering tidak dapat dilakukan untuk menempatkan suatu objek tepat pada satu partisi, karena sebenarnya objek tersebut terletak di antara dua atau lebih partisi yang lain. Sehingga perlu dilakukan clustering dengan menggunakan fuzzy clustering. Pengelompokkan dengan metode ini mempertimbangkan derajat keanggotaan himpunan fuzzy sebagai dasar pembobotan. Pada penelitian ini dibahas metode C-Means Cluster (CM) dan Fuzzy C-Means Cluster (FCM). Dua metode ini cocok digunakan untuk data berukuran besar dan memiliki tipe peubah kontinu. CM Cluster merupakan metode pengelompokkan yang terkenal dan banyak digunakan di berbagai bidang karena sederhana, mudah diimplementasikan, memiliki kemampuan untuk mengelompokkan data yang besar, dan running time-nya linear O(NCT) dengan N adalah banyaknya data, C adalah banyaknya kelompok (cluster), dan T adalah banyaknya iterasi (Kumar, Verma, dan Shrma, 2010). Metode ini mengelompokkan secara partisi yang memisahkan data ke dalam kelompok yang berbeda. Dengan proses partisi secara iteratif, CMeans Cluster mampu meminimalkan rata-rata jarak setiap data ke kelompoknya. Metode ini dikembangkan oleh MacQueen pada tahun 1967, yang merupakan pengembangan dari Steinhaus (1956). Kemudian dikembangkan terus sampai saat ini di berbagai bidang. Metode FCM
Cluster pertama kali diusulkan oleh Dunn (1973), kemudian
dikembangkan oleh Bezdek (1981) yang digunakan dalam bidang pengenalan pola (pattern recognition), dan masih terus dikembangkan sampai saat ini. Dalam metode FCM Cluster ini dipergunakan variabel membership function uik, yang merujuk pada seberapa besar probabilitas suatu data bisa menjadi anggota ke dalam suatu kelompok (cluster) dan variabel m yang merupakan weigthing exponent dari membership function uik. Metode ini merupakan pengembangan dari C-Means Cluster dengan pembobotan fuzzy. Penelitian terdahulu menggunakan FCM dapat dilihat dari hasil penelitian Bezdek (1981), Gath dan Geva (1989), Huang, dkk. (1997). Pengembangan analisis cluster selanjutnya dilakukan dengan menggabungkan atau modifikasi distance space untuk menghitung jarak di
20
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
antara suatu data dengan centroid, metode pengalokasian data kembali data ke dalam setiap kelompok (cluster), dan fungsi objektif yang digunakan, juga telah diimplementasikan oleh Bezdek (1984), Miyamoto dan Agusta (1995), serta McLachlan dan Peel (2000). Pengelompokkan desa menurut status ketertinggalan perlu dilakukan sebagai bahan perencanaan, dan evaluasi sasaran program pemerintah terutama yang berkaitan dengan program pemberdayaan desa tertinggal di Indonesia. Berbagai upaya telah dilakukan pemerintah, misalnya Instruksi Presiden mengeni desa tertinggal yang dilaksanakan dari tahun 1994 sampai dengan tahun 1997. Pendekatan yang digunakan untuk menetapkan sasaran program adalah mengklasifikasikan seluruh desa di Indonesia ke dalam klasifikasi desa tertinggal dan desa tidak tertinggal. Dengan adanya informasi sampai tingkat wilayah desa ini diharapkan upaya pemberdayaan desa tertinggal lebih tepat sasaran (BPS, 2005). Penelitian sebelumnya di bidang kewilayahan telah dilakukan oleh Sarpono (2009) membahas tentang pengelompokkan desa tertinggal menggunakan metode regresi krigging. Pengelompokkan wilayah kecamatan menurut partisipasi sekolah dengan metode FCM pernah dilakukan oleh Pravitasari (2008). Berbeda dengan penelitian terdahulu, pada penelitian ini akan dilakukan pengelompokkan desa menurut status ketertinggalan dengan menerapkan metode CM dan FCM berdasarkan data hasil pendataan Podes 2008. Kemudian dibandingkan hasil pengelompokkan dengan metode CM dan metode FCM. Pengelompokkan desa menurut status (desa tertinggal dan desa tidak tertinggal) seringkali menimbulkan kecemburuan antar daerah tingkat II (kabupaten/kota) di seluruh Indonesia. Pada kenyataannya batasan status desa tertinggal dan desa tidak tertinggal sangat tipis (halus) dan samar, sehingga penerapan metode CM yang dengan tegas mempartisi suatu kelompok menjadi kurang tepat digunakan. Metode FCM diharapkan dapat mengatasi permasalahan tersebut. Pengelompokkan FCM memerlukan indeks validitas untuk mengetahui banyak cluster optimum yang terbentuk. Indeks validitas yang digunakan dalam penelitian ini adalah Indeks Fukuyama-Sugeno (Halkidi dkk, 2010). Pengelompokkan dianggap optimum apabila menghasilkan cluster yang mempunyai variansi minimum di dalam cluster dan mempunyai variansi yang maksimum antar cluster. Kabupaten Lampung Timur sebagai wilayah penelitian adalah karena Lampung Timur termasuk lima kabupaten di Provinsi Lampung (14 kabupaten/kota) dengan kategori desa tertinggal (Umar Said dalam Antara news dan Republika, 2010). Di samping itu Kabupaten Lampung Timur juga merupakan kabupaten dengan jumlah rumah tangga miskin terbanyak ke-3 se-Provinsi Lampung. Sedangkan kota Metro sebagai wilayah penelitian adalah karena merupakan kota dengan jumlah rumahtangga miskin paling sedikit di Provinsi Lampung (BPS, 2008).
TAHUN 6, VOLUME 2, DESEMBER 2014
21
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
II.
METODOLOGI
Langkah-langkah yang digunakan dalam penelitian ini adalah: melakukan kajian metode CM Cluster dan metode FCM Cluster, standarisasi data, mengelompokkan data dengan mencoba berbagai nilai C untuk metode CM
Cluster dan FCM
Cluster,
membandingkan hasil pengelompokkan yang terbentuk. Sedangkan alat bantu komputer yang digunakan adalah berupa piranti lunak (software) yang terkait dengan pengolahan dan analisis statistik yaitu MATLAB versi 7.8.0.347 (2009a). Hasil yang dibandingkan meliputi jumlah kelompok, variansi kelompok (variansi within cluster dan variansi between cluster), dan menyimpulkan cluster ideal pada masing-masing metode seperti ditunjukkan dalam Gambar 1. mulai
Mengkaji metode clustering CM dan FCM
data
Cek kelengkapan data
Standardisasi data
Mnegelompokkan Dengan metode CM dan FCM
Membandingkan: Hasil pengelompokkan dengan C = 2,3,4,C optimum : · · ·
Varians within Varians between Kompleksitas waktu
Pembahasan
Kesimpulan dan saran
selesai
Gambar 1. Alur Kerangka Pikir Penelitian
22
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tahapan Penelitian Tahapan-tahapan yang dilakukan berdasar pada tujuan penelitian yang meliputi : 1. Melakukan kajian tentang metode CM Cluster dan FCM Cluster 2. Membangun algoritma FCM 3. Melakukan analisa statistik deskriptif 4. Melakukan preprosesing, meliputi menyusun matriks ukuran N x p, di mana N adalah banyaknya observasi (banyaknya desa/kelurahan) dan p adalah banyaknya variabel atau atribut data (dimensi data), yaitu matriks ukuran 22 x 15 untuk Kota Metro dan matriks ukuran 257 x 15 untuk Kabupaten Lampung Timur. 5. Melakukan pengelompokkan dengan Metode FCM Cluster a. Formula
optimasi N
fungsi
objektif
yang
diberikan
sebagai
berikut
C
J X ,U ,V (uik )m D( xk , vi ) 2 , melalui optimasi 𝑢𝑖𝑘 dan 𝑣𝑖 k 1 i 1
b. Menguji konvergensi algoritma FCM, yaitu menetapkan kondisi konvergen, menganalisis kondisi konvergen, mendapatkan kondisi matriks jarak 6. Melakukan Analisis data hasil pendataan Podes 2008 Kota Metro dan Kabupaten Lampung Timur di Provinsi Lampung. a. Melakukan clustering dari mulai C=2 sampai C optimum, dilakukan dengan melihat dendrogram hasil hierarkikal clustering untuk memperoleh gambaran jumlah cluster optimum. b. Menentukan faktor fuzzy (weigthing exponent) hasil pengelompokkan (m). Untuk penentuan nilai m, belum terdapat teori yang memberikan landasan pemilihan nilai m yang tepat. Pada penelitian ini digunakan m=2, sebagaimana telah umum diterapkan dalam banyak penelitian terdahulu (Zimmermann dalam Naik, V.C., 2004). N
c. Menghitung fuzzy centroid cluster (Vi) dengan persamaan vi
u k 1 N
m
ik
u k 1
xk m
ik
2 C m 1 D ( x , v ) k i d. Memperbaharui anggota matriks U dengan persamaan uik D( xk , v j ) j 1
1
e. Membandingkan nilai keanggotaan dalam matriks U, jika sudah tidak banyak mengalami perubahan berarti konvergen dan kondisi keanggotaannya sudah optimum nilai mutlak dari (Uk+1 – Uk) < threshold yang ditetapkan). Iterasi dihentikan dan
TAHUN 6, VOLUME 2, DESEMBER 2014
23
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
didapatkan hasil pengelompokkan. Jika belum terpenuhi kondisi optimum kembali ke langkah 6c. 7. Melakukan perhitungan indeks validitas clustering. Ada beberapa indeks validitas yang digunakan.
Pada penelitian ini digunakan indeks validitas Fukuyama-Sugeno karena
indeks ini dapat menunjukkan compactness dalam cluster dan distances of clasters representative (Halkidi dkk., 2000). 8. Melakukan interpretasi hasil penerapan metode FCM pada kasus data Podes 2008 Kota Metro dan Kabupaten Lampung Timur di Provinsi Lampung.
III
HASIL DAN PEMBAHASAN
Pada bagian ini menyajikan analisis dan pembahasan dari ketiga tujuan penelitian, yaitu mengkaji metode CM
Cluster
dan FCM
Cluster, algoritma pengelompokkan
menggunakan metode FCM dengan indeks validitas yang berbeda, dan mengimplementasikan dalam kasus pengelompokkan desa menurut status ketertinggalan di Kabupaten Lampung Timur dan Kota Metro Provinsi Lampung. Hasil eksekusi algoritma program akan ditampilkan dalam pembahasan tujuan ketiga untuk algoritma FCM.
Metode C-Means Cluster Metode CM Cluster pertama kali diperkenalkan oleh MacQueen (1967). Metode ini merupakan metode non hierarki yang umum digunakan yang termasuk dalam teknik penyekatan (partisi), dimana observasi (objek) dipisahkan ke dalam C daerah bagian yang terpisah secara tegas. Pada CM Cluster, setiap objek harus masuk dalam kelompok (cluster) tertentu. Tetapi dalam satu tahapan proses tertentu objek yang sudah masuk dalam satu kelompok tertentu, pada tahap berikutnya masih memungkinkan objek berpindah ke kelompok yang lain. Proses pengelompokkan pada metode CM Cluster diawali dengan menentukan jumlah cluster yang ingin dibentuk, dengan mengasumsikan inisial cluster 2, 3,…,C. Alokasikan data ke dalam cluster secara random. Kemudian menghitung inisial pusat cluster (centroid) yang ada di masing-masing cluster, selanjutnya alokasikan kembali masing-masing data ke pusat cluster yang terdekat dengan persamaan 𝑢𝑖𝑘 = 1, untuk 𝑑 = min{𝐷(𝑥𝑘 , 𝑣𝑖 )} dan 𝑢𝑖𝑘 = 0, untuk d yang lainnya. Setelah data masuk pada pusat cluster terdekat dan membentuk cluster baru, pusat cluster baru ditentukan kembali dengan menghitung rata-rata dari data yang ada di
24
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pusat cluster yang sama. Jika masih ada data yang berpindah cluster atau jika perubahan nilai pusat cluster yang terbentuk di atas nilai threshold yang ditetapkan, atau perubahan nilai fungsi objektif yang digunakan masih di atas nilai threshold yang ditetapkan maka proses partisi penghitungan nilai pusat cluster terus dilakukan sampai salah satu dari tiga kondisi terpenuhi.
Optimasi Fungsi Objektif Algoritma C-Means Cluster Optimasi fungsi objektif pada algoritma CM didapatkan dengan meminimalkan jarak antara objek dan pusat clusternya ( D( xk , vi )2 =||xk – vi||2=( xk – vi )T(xk – vi) di mana vi merupakan rata-rata anggota cluster yang ke-i. Untuk menunjukkan jarak minimal antara objek dan pusat cluster dituliskan kembali fungsi objektif sebagai berikut:
J X ;U ,V min
K1 ,..., KC
J X ;U ,V min
K1 ,..., KC
C
1
K c 1
2 c iKc , jKc
C
c 1 knC
xk vi
xi x j 2
2
ekuivalen dengan
dimana vi
1 Kc
x
jKc
j
adalah rata-rata dari cluster
ke-i, K adalah banyaknya objek 2
kKc
xk vi
2
kKc
1 Kc
1 K c2
(x
jKc
(x
jK c
k
k
xj )
x j ), ( xk xs ) sK c
1 xk , xk xk , xs xk , x j x j , xs K c2 kKc k , sK c k , jK c j , sK c
1 xk , xk xk , x j K c2 kKc k , jK c
1 1 2 K c2
k , jK c
xk x j
2
Untuk mengetahui bahwa persamaan fungsi objektif optimum (mempunyai nilai ekstrim), adalah dengan cara melakukan derivative pertama terhadap vi dan disamakan dengan nol sebagai berikut : dy dvi
xk vi kKc
2
0
dy ( xk vi )T ( xk vi ) 0 dvi kK TAHUN 6, VOLUME 2, DESEMBER 2014
25
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
dy ( xk )2 2(vi ) ( xk ) K (vi ) 2 0 dvi kK kK 2 ( xk ) 2 K (vi ) 0 kK
2( ( xk ) K (vi )) 0 kK
( x ) Kv
0
1 K
i
kK
k
i
( x ) v , yang merupakan rata-rata (mean) dari objek.
kK
k
Sedangkan untuk menunjukkan bahwa nilai ekstrim fungsi adalah minimum yaitu dengan cara melihat tanda yang positif ( > 0 ) dari turunan (derivatif) kedua sebagai berikut: d2y xk vi dvi2 kKc
2
dy (2 ( xk ) 2 Kvi ) 2 K kK dvi
Nilai derivatif kedua dari fungsi di atas adalah 2K yang lebih besar dari 0, sehingga nilai ekstrim yang dihasilkan adalah minimum.
Konvergensi Algoritma C-Means Cluster Algoritma CM Cluster dapat diuraikan sebagai berikut: Input (masukan) dari algoritma CM Cluster berupa data set X1 ,..., X n R p , dalam ruang dimensi p (banyaknya variabel) dan banyaknya cluster (C) yang ingin dibentuk. Langkah berikutnya dilakukan inisialisasi pusat cluster (vi(0) ) secara random, v1(0) ,..., vC(0) . Kemudian dilakukan proses iterasi sampai mencapai konvergen dengan mengalokasikan tiap data set ke pusat
cluster
terdekat,
X s KC (t 1) X s vi (t )
persamaan vi (t 1)
1 Ki (t 1)
2
sehingga
membentuk
cluster
K1(t+1),…,KC(t+1)
dengan
2
X v j (t ) , j 1,..., C dan menghitung pusat cluster baru dengan
X
sKi
s
.
Output (keluaran) berupa cluster K1,…,KC.
26
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK mulai
Banyaknya Cluster C
tidak Menghitung Pusat Cluster
Mengitung Jarak Objek ke Pusat Cluster
Alokasikan ke Cluster berdasarkan jarak minimum
Tidak ada Objek berpindah Cluster?
ya
selesai
Gambar 2. Diagram Alur Algoritma CM Langkah-langkah metode CM Cluster sebagai berikut : Misal X suatu matriks ukuran N x p, di mana N = banyaknya objek (data), dan p = banyaknya variabel (atribut). 1. Menentukan banyaknya inisial cluster, misal C, bentuk pusat cluster (Vi) sebanyak C secara random. 2. Mengalokasikan semua anggota X (= xij) ke dalam C kelompok yang dibentuk ke pusat cluster terdekat. 3. Menghitung kembali pusat cluster yang terbentuk. Ulangi langkah 3 sampai konvergen (sampai tidak ada perubahan berarti pada pusat cluster, Vi.), yaitu kondisi terpenuhinya suatu threshold ( vi(t ) vi(t 1) ).
Running time Algoritma C-Means Cluster Running time proses clustering dengan algoritma CM adalah O(NCT) di mana N banyaknya data (objek), C banyaknya cluster, dan T banyaknya iterasi (Kumar dan Sirohi, 2010). Hal ini dapat ditunjukkan dengan menganalisis algoritma CM sebagai berikut: Fungsi objektif metode CM yang akan dioptimalisasi adalah N
C
J X ,U ,V (uik ) D( xk , vi ) 2 k 1 i 1
Dalam pseudocode dituliskan TAHUN 6, VOLUME 2, DESEMBER 2014
27
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Begin For k=1:N For i=1:C If d=min{ D( xk , vi )2 } uik = 1
C kali
Else
N kali
uik = 0
Endif uik * D( xk , vi )2
End
Variabel yang dominan dalam algoritma CM adalah C dan N, sehingga running timenya adalah O(NC). Variabel T banyaknya iterasi jelas berbanding lurus dengan running time algoritma CM maka dapat dituliskan menjadi O(NCT). Hasil menggunakan data Podes 2008 Kota Metro dan Kabupaten Lampung Timur dengan menetapkan N dan T konstan untuk mengevaluasi running time CM terhadap banyaknya cluster didapatkan data sepeerti Tabel 1.
Tabel 1. Running time Algoritma CM data Podes 2008 Kota Metro dan Kabupaten Lampung Timur Iterasi Waktu (detik) Banyak Cluster Lampung Lampung Metro Metro Timur Timur 2 2 2 0.037420 0.048745 2 3 0.029578 0.034817 2 2 4 0.026115 0.047218 2 2 5 0.027023 0.061226 2 2 6 0.040287 0.074604 2 2 7 0.040635 0.066479 2 2 8 0.028714 0.074693 2 2 9 0.041965 0.077199 2 2 10 0.098525 0.089858 2
28
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
1 0.9
Lampung Timur
0.8
Metro
Wktu (detik)
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 2
3
4
5
6
7
8
9
10
Banyaknya Cluster
Gambar 3. Running time CM Terhadap Banyaknya Cluster
Berdasarkan Tabel 1. dan Gambar 2. running time CM terhadap banyaknya cluster adalah mendekati linear. Menggunakan cara yang sama, running time CM terhadap N diperoleh dengan menetapkan C dan T konstan.
Metode Fuzzy C-Means Cluster Fuzzy clustering merupakan salah satu teknik untuk menentukan cluster optimum dalam suatu ruang vektor yang didasarkan pada bentuk normal Euclidian untuk jarak antar vektor [persamaan 2.4]. Konsep dasar FCM, menentukan pusat cluster (vi) yang akan menandai lokasi rata-rata untuk tiap cluster [persamaan 2.8]. Tiap titik data mempunyai derajat keanggotaan ke tiap cluster (uik) [persamaan 2.7]. Dengan cara mengupdate pusat cluster dan derajat keanggotaan tiap titik data secara iteratif, akan didapat pusat cluster yang “tepat”. Iterasi ini didasarkan pada minimisasi fungsi objektif (J) yang menggambarkan jarak titik data ke pusat cluster dengan bobot derajat keanggotaan titik data tersebut [persamaan 2.9].
Optimasi fungsi objektif Algoritma Fuzzy C-Means Cluster Kondisi fungsi objektif J(X;U,V) seperti pada persamaan 2.9 akan mencapai optimum diberikan melalui optimasi parameter U dan V : N
C
J X ,U ,V (uik )m D( xk , vi ) 2
(dari persamaan 2.9), di mana uik dan vi diberikan
k 1 i 1
pada persamaan berikut :
TAHUN 6, VOLUME 2, DESEMBER 2014
29
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK 2 C m 1 D ( x , v ) k i uik D( xk , v j ) j 1
1
(dari persamaan 2.7)
N
u
vi
k 1 N
m
ik
u k 1
xk (dari persamaan 2.8) m
ik
Mencari nilai optimum uik dan vi dilakukan dengan menurunkan fungsi objektif secara parsial terhadap uik dan vi sebagai berikut: N
C
J X ,U ,V (uik )m D( xk , vi ) 2
(dari persamaan 2.9)
k 1 i 1
dengan batasan 1 m , 0 uik 1 , dan fungsi kendala C
C
C
i 1
i 1
i 1
uik 1, k uik 1 0 1 uik 0 N
u
ik
(4.1)
0, i , dan V v1 , v2 ,, vC R p
k 1
Di mana D(xk,vi)2 = ||xk - vi||2 = (xk – vi)T(xk – vi) = (xk – vi)2 jarak tiap data ke-k ke pusat cluster ke-i dan k merupakan lagrange multiplier, dengan menggunakan teori pengganda lagrange, diperoleh fungsi baru sebagai berikut: J(X,U,V, k ) = J(X,U,V) +
N
k 1
N
di mana
k
G(X,U,V)
(4.2)
C
J X ,U ,V (uik )m D( xk , vi ) 2
(dari persamaan 2.9) dan G(X,U,V) =
k 1 i 1
C 1 uik (dari persamaan 4.1) sebagai fungsi kendala, sehingga turunan pertama persamaan i 1
4.2. terhadap ui dan disamakan dengan nol, dapat dituliskan sebagai berikut : C N C N uik m D( xk , vi ) 2 k 1 uik k 1 i 1 i 1 k 1 0 ui
m(uik )m1 D( xk , vi )2 k 0
(uik )m1
30
k mD( xk , vi )2
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK 1
1
1
m1 k m1 m1 k 1 uik m 2 2 D( xk , vi ) mD( xk , vi )
(4.3)
Berdasarkan persamaan 4.1 didapat: 1
1
1
m1 k m1 C m1 k 1 u 1 1 ik 2 2 m i 1 D( xk , vi ) i 1 i 1 mD( xk , vi ) C
C
1
k m 1 m
1 1
m 1 1 2 i 1 D ( xk , vi )
(4.4)
C
Berdasarkan persamaan 4.4 dan persamaan 4.3 diperoleh:
1
uik C
1
D( x , v ) j 1
uik
k
2
j
1 m 1
1 D( xk , vi ) 2 2 j 1 D ( xk , v j ) C
1 m 1
1 2 D( xk , vi )
1
2 C m 1 D( xk , vi ) uik D( xk , v j ) j 1
1 m 1
D( xk , vi ) j 1 D ( xk , v j ) C
2
m1
1
Sedangkan mencari nilai optimum vi dilakukan penurunan sebagai berikut: J ( X ,U ,V ) 0 vi N C N C uik m D( xk , vi ) 2 k uik 1 k 1 i 1 i 1 k 1 0 vi N C N C 2 uik m xk vi k uik 1 k 1 i 1 i 1 k 1 0 vi
N
u k 1
m ik
xk vi vi
2
0
TAHUN 6, VOLUME 2, DESEMBER 2014
31
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK N
u
m ik
k 1
xk vi
T
xk vi
vi
0
N N N m 2 m u ( x ) 2 u ( x ) v uikm (vi2 ) 0 ik k ik k i vi k 1 k 1 k 1 N
N
k 1
k 1
2 ( xk ) 2 uikm (vi ) 0
N 2 uikm ( xk vi ) 0 k 1 N
N
(x ) u k 1
k
k 1
m ik
(vi )
N
vi
u k 1 N
m ik k
x
u k 1
m ik
Konvergensi Algoritma Fuzzy C-Means Cluster Algoritma FCM
dapat diuraikan sebagai berikut: Pertama ditentukan banyaknya
cluster yang diinginkan (akan dibentuk), misalnya C cluster. Kemudian alokasikan data sesuai dengan jumlah cluster yang telah ditentukan. Langkah berikutnya menghitung nilai pusat C
cluster dari masing-masing cluster menggunakan rumus vi
u i 1 C
m
ik
u i 1
xk (dari persamaan 2.8) m
ik
dan menghitung nilai keanggotaan masing-masing data ke masing-masing cluster dengan 2 C m 1 D( xk , vi ) rumus uik j 1 D ( xk , v j )
1
(dari persamaan 2.7). Apabila perubahan nilai keanggotaan
masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilai centroid masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilai objective function masih di atas nilai threshold yang ditentukan, di mana nilai threshold adalah suatu bilangan positif yang kecil sekali mendekati nol, misalnya 0.000001 (10-6) maka dilakukan penghitungan kembali pusat cluster dan nilai keanggotaan masing-masing data dalam setiap cluster sampai dipenuhi nilai threshold yang ditentukan (konvergen) .
32
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Salah satu kondisi konvergen algoritma FCM ditetapkan dengan selisih matriks partisi (keanggotaan) ke-t ( U ik(t ) ) dengan matriks partisi ke-(t-1) ( U ik(t 1) ) yang memenuhi pertidaksamaan | Uik(t ) Uik(t 1) | di mana adalah bilangan positif yang sangat kecil,
misalnya 0.000001 (10-6), nilai U ik(t )
2 C m 1 D ( x , v ) k i diberikan oleh persamaan uik D( xk , v j ) j 1
1
(4.4) sehingga kondisi konvergen algoritma FCM dapat dituliskan sebagai berikut: | Uik(t ) Uik(t 1) | atau | uik(t ) uik(t 1) | , (dari persamaan 4.4) 2 C m 1 D( xk , vi ) didapat: D( xk , v j ) j 1
1( t )
2 C m 1 D( xk , vi ) D( xk , v j ) j 1
1( t 1)
(4.5)
Start
Baca Matriks X ukuran N x q, toleransi ε, maxiterasi
Inisialisasi membership matriks U0 ukuran N x q secara random, inisialisasi matriks pusat cluster V0 ukuran C x q, iterasi awal t=1, Fungsi objektif awal J0
Menghitung pusat cluster Vi sesuai dengan keanggotaan Uik
Update data keanggotaan Uik, sesuai dengan pusat cluster Vi
C=C+1
Apakah t >= maxiterasi atau |Jt-Jt-1|
tidak
t=t+1
ya
tidak
Apakah IdxC < IdxC-1
ya
Pilih cluster dengan indeks validitas terbaik
Stop
Gambar 4. Diagram Alur Algoritma FCM
TAHUN 6, VOLUME 2, DESEMBER 2014
33
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Kondisi seperti pada persamaan 4.5 dapat tercapai jika D( xk , vi )2 D( xk , v j )2 dan kondisi
D( xk , vi )2 D( xk , v j )2 dapat tercapai jika xk vi yang berarti tiap titik data dalam suatu cluster dekat sekali (minimum) jaraknya terhadap pusat clusternya. Dengan kata lain jika pengelompokkan telah mencapai optimum, maka masing-masing data dalam suatu cluster mencapai jarak minimum ke pusat clusternya. Kondisi seperti ini ditetapkan sebagai tercapainya konvergensi algoritma FCM.
Running time Algoritma Fuzzy C-Means Cluster Menurut Kumar dan Sirohi (2010) running time algoritma FCM adalah O(NC2T), di mana N banyaknya data (objek), C banyaknya cluster, dan T banyaknya iterasi. Berikut ini ditampilkan hasil dari analisis algoritma FCM dengan pseudocode. Fungsi objektif metode FCM yang akan dioptimalisasi ditulis sebagai berikut N
C
J X ,U ,V (uik )m D( xk , vi ) 2 k 1 i 1
Dalam pseudocode dituliskan Begin For k=1:N For i=1:C For j=1:C uik =
1 2
D( xk , vi ) m 1 D( xk , v j )
C kali
N kali
C kali
uik m * D( xk , vi )2
End
Variabel yang dominan dalam algoritma FCM adalah C dan N, sehingga running timenya adalah O(NCC) atau O(NC2). Variabel T banyaknya iterasi jelas berbanding lurus dengan running time algoritma FCM maka dapat dituliskan menjadi O(NC2T). Hasil dari proses penghitungan running time FCM dengan data Podes 2008 Kota Metro dan Kabupaten Lampung Timur ditunjukkan Tabel 2 dan Gambar 4, dan dapat dikatakan bahwa running timenya tidak linear dan mendekati kuadratik.
34
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 2. Running time Algoritma FCM data Podes 2008 Kota Metro dan Kabupaten Lampung Timur Waktu (detik) Banyak Cluster Lampung Metro Timur 2 0.406585 0.636383 3 0.248894 1.089945 4 0.258251 2.973474 5 0.269117 4.550975 6 0.339287 4.555440 7 0.310426 4.223784 8 0.474275 5.417068 9 0.361569 4.888947 10 0.321329 5.053932
Iterasi Lampung Metro Timur 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10
7 Lampung Timur Metro
Waktu (detik)
6 5 4 3 2 1 0 2
3
4
5
6
7
8
9
10
Banyaknya Cluster
Gambar 5. Running time FCM Terhadap Banyaknya Cluster
Penerapan Metode C-Means dan Fuzzy C-Means Cluster pada Pengelompokkan desa menurut status ketertinggalan Penerapan metode CM dan FCM pada pengelompokkan desa menurut status ketertinggalan digunakan data sekunder hasil pendataan Podes 2008 Provinsi Lampung di dua daerah tingkat II, yaitu kota Metro dan Kabupaten Lampung Timur. Perangkat lunak yang digunakan adalah MATLAB versi 7.8.0.347 (2009a).
TAHUN 6, VOLUME 2, DESEMBER 2014
35
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Penerapan Metode C-Means
Cluster pada Pengelompokkan desa menurut status
ketertinggalan di Kota Metro Deskripsi data kelurahan di Kota Metro hasil Podes 2008 menurut 15 variabel yang digunakan untuk pengelompokkan menurut status ketertinggalan adalah seperti pada Tabel 3. di bawah ini. Berdasarkan Tabel 3. dapat dijelaskan bahwa tidak ada rumah tangga yang tinggal di bantaran sungai (x2=0), sehingga variabel x2 didrop untuk analisis pengelompokkan di Kota Metro. Sementara variabel data jumlah penduduk kelurahan (x1) di Kota Metro mempunyai rentang paling tinggi sekitar 12.347. Mengingat data hasil Podes 2008 mempunyai variabilitas satuan, maka perlu dilakukan standardisasi atau transformasi (Milligan dan Cooper, 1988 dalam Gan, Ma dan Wu, 2007) terhadap variabel yang relevan ke bentuk z-score dengan rumus X Z . Di mana adalah rata-rata (mean), dan adalah simpangan baku. Perhitungan z-score didasarkan pada deskriptif seperti pada Tabel 3, dan hasilnya ditampilkan pada Lampiran 1. Hasil dari z-score inilah yang digunakan sebagai dasar analisis cluster.
Tabel 3. Statistik Deskriptif Kelurahan di Kota Metro Hasil Podes 2008 N Minimum Maximum Jumlah penduduk (x1) Bantaran sungai (x2) Kumuh (x3) Rmt berlangganan telp kabel (x4) Pendidikan (x5) Kesehatan (x6) Tenaga kesehatan (x7) Koperasi (x8) Rmt pertanian (x9) Rtm per desa (x10) Pelanggan listrik (x11) Askeskin (x12) Sktm (x13) Luas desa (x14) Rumah permanen (x15) Valid N (listwise)
36
Mean
Std. Deviation
22 22 22
2094 0 0
14441 6.3119E3 0 0 100 4.5455
3397.86019 0 21.32007
22
0
2362 3.9595E2
569.39069
22 22 22 22 22 22 22 22 22 22 22 22
4 2 3 0 5 103 510 74 20 119 305
28 33 25 19 85 918 3178 816 388 772 2284
5.38637 6.35937 4.59083 4.39130 26.74657 215.067 752.84821 182.70081 91.75207 152.22306 539.59010
9.1818 9.8182 7.8636 4.9545 48.0455 338.55 1.3970E3 3.0718E2 1.3018E2 3.1236E2 1.0040E3
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Masukan (input) banyaknya cluster pada langkah pertama algoritma FCM menggunakan hasil dari hierarkikal cluster seperti Gambar 6.
10
9
8
7
6
5
4
3
C=3
2
1 4
6
3
9
1
20
21
2
7
10
13
5
18
12
8
17
19
22
11
15
16
14
Gambar 6. Dendrogram Pengelompokkan Hierarki Data Kelurahan di Kota Metro Hasil Podes 2008
Output dendrogram seperti pada Gambar 6 dapat ditentukan banyaknya jumlah cluster dengan anggota tertentu. Misal ditentukan banyaknya cluster adalah 3, maka anggota cluster pertama sebanyak 18 observasi (kelurahan) yaitu observasi dengan indeks 1-10, 12-13, dan 1722, cluster kedua beranggotakan observasi dengan indeks 11, 15, dan 16, sedangkan cluster ketiga beranggotakan observasi dengan indeks 14. Sebagai alternatif dicoba untuk C=2, C=3, C=4, C=5, dan C=6 sebagai masukan algoritma CM. Hasil pengelompokkan 22 kelurahan di Kota Metro menggunakan metode CM dengan banyaknya cluster 4 disajikan pada Tabel 4. Masing-masing cluster mempunyai anggota sebanyak 3, 4, 1, dan 14 kelurahan. Cluster pertama terdiri dari 3 kelurahan yaitu Iringmulyo, Imopuro, dan Hadimulyo Barat. Cluster kedua sebanyak 4 kelurahan (Ganjarasri, Hadimulyo Timur, Banjarsari, dan Karangrejo). Cluster ketiga hanya satu kelurahan yaitu Metro. Sedangkan cluster keempat terdiri dari 14 kelurahan yaitu Sumbersari, Rejomulyo, Margodadi, Margorejo, Mulyojati, Mulyosari, Ganjaragung, Tejosari, Tejoagung, Yosorejo, Yosodadi, Yosomulyo, Purwosari, dan Purwoasri.
TAHUN 6, VOLUME 2, DESEMBER 2014
37
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 4. Hasil Pengelompokkan 22 Kelurahan di Kota Metro menggunakan metode CM dengan jumlah C=4 No
Nama Kelurahan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Sumbersari Rejomulyo Margodadi Margorejo Mulyojati Mulyosari Ganjaragung Tejosari Tejoagung Yosorejo Yosodadi Yosomulyo Purwosari Purwoasri Metro Ganjarasri Hadimulyo Timur Banjarsari Karangrejo Iringmulyo Imopuro Hadimulyo Barat
C1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1
Anggota Objek keC2 C3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 1 0 1 0 0 0 0 0 0 0
C4 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0
Karakteristik kelurahan yang masuk cluster pertama antara lain memiliki rata-rata jumlah penduduk sebanyak 11.264 jiwa, fasilitas pendidikan sebanyak 11 unit, fasilitas kesehatan sebanyak 10 unit, dan tenaga kesehatan sebanyak 8 orang. Anggota cluster kedua memiliki karakteristik rata-rata jumlah penduduk, fasilitas pendidikan, fasilitas kesehatan, dan tenaga kesehatan berturut-turut sebanyak 7.376 jiwa, 10 unit, 11 unit, dan 7 orang. Cluster ketiga hanya satu kelurahan yaitu kelurahan Metro maka karakteristiknya juga karakteristik yang dimiliki oleh kelurahan Metro sendiri antara lain jumlah penduduk sebanyak 14.441 jiwa, fasilitas pendidikan sebanyak 28 unit, fasilitas kesehatan sebanyak 33 unit, dan tenaga kesehatan sebanyak 25 orang. Karakteristik anggota cluster keempat antara lain memiliki ratarata jumlah penduduk sebanyak 4.367 jiwa, fasilitas pendidikan sebanyak 8 unit, fasilitas kesehatan 8 unit, dan tenaga kesehatan sebanyak 7 orang.
38
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Penerapan Metode Fuzzy C-Means Cluster pada Pengelompokkan desa menurut status ketertinggalan di Kota Metro Dari dendrogram di atas banyaknya cluster optimum adalah 3. Sebagai alternatif dicoba untuk C=2, C=3, C=4, C=5, dan C=6 sebagai masukan FCM. Hasil percobaan menunjukkan bahwa C=4 merupakan jumlah cluster optimum berdasarkan rata-rata nilai indeks validitas Fukuyama-Sugeno yang minimal sebagaimana disajikan pada Tabel 4.
Tabel 5. Rata-rata Iterasi Konvergensi dan Indeks Validitas Hasil Pengelompokkan C=2 s.d. C=6 sebanyak 10 kali Running Banyaknya Cluster
Indeks Validitas FS
Iterasi
2 3 4 5 6
23.0 22.5 38.7 108.3 76.6
72.5724 -15.7903 -45.4649 -43.6523 -34.5996
80
Indeks Fukuyama-Sugeno
60 40 20 0 -20
2
3
4
5
6
-40 -60
Banyaknya Cluster
Gambar 7. Indeks Validitas Fukuyama-Sugeno Kriteria kebaikan pengelompokkan ditunjukkan oleh nilai indeks validitas FukuyamaSugeno minimum pada lembah pertama sebesar -45.4649, yaitu pada C=4, yang berarti bahwa variansi di dalam cluster minimum dan variansi antar cluster maksimum. Berdasarkan hasil tersebut, banyaknya cluster yang dianggap optimum pada kasus ini adalah empat. Tabel 5 dan Gambar 7. menunjukkan bahwa pengelompokkan kelurahan di Kota Metro mencapai optimum dengan jumlah cluster empat, di mana rata-rata iterasi 38,7 dan nilai indeks validitas Fukuyama-Sugeno pada lembah pertama minimum, sebesar -45.4649 (Gan dkk, 2007). Ilustrasi hasil pengelompokkan dengan banyaknya cluster empat ditunjukkan pada Gambar 8(a). Cluster pertama ditunjukkan dengan plot warna merah, cluster kedua dengan TAHUN 6, VOLUME 2, DESEMBER 2014
39
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
plot warna biru muda, cluster ketiga dengan plot warna hijau, dan cluster keempat dengan warna ungu. Plot lingkaran kecil menunjukkan objek (data), plot segi empat menunjukkan pusat cluster. Sedangkan Gambar 8(b) menunjukkan bahwa fungsi objektif pada pengelompokkan dengan empat cluster mencapai kondisi konvergen pada iterasi ke-45. 75
3
70
Objektive Function
2
1
65
0 60
-1
-2 4
55
4
2 2 0
0
50 0
20
40
60
-2
-2
Iterasi
(a)
(b)
Gambar 8. Pengelompokkan kelurahan menurut status ketertinggalan dengan jumlah cluster 4 (b) dan konvergen pada iterasi ke-45
Cluster pertama (plot warna merah) terdiri dari empat kelurahan yaitu Iringmulyo, Metro, Imopuro, dan Hadimulyo Barat yang memiliki kemiripan karakteristik antara lain jumlah penduduk di atas 9.000 jiwa, fasilitas pendidikan di atas 9 unit, dan fasilitas kesehatan di atas 13 unit. Cluster kedua (plot warna biru) terdiri dari empat kelurahan yaitu Ganjarasri, Hadimulyo Timur, Banjarsari, dan Karangrejo. Cluster ketiga (plot warna hijau) terdiri dari enam kelurahan yaitu Mulyojati, Ganjaragung, Tejoagung, Yosorejo, Yosodadi, dan Yosomulyo. Sedangkan cluster keempat (plot warna ungu) terdiri dari delapan kelurahan yaitu Sumbersari, Rejomulyo, Margodadi, Margorejo, Mulyosari, Tejosari, Purwosari, dan Purwoasri. Hasil pengelompokkan dengan jumlah C=4 berdasarkan matriks keanggotaan U, seperti pada Tabel 6.
40
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 6. Derajat Keanggotaan Hasil pengelompokkan dengan jumlah C=4 Derajat Keanggotaan keC1 C2 C3 C4 1 Sumbersari 0.030342 0.098435 0.162529 0.708694 2 Rejomulyo 0.044388 0.307428 0.312149 0.336034 3 Margodadi 0.023281 0.068991 0.120378 0.787350 4 Margorejo 0.014927 0.043333 0.096305 0.845435 5 Mulyojati 0.065846 0.207097 0.453679 0.273377 6 Mulyosari 0.015600 0.050854 0.102252 0.831294 7 Ganjaragung 0.054328 0.251111 0.451360 0.243200 8 Ganjarasri 0.137546 0.444688 0.310112 0.107654 9 Tejosari 0.021692 0.079007 0.130335 0.768966 10 Tejoagung 0.091602 0.167103 0.431845 0.309450 11 Iringmulyo 0.723234 0.123608 0.108344 0.044814 12 Yosorejo 0.217123 0.216264 0.357390 0.209223 13 Yosodadi 0.061680 0.205291 0.518944 0.214085 14 Metro 0.457187 0.207346 0.192301 0.143166 15 Imopuro 0.796094 0.088368 0.076019 0.039519 16 Hadimulyo Barat 0.464535 0.201562 0.211906 0.121997 17 Hadimulyo Timur 0.058972 0.686182 0.178417 0.076429 18 Yosomulyo 0.100463 0.283412 0.428209 0.187915 19 Banjarsari 0.117547 0.540397 0.209822 0.132233 20 Purwosari 0.034420 0.104520 0.208126 0.652934 21 Purwoasri 0.034446 0.104932 0.207188 0.653434 22 Karangrejo 0.094952 0.425875 0.258955 0.220218
No
Kelurahan
Running time rata-rata terhadap banyaknya cluster algoritma CM dan FCM data Podes 2008 Kota Metro ditunjukkan dalam Tabel 7. dan Gambar 8. Berdasarkan plot grafik dalam Gambar 9. running time rata-rata baik algoritma CM maupun FCM terlihat cenderung tidak linear, berbeda dengan pendekatan empiris yang memperlihatkan perbedaan running time antara algoritma CM yang O(NCT) dengan FCM yang O(NC2T). Tabel 7. Running time Algoritma CM dan FCM data Podes 2008 Kota Metro Banyak Cluster 2 3 4 5 6 7 8 9 10 TAHUN 6, VOLUME 2, DESEMBER 2014
Waktu (detik) CM FCM 0.037420 0.406585 0.029578 0.248894 0.026115 0.258251 0.027023 0.269117 0.040287 0.339287 0.040635 0.310426 0.028714 0.474275 0.041965 0.361569 0.098525 0.321329
CM 2 2 2 2 2 2 2 2 2
Iterasi FCM 10 10 10 10 10 10 10 10 10 41
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
0.5 CM
0.45
FCM
0.4 0.35
Waktu (detik)
0.3 0.25 0.2 0.15 0.1 0.05 0 2
3
4
5
6
7
8
9
10
Banyaknya Cluster
Gambar 9. Running time Algoritma CM dan FCM data Podes 2008 Kota Metro
Hasil pengelompokkan metode FCM lebih kokoh terhadap data outlier dibandingkan metode CM dilihat dari distribusi anggota cluster seperti ditunjukkan pada Tabel 8.
Tabel 8. Hasil Pengelompokkan dengan 4 cluster untuk metode CM dan FCM Metode Cluster C1 C2 C3 C4
Penerapan Metode C-Means
Nc 3 4 1 14
CM % 13.64 18.18 4.55 63.64
Nc 4 4 6 8
FCM % 18.18 18.18 27.27 36.36
Cluster pada Pengelompokkan desa menurut status
ketertinggalan di Kabupaten Lampung Timur Deskripsi data desa di Kabupaten Lampung Timur hasil Podes 2008 menurut 15 variabel yang digunakan untuk pengelompokkan menurut status ketertinggalan ditunjukkan seperti pada Tabel 9. Sedangkan tabel z-score untuk data Kabupaten Lampung Timur disajikan pada Lampiran 2 mengingat jumlah observasi yang cukup besar (257 desa). Berdasarkan Tabel 9 variabel luas desa (x15) mempunyai nilai jangkauan yang paling tinggi ( 20.220) sedangkan variabel jumlah penduduk (x1) mempunyai nilai standar deviasi yang paling tinggi (2.076,397).
42
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 9. Statistik Deskriptif Desa di Kabupaten Lampung Timur Hasil Podes 2008 Variabel
N
Minimum Maximum
Jumlah penduduk (x1) Bantaran sungai (x2) Kumuh (x3) Rmt berlangganan telp kabel (x4) Pendidikan (x5) Kesehatan (x6) Tenaga kesehatan (x7) Koperasi (x8) Rmt pertanian (x9) Rtm per desa (x10) Pelanggan listrik (x11) Askeskin (x12) Sktm (x13) Luas desa (x14) Rumah permanen (x15) Valid N (listwise)
257 257 257
1039 .00 .00
15016 3696.44 375.00 4.6615 1204.00 10.6732
2076.397 27.88548 80.76680
257
.00
525.00 16.0039
58.01768
.00 29.00 6.4047 1.00 16.00 5.4747 .00 67.00 5.4591 .00 53.00 1.2840 30.00 99.00 83.1323 44 1826 377.48 .00 2549.00 6.5996E2 .00 1436.00 1.0320E2 .00 725.00 48.4047 170.00 20390.00 1.2140E3 5.00 1984.00 4.2219E2
4.32287 2.59363 5.07976 4.14025 12.27572 241.880 424.55229 186.88891 65.14994 1797.82131 352.42148
257 257 257 257 257 257 257 257 257 257 257 257
Mean
Std. Deviation
Dendrogram pada Gambar 10 memperlihatkan bahwa pengelompokkan desa di Kabupaten Lampung Timur berdasarkan data Podes 2008 apabila diambil pada jumlah cluster enam menghasilkan tingkat kemiripan dengan jarak 10 satuan. Hal ini secara visual tampak dari oordinat (sumbu tegak) dendrogram jika dipangkas pada jarak 10.
16
14
12
10
C=6 8
6
C=11
4 1 10 11 12 19
7 22 16
9 14 27
2 26
4 30 21
5 17 25 28 23
3
6 18 20 24 29
8 13 15
Gambar 10. Dendrogram Pengelompokkan Desa di Kabupaten Lampung Timur Hasil Podes 2008
TAHUN 6, VOLUME 2, DESEMBER 2014
43
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Hasil pengelompokan dengan 2 sampai 13 cluster untuk metode CM pada data Kabupaten Lampung Timur dapat dilihat pada Tabel 10. Berdasarkan Tabel 10 dapat dijelaskan bahwa mulai C=5, pusat cluster mulai terpengaruh dengan objek yang outlier. Bahkan mulai C=8 pengaruh outlier semakin bertambah. Hal ini ditandai dengan adanya cluster yang hanya memiliki satu anggota.
Tabel 10. Hasil pengelompokkan metode CM Kabupaten Lampung Timur. Banyaknya Cluster C=2 C=3 C=4 C=5 C=6 C=7 C=8 C=9 C=10 C=11 C=12 C=13
Nc % Nc % Nc % Nc % Nc % Nc % Nc % Nc % Nc % Nc % Nc % Nc %
C1 215 83.66 19 7.39 163 63.42 15 5.84 14 5.45 11 4.28 54 21.01 75 29.18 1 0.39 1 0.39 28 10.89 1 0.39
C2 42 16.34 75 29.18 73 28.40 90 35.02 46 17.90 1 0.39 18 7.00 86 33.46 8 3.11 29 11.28 56 21.79 17 6.61
C3
C4
Distribusi Anggota Tiap Cluster C5 C6 C7 C8 C9
163 63.42 9 12 3.50 4.67 1 113 38 0.39 43.97 14.79 89 1 103 4 34.63 0.39 40.08 1.56 45 10 96 28 66 17.51 3.89 37.35 10.89 25.68 1 4 17 136 26 1 0.39 1.56 6.61 52.92 10.12 0.39 5 14 1 28 15 9 1.95 5.45 0.39 10.89 5.84 3.50 36 71 72 1 10 23 14.01 27.63 28.02 0.39 3.89 8.95 9 3 7 1 69 71 3.50 1.17 2.72 0.39 26.85 27.63 1 9 28 10 1 10 0.39 3.50 10.89 3.89 0.39 3.89 13 23 14 21 10 23 5.06 8.95 5.45 8.17 3.89 8.95
24 9.34 3 1.17 24 9.34 14 5.45 1 0.39
C10
C11
C12
32 12.45 28 10.89 53 20.62 67 26.07
15 5.84 22 25 8.56 9.73 8 58 3.11 22.57
C13
1 0.39
Penerapan Metode Fuzzy C-Means Cluster pada Pengelompokkan desa menurut status ketertinggalan di Kabupaten Lampung Timur Gambar 11 memberikan ilustrasi pengelompokkan desa menurut status ketertinggalan di Kabupaten Lampung Timur dengan jumlah kelompok enam (C=6) ditunjukkan dalam (b) dan konvergensi fungsi objektif tercapai pada iterasi ke-447 ditunjukkan dalam (a). Jumlah kelompok optimum pada pengelompokkan desa di Kabupaten Lampung Timur seperti ditunjukkan pada Tabel 11. di mana banyaknya kelompok enam, rata-rata iterasi konvergensi fungsi objektif 447,5 dan indeks validitas Fukuyama-Sugeno mencapai nilai minimum 371,320580. Berdasarkan Tabel 8. pengelompokkan desa di Kabupaten Lampung Timur dibentuk enam cluster. Desa anggota masing-masing cluster disajikan pada Lampiran 3.
44
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 11. Hasil 10 kali Running untuk C=2 sampai C=6 dan maksimal Iterasi=500
C= Iterasi 2 3 4 5 6
Indeks Validitas FS
Obj Fct
33.2 1646.683328 1526.106550 95.3 1097.582379 898.097754 303.3 823.145781 625.379498 474.2 658.500346 466.117572 447.5 548.759835 371.320580
720
700 6 680 4
Objektive Function
660
640
2
620 0 600 -2 580
20 20
10
560
10 0
0
540 0
200
400
600
-10
-10
Iterasi
(a)
(b)
Gambar 11. Plot pengelompokkan desa menurut status ketertinggalan dengan jumlah cluster enam (C=6)
Tabel 11. memperlihatkan running time algoritma CM maupun algoritma FCM. Percobaan dilakukan sepuluh kali running untuk jumlah cluster mulai dua (C=2) sampai dengan sepuluh (C=10). Plot running time berdasar banyaknya cluster disajikan dalam Gambar 11. Berdasarkan plot tersebut dapat diketahui bahwa running time CM linear terhadap banyaknya cluster, sedangkan running time FCM cenderung kuadratik terhadap banyaknya cluster.
TAHUN 6, VOLUME 2, DESEMBER 2014
45
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 12. Running time CM dan FCM Data Podes 2008 Kabupaten Lampung Timur Banyak Cluster 2 3 4 5 6 7 8 9 10
Waktu (detik) CM FCM 0.048745 0.636383 0.034817 1.089945 0.047218 2.973474 0.061226 4.550975 0.074604 4.555440 0.066479 4.223784 0.074693 5.417068 0.077199 4.888947 0.089858 5.053932
CM 2 2 2 2 2 2 2 2 2
Iterasi FCM 10 10 10 10 10 10 10 10 10
6 CM FCM 5
Waktu (detik)
4
3
2
1
0 2
3
4
5
6
7
8
9
10
Banyaknya Cluster
Gambar 12. Running time Algoritma CM dan FCM data Podes 2008 Kabupaten Lampung Timur
Berbeda dengan hasil sebelumnya, melalui percobaan dengan banyaknya cluster dua sampai dengan banyaknya cluster 20 dan maksimum iterasi dipasang 500 diperoleh hasil bahwa jumlah cluster optimum untuk data Podes 2008 Kabupaten Lampung Timur berdasarkan kriteria indeks validitas Fukuyama-Sugeno adalah 13 cluster.
Gambar 13
memberikan ilustrasi hasil banyaknya cluster optimum pada C=13 dengan nilai indeks Fukuyama-Sugeno sebesar 197,0.
46
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 13. Indeks Validitas Fukuyama-Sugeno untuk C=2 sampai dengan C=20 Banyaknya Cluster
Nilai Indeks Validitas FS
2 3 4 5 6 7 8 9 10 11
Indeks FukuyamaSugeno 1526.1 898.1 625.4 466.1 371.1 307.3 260.5 236.9 216.1 199.4
Banyaknya Cluster 11 12 13 14 15 16 17 18 19 20
Indeks FukuyamaSugeno 199.4 202.0 197.0 201.2 207.8 210.1 225.2 234.3 240.2 263.1
1500.0 1400.0 1300.0 1200.0 1100.0 1000.0 900.0 800.0 700.0 600.0 500.0 400.0 300.0 200.0 100.0 0.0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Banyaknya Cluster
Gambar 13. Indeks Fukuyama-Sugeno FCM data Podes 2008 Kabupaten Lampung Timur
Banyaknya desa anggota cluster pertama sampai dengan cluster ketiga belas berturut-turut 15, 97, 5, 3, 43, 14, 10, 19, 1, 12, 7, 7, dan 24. Cluster pertama tediri dari 15 desa yaitu desa Karya Mukti, Banjar Agung, Mumbang Jaya, Maringgai, Kebon Damar, Tebing, Braja Luhur, Labuhan Ratu Empat, Putra Aji Satu, Nyampir, Lehan, Trisno Mulyo, Cempaka Nuban, Rantau Fajar, dan Tegal Ombo. Karakteristik desa-desa dalam cluster pertama adalah rata-rata jumlah penduduk 2.882 jiwa, rata-rata fasilitas pendidikan 5 unit, rata-rata fasilitas kesehatan 5 unit, rata-rata tenaga kesehatan 5 orang. Cluster kedua beranggotakan desa yang memiliki karakteristik antara lain jumlah penduduk rata-rata 2.264 jiwa, tidak memiliki pemukiman kumuh (jumlah rumah tangga yang tinggal di pemukiman kumuh nihil), fasilitas pendidikan
TAHUN 6, VOLUME 2, DESEMBER 2014
47
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
rata-rata 4 unit sekolah, dan fasilitas kesehatan rata-rata 4 unit. Hasil pengelompokkan lengkap disajikan dalam matriks U seperti pada Lampiran 3. Berdasarkan Tabel 14. hasil pengelompokkan 257 desa di Kabupaten Lampung Timur ke dalam 13 cluster, terlihat bahwa metode FCM lebih kokoh terhadap objek pencilan dalam mempertahankan anggota cluster daripada metode CM. Hal ini ditunjukkan oleh cluster yang hanya mempunyai satu anggota. Pada metode FCM hanya pada C9, sedangkan pada CM terdapaat pada C1, C9, dan C13. Menurut Loureiro (2004) cluster dengan ukuran kecil dipandang sebagai objek outlier (pencilan).
Tabel 14. Hasil Pengelompokkan dengan 13 cluster untuk metode CM dan FCM Metode Cluster C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13
CM Nc 1 17 13 23 14 21 10 23 1 67 8 58 1
% 0.39 6.61 5.06 8.95 5.45 8.17 3.89 8.95 0.39 26.07 3.11 22.57 0.39
FCM Nc 15 97 5 3 43 14 10 19 1 12 7 7 24
% 5.84 37.74 1.95 1.17 16.73 5.45 3.89 7.39 0.39 4.67 2.72 2.72 9.34
IV. KESIMPULAN DAN SARAN
Kesimpulan Dari uraian analisis dan kajian metode pengelompokkan pada bab sebelumnya dapat diambil kesimpulan: 1. Optimasi fungsi objektif: a. Pada algoritma CM adalah dengan meminimalkan jarak antara objek dengan pusat clusternya. b. Pada algoritma FCM dihasilkan melalui optimasi dalam penentuan pusat cluster (vi) dan derajat keanggotaan (ui). 2. Algoritma FCM dengan indeks validitas Fukuyama-Sugeno secara lengkap dalam script MATLAB disajikan pada lampiran 4. 48
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
3. Hasil Pengelompokkan 22 kelurahan di Kota Metro menggunakan metode FCM menghasilkan jumlah cluster terbaik 4 (empat) cluster. Masing-masing cluster yang terbentuk sebagai berikut : Cluster pertama terdiri dari empat kelurahan yaitu Iringmulyo, Metro, Imopuro, dan Hadimulyo Barat yang memiliki kemiripan karakteristik antara lain jumlah penduduk di atas 9.000 jiwa, fasilitas pendidikan di atas 9 unit, dan fasilitas kesehatan di atas 13 unit. Cluster kedua terdiri dari empat kelurahan yaitu Ganjarasri, Hadimulyo Timur, Banjarsari, dan Karangrejo. Sedangkan cluster ketiga terdiri dari enam kelurahan yaitu Mulyojati, Ganjaragung, Tejoagung, Yosorejo, Yosodadi, dan Yosomulyo. Sedangkan cluster keempat terdiri dari delapan kelurahan yaitu Sumbersari, Rejomulyo, Margodadi, Margorejo, Mulyosari, Tejosari, Purwosari, dan Purwoasri. 4. Hasil pengelompokkan 257 desa di Kabupaten Lampung Timur menggunakan metode FCM menghasilkan banyaknya cluster 13. Hal ini ditunjukkan dengan nilai minimum indeks validitas Fukuyama-Sugeno sebesar 196.9424. Banyaknya desa anggota cluster pertama sampai dengan cluster ketiga belas berturut-turut 15, 97, 5, 3, 43, 14, 10, 19, 1, 12, 7, 7, dan 24. 5. Metode FCM lebih dapat mempertahankan banyaknya cluster terhadap adanya data pencilan jika dibandingkan dengan metode CM. 6. Berdasarkan hasil pengolahan data Podes 2008 sebagai pengujian metode FCM secara empiris diperoleh nilai yang mendukung bahwa FCM lebih halus dalam mempartisi cluster. Hal ini karena tiap objek dilengkapi dengan derajat keanggotaan ke pusat cluster yang terbentuk. 7. Running time terhadap banyaknya cluster algoritma FCM tidak linear seperti CM.
Saran Dalam penelitian ini masih banyak permasalahan yang belum dikaji secara mendalam, oleh karena itu penulis memberikan saran sebagai berikut: 1. Melakukan analisis data dengan metode pengelompokkan lainnya,
seperti dengan
algoritma Two Step Cluster, Fuzzy C-Shelll, Fuzzy Substractive, dan sebagainya. 2. Mengembangkan algoritma pengelompokkan dan membuat sub programnya.
TAHUN 6, VOLUME 2, DESEMBER 2014
49
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
DAFTAR PUSTAKA Agusta, Y (2007). K-Means – Penerapan, Permasalahan dan Metode Terkait, Jurnal Sistem dan Informatika, Vol. 3, pp. 47-60. BPS (2008). Pedoman Pendataan Podes 2008. Publikasi Badan Pusat Statistik, Jakarta. BPS (2005). Identifikasi dan Penentuan Desa Tertinggal Tahun 2002. Publikasi Badan Pusat Statistik, Jakarta. Dombi, J. dan Gera, Z. (2005). The approximation of piecewise linear membership functions and Łukasiewicz operators, Fuzzy Sets and Systems 154, pp. 275–286. Dombi, J. (1988). Membership function as an evaluation, Reseach Group of Theory of Automata, p.4. Dunn, J.C. (1973). A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters, J. Cybernetics 3 (3) pp. 32–57. Halkidi, M., Batistakis, Y., dan Vazirgiannis, M. (2000). On Clustering Validation Techniques, Department of Informatics, Athens University of Economics and Business, Patision 76, Athens, Greece. Jain, A.K., dan Dubes, R.C. (1988). Algorithms for Clustering Data, Prantice-Hall advanced reference series, Prenctice Hall, Upper Saddle River, New Jersey. Jain, A.K., Murty, M.N., dan Flynn, P.J. (1999). Data Clustering : A Review, ACM Computing Survey, Vol. 31, No. 3, September 1999. Johnson, R.A. dan Wichern, D.W. (2002). Applied Multivariate Statistical Analysis, Fifth Edition, Prenctice Hall, Upper Saddle River, New Jersey, pp.668-747. Kanungo, T., Mount, D.M., Netanyahu, N.S., Piatko, C., Silverman, R., dan Wu, A.Y. (2000). An Efficient k-Means Clustering Algorithm : Analysis and Implementation, Proceedings of the 16th ACM Symposium on Computational Geometry 2000. MacQueen, J. (1967). Some Methods for Classification and Analysis of Multivariate Observations, In Proc. 5th Berkeley Symp. Math. Statist. Prob. 1 pp.281–297. Naik, C. Vaibhav (2004). Fuzzy C-Means Clustering Aproach to Design a Warehouse Layout, Master Thesis, Univesity of South Florida. Pal, N.R. dan Bezdek, J.C. (1995) On cluster validity for the fuzzy c-means model, IEEE Trans. on Fuzzy Systems 3 (3) pp. 370–379. Pravitasari, A.A. (2008). Analisis Pengelompokkan dengan Fuzzy C-Means Cluster, Tesis, Institut Teknologi Sepuluh Nopember Surabaya. Nasibov, E. N. dan Ulutagay, G. (2005). A New Approach to Clustering Problem Using the Fuzzy Joint Points Method, Automatic Control and Computer Sciences, 39 No.6, pp.8-17.
50
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Sander, J., Ester, M., Kriegel, H.P., dan Xu, X. (1998). Density-Based Clustering in Spatial Databases: The Algorithm GDBSCAN and Its Applications, Data Mining and Knowledge Discovery 2, pp.169-194. Sarpono (2009). Penggunaan Geographically Weighted Regression-Kriging untuk Klasifikasi Desa Tertinggal, Seminar Nasional Aplikasi Teknologi Informasi 2009 (SNATI 2009) Yogyakarta, 20 Juni 2009, pp. D-71 - D-77.
TAHUN 6, VOLUME 2, DESEMBER 2014
51
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
PENGARUH FOREIGN DIRECT INVESTMENT (FDI) TERHADAP PERTUMBUHAN EKONOMI 10 NEGARA ASEAN
Aisyah Fitri Yuniasih Dosen Sekolah Tinggi Ilmu Statistik
Abstract
One strategy of ASEAN countries to fill the scarcity of capital resources of development to increase their economic growth is to implement economic liberalization through Foreign Direct Investment (FDI). Therefore, this research aimed to analyze the effect of FDI on economic growth of ASEAN countries. Panel data analysis from 10 ASEAN countries during the period 1980-2012 using Fixed Effect Model WLS cross-section SUR stated that FDI, Gross Fixed Capital Formation (GFCF), labor force, net exports and economic crisis significantly affect the economic growth of ASEAN countries altogether. Then, partially, FDI, GFCF, and labor force have a positive effect on economic growth of ASEAN countries, while net exports and economic crisis negatively affect economic growth in the ASEAN countries.
Keywords: Foreign Direct Investment (FDI), Gross Fixed Capital Formation (GFCF), Fixed Effect Model WLS cross-section SUR
I. PENDAHULUAN
Pembangunan merupakan suatu proses multidimensional yang mencakup berbagai perubahan mendasar atas struktur sosial, nilai serta norma masyarakat, dan institusi-institusi nasional, selain tetap mengejar akselerasi pertumbuhan ekonomi, penanganan ketimpangan pendapatan, serta pengentasan kemiskinan. Pembangunan secara umum difokuskan pada pembangunan ekonomi melalui usaha peningkatan pertumbuhan ekonomi yang berkaitan erat dengan peningkatan pendapatan nasional baik secara keseluruhan maupun per kapita sehingga masalah-masalah, seperti pengangguran, kemiskinan, dan ketimpangan distribusi pendapatan diharapkan dapat terpecahkan melalui trickle down effect (Todaro dan Smith, 2006). Era globalisasi telah mendorong semua negara untuk meningkatkan pertumbuhan ekonominya karena pertumbuhan ekonomi yang positif dan progresif penting bagi suatu negara agar dapat bertahan dalam persaingan antar negara di era globalisasi ekonomi, tak
52
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
terkecuali bagi negara-negara di kawasan regional Asia Tenggara yang tergabung dalam Association of South East Asian Nations (ASEAN). Pasca krisis ekonomi, baik krisis moneter Asia tahun 1997-1998, krisis minyak dunia tahun 2005, dan krisis finansial global yang disebabkan oleh krisis mortgage di Amerika Serikat tahun 2008-2009, negara ASEAN tetap dituntut untuk dapat mempertahankan dan meningkatkan performa pertumbuhan ekonominya agar terhindar dari multiplier effect akibat krisis-krisis ekonomi tersebut. Salah satu strategi negara ASEAN untuk menghadapi situasi perekonomian dunia yang tidak pasti dan semakin menantang adalah dengan menerapkan liberalisasi ekonomi melalui Penanaman Modal Asing Langsung atau Foreign Direct Investment (FDI) untuk mengisi kelangkaan sumber daya modal pembangunan untuk meningkatkan pertumbuhan ekonominya. Lalu lintas perekonomian internasional memiliki peranan penting bagi pertumbuhan ekonomi di negara ASEAN yang menganut sistem perekonomian terbuka. Terlebih lagi dikaitkan dengan pembentukan Masyarakat Ekonomi ASEAN (MEA) 2015, yang memiliki tujuan tercapainya suatu kawasan yang stabil, makmur, berdaya saing tinggi, dengan pertumbuhan ekonomi yang berimbang serta berkurangnya kemiskinan dan kesenjangan sosial ekonomi.Oleh karena itu, negara ASEAN dituntut untuk merealisasikan keterbukaan ekonomi yang salah satunya adalah keterbukaan di sektor finansial. Keterbukaan ekonomi di sektor finansial mengindikasikan semakin hilangnya hambatan dan semakin lancarnya mobilitas modal antar negara yang menjadi sumber pembiayaan pembangunan dan pertumbuhan ekonomi di suatu negara sehingga diperlukan sejumlah investasi yang dibiayai oleh tabungan nasional. Negara ASEAN tidak mempunyai dana yang cukup untuk membiayai pembangunan ekonomi karena terbatasnya akumulasi berupa kapital tabungan nasional serta rendahnya produktivitas dan tingginya konsumsi, sehingga diperlukan sumber dana lain yaitu Penanaman Modal Asing Langsung atau Foreign Direct Investment (FDI). Selama periode 1980-2009 kondisi dimana rata-rata tabungan nasional negara ASEAN lebih besar dari rata-rata investasinya hanya terjadi pada tahun 1993, 1995, dan 1996 dimana selisihnya hanya sekitar satu persen. Keterbukaan ekonomi di sektor finansial yang salah satunya melalui Penanaman Modal Asing Langsung atau Foreign Direct Investment (FDI) dapat mengisi kelangkaan sumber daya modal pembangunan untuk meningkatkan pertumbuhan ekonomi di negara tersebut. FDI memberikan eksternalitas positif melalui peningkatan transfer teknologi, kemampuan teknis, kemampuan manajerial, dan kemampuan intelektual tenaga ahli bagi negara penerima modal. FDI diarahkan untuk menggantikan peranan utang luar negeri karena dinilai lebih stabil dan kurang sensitif terhadap suku bunga internasional dan nilai tukar mata uang.Disamping itu, TAHUN 6, VOLUME 2, DESEMBER 2014
53
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
dampak tidak langsung dari FDI antara lain juga dapat meningkatkan produktivitas, kinerja, efisiensi, dan daya saing dari perusahaan domestik dalam sektor yang sama, bahkan sering kali juga dapat meningkatkan nilai ekspor. Lebih jauh lagi, FDI dapat meningkatkan penyerapan tenaga kerja dan pendapatan masyarakat di suatu negara, sehingga berpotensi mengurangi tingkat kemiskinan di negara tersebut (Soekro, 2008). Jumlah aliran dana FDI yang masuk ke negara ASEAN tahun 1999 jika dibandingkan dengan saat krisis moneter Asia tahun 1997-1998, secara nominal mengalami peningkatan sebesar 29,06 % namun secara proporsional terhadap total aliran dana FDI di seluruh dunia mengalami penurunan sebesar 0,73 %. Untuk kasus krisis minyak dunia tahun 2005, jumlah aliran dana FDI yang masuk ke negara ASEAN tahun 2006 secara nominal mengalami peningkatan sebesar 39,17 % begitu pula secara proporsional terhadap total aliran dana FDI di seluruh dunia mengalami peningkatan sebesar 0,20 %. Bahkan, jumlah aliran dana FDI yang masuk ke negara ASEAN tahun 2010 pasca krisis finansial global 2008-2009 meningkat cukup tajam sebesar 108,61 % secara nominal dan 3,07 % secara proporsional terhadap total aliran dana FDI di seluruh dunia. Peningkatan jumlah aliran dana FDI di negara ASEAN diharapkan akan terus meningkat di tahun-tahun mendatang mengingat besarnya potensi ekonomi yang menguntungkan untuk investasi di negara kawasan Asia Tenggara ini. Investor asing tertarik untuk menanamkan modal di negara ASEAN karena reputasi negara ASEAN yang fundamental secara makroekonomi. Perekonomian negara ASEAN dinamis karena memiliki sedikit defisit fiskal, nilai tukar mata uang yang stabil, tingkat tabungan domestik yang tinggi, dan tingkat partisipasi angkatan kerja yang tinggi. Di samping itu, kondisi pasar, kebijakan kebebasan perdagangan internasional, termasuk kebijakan liberalisasi FDI merupakan daya tarik lain bagi investor asing untuk menanamkan modalnya dalam bentuk FDI di negara ASEAN (Almasaied, 2004). Peningkatan aliran dana FDI ke negara ASEAN diharapkan dapat meningkatkan pertumbuhan ekonomi negara ASEAN. Hady (2001) menyatakan bahwa FDI memberikan dampak positif dan negatif bagi pertumbuhan ekonomi suatu negara. Dampak positif FDI terhadap pertumbuhan ekonomi antara lain sebagai sumber pembiayaan jangka panjang dan pembentukan modal serta sebagai sarana transfer teknologi dan pengetahuan di bidang manajemen dan pemasaran. FDI tidak akan memberatkan neraca pembayaran karena tidak ada kewajiban pembayaran utang dan bunga, sedangkan transfer keuntungan didasarkan kepada keberhasilan FDI yang dilakukan oleh perusahaan asing tersebut. FDI diupayakan untuk meningkatkan pembangunan regional dan sektoral dengan meningkatkan persaingan dalam negeri dan kewirausahaan yang sehat, serta meningkatkan lapangan kerja.
54
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Pengaruh negatif FDI terhadap pertumbuhan ekonomi antara lain mendorong munculnya dominasi industrial, meningkatkan ketergantungan teknologi, memengaruhi perubahan budaya. Dominansi FDI dapat menimbulkan gangguan pada perencanaan ekonomi karena terjadi intervensi oleh home government dari negara penanam modal. Secara sektoral mungkin aliran modal internasional ini akan ditentang oleh kelompok pemilik faktor produksi tertentu karena terjadinya redistribusi pendapatan dari pemilik faktor produksi lainnya (tenaga kerja, tanah/bangunan) ke pemilik modal. Uraian diatas menyatakan bahwa pengaruh FDI terhadap pertumbuhan ekonomi berbeda antar negara. Contoh kasus dimana FDI memberikan pengaruh positif terhadap pertumbuhan ekonomi terjadi di Srilanka (Balamurali dan Bogahawatte, 2004), China (Xiaohong, 2009), Nigeria (Adegbite dan Ayadi, 2010), Asia (Tiwari dan Mutascu, 2011), dan Bangladesh (Adhikary, 2011). FDI bisa juga memberikan pengaruh negatif terhadap pertumbuhan ekonomi sektor primer seperti di Negara OEDC (Alfaro, 2003). Bahkan, FDI bisa tidak berpengaruh terhadap pertumbuhan ekonomi seperti di Pakistan (Falki, 2009). Berdasarkan uraian diatas, maka permasalahan dalam penelitian ini adalah bagaimana pengaruh FDI tehadap pertumbuhan ekonomi negara ASEAN. Hal ini tergantung pada kondisi perekonomian, teknologi, dan institusional dari negara tempat penanaman modal FDI tersebut. Oleh karena itu, penelitian ini bertujuan untuk menganalisis pengaruh FDI terhadap pertumbuhan ekonomi negara ASEAN.
II. METODOLOGI
1. Tinjauan Pustaka FDI adalah investasi riil dalam bentuk pendirian perusahaan, pembangunan pabrik, pembelian barang modal, tanah, bahan baku, dan persediaan oleh investor asing dimana investor tersebut terlibat langsung dalam manajemen perusahaan dan mengontrol penanaman modal tersebut. FDI ini biasanya dimulai dengan pendirian subsidiary atau pembelian saham mayoritas dari suatu perusahaan dimana dalam konteks internasional, bentuk investasi ini biasanya dilakukan oleh perusahaan multinasional dengan operasi dibidang manufaktur, industri pengolahan, ekstraksi pengolahan, ekstraksi sumber alam, industri jasa, dan sebagainya (Hady, 2001). Menurut teori pertumbuhan Neoklasik, pertumbuhan output selalu bersumber dari faktor-faktor seperti kenaikan kualitas dan kuantitas tenaga kerja, penambahan modal (tabungan dan investasi) dan penyempurnaan teknologi (Todaro dan Smith, 2006) sedangkan teori dependensi menyatakan bahwa ketergantungan terhadap investasi asing TAHUN 6, VOLUME 2, DESEMBER 2014
55
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
memberikan dampak negatif terhadap pertumbuhan ekonomi dan distribusi pendapatan (Amir, 1974). Negara-negara yang menganut sistem perekonomian terbuka pada umumnya memerlukan investasi asing. Di negara maju investasi asing tetap diperlukan untuk memacu pertumbuhan ekonomi domestik, menghindari kelesuan pasar, dan penciptaan kesempatan kerja. Di negara berkembang yang sangat memerlukan modal untuk pembangunannya, terutama jika modal dalam negeri tidak mencukupi, FDI dipandang sebagai cara yang lebih efektif untuk mendorong pertumbuhan perekonomian suatu negara dimana modal asing dapat memberikan kontribusi yang lebih baik ke dalam proses pembangunan. Oleh karena itu, beberapa negara penerima modal berusaha memberikan insentif untuk mendorong masuknya modal asing dalam bentuk FDI berupa insentif pajak, jaminan dan asuransi atas investasinya. Kegiatan investasi memungkinkan suatu masyarakat terus-menerus meningkatkan kegiatan ekonomi dan kesempatan kerja, meningkatkan pendapatan nasional dan meningkatkan taraf kesejahteraan masyarakat. Hady (2001) menyatakan bahwa FDI memberikan dampak positif dan negatif bagi pertumbuhan ekonomi suatu negara. Dampak positif FDI terhadap pertumbuhan ekonomi antara lain sebagai sumber pembiayaan jangka panjang dan pembentukan modal serta sebagai sarana transfer teknologi dan pengetahuan di bidang manajemen dan pemasaran. FDI tidak akan memberatkan neraca pembayaran karena tidak ada kewajiban pembayaran utang dan bunga, sedangkan transfer keuntungan didasarkan kepada keberhasilan FDI yang dilakukan oleh perusahaan asing tersebut. FDI diupayakan untuk meningkatkan pembangunan regional dan sektoral, meningkatkan persaingan dalam negeri dan kewirausahaan yang sehat, serta meningkatkan lapangan kerja. Pengaruh negatif FDI terhadap pertumbuhan ekonomi antara lain mendorong munculnya dominasi industrial, meningkatkan ketergantungan teknologi, memengaruhi perubahan budaya. Dominansi FDI dapat menimbulkan gangguan pada perencanaan ekonomi karena terjadi intervensi oleh home government dari negara penanam modal. Secara sektoral mungkin aliran modal internasional ini akan ditentang oleh kelompok pemilik faktor produksi tertentu karena terjadinya redistribusi pendapatan dari pemilik faktor produksi lainnya (tenaga kerja, tanah/bangunan) ke pemilik modal. Balamurali dan Bogahawatte (2004) melakukan penelitian dengan data time series periode 1977-2003 di Sri Lanka, dengan metode Johansen’s Full Information Maximum Likelihood Method dan VAR. Penelitian tersebut menyatakan bahwa FDI merupakan determinan utama pertumbuhan ekonomi Srilanka. Tingkat pertumbuhan FDI juga secara
56
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
signifikan memengaruhi pertumbuhan ekonomi di Nigeria periode 1992-2007 berdasarkan penelitian yang dilakukan Adegbite dan Ayadi (2010) dengan metode Ordinary Least Square. Tiwari dan Mustascu (2011) dengan menggunakan data panel periode 1986-2008 dari 23 negara sedang berkembang di Asia dengan metode Random Effect model menemukan bahwa FDI, Ekspor, dan tenaga kerja memberikan pengaruh positif yang signifikan terhadap pertumbuhan ekonomi. Pengaruh positif FDI terhadap pertumbuhan ekonomi juga ditemukan di China periode 1985-2008 berdasarkan penelitian Xiaohong (2009) yang menggunakan metode Ordinary Least Square. Di Indonesia, Ramadhan (2010) menggunakan data time series periode Triwulan I 1995-triwulan IV 2009, dengan metode Ordinary Least Square juga menemukan bahwa FDI memberikan pengaruh positif yang signifikan terhadap pertumbuhan ekonomi. Selain itu, pengaruh positif FDI yang signifikan terhadap pertumbuhan ekonomi juga ditemukan Adhikary (2011) di Bangladesh periode 1986-2008 dengan metode Vector Error Correction Model (VECM). Alfaro (2003) dengan menggunakan data panel periode 1981-1999 dari 47 Negara OECD dengan metode Ordinary Least Square Meneukan bahwa FDI berpengaruh negatif terhadap pertumbuhan ekonomi sektor primer, berpengaruh positif terhadap sektor sekunder, dan berpengaruh ambigu terhadap sektor tersier. Sedangkan, NaFalki (2009) dengan menggunakan Data time series periode 1980-2006 di Pakistan, dengan metode Ordinary Least Square menemukan bahwa FDI tidak berpengaruh terhadap pertumbuhan ekonomi. Perbedaan penelitian ini dengan penelitian-penelitian sebelumnya adalah bahwa penelitian ini meneliti bagaimana pengaruh FDI terhadap pertumbuhan ekonomi di sepuluh negara ASEAN selama kurun waktu 1980-2012. Variabel-variabel yang digunakan dalam penelitian ini persentase FDI Inflow terhadap GDP, persentase PMTB terhadap GDP, jumlah angkatan kerja, persentase nilai ekspor terhadap GDP ditambah persentase nilai impor terhadap GDP, dan variabel dummy krisis ekonomi. Metode analisis yang digunakan dalam penelitian ini adalah analisis deskriptif dan analisis regresi linear berganda data panel.
TAHUN 6, VOLUME 2, DESEMBER 2014
57
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK - Pertumbuhan Ekonomi Negara ASEAN yang fluktuatif dipengaruhi gejolak perekonomian dunia - Defisit Arus Modal Keluar Neto di Negara ASEAN
Variabel Lain: PMTB; Angkatan Kerja; Ekspor Neto; Dummy Krisis
Pertumbuhan Ekonomi Negara ASEAN
FDI
Aliran Modal Transfer Teknologi Transfer Kemampuan Teknis, Manajerial, dan Intelektual Tenaga Ahli
Dampak Positif
Dampak Negatif
Rekomendasi Kebijakan
Gambar 1. Kerangka Pemikiran Pengaruh FDI terhadap Pertumbuhan Ekonomi
Berdasarkan tinjauan teori dan penelitian terdahulu di Srilanka (Balamurali dan Bogahawatte, 2004), China (Xiaohong, 2009), Nigeria (Adegbite dan Ayadi, 2010), Asia (Tiwari dan Mutascu, 2011), dan Bangladesh (Adhikary, 2011) yang menyatakan bahwa FDI memberikan pengaruh positif terhadap pertumbuhan ekonomi, maka hipotesis yang akan diuji dalam penelitian ini adalah bahwa terdapat FDI berpengaruh positif terhadap pertumbuhan ekonomi negara ASEAN pada periode penelitian.
2. Metode Analisis Metode analisis yang digunakan dalam penelitian ini adalah analisis deskriptif dan analisis regresi data panel. Jenis data yang digunakan dalam penelitian ini adalah data sekunder berupa data panel dari 10 negara ASEAN selama kurun waktu 1980–2012. Jenis data panel yang digunakan dalam penelitian ini adalah balanced panel dimana setiap unit cross section memiliki jumlah observasi time series yang sama. Sumber data yang digunakan berasal dari United Nation Conference on Trade and Development (UNCTAD). Rancangan model yang akan diajukan adalah model regresi linear dengan lima variabel independen, dengan variabel dependennya GROWTH dan variabel independennya adalah FDI, GFCF, LF, NX, dan DKRISIS. Data yang diperoleh pada variabel-variabel tersebut ternyata berbeda satuan. Variabel GROWTH, FDI, GFCF, dan NX disajikan dalam satuan persentase, sedangkan variabel LF disajikan dalam satuan ribu jiwa. Oleh karena itu, untuk memudahkan dalam mengolah data dan interpretasi hasil akhirnya, variabel independen LF yang berbeda satuan akan ditransformasi sehingga menjadi bentuk satuan yang sama, yaitu dalam bentuk log
58
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
natural, sedangkan untuk variabel DKRISIS yang tidak memiliki satuan, tidak ditransformasi karena tidak akan diinterpretasi hasilnya. Dengan model tersebut, diharapkan bahwa hasil regresi yang diperoleh akan lebih efisien dan mudah untuk diinterprestasikan. Sesuai dengan keterangan di atas, maka spesifikasi model tersebut secara ekonometrika akan menjadi model sebagai berikut: GROWTHt = α + β1FDIt + β2GFCFt + β3ln(LFt) + β4NXt + β5DKRISISt + εt dimana : GROWTHt = Tingkat Rata-Rata Pertumbuhan Ekonomi Tahunan (data dalam persen) FDIt
= Persentase Nilai FDI Inflow terhadap GDP Tahunan (data dalam persen)
GFCFt
= Persentase Nilai Gross Fixed Capital Formation (GFCF) atau Pembentukan Modal Tetap Bruto (PMTB) terhadap GDP Tahunan (data dalam persen)
NXt
= Persentase Nilai ekspor neto terhadap GDP Tahunan (data dalam persen)
LFt
= Jumlah Labour Force atau Angkatan Kerja Tahunan (data dalam Ribu Jiwa)
DKRISISt
= Variabel Dummy yang mengindikasikan terjadinya krisis ekonomi dimana nilainya sama dengan satu pada saat krisis ekonomi dan nilainya sama dengan nol pada saat bukan krisis ekonomi
III. HASIL DAN PEMBAHASAN
Pertumbuhan ekonomi negara ASEAN periode 1980-2012 cenderung fluktuatif. Hal ini disebabkan dominansi pengaruh ketidakpastian perekonomian dunia terhadap pertumbuhan ekonomi negara ASEAN dimana setiap gejolak yang terjadi dalam perkonomian dunia akan berdampak terhadap pertumbuhan ekonomi negara ASEAN yang sebagian besar hanya merupakan negara dengan perkonomian terbuka kecil (small open economy). Pada periode 1980-2012, jika dibandingkan dengan rata-rata tingkat pertumbuhan ekonomi negara ASEAN yang sebesar 5,33 %, Myanmar menjadi negara ASEAN dengan rata-rata tingkat pertumbuhan ekonomi yang tertinggi yaitu sebesar 6,87 % sedangkan Brunei Darussalam merupakan negara dengan rata-rata tingkat pertumbuhan ekonomi yang terendah selama 1980-2012 yaitu sebesar 0,28 %. Kerjasama negara ASEAN di sektor investasi diawali dengan adanya skema ASEAN Investment Guarantee Agreement (ASEAN IGA) pada tahun 1987. Selanjutnya, pada 7 Oktober 1998 perjanjian tersebut diganti dengan Framework Agreement on ASEAN Investment Area (FA-AIA) yang ditandatangani di Makati City, Filipina, pada tahun 1998. Perkembangan yang paling akhir disepakati adalah ASEAN Comprehensive Investment Agreement (ACIA) di Thailand dalam KTT ASEAN ke-14 yaitu pada 26 Februari 2009. ACIA mencakup empat TAHUN 6, VOLUME 2, DESEMBER 2014
59
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pilar utama yang meliputi: liberalisation, protection, facilitation, dan promotion. ACIA mengikat
negara-negara
anggota
untuk
menghapus
hambatan-hambatan
investasi,
meliberalisasi peraturan-peraturan dan kebijaksanaan investasi, memberi persamaan perlakuan nasional dan membuka investasi di industrinya terutama sektor manufaktur, sehingga dapat meningkatkan arus investasi ke kawasan ASEAN (Halwani, 2005). ACIA lebih bersifat komprehensif karena telah mengadopsi international best practices dalam bidang investasi dengan mengacu kepada kesepakatan-kesepakatan investasi internasional. ACIA diharapkan dapat meningkatkan iklim investasi yang baik di kawasan ASEAN melalui peningkatan daya saing serta daya tarik investasi dengan menciptakan suatu kawasan investasi ASEAN yang liberal dan transparan. ASEAN diharapkan dapat menjadi wilayah yang sangat kompetitif sebagai tujuan FDI serta mendukung realisasi ASEAN Economic Community. Wujud realisasi liberalisasi investasi di kawasan ASEAN terlihat dari perkembangan FDI Inflow negara ASEAN yang secara umum mengalami peningkatan dari waktu ke waktu terutama pada dekade terakhir. Penurunan FDI Inflow negara ASEAN yang disebabkan kemerosotan daya saing terjadi dipengaruhi krisis ekonomi yang dialami negara ASEAN tersebut (Halwani, 2005). Selama tahun 1980–2012, Laos merupakan negara dengan rata-rata jumlah FDI Inflow yang masuk ke negaranya yang paling sedikit yaitu sebesar US$ 75.172.977,77 per tahun atau hanya 0.25 % dari rata-rata jumlah FDI Inflow ke negara ASEAN yang mencapai US$ 30.433.771.019,94 per tahun. Jumlah FDI Inflow yang mengalir ke negara ASEAN didominasi oleh Singapura yang secara rata-rata menguasai US$ 14.980.393.919,96 per tahun FDI Inflow ke negara ASEAN atau hampir 50 % yaitu 49,22 % dari jumlah FDI Inflow ke negara ASEAN. FDI Inflow baru secara rutin mengalir ke sepuluh Negara ASEAN sejak tahun 1992. Brunei Darussalam menjadi negara yang memiliki rata-rata tingkat pertumbuhan FDI Inflow yang tertinggi di negara ASEAN selama 1995-2012 yaitu sebesar 511,38 % jika dibandingkan dengan rata-rata tingkat pertumbuhan FDI Inflow Negara ASEAN sebesar 17,64 %. Rata-rata tingkat pertumbuhan FDI Inflow Brunei Darussalam yang sangat besar dipengaruhi oleh peningkatan FDI Inflow yang sangat signifikan di tahun 1995 sebesar 9.794,07 %. Negara ASEAN dengan rata-rata tingkat pertumbuhan FDI Inflow yang terendah adalah Thailand yaitu sebesar 21,37 %. Rata-rata jumlah FDI Inflow ke negara Indonesia selama 1980–2012 berada diurutan ke empat yaitu mencapai US$ 3.200.519.536,70 per tahun atau 10,52 % dari jumlah FDI Inflow ke negara ASEAN. Rata-rata tingkat pertumbuhan FDI Inflow ke Indonesia sebesar 22,36%. Adapun FDI di Indonesia dalam jangka panjang secara positif dan signifikan dipengaruhi oleh
60
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
PDB, infrastruktur, keterbukaan ekonomi dan nilai tukar sedangkan ekspor berpengaruh negatif terhadap aliran FDI (Sutarsono, 2010). Pada periode 1980-2012, rata-rata persentase PMTB terhadap GDP per negara ASEAN per tahun adalah sebesar 22,79 % dengan rata-rata tingkat pertumbuhan persentase PMTB terhadap GDP tahunan sebesar 2,45 %. Negara ASEAN yang memiliki rata-rata persentase PMTB terhadap GDP per tahun tertinggi selama 1980–2012 adalah Singapura dengan rata-rata persentase PMTB terhadap GDP per tahun sebesar 31,92 % sedangkan Negara ASEAN yang memiliki rata-rata persentase PMTB terhadap GDP per tahun terendah selama 1980–2012 adalah Kamboja dengan rata-rata persentase PMTB terhadap GDP per tahun sebesar 13,57 %. Brunei Darussalam merupakan negara ASEAN dengan rata-rata tingkat pertumbuhan persentase PMTB terhadap GDP tahunan tertinggi yaitu sebesar 8,45% sedangkan Filipina merupakan negara ASEAN dengan rata-rata tingkat pertumbuhan persentase PMTB terhadap
Rata-rata Jumlah FDI Inflow (Juta US$)
GDP tahunan terendah yaitu sebesar -0.89 %.
16,000 14,000 12,000 10,000 8,000 6,000 4,000 2,000 0
14,980.39
3,973.48
3,200.52 402.40 243.41
75.17
411.321,129.08
3,809.39 2,208.60
Sumber : UNCTAD, Data Diolah Gambar 2. Perkembangan Rata-rata FDI Inflow Masing-masing Negara ASEAN Tahun 1980-2012 (Juta US$)
Jumlah angkatan kerja di negara ASEAN dari tahun 1980-2012 memperlihatkan trend yang selalu meningkat dari tahun ke tahun baik secara total negara maupun jika dilihat dari jumlah angkatan kerja di masing-masing negara ASEAN. Rata-rata jumlah angkatan kerja negara ASEAN pada periode 1980-2012 adalah sebesar 229.756.781 jiwa per tahun. Indonesia merupakan negara ASEAN dengan rata-rata jumlah angkatan kerja tertinggi selama 1980– 2012 yaitu sebesar 89.189.951,52 jiwa per tahun sedangkan Brunei Darussalam merupakan negara ASEAN dengan rata-rata jumlah angkatan kerja terendah yaitu sebesar 134.115 jiwa TAHUN 6, VOLUME 2, DESEMBER 2014
61
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
per tahun. Brunei Darussalam merupakan negara ASEAN dengan tingkat pertumbuhan angkatan kerja tahunan yang tertinggi dengan 3,35 % sedangkan Thailand merupakan negara ASEAN dengan tingkat pertumbuhan angkatan kerja tahunan yang terendah sebesar 1,73 %. Jumlah angkatan kerja yang besar saja tidak cukup untuk memengaruhi pertumbuhan ekonomi negara ASEAN. Kualitas angkatan kerja yang baik diperlukan untuk meningkatkan pertumbuhan ekonomi suatu negara. Kualitas angkatan kerja di suatu negara dapat tercermin dari nilai (Indeks Pembangunan Manusia (IPM) negara tersebut. Negara dengan nilai IPM adalah Singapura dengan 0,841 sedangkan yang terendah adalah Myanmar dengan 0,444. Perkembangan perdagangan internasional mengarah pada liberalisasi perdagangan yang disertai dengan berbagai bentuk kerjasama baik kerjasama bilateral, regional maupun multilateral. Salah satu tujuan utama perjanjian kerjasama perdagangan internasional adalah untuk mengurangi atau menghilangkan hambatan perdagangan yang diharapkan dapat memberikan pengaruh yang positif terhadap pertumbuhan ekonomi. Singapura merupakan negara ASEAN dengan rata-rata nilai Ekspor Neto tahunan tertinggi yaitu sebesar US$ 341.443.577.066,67. Nilai ini mencapai 36,15 % dari rata-rata nilai Ekspor Neto tahunan yang masuk ke negara ASEAN yang sebesar US$ 944.409.366.994,07. Sedangkan Laos juga merupakan negara ASEAN dengan rata-rata nilai Ekspor Neto tahunan terendah yaitu sebesar US$ 1.182.839.531,58 yang hanya mencapai 0.12 % dari rata-rata nilai Ekspor Neto tahunan yang masuk ke negara ASEAN. Secara nominal, perkembangan nilai ekspor, nilai impor, dan nilai Ekspor Neto negara ASEAN cenderung meningkat dari tahun ke tahun. Akan tetapi, jika dilihat dari nilai pertumbuhan ekspor dan impornya hasilnya sangat berfluktuasi dari waktu ke waktu dimana secara umum dapat disimpulkan bahwa rata-rata tingkat pertumbuhan impor masing-masing negara ASEAN lebih tinggi daripada rata-rata tingkat pertumbuhan ekspornya. Setelah melakukan tahapan evaluasi model berdasarkan kriteria ekonometrika maka dapat ditentukan bahwa model estimasi analisis data panel yang terbaik adalah Fixed Effect Model dengan WLS cross-section SUR. Nilai R squared 0.397752 berarti variabel FDI, PMTB, Ekspor Neto, Angkatan Kerja dan Krisis Ekonomi mampu menjelaskan keragaman pertumbuhan ekonomi sebesar 39.78 % sisanya sebesar 60,22 % keragaman pertumbuhan ekonomi dijelaskan oleh variabel lain di luar model. Fixed Effect Model dengan WLS crosssection menyatakan bahwa secara keseluruhan FDI, PMTB, Ekspor Neto, Angkatan Kerja dan Krisis Ekonomi signifikan mempengaruhi pertumbuhan ekonomi negara ASEAN. Kemudian, secara parsial FDI, PMTB, dan Angkatan Kerja berpengaruh positif terhadap pertumbuhan ekonomi negara ASEAN sedangkan Ekspor Neto dan Krisis Ekonomi berpengaruh negatif terhadap pertumbuhan ekonomi negara ASEAN.
62
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Dari hasil analisis regresi diperoleh hasil koefisien untuk variabel FDI sebesar 0,084540. Ini berarti bahwa FDI berpengaruh positif terhadap pertumbuhan ekonomi negara ASEAN, peningkatan persentase FDI Inflow terhadap GDP sebesar 1 %, akan meningkatkan pertumbuhan ekonomi sebesar 0,08 % dengan asumsi ceteris paribus. Hasil ini sesuai dengan landasan teori pertumbuhan ekonomi Neoklasik yang dari awal mendasari penelitian ini. Kasus dimana FDI memberikan pengaruh positif terhadap pertumbuhan ekonomi sesuai dengan yang terjadi di Srilanka (Balamurali dan Bogahawatte, 2004), China (Xiaohong, 2009), Nigeria (Adegbite dan Ayadi, 2010), Asia (Tiwari dan Mutascu, 2011), dan Bangladesh (Adhikary, 2011). FDI dipandang sebagai cara yang lebih efektif untuk mendorong pertumbuhan perekonomian suatu negara karena melalui FDI maka modal asing dapat memberikan kontribusi yang lebih baik ke dalam proses pembangunan. Oleh karena itu, beberapa negara berusaha memberikan insentif kepada masuknya modal asing dalam bentuk FDI ini. Di sisi lain, negara pengekspor kapital juga memberikan insentif kepada sektor swastanya, berupa insentif pajak, jaminan dan asuransi atas investasi untuk mendorong FDI ke negara berkembang. Dari hasil analisis regresi diperoleh hasil koefisien untuk variabel PMTB sebesar 0,056746.
Ini berarti bahwa PMTB berpengaruh positif terhadap pertumbuhan ekonomi
negara ASEAN, peningkatan persentase PMTB terhadap GDP sebesar 1 %, akan meningkatkan pertumbuhan ekonomi sebesar 0,06 % dengan asumsi ceteris paribus. Hasil yang menunjukkan bahwa PMTB memberikan pengaruh positif terhadap pertumbuhan ekonomi sesuai dengan yang terjadi di Bangladesh (Adhikary, 2011) sesuai dengan landasan teori pertumbuhan ekonomi Harrod-Domar. Pembentukan modal membawa pada pemanfaatan penuh sumber daya yang ada sehingga dapat menaikan besarnya output nasional, menekan angka inflasi dan defisit neraca pembayaran, serta membuat perekonomian bebas dari beban utang luar negeri. Dari hasil analisis regresi diperoleh hasil koefisien untuk variabel Angkatan Kerja sebesar 3,333877.
Ini berarti bahwa Angkatan Kerja berpengaruh positif terhadap
pertumbuhan ekonomi negara ASEAN, peningkatan Jumlah angkatan Kerja sebesar 1 %, akan meningkatkan pertumbuhan ekonomi sebesar 3,33% dengan asumsi ceteris paribus. Hasil yang menunjukkan bahwa angkatan kerja memberikan pengaruh positif terhadap pertumbuhan ekonomi sesuai dengan yang terjadi di Asia (Tiwari dan Mutascu, 2011) dan Pakistan (Falki, 2009). Pertumbuhan angkatan kerja secara tradisional dianggap sebagai salah satu faktor positif yang memacu pertumbuhan ekonomi dimana jumlah tenaga kerja yang lebih besar berarti akan menambah tingkat produksi (Todaro dan Smith, 2006). TAHUN 6, VOLUME 2, DESEMBER 2014
63
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Pengaruh positif atau negatif dari angkatan kerja tergantung pada kemampuan sistem perekonomian negara tersebut dalam menyerap dan memanfaatkan pertambahan angkatan kerja tersebut secara produktif. Kemampuan tersebut dipengaruhi oleh tingkat dan jenis akumulasi modal, tersedianya input dan faktor penunjang seperti kecakapan manajerial dan administrasi. Pertumbuhan angkatan kerja secara tradisional dianggap sebagai salah satu faktor positif yang memacu pertumbuhan ekonomi dimana jumlah tenaga kerja yang lebih besar berarti akan menambah tingkat produksi (Todaro dan Smith, 2006). Hasil ini dimana ekspor neto memberikan pengaruh negatif terhadap pertumbuhan ekonomi sesuai dengan yang terjadi di Bangladesh (Adhikary, 2011). Faktor dominan yang memengaruhi pertumbuhan ekonomi negara ASEAN diantaranya adalah konsumsi dan investasi yang cenderung meningkatkan impor. Peningkatan impor ini memicu penurunan ekspor neto. Akan tetapi, pengaruh penurunan ekspor neto terhadap pertumbuhan ekonomi negara ASEAN yang terjadi lebih kecil dibandingkan peningkatan pertumbuhan ekonomi akibat peningkatan konsumsi dan investasi sehingga menyebabkan hubungan negatif antara ekspor neto dan pertumbuhan ekonomi negara ASEAN (Lin dan Li, 2002). Dari hasil analisis regresi diperoleh hasil koefisien untuk variabel Krisis Ekonomi sebesar -2,253876.
Ini berarti bahwa krisis ekonomi berpengaruh negatif terhadap
pertumbuhan ekonomi negara ASEAN atau mengurangi pertumbuhan ekonomi negara ASEAN. Krisis ekonomi mempengaruhi pertumbuhan investasi menjadi berkurang baik FDI maupun PMTB. Selain itu, dampak krisis ekonomi mempengaruhi kinerja laju pertumbuhan ekspor neto dimana pertumbuhan ekspor yang lebih rendah daripada impor. Hal ini disebabkan oleh menurunnya permintaan dunia.
IV. KESIMPULAN DAN SARAN
Analisis data panel dari sepuluh negara ASEAN periode 1980-2012 dengan menggunakan Fixed Effect Model GLS Weights Cross-section SUR menyatakan bahwa FDI berpengaruh positif terhadap pertumbuhan ekonomi negara ASEAN. .
Faktor-faktor
lain
yang juga memengaruhi pertumbuhan ekonomi negara ASEAN antara lain Pendapatan Modal Tetap Bruto (PMTB) dan angkatan kerja yang memberikan pengaruh positif serta ekspor neto dan krisis ekonomi yang memberikan pengaruh negatif. Pemerintah masing-masing negara ASEAN perlu meningkatkan FDI Inflow, PMTB, kualitas angkatan kerja, dan pertumbuhan ekspor dengan menurunkan impor dengan tujuan untuk meningkatkan pertumbuhan ekonomi negara ASEAN. Untuk meningkatkan jumlah FDI Inflow ke negara ASEAN guna mengisi kelangkaan sumber daya modal pembangunan agar
64
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pertumbuhan ekonomi negara ASEAN meningkat maka pemerintah masing-masing negara ASEAN perlu melakukan upaya-upaya yang antara lain sebagai berikut: 1. Menjaga laju pertumbuhan ekonominya agar tetap tinggi untuk dapat lebih meningkatkan daya tarik investor asing agar menanamkan FDI jangka panjang di negara ASEAN sehingga negara ASEAN dapat memperoleh manfaat dari masuknya FDI yang lebih besar tersebut untuk mendorong pertumbuhan ekonomi yang lebih tinggi lagi. 2. Melakukan peningkatan infrastruktur, terutama sarana transportasi dan komunikasi, yang dapat mendukung efisiensi di dalam melakukan kegiatan produksi terutama untuk negaranegara dengan peringkat FDI Potential Index rendah seperti Vietnam, Filipina, Indonesia, Myanmar, Kamboja, dan Laos. 3. Menyederhanakan birokrasi perizinan usaha investasi dan mengarahkan pada sistem perizinan satu atap untuk masing-masing negara ASEAN sehingga dapat mengurangi lamanya waktu perizinan usaha terutama untuk negara-negara dengan lamanya waktu perizinan usaha yang lebih dari 1 bulan seperti Thailand, Vietnam, Filipina, Indonesia, Myanmar, Kamboja, dan Laos. 4. Pemerintah
masing-masing
negara
ASEAN
juga
perlu
memerhatikan
dampak
ketergantungan yang dapat muncul dari meningkatnya aliran FDI ke suatu negara dengan memperhatikan transfer teknologi, kemampuan teknis, manajerial, dan intelektualitas dari perusahaan multinasional yang menanamkan modalnya di suatu negara dengan perusahaan domestik. 5. Untuk menghindari dampak negatif dari FDI terhadap pertumbuhan ekonomi negara ASEAN pemerintah masing-masing negara ASEAN dapat mencanangkan undang-undang yang mengatur mengenai besarnya persentase maksimum kepemilikan saham oleh investor asing, besarnya persentase maksimum bahan baku produksi yang boleh diimpor, besarnya persentase maksimum penggunaan tenaga kerja domestik.
DAFTAR PUSTAKA Adegbite, E.O dan F.S. Ayadi. 2010. “The Role of FDI in Economic Development: A Study of Nigeria”. World Journal of Entrepreneurship, Management and Sustainable Development, 6(1/2): 133-147. Adhikary, B.K. 2011. “FDI, Trade Openness, Capital Formation, and Economic Growth in Bangladesh: A Linkage Analysis”, International Journal of Business and Management , 6(1): 16-28.
TAHUN 6, VOLUME 2, DESEMBER 2014
65
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Alfaro, L. 2003. “Foreign Direct Investment and Growth: Does the Sector Matter?” Harvard University, Harvard Business School, Working Paper, 14: 1-31. Almasaied, S.W. 2004. Foreign Direct Investment, Domestic Investment and Economic Growth: Evidence from ASEAN-5. [Thesis]. Universiti Putra Malaysia, Selangor. Anoraga, P. 1994. Perusahaan Multinasional Penanaman Modal Asing, Pustaka Jaya, Semarang. Arsyad, L. 1999. Ekonomi Pembangunan. Bagian Penerbitan STIE YKPN, Yogyakarta. Balamurali, N. dan C. Bogahawatte. 2004. “Foreign Direct Investment and Economic Growth in Sri Lanka”. Sri Lankan Journal of Agricultural Economics, 6(1): 37-50. Baltagi, B.H. 2005. Econometric Analysis of Panel Data Third Edition. John Wiley and Sons Ltd, Chichester. Departement of Economic, Planning, and Development Government of Brunei Darussalam. 2010. Brunei Darussalam, Millenium Development Goals Report. Departement of Economic Planning, and Development Government of Brunei Darussalam, Bandar Seri Begawan. Ear, S. 1995. “Cambodia Economic Development and History: A Contribution to the Study of Cambodia’s Economy”. First Working Draft of Department of Economics University of California, Berkeley. Ekananda, Mahyus. 2006. Analisis Data Panel: Estimasi dengan Struktur Varian-Covarian Residual. Program Pasca Sarjana Universitas Indonesia, Jakarta. Falki, N. 2009. “Impact of Foreign Direct Investment on Economic Growth in Pakistan”, International Review of Business Research Papers, 5(5): 110-120. Goldar, B. dan R. Banga. 2007.”Impact of Trade Liberalization on Foreign Direct Investment in Indian Industry”. Asia-Pacific Research and Training Network on Trade Working Paper Series, 36. Gujarati, D.N. 2004. Basic Econometrics Fourt Edition. The McGraw-Hill Company, New York. Hady, H. 2001. Ekonomi Internasional Teori dan Kebijakan Keuangan Internasional Buku 2. Ghalia Indonesia, Jakarta. Halwani, R.H. 2005. Ekonomi Internasional dan Globalisasi Ekonomi. Ghalia Indonesia, Bogor. Hussein, M.A. 2009. “Impacts of Foreign Direct Investment on Economic Growth in the Gulf Cooperation Council (GCC) Countries”. International Review of Business Research Papers, 5(3): 362-376. Jhingan, M.L. 2004. Ekonomi Pembangunan dan Perencanaan. D. Guritno [penerjemah]. PT. Raja Grafindo Persada, Jakarta.
66
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Kuncoro, M. 2010. Masalah, Kebijakan, dan Politik Ekonomika Pembangunan. Erlangga, Jakarta. Kurniati, Y., A. Prasmuko, dan Yanfitri. 2007. Determinan FDI (Faktor-faktor yang Menentukan Investasi Asing Langsung). Bank Indonesia, Jakarta. Krugman, P dan M. Obstfeld. 1999, Ekonomi Internasional: Teori Dan Kebijakan. Faisal H. Basri [penerjemah]. PT. Raja Grafindo Perkasa, Jakarta. Laboratorium Komputasi Departemen Ilmu Ekonomi FE UI. “Modul Data Panel”. Lin, J. dan Y. Li. 2002. “Export and Economic Growth in China: A Demand-oriented Analysis”, Peking University Paper, C2002008. Ramadhan, F. 2010. Pengaruh Utang Luar Negeri, Penanaman Modal Asing, dan Inflasi terhadap Pertumbuhan Ekonomi Indonesia [Skripsi]. Fakultas Ekonomi, Universitas Gunadarma, Jakarta. Salvatore, D. 1996. Ekonomi Internasional. Munandar [penerjemah]. Erlangga, Jakarta. Soekro, S.R.I. 2008. Bangkitnya Perekonomian Asia Timur: Satu dekade setelah Krisis. Elex Media Komputindo, Jakarta. Tambunan, T.T.H. 2004. Globalisasi dan Perdagangan Internasional. PT. Ghalia Indonesia, Jakarta. Tiwari, A.K dan M. Mutascu. 2011. “Economic growth and FDI in ASIA: A panel data approach”, Economic Analysis & Policy, 41(2): 173-187. Todaro, M. P. dan S.C. Smith. 2006. Pembangunan Ekonomi. Jilid I. Edisi ke-9. Haris Munandar [penerjemah]. Erlangga, Jakarta. UNCTAD. 2011. World Investment Report 2011 Non-Equity Modes of International Production and Development. United Nation, Genewa. Winarno, W.W. 2007. Analisis Ekonometrika dan Statistika dengan Eviews. UPP STIM YKPM, Yogyakarta. World Bank. 2010. “Lao PDR Development Report 2010”. Natural Resource Management for Sustainable Development. Xiaohong, M. 2009. “An Empirical Analysis on the Impact of FDI on China’s Economic Growth”. International Journal of Business and Management, 4(6): 76-80. http://www.aseansec.org/22122.htm [16 Oktober 2011]. http://unctadstat.unctad.org/ReportFolders/reportFolders.aspx?sCS_referer=&sCS_ChosenLan g=en [14 Agustus 2014].
TAHUN 6, VOLUME 2, DESEMBER 2014
67
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
LAMPIRAN
Hasil Output Fixed Effect Model WLS Cross Section SUR Dependent Variable: GROWTH Method: Panel EGLS (Cross-section SUR) Date: 11/23/14 Time: 05:39 Sample: 1980 2012 Periods included: 33 Cross-sections included: 10 Total panel (balanced) observations: 330 Linear estimation after one-step weighting matrix Variable
Coefficient
C FDI PMTB LN_LF NX DKRISIS
-25.79635 0.084540 0.056746 3.333877 -0.051735 -2.253876
Std. Error
t-Statistic
7.797981 -3.308081 0.039445 2.143247 0.027486 2.064533 0.904858 3.684420 0.020296 -2.549062 0.536901 -4.197940
Prob. 0.0010 0.0329 0.0398 0.0003 0.0113 0.0000
Effects Specification Cross-section fixed (dummy variables) Weighted Statistics R-squared Adjusted R-squared S.E. of regression F-statistic Prob(F-statistic)
0.397752 0.370985 1.017474 14.86002 0.000000
Mean dependent var S.D. dependent var Sum squared resid Durbin-Watson stat
1.149305 1.612633 326.1051 1.597181
Unweighted Statistics R-squared Sum squared resid
68
0.304181 4770.450
Mean dependent var Durbin-Watson stat
5.393335 1.293201
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
DAYA SAING DAN VARIABEL YANG MEMENGARUHI EKSPOR BATUBARA INDONESIA DI DELAPAN NEGARA TUJUAN EKSPOR TAHUN 2002-2012
Harianto Sardy Purba Staf Badan Pusat Statistik
Fitri Kartiasih Dosen Sekolah Tinggi Ilmu Statistik
Abstract
Coal is the main commodity required by various countries as a substitute for petroleum as an energy source. This study aims to look at the competitiveness of Indonesian coal exports and the development of Indonesian coal in eight countries of export destination and want to study the effect of the ratio of the price of coal, the export destination country's GDP, exchange rate, and the value of RCA against Indonesian coal exports. Export destinations in this study are China, India, Japan, South Korea, Hong Kong, Thailand, Malaysia, and the Philippines and the study period is 2002-2012.. This study uses RCA index, EPD, and IIT and panel data regression analysis. The results show that in general the development of export coal to eight destination countries has increased. RCA results show Indonesian coal generally has a comparative advantage in the eight countries of export destination. Based on EPD index, almost in all destination countries except Hong Kong, Indonesia coal competitive position is a rising star. Based on the method of IIT, the nature of Indonesia's trade with all destination countries except Hong Kong are weak integration that is no integration. Variables that affect the volume of coal exports is real GDP export destinations, the real exchange rate of export destinations, and RCA. Meanwhile, the Indonesian coal price ratio does not significantly affect the volume of Australian coal exports. Keywords: coal exports, EPD, RCA, IIT, panel data
I.
PENDAHULUAN
Disamping sektor pertanian, sektor pertambangan merupakan salah satu sektor unggulan di Indonesia. Komoditi-komoditi unggulan dari sektor pertambangan terdiri dari antara lain, batubara, nikel, bauksit, tembaga, emas, perak, dan granit. Dari semua komoditi tersebut, batubara merupakan komoditi yang paling diunggulkan. TAHUN 6, VOLUME 2, DESEMBER 2014
69
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Selama 2002–2012 kontribusi nilai ekspor batubara Indonesia terhadap total nilai ekspor Indonesia terus mengalami peningkatan, kecuali pada tahun 2007 dan 2010. Pada tahun 2012 kontribusi komoditi batubara terhadap total ekspor sektor pertambangan telah mencapai hampir 20,5 persen, yang merupakan sekitar 12,8 persen daritotal ekspor Indonesia. Batubara dapat menjadi potensi besar bagi negara Indonesia, karena Indonesia merupakan salah satu produsen utama batubara di dunia. Pada 2006, batubara memberikan kontribusi sebesar 26,0 persen sebagai pemasok energi primer, kedua terbesar setelah minyak yang berkontribusi sekitar
34,4 persen. Sedangkan sebagai pembangkit listrik, batubara
memberikan kontribusi paling besar yaitu 41,0 persen diantara sumber energi lainnya seperti gas (20,1 persen), hydro (16 persen), nuklir (14,8 persen), dan minyak (5,8 persen). Peran batubara sebagai pembangkit listrik di beberapa negara di dunia bahkan sangat dominan seperti di Polandia dan Afrika Selatan yang mencapai 93 persen, Australia 80 persen, Cina 78 persen, India 69 persen, Maroko 69 persen, Kazakhstan 70 persen, dan Indonesia 71 persen. Selain pembangkit listrik, batubara juga banyak digunakan pada industri seperti industri besi dan baja, semen, pulp, dan kertas. Sekitar 13 persen dari produksi batubara ketel uap (hard coal) dialokasikan untuk industri dan hampir 70 persen dari produksi baja global tergantung pada batubara (Miranti, 2008). Walaupun dengan pertumbuhan yang tidak terlalu pesat, batubara diperkirakan akan menjadi bahan bakar utama. Hingga 2035, permintaan batubara akan meningkat rata-rata 1,1 persen per tahun dengan pertumbuhan rata-rata 2 persen per tahun hingga 2020, lalu 1,2 persen per tahun hingga 2035 (Liputan6.com). Gambaran ini sejalan dengan Miranti (2008) yang menyatakan bahwa batubara dunia secara global diperkirakan akan tumbuh rata-rata 2,6 persen per tahun antara periode 2005–2015 dan kemudian melambat menjadi 1,7 persen per tahun sepanjang 2015–2030. Proyeksi pertumbuhan permintaan batubara yang cukup tinggi ini didasari oleh semakin banyaknya negara mulai mengganti minyak bumi dengan batubara sebagai bahan bakar utama di sektor industri dan pembangkit listrik. Hal ini terjadi karena harga batubara lebih murah dan tingginya kenaikan harga minyak bumi, serta ketersediaan batubara yang lebih mencukupi. Indonesia sebagai salah satu produsen utama batubara tidak memanfaatkan sepenuhnya produksi batubara yang dihasilkan untuk memenuhi kebutuhan domestik, antara lain karena batubara dianggap kurang ramah lingkungan. Dengan demikian, salah satu cara untuk memanfaatkan produksi batubara Indonesia tersebut adalah dengan melakukan ekspor. Ekspor batubara Indonesia di pasar dunia dalam beberapa tahun terakhir mengalami pertumbuhan yang cukup pesat. Terbukti pada tahun 2011 Indonesia berhasil menjadi eksportir
70
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
batubara terbesar di dunia mengungguli pesaing utama eksportir batubara yaitu Australia. Ekspor batubara Indonesia yang signifikan ini menyebabkan Indonesia sangat berkontribusi besar dalam memenuhi kebutuhan batubara dunia.
II. METODOLOGI
1. Tinjauan Pustaka Beberapa studi terkait dengan ekspor batubara sudah dilakukan. Penelitian Amanda (2012) yang berjudul “Kinerja Ekspor Komoditi Utama Indonesia ke Delapan Negara Mitra Dagang Utama Tahun 2000-2010” menggunakan 4 variabel bebas dan volume impor negara tujuan sebagai variabel terikatnya. Penelitian menunjukkan
variabel yang signifikan
memengaruhi volume impor batubara adalah interaksi PDB negara Indonesia dengan PDB negara tujuan ekspor, interaksi jumlah penduduk Indonesia dengan jumlah penduduk negara tujuan ekspor, dan nilai tukar rupiah. Sedangkan variabel jarak ekonomi yang merupakan perkalian jarak nautical dengan rasio PDB Per Kapita Indonesia dan negara mitra dagang tidak berpengaruh signifikan terhadap volume impor batubara. Penelitian ini mempunyai nilai adjusted R2 yang besar yaitu 0,9862 yang berarti keberagaman variabel terikat dapat dijelaskan dengan baik oleh variabel-variabel bebas yang digunakan. Selanjutnya Ocal, et. al (2013) melakukan penelitian dengan judul “Coal Consumption and Economic Growth in Turkey”. Penelitian ini menganalisis hubungan kausalitas antara konsumsi batubara dan pertumbuhan ekonomi di Turki pada periode 1980-2006 dengan menggunakan uji kausalitas asimetris Granger. Hasil uji kausalitas asimetris Granger menunjukkan tidak ada hubungan kausalitas antara konsumsi batubara dan pertumbuhan ekonomi di Turki. Artinya konsumsi batubara tidak berpengaruh secara signifikan terhadap pertumbuhan ekonomi di Turki. Dengan kata lain, kondisi hemat energi di Turki tidak berpengaruh terhadap pertumbuhan ekonomi. Asyiyah (2011) melakukan penelitian dengan judul “Analisis Perhitungan Total Factor Productivity untuk Mengetahui Daya Saing Ekspor Industri Batubara Dalam Era Persaingan AFTA”. Penelitian ini membahas seberapa besar total factor productivity industri batubara Indonesia dibandingkan dengan industri batubara Cina. Penelitian ini menggunakan analisis deskriptif dalam menjelaskan kemampuan Indonesia dan Cina menghadapi persaingan global dalam era AFTA. Sampel terdiri dari 5 perusahaan batubara yang mewakili Indonesia pada tahun 2010. Penelitian ini menggunakan berbagai pengukuran seperti Net Profit Margin (NPM), Gross Profit Margin (GPM) dan Operating Profit Margin (OPM) serta menggunakan ukuran TAHUN 6, VOLUME 2, DESEMBER 2014
71
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Revealed Comparative Advantage (RCA) untuk mempelajari daya saing suatu komoditas. Disimpulkan bahwa industri batubara Indonesia memiliki keunggulan komparatif daripada Cina. Penelitian lainnya dilakukan oleh Putry (2014) berjudul “Strategi Meningkatkan Pasar China Menjadi Negara Tujuan Utama Ekspor Batubara Indonesia, 2008-2011” dengan menggunakan metode analisis SWOT. Penelitian ini bertujuan untuk menganalisis faktorfaktor pendukung yang dapat menjadikan China sebagai negara tujuan utama ekspor. Kesimpulan penelitian ini adalah pajak tambahan yang ditetapkan China untuk batubara kalori rendah dapat menjadi tantangan sekaligus kesempatan bagi Indonesia untuk mengoptimalkan ekspor batubara dengan harga yang bersaing. Selain itu perlu dilakukan merger terhadap penambang batubara skala kecil agar produksi batubara dapat dipantau sehingga kualitas yang dihasilkan konsisten. Suciati
(2009)
melakukan
penelitian
mengenai
analisis
faktor-faktor
yang
mempengaruhi permintaan ekspor batubara Indonesia di Pasar Jepang dengan menggunakan dua analisis yaitu analisis kualitatif dan analisis kuantitatif. Analisis deskriptif kualitatif dapat dijelaskan dengan melihat perkembangan produksi, ekspor, dan harga ekspor batubara Indonesia. Sedangkan analisis kuantitatif bertujuan untuk menganalisis faktor-faktor yang mempengaruhi permintaan ekspor batubara Indonesia ke Jepang dengan menggunakan metode Ordinary Least Square (OLS). Kesimpulan penelitian ini adalah perkembangan industri batubara di Indonesia mengalami peningkatan baik produksi, ekspor maupun harga ekspornya. Variabel-variabel yang memengaruhi secara nyata terhadap permintaan ekspor batubara Indonesia ke Jepang adalah harga ekspor riil batubara Afrika Selatan, harga ekpsor riil batubara Indonesia, harga ekspor riil batubara Australia, GDP riil negara Jepang, nilai tukar rupiah terhadap yen, dan dummy pembatasan ekspor batubara Cina. Variabel yang sangat responsif terhadap permintaan ekspor batubara ke Jepang adalah GDP negara Jepang, sedangkan variabel lainnya pengaruhnya kurang responsif. Kesimpulan dari penelitian terkait diatas adalah komoditi batubara merupakan salah satu komoditi penting dari Indonesia. Batubara Indonesia dapat dioptimalkan menjadi pendapatan bagi Indonesia melalui ekspor. Selain itu penting juga untuk meningkatkan daya saing batubara untuk mengoptimalkan perdagangan batubara Indonesia di dunia baik dengan cara meningkatkan kualitas batubara maupun pendekatan pasar yang lebih baik. Penelitian ini memiliki kesamaan dengan peneltitian terdahulu diatas dalam hal samasama meneliti tentang komoditi batubara. Sedangkan perbedaannya terdapat dalam bahasan mengenai komoditi batubara. Penelitian ini bertujuan untuk menganalisis perkembangan batubara Indonesia serta keadaan daya saing batubara Indonesia dan variabel-variabel yang
72
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
memengaruhi ekspor batubara Indonesia. Penggunaan variabel lebih dispesifikkan berdasarkan sisi permintaan yaitu negara tujuan ekspor seperti PDB negara tujaun ekspor dan nilai tukar mata uang negara tujaun ekspor. Sedangkan penelitian terkait diatas membahas komoditi batubara dari sisi konsumsi batubara, pembahasan ekspor melalui pendekatan variabel berdasarkan interaksi Indonesia dan negara tujuan ekspor maupun melalui pendekatan harga ekspor. Selain itu model peneitian yang digunakan dalam penelitian ini dengan penelitian terkait juga berbeda. Pada akhirnya Penelitian ini diharapkan dapat memberikan kontribusi untuk menambah pembahasan mengenai komoditi batubara Indonesia sesuai dengan tujuan penelitian. Penelitian ini menganalisis perkembangan ekspor batubara Indonesia ke delapan negara tujuan ekspor, daya saing batubara Indonesia ke delapan negara tujuan ekspor, dan pengaruh rasio harga batubara, produk domestik bruto , kurs riil, dan RCA terhadap volume ekspor batubara Indonesia. Penelitian ini menggunakan data sekunder tahunan pada rentang waktu tahun 20022012, yang diperoleh dari berbagai sumber, mencakup data nilai dan volume eskpor batubara Indonesia, PDB riil delapan negara tujuan ekspor, kurs riil negara tujuan ekspor terhadap US$. Data dikumpulkan dari UN Comtrade, Badan Pusat Statistik (BPS), Worldbank, dan International Financial Statistics (IFS). 2. Metode Analisis Penelitian ini menggunakan analisis deskriptif untuk mempelajari perkembangan dan daya saing ekspor batubara Indonesia ke delapan negara tujuan ekspor serta analisis regresi data panel untuk menganalisis pengaruh rasio harga batubara, produk domestik bruto , kurs riil, dan RCA terhadap volume ekspor batubara Indonesia. Daya Saing Batubara Indonesia Daya saing batubara Indonesia ke delapan negara tujuan ekspor dapat dianalisis dengan, antara lain, metode Revealed Comparative Advantage (RCA), Export Product Dynamic (EPD), dan Intra Industry Trade (IIT). Revealed Comparative Advantage (RCA) Salah satu metode yang dapat digunakan untuk mengukur daya saing, yang menunjukkan keunggulan komparatif suatu negara, adalah Revealed Comparative Advantage (RCA). Metode ini mengukur kinerja ekspor suatu komoditas tertentu ke negara tertentu dengan mengevaluasi peranan ekspor komoditas tertentu dalam ekspor total suatu negara dibandingkan dengan pangsa pasar komoditas tersebut dalam perdagangan dunia. Rumus indeks RCA menurut Balassa dalam Batra dan Khan (2005) adalah sebagai berikut:
TAHUN 6, VOLUME 2, DESEMBER 2014
73
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
RCA=
Xij / Xj Xiw /Xw
(1)
RCA : Indeks Revealed Comparative Advantage Xij
: Nilai ekspor komoditi i ke negara j
Xj
: Nilai total ekspor semua komoditi ke negara j
Xiw
: Nilai ekspor dunia komoditi i ke negara j
Xw
: Nilai total ekspor semua komoditi dunia ke negara j
1. Jika nilai indeks RCA < 1 menunjukkan bahwa negara tersebut mempunyai keunggulan komparatif untuk produk tersebut. 2. Jika nilai indeks RCA > 1 menunjukkan bahwa negara tersebut tidak mempunyai keunggulan komparatif untuk produk tersebut. Revealed Comparative Advantage dapat menggambarkan baik tidaknya kinerja ekspor suatu produk dari suatu negara. Selain menggambarkan keunggulan komparatif, RCA suatu produk yang tinggi di suatu negara menandakan bahwa negara tersebut memiliki spesialisasi pada komoditi tersebut. Export Product Dynamic Salah satu indikator yang dapat memberikan gambaran tingkat daya saing adalah Export Product Dynamic (EPD). Indikator ini mengukur posisi pasar dari produk suatu negara untuk tujuan pasar tertentu, yang dapat menggambarkan dinamis atau tidaknya kinerja produk tersebut. Sebuah matriks EPD terdiri dari daya tarik pasar dan informasi kekuatan bisnis. Daya tarik pasar dihitung berdasarkan pertumbuhan dari permintaan sebuah produk untuk tujuan pasar tertentu, sedangkan informasi kekuatan bisnis diukur berdasarkan pertumbuhan dari perolehan pasar (market share) dari produk tertentu dari sebuah negara pada tujuan pasar tertentu. Kombinasi dari daya tarik pasar dan kekuatan bisnis ini menghasilkan karakter posisi dari produk yang ingin dianalisis ke dalam empat kategori, yaitu (Esterhuizen, 2006) : 1. Rising Star : terjadi peningkatan pangsa pasar ekspor negara dan pangsa pasar produk tertentu di perdagangan dunia. 2. Lost Opportunity : terjadi penurunan pangsa pasar ekspor negara, tetapi terjadi peningkatan pangsa pasar produk tertentu di perdagangan dunia. 3. Falling Star : terjadi peningkatan pangsa pasar ekspor negara, tetapi terjadi penurunan pangsa produk tertentu di perdagangan dunia. 4. Retreat : terjadi penurunan pangsa pasar ekspor negara dan pangsa pasar produk tertentu di perdagangan dunia.
74
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Lost Opportunity
Rising Star
Retreat
Falling Star
Sumber : Bappenas (2009) Keterangan : sumbu x (the growth of share of country's export in the world trade) sumbu y (the growth of share of product in the world trade) Gambar 1. Matriks posisi daya saing
Intra Industry Trade Penghitungan indeks IIT didasarkan pada selisih antara nilai ekspor dan impor dari sebuah industri atau komoditi dan total perdagangan dari industri atau komoditi tersebut. Metode IIT bertujuan untuk melihat integrasi perdagangan antara negara-negara yang melakukan perdagangan internasional. Terdapat 2 (dua) alasan terjadi perdagangan intra-industri. Pertama adalah differensiasi produk. Pada perekonomian modern sebagian besar produk yang dihasilkan adalah produk yang terdifferensiasi. Produk yang terdifferensiasi adalah produk yang jenisnya sama atau dihasilkan dalam industri yang sama tetapi berbeda secara kualitas dan atau preferensi. Kedua adalah skala ekonomis (economies of scale).
Motif perdagangan intra industri adalah
memperoleh keuntungan dari adanya economies of scale. Dalam hal ini persaingan internasional memaksa setiap perusahaan untuk membatasi model atau tipe produknya agar dapat berkonsentrasi memanfaatkan sumberdayanya untuk menekan biaya produksi per unit sehingga dapat menghasilkan beberapa jenis produk saja dengan kualitas terbaik dan harga bersaing. Indeks Intra Industry Trade (IIT) yang umum digunakan adalah Grubel-Lloyd Index, yangberkisar antara 0 – 100. IITkjt = (1-
|Xkjt -Mkjt | Xkjt +Mkjt
) x 100
(2)
dimana: IITkjt = indeks intra industry trade di negara j untuk komoditi k pada waktu t Xkjt
= total ekspor negara j untuk komoditi k pada waktu t
Mkjt
= total impor negara j untuk komoditi k pada waktu t
TAHUN 6, VOLUME 2, DESEMBER 2014
75
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 1. Klasifikasi dari nilai Intra Industry Trade IIT
Klasifikasi
(1)
(2)
0,00
No integration (one way trade)
>0,00 – 24,99
Weak integration
25,00 – 49,99
Mild integration
50,00 – 74,99
Moderately strong integration
75,00 – 99,99
Strong integration (two way trade
Sumber : Austria, 2004 dalam Kemendagri (2011)
Faktor-faktor yang Memengaruhi Volume Ekspor Batubara Indonesia Untuk menganalisis faktor-faktor yang memengaruhi volume ekspor batubara Indonesia di delapan negara tujuan ekspor digunakan model sebagai berikut : Ln(VEB)it = αit + β1Ln(RHH)it + β2Ln(PDB)it + β3Ln(KURS)it + β4ln(RCA)it + εit
(3)
dimana; VEB
: Volume ekspor batubara Indonesia
RHH
: Rasio harga batubara Indonesia tehadap Australia
PDB
: PDB riil per kapita negara tujuan ekspor
KURS
: Kurs riil mata uang negara tujuan ekspor terhadap US$
RCA
: Nilai Revealed Comparative Advantage batubara Indonesia
i
: Negara tujuan ekspor utama (Cina, India, Jepang, Korea Selatan, Hongkng, Thailand, Malaysia, Filipina)
t
: Periode waktu (2002, … , 2012)
αi
: Intersep untuk setiap individu (negara tujuan ekspor)
βk
: Koefisien pengaruh setiap variabel bebas (k=1,…, 4)
εit
: error term
Definisi operasional dari variabel di atas dan hipotesis penelitian yang digunakan adalah sebagai berikut : Volume ekspor batubara Volume batubara yang dijual ke negara tujuan ekspor, meliputi ekspor komoditi batubara (kode HS 2701) yang dinyatakan dalam satuan kg.
76
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Produk Domestik Bruto (PDB) Nilai barang dan jasa yang dihasilkan oleh seluruh unit usaha dalam suatu negara dalam kurun waktu satu tahun tertentu (BPS, 2012). Penelitian ini menggunakan PDB perkapita atas dasar harga konstan 2005 dari negara tujuan ekspor dengan satuan milyar US$. Kurs Nilai mata uang negara tujuan terhadap US$. Kurs yang digunakan adalah kurs riil, average of period. Rasio harga ekspor Rasio nilai ekspor rill dengan volume ekspor dengan asumsi batubara Indonesia dan Australia memiliki kualitas yang relatif sama. Harga ekspor yang digunakan dalam penelitian ini adalah harga ekspor riil yang sudah dibagi dengan indeks harga konsumen (2005 = tahun dasar). PDB negara tujuan ekspor dan RCA diduga berpengaruh positif terhadap volume permintaan eskpor batubara Indonesia, sedangkan kurs riil beberapa negara tujuan serta rasio harga ekspor diduga berpengaruh negatif.
III. HASIL DAN PEMBAHASAN
Ekspor Batubara Indonesia Selama 2007-2009, ekspor batubara Indonesia ke beberapa negara seperti Korea Selatan, Hongkong, Thailand mengalami penurunan. Penyebab merosotnya volume ekspor batubara Indonesia pada awal tahun 2007 sampai pertengahan 2009 adalah karena beberapa negara di Asia mengalami pelemahan pertumbuhan ekonomi akibat krisis global sehingga berdampak pada kurangnya kemampuan negara tujuan ekspor untuk melakukan kegiatan perdagangan seperti mengimpor batubara. Penurunan jumlah ekspor batubara Indonesia ke Cina diakibatkan perlambatan ekonomi yang terjadi di Cina. Hal ini menjadi momok yang menekan harga batubara dunia karena Cina dianggap sebagai pusat pasar batubara. Ekspor batubara Indonesia ke Cina terus meningkat sejak tahun 2003 dengan jumlah ekspor paling banyak pada tahun 2012 yaitu 81.600 ribu ton (Gambar 2). Cina menjadi tujuan ekspor terbesar batubara dunia pada tahun 2011, dan pada tahun 2012 Cina mengimpor 288 juta ton batubara. Walau dengan pertumbuhan yang cepat ini, impor Cina hanya 8 persen dari total konsumsi batubara negara itu pada tahun 2012. Dengan kata lain, Cina 92 persen mandiri dalam hal penggunaan batubara (Greenpeace, 2014). Cina menggunakan batubara sebagai substitusi minyak bumi untuk digunakan oleh sektor transportasi dan industri dengan cara
TAHUN 6, VOLUME 2, DESEMBER 2014
77
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
mengkonversi batubara menjadi bahan cair. Selain untuk industri, penggunaan batubara di Cina juga difokuskan sebagai sumber energi pada Pembangkit Listrik Tenaga Uap (PLTU).
Volume (Ribu ton) 100000 87500 75000 62500 50000 37500 25000 12500 0
Cina
India
Jepang
Korea Selatan
Hongkong
Thailand
Malaysia
Filipina
Sumber : UN Comtrade (diolah) Gambar 2. Volume ekspor batubara indonesia ke delapan negara tujuan ekspor tahun 2002–2012 (ribu ton)
Secara umum berdasarkan Gambar 2, ekspor batubara Indonesia ke delapan negara tujuan ekspor menunjukkan prospek yang bagus khususnya untuk negara-negara besar seperti Cina dan India. Tren ekspor batubara Indonesia ke negara-negara tujuan ekspor tidak terlalu berfluktuatif yang berarti ekspor batubara Indonesia ke negara tujuan ekspor cenderung stabil dan konsisten. Hal ini disebabkan produksi batubara Indonesia yang juga konsisten dan batubara yang dihasilkan di Indonesia memiliki kualitas sesuai dengan kebutuhan negaranegara tujuan ekspor.
Daya Saing Batubara Indonesia Revealed Comparative Advantage Secara umum, selama 2002-2012, bahkan hampir setiap tahun, batubara Indonesia masuk sebagai komoditi yang memiliki keunggulan komparatif di delapan negara tujuan ekspor. Hal ini berarti komoditi batubara merupakan salah satu komoditi Indonesia yang termasuk komoditi yang memiliki keunggulan komparatif. Nilai RCA batubara Indonesia secara rata-rata paling tinggi di Hongkong sedangkan yang paling rendah di Jepang. Tinggi
78
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
rendahnya nilai RCA batubara Indonesia di negara tujuan ekspor dipengaruhi oleh nilai ekspor batubara Indonesia ke negara tujuan ekspor sehingga apabila jumlah batubara Indonesia yang diekspor ke negara tujuan ekspor semakin meningkat maka nilai RCA batubara Indonesia juga meningkat.
Tabel 2. Nilai Revealed Comparative Advantage batubara Indonesia ke delapan negara tujuan ekspor, 2002–2012 Negara Tahun China
India
Jepang Korsel Hongkong Thailand Malaysia Filipina
2002
7,44
1,02
1,06
2,58
43,66
12,83
19,65
19,54
2003
2,43
2,63
1,44
2,9
76,96
17,29
21,73
21,34
2004
3,37
3,99
1,8
3,26
111,68
26,24
16,93
16,74
2005
6,99
8,17
2,74
3,1
172,89
41,14
17,46
16,71
2006
23,8
15,83
4,23
5,52
234,24
50,37
18,16
24,55
2007
72,44
32,29
5,17
7,37
250,77
59,82
17,74
19,97
2008
127,93 37,68
3,66
4,59
259,87
93,99
11,79
21,13
2009
66,76
44,51
3,45
6,83
194,67
63,3
14,23
18,59
2010
14,47
4,45
2,11
6,1
124,53
18,06
12,24
20,89
2011
31,08
9,95
3,38
4,27
194,55
28,67
11,56
19,45
2012
17,1
8,35
3,16
5,37
199,71
19,8
12,07
20,47
Sumber : UN Comtrade (diolah)
Nilai RCA batubara Indonesia di Hongkong yang paling tinggi dicapai pada tahun 2008 yang mencapai 259,87 yaitu pada saat nilai ekspor batubara Indonesia ke Hongkong senilai 447.057.920 US$. Peningkatan RCA batubara Indonesia di Cina paling tinggi terjadi pada tahun 2008 yang mencapai 127,93 dan juga merupakan nilai RCA tertinggi, naik 55,49 dari tahun sebelumnya. Hal ini disebabkan tahun 2008 merupakan tahap awal Cina mulai memperluas bidang industrinya ke segala bidang dan mulai banyak negara dari luar Cina yang membuka perusahaan di Cina sehingga konsumsi batubara China sebagai sumber energi untuk kegiatan industri meningkat pesat. Selain itu Cina menghadapi peningkatan permintaan batubara dari industri listrik setelah manufaktur di negara itu mengalami pertumbuhan pesat dari yang diperkirakan
TAHUN 6, VOLUME 2, DESEMBER 2014
79
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
sehingga konsumsi batubara sebagai sumber energi mengalami peningkatan yang cukup signifikan. Nilai RCA batubara Indonesia di Thailand pada tahun 2008 mencapai 93,99. Hal ini terjadi karena pada periode tersebut nilai ekspor batubara Indonesia ke Thailand mencapai nilai yang cukup besar yaitu US$ 552.174.967 atau 51,9 persen dari total ekspor Indonesia ke Thailand. Batubara Indonesia sejak tahun 2002 sudah memiliki keunggulan komparatif di India. Nilai RCA batubara Indonesia tertinggi terjadi pada tahun 2009 mencapai 44,51. Salah satu alasan ketergantungan India terhadap batubara Indonesia adalah adanya kerjasama antara Indonesia dan India dalam bidang industri besi dan baja juga sumber energi sehingga permintaan batubara oleh India juga terus stabil dan konsisten. Pada tahun 2007 nilai RCA batubara Indonesia di Jepang sebesar 5,17. Pada saat itu nilai ekspor batubara Indonesia ke Jepang mencapai 1.290.282.716 US$ dan kontribusi batubara terhadap total ekspor Indonesia mencapai 10,7 persen. Nilai RCA batubara Indonesia di Jepang tidak terlalu besar namun sudah masuk kategori komoditi yang memiliki keunggulan komparatif. Nilai RCA batubara Indonesia yang paling tinggi di Korea Selatan terjadi pada tahun 2007 yang mencapai 7,37. Tingginya RCA ini salah satunya disebabkan tingginya permintaan batubara Indonesia oleh Korea Selatan mencapai 923.018.110 US$ dan kontribusi batubara terhadap total ekspor Indonesia pada saat itu mencapai 12,17 persen. Di dua negara lainnya yaitu Malaysia dan Filipina batubara Indonesia juga memiliki keunggulan komparatif. Di Malaysia nilai RCA tertinggi terjadi pada tahun 2003 yang mencapai 21,73 sedangkan di Filipina yang tertinggi terjadi pada tahun 2006 dengan nilai RCA 24,55.
Export Product Dynamic (EPD) India adalah negara dengan rata-rata pertumbuhan pangsa pasar total ekspor Indonesia terbesar selama 2002-2012, yang mencapai 54,22 persen, diikuti oleh Cina sebesar 32,06 persen. Sedangkan rata-rata pertumbuhan pangsa pasar ekspor batubara Indonesia di Cina merupakan yang tertinggi yaitu mencapai 17,51 persen kemudian diikuti oleh India dengan 14,14 persen.
80
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Lost Opportunity
Rising Star
Retreat
Falling Star
China
India
Jepang
Korea Selatan
Hongkong
Thailand
Malaysia
Filipina
Sumber : UN Comtrade (diolah) Gambar 3. Matriks posisi daya saing batubara Indonesia di delapan negara tujuan ekspor
Gambar 3 menunjukkan bahwa daya saing batubara Indonesia di tujuh negara tujuan ekspor yaitu Cina, India, Jepang, Korea Selatan, Thailand, Malaysia, dan Filipina berada pada posisi rising star karena rata-rata pertumbuhan pangsa pasar ekspor batubara Indonesia di tujuh negara ini bernilai positif dan searah dengan rata-rata pertumbuhan pangsa pasar total ekspor Indonesia di tujuh negara. Di dua negara konsumen utama batubara, yaitu Cina dan India rata-rata pangsa ekspor batubara dan total ekspor Indonesia selain memiliki posisi daya saing rising star juga mempunyai persentase rata-rata yang cukup besar yaitu diatas 10 persen utnuk komoditi batubara dan diatas 40 persen untuk semua komoditi. Hal ini berarti selain posisi pasar batubara Indonesia yang sudah ideal, ketergantungan Cina dan India terhadap batubara Indonesia juga sudah merujuk untuk kebutuhan jangka panjang. Di Thailand dan Jepang meskipun rata-rata pertumbuhan pangsa pasar total ekspor dan ekspor batubara Indonesia cukup kecil namun posisinya sudah termasuk aman karena sudah termasuk kategori rising star. Posisi daya saing rising star di tujuh negara tujuan ekspor ini menggambarkan bahwa batubara Indonesia merupakan komoditi yang memiliki keunggulan kompetitif dan merupakan produk dinamis. Produk dinamis menunjukkan bahwa batubara Indonesia akan tetap dibutuhkan dalam jangka waktu yang panjang di negara-negara tujuan ekspor ini. Hongkong memiliki nilai EPD yang masuk dalam kategori lost opportunity karena ratarata pertumbuhan pangsa pasar total ekspor Indonesia di negara ini bernilai negatif dan ratarata pertumbuhan pangsa ekspor batubara Indonesia bernilai positif. Hongkong memiliki nilai rata-rata pertumbuhan pangsa pasar total ekspor dan ekspor batubara Indonesia masing-masing -4,63 dan 7,75 persen. Keadaan lost opportunity menunjukkan kondisi perdagangan dimana batubara Indonesia mengalami pertumbuhan pangsa pasar yang bagus namun tidak sejalan dan
TAHUN 6, VOLUME 2, DESEMBER 2014
81
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
tidak didorong dengan peningkatan pangsa total ekspor dari Indonesia. Pada kondisi posisi daya saing ini batubara Indonesia belum dianggap sebagai suatu produk dinamis namun tetap dianggap sebagai komoditi keunggulan komparatif. Salah satu keunggulan EPD yaitu dapat digunakan untuk melihat daya saing perdagangangan dan membandingkan daya saing Indonesia dengan negara pesaing yaitu Australia. Berdasarkan Gambar 3 diketahui bahwa di negara Cina, Jepang, Korea Selatan, dan Filipina, batubara Australia memiliki posisi daya saing yang sama dengan Indonesia yaitu rising star yang berarti batubara Australia juga merupakan produk yang memiliki keunggulan kompetitif di empat negara tersebut sekaligus merupakan produk dinamis yaitu produk yang tingkat kebutuhannya untuk periode jangka panjang. Keadaan ini sangat menguntungkan bagi Indonesia dan Australia untuk meningkatkan pendapatan melalui ekspor sekaligus untuk meningkatkan daya saing kedua negara. Empat negara ini memang dikenal memiliki sektor industri dan pembangkit listrik PLTU yang cukup banyak, sehingga sumber energi sangat diperlukan dalam jumlah yang tidak sedikit dan jangka untuk waktu yang lama. Batubara Indonesia di India, Thailand, dan Malaysia memiliki posisi daya saing rising star sedangkan batubara Australia di kedua negara ini posisi daya saingnya falling star. Artinya untuk ketiga negara ini batubara Indonesia lebih unggul dibandingkan batubara Australia terutama dari sisi keunggulan kompetitifnya. Posisi daya saing falling star berarti terjadi penurunan pangsa pasar batubara Australia dan kesulitan menembus pasar India, Thailand, dan Malaysia. Hal ini salah satunya disebabkan perbedaan spesifikasi batubara antara Indonesia dan Australia sehingga keunggulan kompetitif batubara Indonesia lebih bagus dibanding Australia dikarenakan spesifikasi batubara Indonesia lebih cocok bagi tiga negara ini. Kondisi falling star berarti batubara Australia tidak mampu memaksimalkan keadaan pasar yang sedang bagus di negara-negara itu. Pangsa pasar dari negara Australia yang cukup baik tidak diikuti dengan peningkatan pangsa pasar batubara Austalia. Apabila kemampuan ekspor batubara Australia di India, Thailand, dan Malaysia bisa semakin ditingkatkan maka besar peluang batubara Australia untuk masuk sebagai kategori produk dinamis di tiga negara tersebut.
82
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Lost Opportunity
Rising Star
Retreat
Falling Star
China
India
Jepang
Korea Selatan
Hongkong
Thailand
Malaysia
Filipina
Sumber : UN Comtrade (diolah) Gambar 4. Matriks posisi daya saing batubara Australia di delapan negara tujuan ekspor
Batubara Australia di Hongkong masuk kategori posisi daya saing retreat. Kondisi pasar retreat ini merupakan kondisi pasar yang paling tidak diinginkan. Selain kondisi pangsa pasar komoditi batubara yang mengalami penurunan, posisi daya saing retreat ini juga menandakan kondisi ekspor dari negara Australia ke Hongkong juga mengalami penurunan. Oleh karena itu selain merupakan produk yang stagnan, batubara Australia di Hongkong juga tidak memiliki keunggulan kompetitif. Dengan demikian batubara Indonesia lebih kompetitif di Hongkong dibandingkan batubara Australia. Kondisi retreat ini disebabkan cukup seringnya terjadi penurunan pangsa pasar baik pangsa pasar total maupun batubara. Dengan penurunan tersebut menandakan bahwa komoditi-komoditi dari Australia semakin kurang diminati di Hongkong. Untuk bisa memperbaiki posisi daya saing retreat ini diperlukan waktu yang cukup lama. Caranya adalah dengan menjalin kerjasama maupun meningkatkan kualitas dan spesifikasi produk-produk yang diekspor.
Intra-Industry Trade (IIT) Hasil estimasi menggunakan metode Intra Industry Trade (IIT) menunjukkan keterkaitan perdagangan batubara antara Indonesia dengan delapan negara tujuan. Hasil estimasi nilai IIT batubara Indonesia dapat dilihat pada Tabel 3 berikut.
TAHUN 6, VOLUME 2, DESEMBER 2014
83
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 3. Nilai Intra Industry Trade komoditi batubara antara Indonesia dengan delapan negara tujuan periode 2002–2012 Tahun
Negara Cina
India
Jepang Korsel Hongkong Thailand Malaysia Filipina
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
2002
1,034
0,000
0,040
0,062
0,000
2,613
0,000
0,000
2003
6,204
0,000
0,040
0,086
0,000
0,117
0,070
0,000
2004
7,062
0,000
0,036
0,023
0,000
11,760
0,058
0,000
2005
10,118 0,000
0,054
0,019
0,000
0,001
0,015
0,000
2006
3,057
0,000
0,038
0,000
0,000
0,294
0,147
0,102
2007
0,651
0,000
0,004
0,000
0,000
0,010
0,000
0,000
2008
1,535
0,000
0,047
0,000
0,000
2,855
0,056
0,000
2009
0,393
0,105
0,060
0,000
0,000
0,000
0,195
0,000
2010
0,058
0,000
0,096
0,005
0,000
0,000
0,149
0,000
2011
0,019
0,000
0,079
0,001
0,000
0,100
0,116
0,000
2012 0,022 0,000 0,104 Sumber : UN Comtrade (diolah)
0,004
0,000
0,004
0,164
0,000
Nilai IIT antara Indonesia dan Cina pada tahun 2002 sampai 2012 berada antara nilai 0 sampai 11 dengan yang tertinggi pada tahun 2005 mencapai 10,018 yang berarti keterikatan perdagangan antara Indonesia dan Cina untuk komoditi batubara bersifat weak integration. Artinya perdagangan batubara lebih didominasi dengan permintaan Cina terhadap Indonesia meskipun Indonesia juga melakukan permintaan terhadap Cina namun dalam jumlah yang sedikit dan tidak sebanding dengan permintaan Cina dari Indonesia sehingga kecil kemungkinan terdapat perdagangan dua arah (two way trade). Hal yang berbeda ditunjukkan oleh India, Filipina, dan Hongkong. Keterikatan perdagangan antara Indonesia dengan empat negara ini masuk dalam kategori IIT no integration (one way trade) yang artinya di empat negara ini Indonesia sangat mendominasi perdagangan batubara dan berperan sebagai eksportir. Untuk India, selama tahun 2002 sampai 2012 hanya di tahun 2009 saja Indonesia mengimpor batubara dari India dan itupun dengan nilai yang sangat kecil yaitu 1.267.231 US$, selebihnya Indonesia mutlak berperan sebagai eksportir saja ke negara ini tanpa melakukan impor. Untuk Filipina, Indonesia hanya melakukan impor batubara dari negara tersebut pada tahun 2006 saja, dan dengan nilai yang sangat kecil yaitu hanya 221.993.731 US$. Oleh karena itu dapat dikatakan sifat perdagangan antara Indonesia dan Filipina juga bersifat no integration (one way trade). Satu-satunya negara yang tidak pernah melakukan ekspor batubara ke
84
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Indonesia adalah Hongkong. Indonesia berperan sebagai eksportir murni di Hongkong sehingga sifat perdagangan antara Indonesia dan Hongkong juga no integration. Untuk Hongkong dan Filipna, nilai IIT menunjukkan keterikatan perdagangan antara Indonesia dengan Hongkong dan Filipina mutlak bersifat satu arah untuk batubara Indonesia. Artinya di sepanjang tahun 2002 sampai 2012 nilai IIT antara Indonesia dengan Hongkong dan Filipina semuanya bernilai 0 dan tidak sekalipun dalam periode tersebut Indonesia melakukan impor batubara dari Hongkong dan Filipina. Nilai IIT untuk batubara Indonesia di empat negara ini yang hampir semuanya bernilai nol dan mendekati nol menunjukkan bahwa keterikatan perdagangan antara Indonesia dengan India, Korea Selatan, Filipina, dan Hongkong selain bersifat satu arah (one way trade) juga bersifat perfect inter-product. Indonesia dapat mempertahankan posisinya sebagai eksportir batubara di negara tujuan dengan terus melakukan peningkatan kualitas dan diferensiasi produk misalnya dengan meningkatkan mutu batubara dan mengekspor batubara dalam bentuk olahan yang memiliki nilai jual dan mutu yang lebih tinggi. Nilai IIT antara Indonesia dengan Korea Selatan, Thailand, Malaysia, dan Jepang diatas India, Filipina, dan Hongkong. Apabila India, Filipina, dan Hongkong masuk pada kategori no integration maka Korea Selatan, Thailand, Malaysia, dan Jepang masuk pada kategori weak integration. Dua kategori ini tidak menunjukkan keadaan yang terlalu berbeda secara signifkan, hanya saja weak integration berarti Korea Selatan, Thailand, Malaysia, dan Jepang melakukan perdagangan dua arah yaitu juga melakukan ekspor ke Indonesia namun dalam jumlah yang tidak terlalu banyak dan hampir terjadi setiap tahun. Nilai IIT Indonesia dengan Thailand tertinggi terjadi pada tahun 2004 yang mencapai 11,760 persen, karena pada tahun ini Indonesia cukup banyak mengimpor batubara dari Thailand yaitu senilai 1.557.643 US$. Ekspor batubara Thailand ke Indonesia sendiri yang terbesar terjadi pada tahun 2007 yang mencapai 12.322.252 US$. Indonesia hampir setiap tahun mengimpor batubara dari Malaysia namun juga dalam jumlah yang tidak terlalu banyak. Impor batubara terbesar dari Malaysia oleh Indonesia terjadi pada tahun 2008 mencapai 1.508.160 US$. Rata-rata permintaan batubara Malaysia terhadap Indonesia mencapai 578.945.573 US$. Rata-rata impor batubara Indonesia dari Jepang mencapai 728.774,55 US$ dengan yang tertinggi pada tahun 2009 yang mencapai 4.358.696 US$. Di Jepang meskipun jumlah ekspor ke Indonesia cukup banyak namun nilai IITnya hanya berkisar antara 0 sampai 0,1. Hal ini disebabkan jumlah permintaan Jepang terhadap komoditi batubara Indonesia jauh lebih banyak bahkan mencapai rata-rata 1.787.870.307 US$ tiap tahunnya sepanjang tahun 2002 sampai 2012. TAHUN 6, VOLUME 2, DESEMBER 2014
85
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Secara keseluruhan berdasarkan nilai IIT untuk komoditi batubara Indonesia di delapan negara tujuan ekspor ini dapat dikatakan bahwa Indonesia memiliki peranan penting sebagai pemasok permintaan batubara. Dengan kata lain Indonesia berperan lebih besar dalam mengekspor batubara ke delapan negara tujuan ekspor karena nilai IITnya masuk kategori weak integration dan no integration.
Variabel-Variabel yang Memengaruhi Ekspor Batubara Indonesia Sebelum menentukan model yang tepat dalam melihat pengaruh variabel bebas terhadap volume ekspor Indonesia terlebih dahulu dilakukan pengujian akar unit melalui uji stasioneritas dari tiap variabel bebas dan variabel terikat untuk menghindari regresi palsu (spurious regression). Hasil uji stasioneritas menunjukkan bahwa semua variabel bebas dan variabel terikat sudah stasioner di level (Lampiran 3). Pemilihan model terbaik dalam penelitian ini dilakukan melalui kriteria formal yaitu memilih model estimasi melalui uji signifikansi fixed effects (Chow test) dan uji signifikansi Hausman (Hausman test). Setelah terpilih model terbaik diantara tiga model tersebut selanjutnya dilakukan pemilihan estimator struktur varians covarians residual melalui uji Lagrange Multiplier (LM test).
Tabel 4. Hasil estimasi regresi data panel model common effects, fixed effects, dan random effect Jenis Estimasi
Variabel Dependen
Koefisien
t statistik
Prob
Adj R ; SSE ; DW
(1)
(2) C LOG(RHH?) LOG(GDPM?) LOG(KURS?) LOG(RCA?) C LOG(RHH?) LOG(GDPM?) LOG(KURS?) LOG(RCA?) C LOG(RHH?) LOG(GDPM?) LOG(KURS?) LOG(RCA?)
(3) 22,79181 -0,465825 0,118834 0,162923 0,074181 18,34399 0,011247 4,091796 -0,664269 0,121382 21,25352 -0,310208 0,725187 0,004174 0,406210
(4) 55,00836 -2,850882 1,663958 2,414256 0,869676 10,98321 0,184833 13,77862 -1,719381 2,529586 69,61398 -5,916160 9,390450 0,062746 10,37102
(5) 0,0000 0,0055 0,0999 0,0180 0,3870 0,0000 0,8539 0,0000 0,0896 0,0135 0,0000 0,0000 0,0000 0,9501 0,0000
(6) 2 Adj R = 0,168592 SSE = 0,864926 DW = 0,217614
Common effects
Fixed effects
Random effects
86
2
2
Adj R = 0,926915 SSE = 4,997875 DW = 1,266421
2
Adj R = 0,392450 SSE = 0,630460 DW = 0,324643
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Uji Signifikansi Fixed Effects (Chow Test) Uji ini dilakukan untuk membandingkan model regresi yang lebih baik antara model regresi fixed effects dan common effects. Berdasarkan hasil pengujian diperoleh keputusan untuk menolak H0 (p-value dari F statistic 124,029 adalah 0,000) yang memberikan kesimpulan bahwa model regresi fixed effects lebih baik daripada model regresi common effects. Uji Signifikansi Hausman (Hausman Test) Selain uji signifikansi fixed effects (Chow test) dan random effects, dilakukan juga uji signifikansi Hausman untuk membandingkan model regresi yang lebih baik antara model regresi fixed effects dan random effects. Berdasarkan hasil pengujian diperoleh keputusan untuk menolak H0 (p-value dari Chi-square statistic 422,673 adalah 0,000) yang memberikan kesimpulan bahwa model regresi fixed effects lebih baik daripada model regresi random effects. Hasil uji signifikansi fixed effects (Chow test) dan uji signifikansi Hausman memberikan kesimpulan bahwa model regresi fixed effects lebih baik dalam mengestimasi variabel-variabel yang mempengaruhi ekspor batubara Indonesia ke delapan negara tujuan ekspor utama. Model terpilih adalah model regresi fixed effects sehingga selanjutnya perlu dilakukan pengujian untuk memeriksa struktur varian-kovarian residual dari model terpilih. Pengujian Asumsi Struktur Varians Covarians Residual Langkah pertama adalah melakukan pengujian apakah varians kovarians residual bersifat homoskedastik atau heteroskedastik dan langkah selanjutnya melakukan pengujian apakah terdapat autokorelasi atau tidak pada struktur varians kovarians residual. Pemilihan Estimator dengan Struktur Varians Kovarians Homoskedastik Untuk
menguji
apakah
varians
covarians
residual
yang
digunakan
bersifat
homoskedastik atau heteroskedastik dilakukan dengan menggunakan Lagrange-Multiplier (LM test). Berdasarkan hasil pengujian diperoleh nilai LM statistik sebesar 43,015 yang lebih besar daripada nilai kritis χ2(0,05;7) = 14,067 sehingga menghasilkan keputusan tolak H0. Oleh karena itu dapat disimpulkan bahwa struktur varians kovarians residual berdifat heteroskedastik. Pemilihan Estimator Struktur Heteroskedastik dan Tidak Ada Cross sectional Correlation dengan uji λLM Nilai λLM berdasarkan hasil pengujian sebesar 64,411 yang lebih besar daripada nilai kritis χ20,05;28 yaitu sebesar 41,337 sehingga keputusannya adalah tolak H0. Oleh karena itu kesimpulannya adalah struktur varians kovarians residual bersifat heteroskedastik dan ada cross sectional correlation Seemingly Unrelated Regression (SUR). TAHUN 6, VOLUME 2, DESEMBER 2014
87
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Berdasarkan serangkaian tahapan diatas dapat disimpulkan bahwa model estimasi yang digunakan adalah model estimasi fixed effect dan karena struktur varians covarians residual bersifat heteroskedastik dan ada cross sectional correlation maka model estimasi fixed effect with SUR adalah model estimasi yang paling sesuai dalam penelitian ini. Dalam penelitian ini juga sudah dilakukan uji asumsi dan disimpulkan tidak terjadi multikolinearitas. Variabel-Variabel yang Memengaruhi Ekspor Batubara Indonesia ke Delapan Negara Tujuan Utama Tahun 2002-2012 Setelah dilakukan pemilihan model terbaik, pengujian asumsi struktur varians kovarians residual, dan dilakukan pengujian asumsi klasik, maka didapatkan persamaan data panel yang akan digunakan dalam penelitian. Persamaan data panel digunakan untuk menganalisis variabel-variabel yang memengaruhi eskpor batubara Indonesia ke delapan negara tujuan ekspor utama tahun 2002-2012. Perkiraan persamaan yang diperoleh adalah : ̂ ) =(21,22201+αi )* + 4,474898 ln [PDB]* − 0,317012 ln[KURS]*it + 0,090217 ln[RCA]*it ln(VEB it it (0,0000) (4)
(0,0000)
(0,0000)
(0,01466)
(0,0059)
Prob (F-stat) = 0,0000 Adj. R2 = 0,926741 * Signifikansi 5 persen Keterangan : αj : Cross section effect negara tujuan ekspor Variabel bebas dalam model, secara keseluruhan, signifikan memengaruhi variabel tak beba (volume eskpor batubara Indonesia) (p-value dari F statistic adalah 0,000). Nilai Adjusted R2 sebesar 0,9938 berarti 99,38 persen variasi yang terjadi pada volume permintaan batubara Indonesia dapat dijelaskan oleh variabel–variabel independen yaitu rasio harga riil ekspor batubara Indonesia, PDB riil, kurs riil, dan nilai Revealed Comparative Advantage (RCA). Hasil estimasi model terbaik menunjukkan bahwa pada tingkat signifikansi 5 persen dapat disimpulkan bahwa tiga variabel independen yaitu PDB riil, kurs riil, dan Revealed Comparative Advantage berpengaruh signifikan terhadap volume permintaan ekspor batubara Indonesia ke delapan negara tujuan ekspor selama 2002–2012, sedangkan rasio harga riil ekspor batubara tidak berpengaruh signifikan terhadap volume permintaan ekspor batubara. Koefisien regresi dari ke empat variabel bebas mempunyai tanda seperti yang diharapkan. Koefisien regresi dari PDB dan RCA bertanda positif, sedangkan koefisien regresi dari rasio harga dan kurs riil bertanda negatif. 88
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 5. Nilai intersep observasi Observasi (1) Cina India Jepang Korea Selatan
ci (2) 20,56 26,23 11,49 14,98
Observasi (3) Hongkong Thailand Malaysia Filipina
ci (4) 9,51 19,93 15,90 23,08
Berdasarkan Tabel 5 di atas dapat diketahui India merupakan observasi dengan nilai intersep terbesar, yaitu 26,23. Hal ini berarti pertumbuhan volume ekspor batubara Indonesia ke lebih besar jika dibandingkan negara tujuan ekspor lainnya dengan asumsi faktor lain ceteris paribus, sehingga dapat dikatakan pasar India lebih potensial bagi ekspor batubara Indonesia. Kondisi ini didukung dengan hasil analisis deskriptif yang menyatakan bahwa selama 2002-2012 rata-rata permintaan ekspor batubara Indonesia oleh India lebih tinggi dibanding negara tujuan ekspor lainnya. Peningkatan ini dipicu karena kebutuhan India terhadap batubara sangat besar. a)
Rasio Harga Riil Ekspor Batubara Dalam penelitian ini rasio harga riil ekspor batubara Indonesia terhadap Australia
ternyata tidak berpengaruh secara signifikan terhadap volume ekspor batubara Indonesia, walaupun mempunyai bentuk hubungan negatif seperti yang diduga. Hal ini menunjukkan bahwa negara tujuan ekspor memang membutuhkan batubara Indonesia untuk kebutuhan dalam negerinya, terutama karena tidak semua negara mampu memproduksi batubara sendiri terkait dengan kondisi alam yang tidak sesuai. Oleh karena itu, negara-negara tersebut tetap mengimpor batubara Indonesia tanpa melihat perbedaan harga antara Indonesia dan Australia. Perlu dicatat bahwa hasil ini adalah berdasarkan persamaan yang juga memasukkan variabel bebas yang lain, sehingga kesimpulan ini dengan kondisi adanya variabel-variabel tersebut. b)
PDB Riil Negara Tujuan Ekspor Berdasarkan hasil estimasi variabel PDB riil negara tujuan ekspor memiliki pengaruh
positif dan signifikan terhadap volume ekspor batubara Indonesia pada taraf nyata 5 persen. Nilai koefisien regresi variabel PDB riil negara tujuan ekspor sebesar 4,1525. Artinya, setiap kenaikan 1 persen PDB riil negara tujuan ekspor maka akan meningkatkan volume ekspor batubara ke negara tujuan ekspor sebesar 4,1525 persen, dengan asumsi variabel lain konstan (ceteris paribus). Hasil ini sudah sesuai dengan hipotesis penelitian. Hasil estimasi menunjukkan bahwa PDB riil negara tujuan ekspor memiliki nilai koefisien regresi, yang dalam hal ini sekaligus merupakan nilai elastisitas 2, yang cukup besar yaitu 4,15 dan merupakan yang paling besar diantara variabel bebas lainnya. Hal ini 2
Karena variabel tersebut dalam persamaan adalah berbentuk logaritma.
TAHUN 6, VOLUME 2, DESEMBER 2014
89
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
menunjukkan bahwa PDB riil negara tujuan ekspor merupakan variabel yang paling responsif dan sifatnya elastis. Oleh karena itu, ini dapat menjadi peluang besar bagi Indonesia untuk lebih memaksimalkan pasar batubara di delapan negara tujuan ekspor mengingat delapan negara tujuan ekspor batubara Indonesia sudah termasuk kategori negara berkembang dan negara maju dan memiliki kegiatan ekonomi yang sedang berkembang. c)
Kurs Riil Koefisien kurs riil mata uang negara tujuan terhadap US$ signifikan pada taraf nyata 5
persen. Hal ini menunjukkan bahwa variabel kurs riil mata uang negara tujuan terhadap US$ merupakan salah satu variabel yang mempengaruhi permintaan ekspor batubara Indonesia ke delapan negara tujuan ekspor. Variabel kurs riil memiliki nilai koefisien -0,5087, yang juga dalam hal ini merupakan nilai elastisitas. Artinya apabila kurs riil mata uang negara tujuan terhadap US$ terdepresiasi sebesar 1 persen akan menurunkan permintaan ekspor batubara Indonesia ke delapan negara tujuan ekspor sebesar -0,5087 persen, dengan asumsi variabel lain konstan (ceteris paribus). Kondisi diatas sesuai dengan diharapkan pada hipotesis penelitian. Kurs riil negara tujuan terhadap US$ memiliki pengaruh yang negatif terhadap permintaan ekspor batubara Indonesia. Artinya ketika nilai tukar riil negara tujuan terhadap US$ terdepresiasi maka permintaan ekspor batubara Indonesia akan mengalami penurunan karena negara tujuan ekspor akan mengeluarkan biaya lebih besar untuk mendapatkan batubara dengan asumsi variabel lain dianggap konstan. Sedangkan ketika kurs riil negara tujuan ekspor terhadap US$ terapresiasi maka negara tujuan ekspor akan meningkatkan permintaan ekspor batubaranya karena biaya yang dikeluarkan untuk memperoleh batubara akan menjadi semakin kecil dan juga dengan asumsi variabel lain dianggap konstan. d)
Daya Saing Berdasarkan hasil estimasi variabel daya saing dengan menggunakan nilai Revealed
Comparative Advantage memiliki pengaruh positif dan signifikan terhadap permintaan ekspor batubara Indonesia pada taraf nyata 5 persen. Nilai koefisien regresi variabel daya saing (yang juga dalam penelitian ini merupakan nilai elastisitas) sebesar 0,1203. Artinya, setiap kenaikan 1 persen nilai RCA maka akan meningkatkan volume ekspor batubara ke negara tujuan ekspor sebesar 0,1203 persen, dengan asumsi variabel lain konstan (ceteris paribus). Daya saing merupakan gambaran kemampuan suatu negara dalam memasarkan produknya di pasar internasional. Selain dilihat dari jumlah komoditi batubara yang diekspor, kualitas komoditi batubara juga berperan peenting dalam meningkatkan daya saing batubara Indonesia. Oleh karena itu, apabila daya saing batubara Indonesia semakin baik maka
90
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
kemampuan batubara Indonesia untuk memasuki pasar luar negeri akan semakin besar dan permintaan batubara oleh negara tujuan ekspor juga akan mengalami kenaikan.
V. KESIMPULAN DAN SARAN
Berdasarkan hasil dan pembahasan diperoleh beberapa kesimpulan sebagai berikut : 1. Volume ekspor batubara Indonesia selama 2002– 2012 ke delapan negara tujuan ekspor utama secara umum menunjukkan tren peningkatan dari tahun ke tahun dan tidak terlalu berfluktuatif. Sejak tahun 2008, eskpor batubara Indonesia ke beberapa negara mengalami peningkatan yang sangat signifikan seperti ke Cina, India, dan Korea Selatan sedangkan ke beberapa negara lainnya mengalami penurunan yang juga cukup signifikan. 2. Hasil RCA memperlihatkan bahwa secara umum batubara Indonesia dan Australia memiliki keunggulan komparatif hampir di semua negara tujuan ekspor selama 2002–2012. Analisis EPD menunjukkan bahwa secara umum komoditi batubara Indonesia merupakan komoditi yang masuk kategori rising star di negara tujuan ekspor kecuali di Hongkong yang termasuk pada posisi daya saing lost opportunity. Sementara itu batubara Australia memiliki posisi daya saing rising star hanya di Cina, Jepang, Korea Selatan, dan Filipina selebihnya masuk pada kategori lost opportunity di Thailand, India, Malaysia dan kategori retreat di Hongkong. Berdasarkan analisis IIT diperoleh bahwa sifat perdagangan untuk komoditi batubara antara Indonesia dengan Cina, Jepang, Korsel, Malaysia, dan Thailand bersifat weak integration sedangkan dengan India, Filipina, dan Hongkong bersifat no integration. 3. Variabel yang mempengaruhi permintaan ekspor batubara Indonesia ke delapan negara tujuan ekspor utama secara signifikan adalah variabel PDB riil negara tujuan ekspor (secara positif), kurs riil negara tujuan ekspor (secara negatif), dan daya saing batubara Indonesia (secara positif). . Sementara itu, variabel rasio harga ekspor tidak signifikan mempengaruhi volume ekspor batubara Indonesia ke delapan negara tujuan tersebut.
Berdasarkan hasil pembahasan dan kesimpulan, saran yang dapat diberikan adalah sebagai berikut : 1.
Indonesia harus berupaya mengoptimalkan produksi batubara agar dapat lebih memaksimalkan volume ekspornya karena komoditi ini memiliki prospek yang menjanjikan. Cara mengoptimalkannya yaitu melalui eksplorasi pertambangan batubara, mempermudah perizinan perusahaan tambang batubara oleh pemerintah, maupun dengan mencukupi teknologi dan sumber daya yang modern.
TAHUN 6, VOLUME 2, DESEMBER 2014
91
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
2.
Salah satu variabel yang dapat dikendalikan Indonesia adalah variabel daya saing. Indonesia perlu meningkatkan kulaitas batubara yang dimiliki khususnya batubara yang diekspor agar permintaan ekspor terhadap Indonesia tidak terbatas pada batubara kualitas menengah ke bawah. Caranya yaitu dengan melakukan modifikasi teknik produksi, maupun penerapan teknologi Upgraded Brown Coal (UBC) seperti yang dilakukan Jepang.
3.
Untuk penelitian selanjutnya perlu dilakukan analisis secara rinci dengan menambahkan variabel-variabel lain yang juga berpengaruh terhadap ekspor batubara Indonesia seperti pajak ekspor, dummy kebijakan ekspor, kuota ekspor, kurs Indonesia, dan sebagainya.
DAFTAR PUSTAKA
Amanda, C.F. (2012). Kinerja Ekspor Komoditi Utama Indonesia ke Delapan Negara Mitra Dagang Utama Tahun 2000–2010 [Skripsi]. Jakarta : Sekolah Tinggi Ilmu Statistik. Asyiyah, S. (2011). Analisis Perhitungan Total Factor Productivity untuk Mengetahui Daya Saing Ekspor Industri Batubara dalam Era Persaingan Afta [Jurnal]. Jakarta : Universitas Gunadarma. Badan Pusat Statistik [BPS]. (2012). Statistik Indonesia. Jakarta: BPS. Bappenas. (2009). Perdagangan dan Investasi di Indonesia: Sebuah Catatan tentang Daya Saing dan Tantangan ke Depan. Bappenas: Jakarta. Batra, Amita & Zeba, Khan. (2005). Revealed Comparative Advantage : An Analysis for India and China. India Council for Research on International Economic Relations. Working Paper no.168. Esterhuizen, D. (2006). An Evaluation of The Competitiveness of The South African Agribusiness Sector [Disertasi]. Pretoria: University of Pretoria. Kementerian Energi dan Sumber Daya Mineral. (2011a). Indonesia Energy Outlook 2010. Jakarta: Kementerian ESDM. Kementerian Energi dan Sumber Daya Mineral. (2011b). Indonesia Energy Outlook 2011. Jakarta: Kementerian ESDM. Greenpeace. (2014). Bagaimana Pertambangan Batubara Melukai Perekonomian Indonesia. Diakses pada tanggal 22 Juli 2014 melalui http://www.greenpeace.org/seasia/id/press/reports/Bagaimana-pertambangan-batubaramelukai-perekonomian-Indonesia/. Miranti, E. (2008). Prospek Industri Batubara di Indonesia. Economic Review No. 214 Desember 2008, hal 3-6. Liputan6.com. (2014). China dan India, Konsumen Batu Bara Terbesar Dunia hingga 2035. Diakses pada tanggal 12 April 2014 melalui
92
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
http://bisnis.liputan6.com/read/807500/china-dan-india-konsumen-batu-bara-terbesar-duniahingga-2035. Ocal, Oguz et al. (2013). Coal Consumption and Economic Growth in Turkey. International Journal of Energy Economics and Policy Vol. 3, No. 2, 2013, pp.193-198. Putry, A.P. (2014). Strategi Meningkatkan Pangsa Pasar China Menjadi Negara Tujuan Utama Ekspor Batubara Indonesia, 2008-2011. Jurnal Ilmiah Mahasiswa Universitas Surabaya Vol.3 No.2 (2014). Suciati, R. (2009). Analisis Faktor-Faktor Yang Mempengaruhi Permintaan Ekspor Batubara Indonesia Di Pasar Jepang [Skripsi]. Bogor : Institut Pertanian Bogor.
TAHUN 6, VOLUME 2, DESEMBER 2014
93
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
FRAMEWORK UNTUK MENDETEKSI PEMALSUAN DATA PADA MOBILE SURVEY
Ibnu Santoso Dosen Sekolah Tinggi Ilmu Statistik
Abstract
Interviewer falsifications are relevant problem faced by institutions conducting census and surveys around the world, including BPS-Statistics Indonesia. Falsified data may cause serious impact to generated statistics even though the proportion of falsified data is very small. Usage of Computer Assisted Personal Interviewing (CAPI) in field data collection has proven to improve efficiency and effectiveness. In addition, the use of CAPI is believed to be able to detect data falsification better. This is because CAPI devices can produce a variety of metadata that can not be obtained when using paper questionnaires. This study discusses relevant features to detect interviewer falsification in CAPI-based surveys, validates them, and uses them to identify interviewer falsification automatically using data mining techniques so that human supervisors can take further actions. After analyzing relevant features and conducting experiment, the result showed that unsupervised classification algorithm using simple 2-means clustering could have up to 70,5% accuracy, while supervised classification using logistic regression could have up to 88,5% accuracy. Keywords:
CAPI,
interviewer
falsification,
unsupervised
classification,
supervised
classification
I. PENDAHULUAN
Berdasarkan Undang-undang Nomor 16 Tahun 1997 tentang Statistik, salah satu peranan yang harus dijalankan oleh Badan Pusat Statistik (BPS) adalah menyediakan kebutuhan data bagi pemerintah dan masyarakat. Data ini banyak didapatkan dari sensus dan survei yang dilakukan oleh BPS. Dalam melaksanakan sensus dan survei tersebut, terutama jika skala kegiatannya cukup besar, BPS hampir selalu melibatkan mitra (tenaga outsource) yang direkrut oleh Koordinator Statistik Kecamatan (KSK) yaitu pegawai BPS yang bertanggung jawab di level kecamatan.
94
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Visi BPS adalah sebagai pelopor data statistik terpercaya untuk semua. Agar data statistik dapat dipercaya oleh semua kalangan, kualitas data adalah suatu hal yang harus terjamin. Kualitas data hasil sensus dan survei ditentukan oleh banyak faktor. Diantara faktorfaktor tersebut adalah faktor responden dan pencacah. Kualitas data yang baik salah satunya dapat diharapkan dari kombinasi responden yang kooperatif memberikan jawaban yang akurat apa adanya dan dari petugas pencacah yang menguasai konsep dan definisi, memiliki etika dan teknik wawancara, serta memiliki kejujuran dan integritas yang tinggi. Dalam prakteknya selalu ada hambatan dalam mencapai kualitas data yang diharapkan. Hambatan tersebut diantaranya berasal dari faktor responden yang sulit ditemui, responden yang tidak kooperatif dan memberikan jawaban sekenanya, dan responden yang tidak bisa memberikan jawaban dengan akurat. Sementara dari sisi petugas pencacah diantaranya petugas yang kurang menguasai etika dan teknik wawancara, kurang menguasai konsep dan definisi, dan petugas yang bekerja tidak sesuai prosedur operasional seperti melakukan kecurangan dengan mengisi sendiri seluruh atau sebagian isian kuesioner tanpa melakukan wawancara tatap muka dengan responden (Harrison, 1947). Kecurangan petugas dalam hal ini disebut juga sebagai pemalsuan data. Pemalsuan data merupakan permasalahan relevan yang dihadapi oleh BPS. Dalam mengatasi permasalahan ini, BPS telah menjalankan program pengawasan dan monitoring berjenjang di setiap kegiatan survei dan sensus. Pengawasan berjenjang ini bertujuan untuk memastikan bahwa petugas bekerja sesuai dengan Standard Operation Procedure (SOP) sehingga data yang dihasilkan dapat dipertanggungjawabkan. Sebagai contoh pada kegiatan pendataan Sensus Penduduk 2010, satu tim pencacah terdiri dari seorang koordinator tim yang bertugas mengawasi tiga orang pencacah. Untuk mengawasi tim pencacah, masih ada petugas monitoring kualitas mulai dari level kabupaten/kota, provinsi, dan pusat. Relevansi permasalahan pemalsuan data di BPS salah satunya dapat dilihat dari laporan resmi hasil monitoring kualitas Sensus Penduduk 2010 yang menyatakan bahwa ada indikasi pemalsuan data di beberapa daerah yang diawasi (BPS, 2010). Bukan hanya di BPS, permasalahan pemalsuan data juga merupakan kasus yang ditemui pada penyelenggaraan sensus dan survei oleh lembaga-lembaga statistik di berbagai negara, bahkan di negara maju. Berbagai studi dan laporan terkait tingkat pemalsuan data pada berbagai survei yang telah dilakukan dijabarkan pada Tabel 1.
TAHUN 6, VOLUME 2, DESEMBER 2014
95
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 1 Berbagai Studi dan Laporan terkait Tingkat Pemalsuan data No
Survei
Negara
Hasil Studi dan Laporan
1
Monthly Current Population Survey dan Annual National Crime Survey
Amerika
0.4% petugas memalsukan data. Padahal wawancara dilakukan oleh petugas professional (S. Bredl, P. Winker, dan K. Kotschau, 2008)
2
Household Vacancy Survey
Amerika
Tingkat pemalsuan data sebesar 6,5%. Petugas adalah staf temporer (S. Bredl, P. Winker, dan K. Kotschau, 2008)
3
ALLBUS, German General Social Survey 1994
Jerman
tingkat pemalsuan data sebesar 2,3% (A. Koch, 1995)
4
Phone Survey
Amerika
6% pewawancara mengakui telah memalsukan seluruh wawancara dan 13% pewawancara mengakui telah memalsukan sebagian data wawancara (P. Kiecker dan J. E. Nelson, 1996)
5
US-National Health Interview Survey (NHIS)
Amerika
3 dari 83 (3,6%) petugas yang dicurigai positif melakukan pemalsuan data (C. Hood dan M. Bushery, 1997)
6
The 1997-98 Baltimore STD and Behavior Survey (BSBS)
Amerika
7 dari 36 petugas (19,4%) melakukan pemalsuan data. 49% dari 451 wawancara yang dilakukan oleh 6 petugas diantaranya adalah palsu. 7 orang tersebut merupakan petugas yang belum memiliki pengalaman survei sebelumnya.( C. Turner dkk, 2002)
7
American National Drug Survey on Drug Use and Health (NSDUH)
Amerika
terdapat 3 orang petugas yang memalsukan data (J. Murphy dkk, 2004)
8
Amerika 9 survey yang diselenggarakan Census Bureau antara 2005-2009
143 dari 735 kasus wawancara yang dicurigai dipastikan palsu (C. Lawrence dan E. Love, 2010)
Di Indonesia belum ada studi khusus yang meneliti tingkat pemalsuan data suatu survei atau sensus maupun indikator-indikatornya. Penelitian tentang pemalsuan data menjadi sangat penting karena besarnya dampak yang dapat ditimbulkannya. Salah satu dampak dari pemalsuan data diantaranya dapat menyebabkan akibat yang serius untuk angka statistik yang dihasilkan dari data survei (S. Bredl, P. Winker, dan K. Kotschau, 2008). Untuk kegiatan survei, jika semakin banyak kasus pemalsuan data terjadi dan semakin besar perbedaan antara
96
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
nilai variabel yang sebenarnya dengan nilai variabel yang dipalsukan, maka akan semakin besar pula nilai bias dari hasil survei (J. Murphy dkk, 2004). Efek pemalsuan data untuk statistik univariat mungkin tidak terlalu besar karena bagian yang dipalsukan tidak banyak dan data yang dipalsukan mungkin nilainya seperti data asli. Tetapi dari sebagian kecil data palsu tersebut sudah cukup untuk menghasilkan bias yang besar pada statistik multivariat (R. Schnell, 1991). Penelitian pada data German Socio Economic Panel (GSOEP) menemukan bahwa penyertaan data GSOEP palsu dalam regresi multivariat mengurangi efek training pada log upah kotor (gross wages) sebesar sekitar 80 persen, meskipun proporsi data palsu tersebut kurang dari 2,5 persen (J. Schrapler and G. Wagner, 2003). Oleh karena itu, untuk memenuhi salah satu persyaratan kualitas data maka tindakan pemalsuan data idealnya tidak boleh terjadi sama sekali dalam kegiatan pengumpulan data. Bredl dkk. (2011) membagi studi tentang deteksi pemalsuan data menjadi dua jenis: (1) Ex-ante study, yaitu studi yang membahas tentang metode-metode deteksi yang diaplikasikan saat pelaksanaan lapangan dengan tujuan untuk mengidentifikasi petugas mana yang melakukan kecurangan. (2) Ex-post study, yaitu studi yang mengaplikasikan berbagai indikator pada suatu dataset dengan kasus-kasus kecurangan yang telah diketahui dengan tujuan mengidentifikasi indikator-indikator yang membedakan antara data yang diperoleh dengan jujur dan data yang telah dipalsukan. Ex-ante study menjadi penting karena pelaksanaan lapangan suatu kegiatan sensus atau survei memerlukan suatu strategi proses monitoring atau pengawasan yang baik dan terencana untuk memastikan kegiatan lapangan berjalan sesuai dengan SOP. Proses monitoring saat kegiatan pelaksanaan pendataan lapangan sedang berlangsung juga berguna untuk mendeteksi dan meminimalisir kejadian pemalsuan data. M Rita Tisshen (2008) telah merangkum berbagai teknik/metode monitoring klasik beserta kelebihan dan kekurangannya sebagaimana dijelaskan pada Tabel 2. Namun, teknik klasik tersebut memiliki kekurangan dalam skala penerapannya, yaitu jumlah tenaga pengawas atau supervisor maupun dana yang ada dapat menjadi keterbatasan jika harus mengawasi seluruh petugas dan memantau seluruh kegiatan wawancara. Maka hampir semua prosedur pengawasan dengan teknik klasik ini hanya dilakukan secara sampel, tidak dapat menjangkau seluruh populasi. Ex-post study memiliki arti penting ketika indikator-indikator yang berhubungan dengan pemalsuan data dapat diidentifikasi dan memiliki pengaruh yang kuat. Contoh dari hasil ex-post study seperti dijelaskan oleh Chrishelle Lawrence dan Elizabeth Love (2010) adalah petugas yang minim pengalaman/belum memiliki pengalaman pendataan lapangan sama sekali dan petugas yang berasal dari wilayah tertentu memiliki kecenderungan yang lebih tinggi dalam melakukan pemalsuan data. Indikator ini dapat menjadi input dalam melakukan TAHUN 6, VOLUME 2, DESEMBER 2014
97
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pengawasan/monitoring untuk survei berikutnya. Sebagai contoh, pada survei berikutnya, petugas
yang
memenuhi
kriteria
dalam
indikator
tersebut
mendapatkan
porsi
supervisi/pengawasan yang lebih tinggi daripada petugas yang sudah berpengalaman.
Tabel 2. Berbagai Teknik Klasik dalam Pengawasan Kegiatan Lapangan (M Rita Tisshen, 2008) Teknik
Kelebihan
Kekurangan
Observasi Langsung
Memberikan gambaran mendetail
-Dapat mempengaruhi pewawancara dan responden -Mahal dari segi biaya
Diskusi dengan pewawancara setelah selesai wawancara
Murah dari segi biaya
Hanya mendapatkan sudut pandang pewawancara
Verifikasi responden lewat Mendapatkan sudut pandang telepon atau wawancara ulang responden secara langsung
-Membebani responden
Melakukan review pada data respons dan waktu
Efektif untuk mengawasi kualitas data
Terbatasnya informasi tentang performa wawancara
Merekam pembicaraan dengan tape recorder
Informatif
-Dapat mengganggu
-Mahal dari segi biaya
-Canggung jika tape harus di stop dan start -Biaya dan usaha ekstra untuk perlengkapan dan pengiriman tape
Perkembangan teknologi merambah semua bidang tidak terkecuali pada teknologi pendataan lapangan sebagaimana diilustrasikan pada Gambar 1. Perkembangan teknologi memungkinkan wawancara tidak lagi dilakukan dengan tatap muka melainkan bisa lewat telepon dan e-mail. Kemudian media pendataan juga mengalami perubahan dari media kertas menjadi media komputer. Teknologi pengolahan juga berkembang dari yang tadinya isian kuesioner kertas di-input ke komputer oleh petugas pengolahan menjadi di-scan oleh mesin scanner. Teknologi terkini memungkinkan wawancara dilakukan menggunakan media komputer genggam kemudian hasil wawancara langsung dikirimkan ke server. Meskipun dari segi biaya termasuk yang menghabiskan biaya paling besar dibanding moda lain, survei tatap muka tetap menjadi pilihan BPS karena memiliki tingkat respon yang paling baik. Survei tatap muka juga menjadi kebutuhan bagi responden tertentu, misalnya responden yang buta huruf, responden yang berdomisili di daerah terpencil serta responden 98
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
yang tidak dapat dijangkau surat maupun telepon. Dalam perkembangannya di BPS, survei tatap muka yang tadinya menggunakan media kertas (Paper and Pencil Interviewing, PAPI) secara perlahan berubah menggunakan media komputer (Computer Assisted Personal Interview, CAPI) yang ditandai dengan pembelian perangkat berbasis Android sebanyak 1300 unit khusus untuk pendataan lapangan.
Gambar 1. Perkembangan Teknologi Survei (University of Maryland, 2013)
Survei berbasis CAPI pertama yang dilakukan oleh BPS adalah Survei Penggunaan Tembakau Indonesia (SPTI) 2011 (BPS, 2011). Kemudian pada bulan Juni 2013 BPS melakukan Pendataan Pilot Survei Pengetahuan, Sikap, dan Perilaku Kesiapan Menghadapi Bencana di Kota Padang, Sumatera Barat. Dalam pelaksanaan kegiatan yang kedua ini, BPS menggunakan tablet berbasis Android untuk kegiatan lapangannya. Penggunaan tablet berbasis Android dalam pengumpulan data bertujuan untuk meminimalisir kesalahan yang menyebabkan data tidak bersih. Survei berbasis CAPI yang dilakukan oleh BPS belum dilengkapi dengan mekanisme untuk mendeteksi pemalsuan data secara cepat, yaitu mekanisme yang dapat mendeteksi pemalsuan data yang dilakukan oleh petugas pada saat kegiatan pengumpulan data masih berjalan. Moda CAPI masih merupakan hal yang baru bagi BPS. Selain memberikan keuntungan lebih dalam proses pengolahan data, pengumpulan data dengan moda CAPI dipercaya dapat memberikan keuntungan lebih dalam proses monitoring dan pendeteksian pemalsuan data oleh petugas. Hal ini karena dengan moda CAPI dapat diperoleh metadata yang menjelaskan kapan, dimana, dan bagaimana data respon diperoleh. Pemalsuan data dapat terjadi pada kegiatan pengumpulan data, terlepas dari apapun moda pengumpulan data yang digunakan. Untuk itu diperlukan suatu strategi pengawasan lapangan yang baik karena keterbatasan jumlah dan kapabilitas supervisor manusia dalam
TAHUN 6, VOLUME 2, DESEMBER 2014
99
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
melakukan pengawasan. Dengan menggunakan moda CAPI, supervisor manusia dapat menjadi lebih terbantu karena pengawasan atau monitoring dapat dilakukan secara sistemik, lebih terfokus, dan menjangkau seluruh populasi, tidak lagi secara sampel seperti yang ditemukan pada keterbatasan teknik klasik dalam melakukan pengawasan sebagaimana dijelaskan pada Tabel 2 di atas. Dalam penelitian ini pertama penulis berusaha untuk mengkaji fitur-fitur apa saja yang dapat digunakan untuk mendeteksi pemalsuan data. Kemudian setelah mendapatkan fitur-fitur tersebut, penulis mencoba menganalisis kebutuhan sistem pendeteksi pemalsuan data dan membuat framework untuk sistem tersebut. Penulis melakukan eksperimen dengan menerapkannya pada suatu survei nyata yang dilakukan oleh BPS yang melibatkan petugas yang berpengalaman dan mengukur apakah sistem pendeteksi pemalsuan wawancara dapat berjalan dengan baik. Berdasarkan uraian pada latar belakang di atas, maka masalah pada penelitian dapat dirumuskan sebagai berikut: 1. Apa saja fitur yang relevan dan dapat dijadikan rujukan untuk mendeteksi pemalsuan data? 2. Bagaimana sistem yang dapat mendeteksi kecurangan petugas dapat diterapkan pada survei berbasis CAPI? Tujuan penelitian ini adalah: 1. Melakukan identifikasi fitur yang relevan untuk mendeteksi pemalsuan data oleh petugas pencacah. 2. Merancang dan membangun sistem prototype pendeteksi pemalsuan data untuk diterapkan pada instrumen tablet phone, melakukan ujicoba, dan mengevaluasi hasil ujicoba. Ruang lingkup penelitian ini adalah: 1. Hanya melakukan pendeteksian pemalsuan data secara otomatis saja, tidak membahas pada pencegahan sebelum terjadi dan tindakan setelah terjadi. 2. Tidak membahas tindakan kecurangan yang dilakukan oleh selain petugas pewawancara. 3. Prototype dibangun pada perangkat tablet phone berbasis Android.
II. TINJAUAN PUSTAKA Pemalsuan data AAPOR (2003) mendefinisikan pemalsuan data (interviewer falsification) sebagai perbuatan sengaja dari petugas untuk tidak mematuhi petunjuk dan instruksi pencacahan yang tidak dilaporkan oleh petugas itu sendiri dan dapat berakibat pada kontaminasi data. “Sengaja” berarti bahwa petugas melakukan secara sadar perbuatan menyimpang tersebut. Pemalsuan data yang dimaksud diantaranya:
100
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
a. memalsukan seluruh atau sebagian wawancara – dengan cara mengisi sendiri isian kuesioner dan melaporkannya sebagai jawaban responden; b. sengaja salah melaporkan kode disposisi dan memalsukan data proses (misalnya, pencatatan kasus non response, melaporkan upaya menghubungi responden secara fiktif); c. sengaja menulis kode jawaban yang berbeda dari responden untuk menghindari pertanyaan berikutnya; d. sengaja melakukan wawancara pada rumah tangga yang bukan sampel, untuk mengurangi usaha yang diperlukan dalam menyelesaikan proses wawancara; e. sengaja membuat laporan palsu tentang proses pengumpulan data kepada manajemen survei. Kecurangan yang dimaksud tidak termasuk kesalahan umum dan tidak disengaja, misalnya kesalahan pengukuran dalam situasi tanya jawab atau kesalahan oleh pewawancara dalam merekam jawaban responden karena untuk tidak memahami atau ingat protokol wawancara. Dengan demikian, menentukan bahwa tindakan kecurangan telah terjadi melibatkan beberapa penilaian tentang niat dari petugas itu sendiri. Ada beberapa alasan mengapa petugas pencacah melakukan pemalsuan data. Diantaranya disebabkan oleh kuesioner yang panjang, pertanyaan yang kompleks, responden yang sulit dijangkau, dan faktor eksternal seperti cuaca dan kondisi masyarakat (L. Crespi, 1945). Biasanya petugas pencacah tidak memiliki kepedulian kuat untuk mendapatkan kualitas data yang tinggi. Petugas tidak terlibat dalam perencanaan survei atau pengembangan kuesioner dan jarang sekali ada petugas yang menguasai etika riset ilmiah (AAPOR, 2003). Petugas harus melakukan wawancara dengan responden yang tidak dikenal untuk mendapatkan informasi personal yang mungkin bersifat sensitif sehingga kemungkinan akan muncul rasa sungkan. Petugas mungkin juga dihadapkan pada skema pemberian honor yang hanya berdasarkan pada jumlah responden yang diwawancarai (A. Kennickell, 2002), suatu skema yang bisa menyebabkan pemahaman bahwa kuantitas wawancara lebih berarti dibandingkan kualitasnya (A. Bennet, 1948). Ciri-ciri Data Palsu Data-data yang dipalsukan memiliki sifat-sifat tertentu. Berdasarkan studi pustaka, Benjamin B. (2012) telah menghimpun 15 ciri-ciri data palsu dari berbagai makalah. Kemudian ciri-ciri data yang dipalsukan tersebut dibagi dalam empat kategori karakteristik yaitu: 1. Menurut karakteristik bahwa petugas ingin usaha minimal dalam menyelesaikan wawancara: a. Fast interview, wawancara dilakukan dalam waktu yang cepat TAHUN 6, VOLUME 2, DESEMBER 2014
101
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
b. Many missing unit, banyak terdapat jawaban yang kosong c. Interview surge, terjadi lonjakan jumlah wawancara yang selesai dalam waktu yang singkat d. Close to deadline, mendekati batas akhir penyelesaian wawancara e. Short paths through survey, petugas memilih “rute” pertanyaan yang pendek dalam kuesioner f. Unusual time of day, wawancara dilakukan pada waktu yang tidak biasa, terlalu pagi atau terlalu petang g. Many incomplete interview, banyak wawancara yang tidak selesai 2. Menurut karakteristik bahwa petugas ingin menghindari pengawasan: a. Missing telephone number, Nomor telepon responden pada kuesioner sengaja dikosongkan b. Low data variance, variasi data rendah c. Few missing units, hanya sedikit jawaban yang kosong 3. Menurut karakteristik bahwa petugas tidak mengetahui sebaran distribusi populasi data yang sebenarnya: a. Bad fit to benford’s law, kurang sesuai dengan hukum distribusi angka benford b. Unusual data, adanya data yang tidak biasa c. Rare response combination, kombinasi jawaban yang langka 4. Menurut karakteristik lain: a. Low time variance, variasi waktu penyelesaian wawancara kecil b. Long interview, wawancara dilakukan dalam waktu yang lama
III. METODE PENELITIAN
Metodologi yang digunakan dalam penelitian ini menggunakan Design Science Research Methodology (DSRM) for Information System Research. Alur dan kerangka pemikiran yang digunakan dalam penelitian ini dapat dilihat pada Gambar 2. Penelitian dimulai dengan melakukan analisis fitur yang relevan melalui berbagai studi pustaka dan analisis kebutuhan sistem yang dapat mendeteksi pemalsuan data secara otomatis dan diakhiri dengan melakukan uji korelasi dan evaluasi fitur data respon dan fitur metadata terhadap pemalsuan data, melakukan analisis, dan menarik kesimpulan untuk mencoba menjawab pertanyaan penelitian.
102
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK Analisis fitur yang relevan: -fitur dari data respon
Analisis kebutuhan sistem pendeteksi pemalsuan data
Perancangan prototype sistem pengumpulan data lapangan tablet phone berbasis Android Pembuatan prototype server dan aplikasi mobile pada perangkat tablet phone
Evaluasi dan pengujian prototype server dan aplikasi mobile pada perangkat tablet phone
Evaluasi hasil implementasi, Implementasi dan melakukan data dan metadata yang percobaan pengumpulan data dan diperoleh dari percobaan metadata untuk test set pengumpulan data Melakukan uji korelasi dan evaluasi fitur data respon dan fitur metadata terhadap pemalsuan data, melakukan analisis, dan menarik kesimpulan
Gambar 2. Alur Pelaksanaaan Penelitian
IV. HASIL DAN PEMBAHASAN
Berikut adalah berbagai fitur metadata yang dapat digunakan untuk mendeteksi data palsu yang dirangkum dari berbagai literatur. Fitur-fitur yang Relevan 1. Lokasi Secara teoritis, wawancara yang jujur dilakukan di tempat atau lokasi yang benar. Pemalsuan data bisa dilakukan di tempat yang benar bisa juga tidak. Jadi, lokasi atau tempat dapat memegang peranan yang penting dalam mendeteksi pemalsuan data. Perangkat tablet phone saat ini sudah dilengkapi dengan Global Positioning System (GPS) untuk mendeteksi lokasi dimana perangkat tersebut berada. Lokasi yang didapat dari GPS dinyatakan dalam koordinat latitude dan longitude. Pendeteksian lokasi sangat berguna jika terdapat data lokasi koordinat responden. BPS tidak mempunyai data lokasi koordinat responden, tetapi BPS memiliki peta wilayah kerja yang sudah memiliki lokasi geografis. Unit terkecil peta wilayah kerja adalah peta blok sensus. Dalam satu blok sensus terdiri dari 80-100 rumah tangga. Peta blok sensus merupakan perlengkapan standar yang harus dibawa oleh petugas pada saat melakukan pengumpulan data (Gambar 3). Penggunaan peta memastikan bahwa data diambil dari tempat yang benar. Peta blok sensus berbentuk polygon dan dapat berbentuk peta digital. peta digital yang dimiliki BPS disimpan dalam bentuk shapefile.
TAHUN 6, VOLUME 2, DESEMBER 2014
103
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Pendekatan pemeriksaan lokasi bisa dipastikan dengan melihat apakah suatu titik koordinat perangkat tablet phone pada saat melakukan wawancara berada dalam polygon peta blok sensus atau tidak. Jika titik koordinat tidak berada dalam polygon, bahkan jauh, maka kebenaran wawancara dapat dicurigai. Selain melihat titik dalam polygon, dapat juga dilihat pergerakan dari perangkat tablet phone tersebut. Secara teknis, pendeteksian satu titik koordinat berada dalam polygon shapefile dapat dilakukan menggunakan library osgeo dan iphyton. Dengan input koordinat lokasi latitude dan longitude, output program menghasilkan titik koordinat tersebut berada di polygon yang mana. Bila output polygon sama dengan wilayah kerja, maka wawancara dilakukan di wilayah kerja yang benar.
Gambar 3. Peta Analog dan Digital BPS
2. Date Stamps Date Stamps adalah tanggal kapan wawancara dilakukan. Pada pendataan BPS yang menggunakan kertas sebagaimana ditunjukkan pada Gambar 4, biasanya terdapat kolom kapan wawancara dilakukan dan kapan pemeriksaan oleh pengawas dilakukan. Date Stamps sangat berguna dan dapat memberikan informasi dalam satu hari berapa kuesioner yang bisa diselesaikan oleh petugas. Jika terlalu banyak wawancara yang diselesaikan dalam satu hari melebihi batas normal, maka petugas dapat dicurigai melakukan pemalsuan data. Indikasi
104
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pemalsuan data juga dapat dinilai ketika banyak wawancara yang diselesaikan mendekati deadline pendataan lapangan.
Gambar 4. Contoh Date Stamps
Kelemahan penggunaan kuesioner kertas, data date stamp ini dapat dipalsukan dengan mudah. Petugas dapat mengisi tanggal dilakukan wawancara sesuka hati. Mekanisme kontrol ada pada pengawas yang melakukan pengawasan petugas pencacah. Jika menggunakan perangkat tablet phone, date stamp dapat dikirimkan bersamaan dengan pengiriman data. Meski dapat juga dipalsukan, namun pengubahan date stamp pada perangkat tablet phone lokal, date stamp yang akurat dapat diperoleh menggunakan time server internet. 3. Time Stamps Time Stamps menginformasikan pada jam berapa suatu wawancara dilakukan. Indikasi pemalsuan data jika beberapa wawancara memiliki interval time tamps yang terlalu rapat, atau wawancara terjadi pada waktu yang tidak lazim (misalnya antara jam 12 malam hingga jam 6 pagi). Untuk mendapatkan metadata time stamp yang lebih akurat dapat digunakan tablet phone sebagai instrumen pendataan. Sama seperti date stamps, informasi time stamp juga bisa didapat dari kuesioner kertas, tetapi time stamp tersebut dapat dengan mudah dipalsukan oleh petugas. 4. Duration Duration data secara umum adalah metadata yang berkaitan dengan lamanya wawancara atau durasi wawancara. Secara umum, duration data menjelaskan berapa lama satu wawancara dilakukan. Dalam beberapa literatur, timing data dipandang sebagai pemrediksi yang kuat untuk mendeteksi pemalsuan wawancara. Wawancara yang baik biasanya berlangsung dalam durasi waktu yang normal. Indikasi pemalsuan data jika wawancara selesai terlalu cepat, kemungkinan jika petugas tidak memalsukan data maka kurang menggali jawaban responden sehingga data yang diperoleh menjadi kurang berkualitas. Jika wawancara selesai terlalu lama dari waktu normal, mungkin petugas yang bersangkutan membutuhkan
TAHUN 6, VOLUME 2, DESEMBER 2014
105
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
pelatihan tambahan yang mengajarkan bagaimana menggunakan waktu wawancara dengan efisien. Duration data ini dapat dijabarkan lagi tidak sekedar durasi keseluruhan wawancara. Penggunaan tablet phone memungkinkan aplikasi merekam dari keseluruhan lama waktu wawancara tersebut, berapa lama durasi petugas menanyakan pertanyaan dan berapa lama durasi responden menjawab. Pertanyaan yang sulit juga dapat membantu memprediksi karena waktu yang dibutuhkan oleh responden akan lebih lama untuk menjawabnya. 5. Behavioral Data Behavioral data menjelaskan bagaimana pola perilaku interaksi antara petugas dengan responden. Misalnya petugas yang banyak melakukan swipe terlalu banyak dalam waktu yang singkat mungkin hanya berinteraksi dengan perangkatnya, tidak dengan responden. Behavioral data misalnya jumlah swipe, click, next, prev, melakukan editing jawaban, dan menekan tombol bantuan. Penelitian terkini tentang pemalsuan data oleh Birnbaum dkk (2013) menggunaan behavioral data untuk mendeteksi pemalsuan data. Dalam studi tersebut, penggunaan supervised learning terhadap behavioral data dapat memberikan akurasi yang tinggi meski petugas tahu bagaimana sistemnya bekerja dan diberikan insentif lebih jika mampu memalsukan data tanpa diketahui oleh server. Setelah mempelajari berbagai literatur, Birnbaum (2012) merangkum 15 karakteristik dari data-data yang dipalsukan. Kemudian dari karakteristik-karakteristik tersebut dapat dipetakan dengan fitur-fitur untuk mendeteksinya. Hasil pemetaan tersebut dapat dilihat pada Tabel 3.
Tabel 3. Pemetaan Ciri Data Palsu dan Fitur untuk Mendeteksinya No
Karakteristik
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Fast interview Many missing unit *) Interview surge Close to deadline Short paths through survey Unusual time of day Many incomplete interview*) Missing telephone number Low data variance Few missing units *) Bad fit to benford’s law Unusual data Rare response combination Low time variance Long interview
106
Fitur Metadata 1 2 3 √ √ √ √ -
4 √ √ √
5 √ -
Fitur Data 6 7 8 √ √ √ √ -
9 √ √
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Ket:
1=Lokasi, 2=Date Stamp, 3=Time Stamp, 4=Duration, 5=Behavioral Data, 6=Benford
Law, 7=Variability, 8=Data rarity, 9=Jumlah skip *) Tidak seperti kuesioner kertas, pada CAPI meminimalisir kemungkinan wawancara yang tidak selesai dan tidak ada unit yang tidak terisi.
Dari hasil pemetaan di Tabel 3 terlihat bahwa dari 15 sifat data palsu, 3 diantaranya sudah dapat diatasi dengan penerapan CAPI. 7 sifat data palsu dapat dilihat menggunakan metadata dan sisanya menggunakan data respon. Secara keseluruhan sifat data palsu dapat dideteksi terutama cukup dengan menggunakan fitur date stamp, time stamp, timing data, dan analisis data respon sederhana. Fitur lain seperti lokasi, dan behavioral data sebagaimana disebutkan sebelumnya diyakini dapat membuat deteksi lebih akurat. Implementasi Uji coba sistem pendeteksi pemalsuan data ini dilakukan pada Survei Perilaku Peduli Lingkungan Hidup (SPPLH). SPPLH dipilih karena merupakan survei BPS yang waktu penyelesaiannya di responden relatif tidak terlalu lama. Kuesioner survei SPPLH dibagi dalam 13 blok dan 36 nomor pertanyaan. Jumlah kolom yang dibutuhkan dalam database untuk menyimpan satu record sejumlah 138 kolom. Kuesioner SPPLH memiliki banyak pertanyaan bersyarat (conditional) yaitu pertanyaan yang hanya ditanyakan jika jawaban tertentu diberikan pada pertanyaan sebelumnya. Jumlah variabel bersyarat pada kuesioner SPPLH berjumlah sekitar 51 variabel dari 138 variabel. Karena diterapkan pada lingkungan percobaan, beberapa fitur tidak dapat digunakan seperti fitur date stamp dan time stamp yang berfungsi mencatat tanggal dan waktu dilakukan wawancara. Oleh karena itu digunakan fitur lain yang masih relevan dengan lingkungan percobaan ini sebagaimana dijelaskan pada Tabel 4.
1. Pembuatan Aplikasi Aplikasi dikembangkan untuk perangkat Samsung Galaxy Tab 2 P3100 dengan spesifikasi sebagai berikut: - Layar 7.0 inch - Prosesor 1GHz Dual Core - Ram 1 GB - OS Android 4.0.3 Ice Cream Sandwich Aplikasi dilengkapi dengan fitur yang dapat merekam data dan metadata sebagaimana dibahas pada sub bab sebelumnya. Gambar 5 memperlihatkan screenshot dari aplikasi yang telah dibuat. TAHUN 6, VOLUME 2, DESEMBER 2014
107
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Aplikasi server dikembangkan menggunakan bahasa pemrograman PHP dengan fungsionalitas sebagai berikut: 1. Otentikasi login pengguna 2. Mentransfer daftar rumah tangga yang harus dicacah oleh petugas 3. Menampilkan kemajuan pelaksanaan pencacahan lapangan untuk setiap petugas 4. Menyimpan seluruh data respon dan metadata yang diunggah oleh client ke database Tabel 4 Fitur yang Digunakan
108
No 1
Fitur Dalamblok
2
Totalwaktu
3
Totalwaktubertanya
4
Reratawaktubertanya
5
Totalwaktujawab
6
Reratawaktujawab
7
Jumlahcontendit
8
Jumlahnoncontedit
9 10
Jumlahbersyarat Waktubersyarat
11 12 13
Berikutnya Sebelumnya Bantuan
Penjelasan Apakah wawancara dilakukan di dalam blok sensus yang ditentukan atau tidak Total waktu yang dibutuhkan untuk menyelesaikan wawancara Total waktu yang dibutuhkan untuk menanyakan pertanyaan Rata-rata waktu yang dibutuhkan untuk menanyakan pertanyaan (Totalwaktubertanya dibagi dengan jumlah layar pertanyaan yang dilalui) Total waktu yang dibutuhkan untuk menjawab pertanyaan Rata-rata waktu yang dibutuhkan untuk menjawab pertanyaan (Totalwaktujawab dibagi dengan jumlah layar pertanyaan yang dilalui) Total berapa kali petugas mengubah-ubah jawaban dalam satu layar pertanyaan Total berapa kali petugas tidak mengubah jawaban setelah layar muncul Total berapa kali layar pertanyaan bersyarat muncul Total waktu yang dihabiskan dalam layar pertanyaan bersyarat Total berapa kali tombol “berikutnya” ditekan Total berapa kali tombol “sebelumnya” ditekan Total berapa kali tombol “kalkulator” ditekan
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Gambar 5. Aplikasi SPPLH
2. Pelatihan Petugas dan Pengumpulan Data Pelatihan Petugas dilakukan selama satu hari kerja. Satu hari pelatihan dibagi menjadi dua sesi, sesi pertama pemahaman konsep dan definisi yang digunakan pada SPPLH sehingga petugas dapat bertanya dengan lebih spesifik dan efektif. Sesi kedua adalah pelatihan penggunaan perangkat tablet. Peserta terdiri dari 30 orang, yang dibagi dalam 15 tim. Satu orang petugas mengumpulkan data 20 rumah tangga dengan pembagian 10 rumah tangga hasil pencacahan yang sebenarnya dan 10 rumah tangga hasil prediksi. 5 rumah tangga prediksi dilakukan pada saat pelatihan dan 5 sisanya dilakukan setelah mencacah 10 rumah tangga sebenarnya untuk mendapatkan pengetahuan dan pengalaman dalam mencacah rumah tangga yang sebenarnya. Sehingga total ada data 300 rumah tangga sebenarnya dan 300 rumah tangga prediksi. Metode eksperimen ini mirip dengan yang dilakukan Brinbaum dkk (2013) dalam studinya.
Hasil Tes Dan Evaluasi 1. Survei Penerimaan Pengguna Setelah aplikasi diujicoba oleh pengguna, dilakukan survei penerimaan pengguna untuk melihat kemudahan penggunaan aplikasi. Gambar 6 menjelaskan kemudahan penggunaan aplikasi menurut pengguna dimana 25 orang (83%) menyatakan aplikasi mudah digunakan tanpa kendala dan sisanya 5 orang (17%) menyatakan bahwa
TAHUN 6, VOLUME 2, DESEMBER 2014
109
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
aplikasi cukup mudah digunakan. Tidak ada pengguna aplikasi yang mengeluhkan sulit menggunakan aplikasi.
0% 17% Mudah Cukup 83%
Sulit
Gambar 6. Kemudahan Penggunaan Aplikasi
2. Evaluasi Fitur Dari 13 fitur yang digunakan di atas, kemudian dihitung korelasinya dengan pemalsuan data. Tabel 5 memperlihatkan nilai korelasi untuk masing-masing fitur. Dari tabel 5 diperoleh data bahwa 7 fitur memiliki korelasi yang sedang hingga kuat. Sisanya tidak ada korelasi atau sangat lemah. Terlihat bahwa fitur yang memiliki korelasi yang kuat dan sedang kebanyakan berhubungan dengan durasi. Satu fitur help bahwa petugas yang memalsukan data ternyata tidak banyak menggunakan tombol bantuan. Tabel 5. Nilai Korelasi Fitur (r) Terhadap Pemalsuan Data Fitur Totalwaktu Reratawaktujawab Totalwaktujawab Totalwaktubertanya Reratawaktubertanya Bantuan Waktubersyarat Jumlahcontedit Berikutnya Sebelumnya Jumlahnoncontedit Jumlahbersyarat
110
r 0.539 0.506 0.499 0.489 0.470 0.467 0.382 -0.126 0.079 0.061 0.057 0.055
Deskripsi Kuat Kuat Kuat Sedang Sedang Sedang Sedang Lemah Tidak ada/sangat lemah Tidak ada/sangat lemah Tidak ada/sangat lemah Tidak ada/sangat lemah
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
3. Unsupervised Classification Unsupervised Classification dapat digunakan ketika tidak ada informasi tentang label data yang tersedia. Algoritma K-means clustering membagi data ke sejumlah k klaster sesuai dengan fitur yang ada. Pada kasus ini, wawancara dapat dibagi menjadi dua klaster, yaitu wawancara jujur dan wawancara palsu. Kelemahan metode unsupervised classification terhadap supervised classification secara umum adalah akurasinya. Menggunakan software WEKA (Mark H dkk, 2009), pada tab clustering menggunakan simple k means clustering dimana k=2 diperoleh data bahwa instance yang salah klaster sebanyak 29,5%. Ini berarti bahwa akurasi yang didapatkan mencapai 70,5%. Gambar 7 memperlihatkan output program.
=== Model and evaluation on training set === Clustered Instances 0 379 ( 63%) 1 221 ( 37%) Class attribute: interview Classes to Clusters: 0 1 <-- assigned to cluster 128 172 | REAL 251 49 | FALSIFIED Cluster 0 <-- REAL Cluster 1 <-- FALSIFIED Incorrectly clustered instances :177.0 29.5 % Gambar 7. Output 2-Means Clustering
4. Supervised Classification Supervised classification dapat digunakan ketika ada informasi tentang pelabelan data untuk tiap instance. Dibandingkan unsupervised classification, supervised classification menawarkan tingkat akurasi yang lebih baik. Metode umum untuk mengevaluasi classifier adalah k-fold cross validation, dimana data dibagi ke dalam sejumlah k bagian. Kemudian sejumlah k-1 bagian digunakan untuk melatih classifier dan 1 bagian untuk melakukan pengetesan.
TAHUN 6, VOLUME 2, DESEMBER 2014
111
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Prosesnya kemudian dilakukan berulang sebanyak jumlah k dan akurasi final ditentukan dengan menghitung akurasi rata-rata dari setiap iterasi. Classifier yang digunakan pada studi ini adalah regresi logistik. Regresi logistik sangat cocok sebagai classifier binary, sederhana, cepat, dan memiliki skalabilitas yang baik. Gambar 8 menunjukkan output software WEKA (Mark H dkk, 2009) menggunakan 10-fold cross validation.
=== Summary === Correctly Classified Instances
88.5
%
Incorrectly Classified Instances
11.5
%
Kappa statistic
0.77
Mean absolute error
0.166
Root mean squared error Relative absolute error
0.2912 33.1922 %
Root relative squared error
58.232 %
Total Number of Instances
600
=== Confusion Matrix === a b <-- classified as 272 28 | a = REAL 41 259 | b = FALSIFIED Gambar 8. Output Logistic Regression
IV.
KESIMPULAN DAN SARAN
Kesimpulan Berikut adalah kesimpulan dari hasil penelitian ini: 1. Fitur-fitur yang relevan dengan pemalsuan data didapatkan dari studi literatur dan dibagi menjadi dua kategori yaitu kategori data dan metadata. Untuk kategori metadata antara lain lokasi, date stamp, time stamp, durasi, dan behavioral data sedangkan untuk kategori data antara lain kesesuaian dengan hukum benford, variasi data, kombinasi jawaban yang jarang atau tidak lazim, dan unit yang tidak terisi. 2. Setelah dilakukan pemetaan dengan 15 sifat-sifat data palsu yang ada, ke-15 sifat data palsu tersebut dapat dicakup dengan fitur yang diusulkan.
112
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
3. Dari eksperimen yang dilakukan didapat kesimpulan tidak semua fitur efektif untuk mendeteksi pemalsuan data. fitur durasi dan tombol bantuan merupakan pemrediksi yang kuat dalam mendeteksi wawancara. 4. Klasifikasi otomatis dengan supervised classification memberikan akurasi yang lebih tinggi dari unsupervised classification. Namun supervised classification hanya dapat dilakukan dengan syarat terdapat informasi tentang data label.
Saran Saran terkait penelitian ini antara lain: 1. Organisasi penyelenggara survei atau sensus sebaiknya merancang kuesioner dengan baik sehingga dapat lebih mengefektifkan waktu wawancara dan petugas tidak tertarik untuk melakukan pemalsuan data. 2. Sistem untuk monitoring dan pembuatan laporan dari sisi server dapat lebih dipelajari dan dikembangkan lagi.
DAFTAR PUSTAKA A. Bennet, "Toward a solution of the “cheater problem” among parttime research investigators," Journal of Marketing 12 (4), pp. 470-474, 1948. A. Kennickell, " Interviewers and data quality: Evidence from the 2001 survey of consumer finances," in Proceedings of the American Statistical Association (Survey Research Methods Section), 2002, p. 1807–1812. A. Koch, "Fake Interview: Results of the Interviewer Control in ALLBUS 1994 ," ZUMA-Nachrichten 36, p. 89–105, 1995. AAPOR. (2003) [Online]. http://www.aapor.org/Content/NavigationMenu/ResourcesforResearchers/falsification. pdf Birnbaum B, Thessis: Algorithmic Approaches to Detecting Interviewer Fabrication in Surveys. University of Washington, 2012. Birnbaum B., Gaetano B., Abraham D. F., Brian D., Anna R. K.. “Using Behavioral Data to Identify Interviewer Fabrication in Surveys”. Proceeding ACM CHI ‘13 Proceedings of the SIGCHI Conference on Human Factors in Computing Systems Pages 2911-2920. 2013. BPS, "Laporan Monitoring Kualitas Sensus Penduduk 2010," 2010. BPS. (2011) Sirusa. [Online]. http://sirusa.bps.go.id/index.php?r=sd/view&kd=2164&th=2011 C. Hood and M. Bushery, "Getting more bang from the reinterviewer buck: Identifying ‘at risk’ interviewers," in In Proceedings of the American Statistical Association (Survey Research Methods Section), 1997., p. 820–824. TAHUN 6, VOLUME 2, DESEMBER 2014
113
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
C. Lawrence and E. Love, "Characteristics of Falsified Interviews," Section of Survey Research Methods – JSM. , 2010. C. Turner, J. Gribbe, A. Al-Tayyip, and J. Chromy, "Falsification in epidemiologic surveys: Detection and remediation (prepublication draft).," Technical Papers on Health and Behavior Measurement, No. 53., 2002. I. Schreiner, K. Pennie, and J. Newbrough., "Interviewer falsification in census bureau surveys," in Proceedings of the American Statistical Association (Survey Research Methods Section), 1988, p. 491–496. J. Murphy, R. Baxter, J. Eyerman, D. Cunningham, and J. Kennet, "A system for detecting interviewer falsification," the American Association for Public Opinion Research 59th Annual Conference, 2004. J. Schrapler and G. Wagner, "Identification, characteristics and impact of faked interviews in surveys - an analysis by means of genuine fakes in the raw data of SOEP," IZA Discussion Paper Series, 969, 2003. L. Crespi, "The cheater problem in polling," Public Opinion Quarterly 9 (4), p. 431– 445, 1945. M. Rita Thissen., "Computer Audio-Recorded Interviewing (CARI): A Tool for Monitoring Field Interviewers and Improving Field Data Collection," in Proceedings of Statistics Canada Symposium: Data Collection: Challenges, Achievements and New Directions, 2008. Mark H., Eibe F., Geoffrey H., Bernhard P., Peter R., Ian H. W. “The WEKA Data Mining Software: An Update”. SIGKDD Explorations, Volume 11, Issue 1. 2009 P. Harrisson, "A british view on “cheating”," Public Opinion Quarterly 11 (1), p. 172– 173, 1947. P. Kiecker and J. E. Nelson., "Do interviewers follow telephone survey instructions? ," Journal of the Market Research Society, p. 38:161–176, 1996. R. Schnell, " The impact of counterfeit interviews on survey results," Journal of Sociology 20 (1), p. 25–35, 1991. S. Bredl, N. Storfinger, and N. Menold, " A literature review of methods to detect fabricated survey data," ZEU, Universität Gießen, p. DiscussionPaer56, 2011. S. Bredl, P. Winker, and K. Kotschau, "Technical Report 39: A statistical approach to detect cheating interviewers," 2008. University of Maryland: Computer Assisted Surveys. [Online]. http://www.jpsm.umd.edu/surv400/notes/lecture%206%20Computer%20assisted%20s urveys.pdf
114
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
PENGEMBANGAN SISTEM WEB CRAWLER SEBAGAI SARANA RISET MEDIA SECARA OTOMATIS (Studi di Subdit Neraca Rumah Tangga dan Institusi Nirlaba)
Enggelin Giacinta Wongkar Staf Badan Pusat Statistik
Yunarso Anang Sulistiadi Dosen Sekolah Tinggi Ilmu Statistik
Abstrak
With the vast development of data to become informations on the Internet, everything online seems to explode at a rapid rate. These informations, including online news which is created as a complement to the original printed media, has even overtaken the latter. Subdirectorate of Household National Account and Non-profit Institution of Statistics Indonesia is in charge for the work of media research. In the process of media research, time and human resources are two important elements but yet having problem of ineffective and inefficient process. This study aimed to overcome that problem by developing a web crawler system that could do summarization automatically from online news sites (currently from Bisnis and Kontan) with output in Microsoft Word format file and minimizing number of similar news. This system is developed using several techniques in information technologies such as crawling and wrapping method and cosine similarity method to minimalize similar news. The result shows the process of media research by using this system much more effective and efficient. Keywords: web crawler, wrapper, cosine similarity, information extraction
I. PENDAHULUAN
Badan Pusat Statistik (BPS) merupakan Lembaga Pemerintah Non-Kementrian yang bertanggung jawab langsung kepada Presiden. Berdasarkan UU Nomor 16 Tahun 1997 tentang Statistik, salah satu peran yang harus dijalankan oleh BPS adalah menyediakan kebutuhan data bagi pemerintah dan masyarakat. Di antara media yang digunakan oleh BPS untuk menyampaikan atau menyebarkan data statistik adalah press release. Satu di antara sekian TAHUN 6, VOLUME 2, DESEMBER 2014
115
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
agenda press release BPS adalah penyajian angka-angka ekonomi kepada publik setiap tiga bulan sekali / triwulanan yang dilakukan oleh Direktorat Neraca Pengeluaran, khususnya Subdirektorat Neraca Rumah Tangga dan Institusi Nirlaba. Angka-angka ekonomi yang disajikan pada saat press release tentu saja harus dapat merepresentasikan fenomena-fenomena yang jelas dan nyata yang terjadi di Indonesia pada saat itu. Misalnya, hasil suatu penelitian menyebutkan bahwa nilai tukar petani di Propinsi Jawa Timur pada suatu tahun tertentu mengalami penurunan. Penurunan ini harusnya merupakan dampak dari suatu fenomena yang terjadi kepada petani di Propinsi Jawa Timur. Mungkin pada tahun tersebut, petani-petani di Jawa Timur mengalami gagal panen yang berakibat pada menurunnya kesejahteraan petani sehingga berkontribusi pada penurunan nilai tukar petani. Fenomena-fenomena seperti itulah yang akan dicari dan diteliti oleh Subdirektorat Neraca Rumah Tangga dan Institusi Nirlaba. Untuk mencari dan meneliti fenomena-fenomena tersebut, Subdirektorat Neraca Rumah Tangga dan Institusi Nirlaba menggunakan informasi dari situs-situs berita yang ada, baik di media cetak maupun di Internet (situs berita online). Proses pengumpulan dan penginterpretasian data ini yang kemudian disebut sebagai riset media. Seiring berkembangnya teknologi informasi, Internet menjadi ajang komunikasi yang sangat cepat dan efektif sehingga telah menyimpang jauh dari misi awalnya (Nurudin, 2007). Internet telah tumbuh menjadi kebutuhan utama manusia sebagai alat informasi dan komunikasi yang tidak dapat diabaikan (Safitri, 2010). Hal ini berdampak pada makin banyaknya konten online di Internet, baik konten yang bersifat hiburan maupun yang bersifat pendidikan dan pengetahuan. Situs-situs berita ekonomi online seperti Bisnis, Kontan, Kompas, maupun Antara juga tidak luput dari dampak ini. Konten berita ekonomi pada situssitus berita online tersebut semakin meningkat seiring waktu. Akibatnya, proses pembacaan dan perangkuman berita-berita ekonomi dari situs berita ekonomi online akan semakin memakan waktu. Oleh karenanya, dibutuhkan kegiatan perangkuman berita yang lebih efektif dan efisien dalam hal waktu dan tenaga. Tujuan umum dari penelitian ini adalah untuk mencari metode dan solusi agar waktu dan tenaga yang digunakan pada proses pembacaan dan perangkuman berita-berita ekonomi online dari Internet dapat diminimalisasi. Dari sisi waktu, diharapkan dapat mengurangi waktu pembacaan dan perangkuman berita sebesar lebih dari 50% dari total waktu yang dibutuhkan untuk melakukan perangkuman berita. Dari sisi tenaga, diharapkan dapat mengurangi keterlibatan pengguna atau aktivitas yang dilakukan pengguna untuk membaca dan merangkum berita sekitar sepertiga dari total aktivitas yang dilakukan.
116
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Secara khusus, tujuan dari penelitian ini adalah sebagai berikut. 1. Membantu pengguna (dalam hal ini subject matter) untuk membuat rangkuman berita dalam format Microsoft Word setiap hari untuk berbagai kepentingan, antara lain untuk keperluan pembuatan riset media, agar dapat mengetahui fenomena ekonomi secara cepat, serta membantu orang-orang di subdirektorat untuk dapat membaca bermacam-macam berita yang berkaitan dengan ekonomi dalam waktu singkat. 2. Membantu pengguna untuk membaca berita-berita online secara terintegrasi pada satu tempat. 3. Membantu pengguna untuk dapat menemukan berita yang menjadi kehendaknya dengan memberikan fasilitas pengkategorian berita berdasarkan kata kunci yang ditentukan oleh pengguna serta memberikan fasilitas pencarian berita berdasarkan kategori, waktu, dan sumber berita. Manfaat dari penelitian ini adalah meningkatkan efisiensi dan efektifitas pekerjaan subdirektorat Neraca Rumah Tangga dan Institusi Nirlaba dalam mencari, merangkum, dan menganalisis berita-berita yang dibutuhkan untuk dapat menangkap fenomena yang mendukung data-data ekonomi yang disajikan. Adapun batasan dari penelitian yang dilakukan penulis ini antara lain: 1. Situs-situs berita online yang menjadi sumber pengambilan berita dari sistem aplikasi ini hanya terbatas pada situs-situs berita online permintaan subject matter, dalam penelitian kali ini
situs
berita
ekonomi
online
yang
digunakan
ada
dua,
yaitu
Bisnis
(http://finansial.bisnis.com/) dan Kontan (http://keuangan.kontan.co.id/). 2. Meta-data dan elemen yang diambil dari berita-berita online adalah judul, headline, isi berita, waktu berita pada situs bersangkutan, lokasi pengambilan berita, penulis (jika tercantum), editor, dan sumber berita. 3. Dalam perangkuman berita dengan mengambil kalimat yang memiliki angka saja, tidak diperhatikan arti semantiknya. 4. Dalam pengecekan kesamaan dari dua berita, jika ada dua berita yang sama, maka yang akan diambil dan diproses lebih lanjut adalah salah satu dari kedua berita tersebut sesuai dengan algoritma yang telah ditentukan penulis. 5. Waktu yang digunakan sebagai atribut berita adalah waktu saat diambilnya berita, bukan waktu yang tertera pada berita dalam situs yang bersangkutan.
II. TINJAUAN PUSTAKA
1. Kerangka Pikir TAHUN 6, VOLUME 2, DESEMBER 2014
117
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Sebagaimana terlihat pada Gambar 1, proses pembangunan Sistem Aplikasi Riset Media Expenditure ini terdiri atas 5 komponen, yaitu problems, approach, opportunity, result, dan impact. Kelima komponen ini dapat dijelaskan sebagai berikut.
·
Problems: Bagaimana cara agar proses perangkuman dan pembacaan berita dari
situs-situs berita ekonomi online bisa menjadi lebih efektif dari segi
tenaga dan waktu, serta apakah solusi terbaik untuk memecahkan masalah tersebut.
·
Opportunity: Adanya koneksi internet yang lancar pada komputer pengguna serta telah ditemukannya metode crawling, wrapping, dan cosine similarity
untuk pengambilan berita dan pengecekan kesamaan.
·
Approach: Proses riset media yang terotomisasi serta pemanfaatan teknologi web crawler, wrapper, dan cosine similarity untuk
perhitungan kesamaan.
·
Gambar 1. Kerangka Pikir Sistem Aplikasi Riset Media Expenditure ·
Result: Waktu perangkuman berita secara secara keseluruhan dapat direduksi, pembacaan berita dari berbagai situs bisa dilakukan pada satu tempat (terintegrasi), serta berita yang dapat dicari berdasarkan kategori, waktu, dan sumber berita.
118
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
·
Impact: Proses perangkuman dan pembacaan berita menjadi lebih efektif dari segi
tenaga dan biaya, serta rangkuman berita yang dihasilkan dapat membantu pengguna membuat riset media.
2. Penelitian Terkait Penelitian terdahulu yang berhubungan dengan penelitian ini adalah penelitian yang dilakukan I Gede Arya Agus Yogantara dalam skripsinya yang berjudul “Pengembangan Sistem Aplikasi Pengelolaan Resume Berita Media Cetak dan Online secara Terpadu” (2010). Pada penelitian tersebut, pengguna mengetikkan sendiri berita yang ingin dikelola dari media cetak maupun media online. Perbedaan penelitian tersebut dengan penelitian ini adalah pada penelitian ini, berita yang ada pada situs berita online diambil dan dikelola secara otomatis. Selain itu, penelitian ini hanya terbatas pada media online.
III.
METODOLOGI
Tahapan pembangunan yang dilakukan penulis dalam penelitian ini adalah Design Oriented Research, yaitu membuat sebuah artifak baru yang dapat memudahkan pengguna dalam memanfaatkan hasil implementasi dari penelitian ini. Adapun langkah-langkah pembangunan artifak tersebut adalah sebagai berikut. 1. Awareness of Problem, yaitu menemukan masalah utama pada sistem berjalan, dalam hal ini pada Subdirektorat Neraca Rumah Tangga dan Institusi Nirlaba dalam melakukan riset media. Input dari tahapan ini adalah wawancara dengan subject matter dan penelitian awal penulis. Output dari tahapan ini adalah hasil analisis sistem berjalan serta masalah-masalah yang ada. 2. Suggestion, yaitu menemukan solusi yang tepat agar riset media yang dilakukan subdit bersangkutan menjadi lebih efektif dan kemudian mengajukan rancangan suatu sistem aplikasi. Input dari tahapan ini adalah hasil analisis sistem berjalan serta masalah-masalah yang ada. Output dari tahapan ini adalah rancangan penulis untuk mengatasi masalahmasalah yang muncul pada sistem berjalan atau rancangan sistem usulan. 3. Development, yaitu mengembangkan suatu sistem aplikasi sesuai dengan rancangan pada tahapan sebelumnya. Input dari tahapan ini adalah rancangan sistem usulan. Output dari tahapan ini adalah sebuah artifak sesuai dengan rancangan sistem usulan. 4. Evaluation, yaitu menguji kinerja dari sistem aplikasi yang telah dibangun dengan uji coba internal, yaitu melihat apakah rancangan awal sistem usulan dibangun sudah terpenuhi, kemudian mengujicobakannya pada subject matter yang juga bertindak sebagai pengguna TAHUN 6, VOLUME 2, DESEMBER 2014
119
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
sistem aplikasi ini serta dengan melihat perbandingan waktu yang dibutuhkan untuk melakukan riset media sebelum dan sesudah menggunakan sistem usulan dan menyajikan hasilnya dalam bentuk tabel. Input dari tahapan ini adalah artifak yang sudah dibangun dari tahapan sebelumnya. Output dari tahapan ini adalah daftar kelebihan dan kelemahan sistem. 5. Conclusion, yaitu menyimpulkan keefektifan dari metode penelitian yang dilakukan ini. Input dari tahapan ini adalah daftar kelebihan dan kelemahan sistem. Output dari tahapan ini adalah daftar kesimpulan dan saran. Sumber data yang digunakan pada pembangunan sistem aplikasi ini adalah berikut. 1. Awareness of problem. Pada tahapan ini, yang menjadi sumber data adalah hasil wawancara dengan subject matter mengenai alur sistem berjalan. Selain itu, penulis melakukan
pengamatan
langsung
di
lapangan
dengan
menyimulasikan
proses
perangkuman berita dari beberapa situs. Data-data ini digunakan untuk tahapan analisis masalah yang terdapat pada sistem berjalan. 2. Suggestion. Pada tahapan ini, yang menjadi sumber data adalah hasil analisis pada tahap sebelumnya yang menghasilkan rincian-rincian masalah sistem berjalan. 3. Development. Untuk melakukan pengembangan sistem usulan, data yang diperlukan adalah pola berita-berita pada situs yang dijadikan sumber crawling, yaitu situs Bisnis dan Kontan. Dari pola-pola yang ada, dapat ditemukan metode untuk melakukan crawling berita dari situs asalnya. 4. Evaluation. Sumber data pada tahapan ini adalah hasil simulasi program yang menunjukkan tingkat keefektifan sistem usulan. Sumber data yang berikutnya yaitu tanggapan dari subject matter selaku pengguna sistem aplikasi usulan. Kedua sumber ini dapat dijadikan bahan acuan untuk mengidentifikasi kelebihan dan kelemahan sistem usulan yang telah dibuat. 5. Conclusion. Sumber data pada tahapan ini adalah kelebihan dan kelemahan sistem usulan seperti yang telah diidentifikasikan pada tahapan sebelumnya. Data-data tersebut dapat dijadikan bahan acuan untuk membuat kesimpulan dan saran dari sistem usulan.
IV. HASIL DAN PEMBAHASAN
Berdasarkan tahapan pembangunan Design Oriented Research, maka didapatkan beberapa hasil yaitu sebagai berikut. 1. Awareness of Problem
120
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Pada tahapan awal penelitian ini, dilakukan analisis pada sistem berjalan yang sudah ada sebelumnya. Dari analisis yang telah dilakukan, didapatkan beberapa fakta pada sistem berjalan, yaitu sebagai berikut. a. Keterlibatan pengguna Pengguna harus melakukan riset media secara manual. Sebelum melakukan riset media, proses perangkuman berita yang seharusnya bisa dilakukan dengan lebih cepat malah masih dilakukan secara manual yang berdampak pada kurang efektifnya pemanfaatan waktu dan tenaga pengguna untuk melakukan pekerjaannya. Padahal seharusnya waktu yang digunakan untuk perangkuman yang dilakukan secara manual ini bisa digunakan untuk melakukan pekerjaan lain. Selain itu pengguna juga harus terus menerus memonitor situs-situs berita online yang diinginkan agar pekerjaannya tidak menumpuk ketika jam kerja hampir selesai. Seluruh proses ini cukup memakan waktu kerja. b. Proses perangkuman Berdasarkan hasil pengamatan penulis, rata-rata setiap 45 menit sekali ada satu berita ekonomi baru yang muncul pada satu situs berita ekonomi online. Artinya dalam satu hari ada sekitar kurang lebih 30 berita ekonomi pada satu situs berita ekonomi online. Untuk dua situs berita ekonomi online, maka total berita yang ada bisa mencapai kira-kira 60 berita ekonomi setiap harinya. Sementara itu, waktu yang dibutuhkan untuk menyalin (copy-paste) sebuah berita ke dalam format Microsoft Word rata-rata sekitar 1-2 menit per berita, jika ditambah dengan waktu untuk membaca sekilas (skimming) terlebih dahulu berita-berita tersebut (untuk meminimalisir berita yang mirip dari situs yang berbeda disalin dua kali) maka kira-kira untuk satu berita dibutuhkan waktu 3-4 menit. Kemudian untuk menyeragamkan format berita yang telah dikumpulkan agar menjadi lebih rapi untuk dibaca (asumsinya penyeragaman dilakukan setelah seluruh berita dalam satu hari tersebut dikumpulkan) maka membutuhkan waktu kurang lebih 10 menit. Berarti dalam setiap harinya, total waktu yang dibutuhkan untuk mengerjakan seluruh rangkuman berita tersebut adalah sekitar (3*60) + 10 = 190 menit = 3,2 jam. Sedangkan subject matter yang juga adalah pengguna sistem aplikasi ini cukup kesulitan dalam mengalokasikan waktu untuk melakukan setiap pekerjaannya. c. Pembacaan berita streaming Jika pengguna ingin membaca berita dari situs-situs berita ekonomi online yang berbeda, maka pengguna harus membuka situs-situs tersebut satu persatu dan membaca berita pada situs-situs tersebut. Hal ini menyebabkan pengguna harus berpindah dari tab atau window browser yang satu ke yang lain dan hal ini tentunya akan memakan waktu yang cukup lama jika dilakukan secara berulang-ulang. TAHUN 6, VOLUME 2, DESEMBER 2014
121
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Selain itu, kebutuhan-kebutuhan pengguna adalah sebagai berikut: 1. Mencari dan menemukan suatu metode yang dapat melakukan perangkuman berita dari situs-situs berita ekonomi online secara otomatis dalam format Microsoft Word setiap hari untuk berbagai kepentingan, antara lain untuk keperluan pembuatan riset media, agar dapat mengetahui fenomena ekonomi secara cepat, serta membantu orang-orang di subdirektorat untuk dapat membaca bermacam-macam berita yang berkaitan dengan ekonomi dalam waktu singkat. 2. Mencari dan menemukan suatu metode yang dapat meminimalisasi kemiripan dari beritaberita yang dirangkum, sehingga jika ada dua buah atau lebih berita yang sama, yang akan dirangkum hanya salah satu berita dan berita-berita yang mirip lainnya tidak akan dimasukkan ke dalam perangkuman. 3. Membuat rangkuman berita dengan cara mengambil kalimat yang hanya berisi angka saja untuk masing-masing berita asli.
2. Suggestion Dari analisis masalah di atas, maka penulis menemukan sebuah solusi untuk memudahkan pekerjaan pengguna dalam melakukan perangkuman berita dari situs-situs berita ekonomi online dengan mengajukan rancangan suatu sistem aplikasi yang secara garis besar memiliki fungsi-fungsi berikut. 1. Meminimalisasi ketelibatan pengguna dengan sistem dengan cara melakukan sebagian besar pekerjaan secara otomatis. 2. Melakukan perangkuman berita-berita ekonomi yang berada dalam situs-situs berita ekonomi online yang sudah ditentukan sebelumnya oleh pengguna dalam format Microsoft Word setiap hari, yang sebelumnya berita-berita yang mirip dari dua atau lebih situs yang berbeda hanya akan diambil salah satu sehingga meminimalisasi pengulangan. Berikut merupakan contoh tahapan-tahapan pengecekan kesamaan dari dua dokumen dengan menggunakan metode cosine similarity. · Misalkan dokumen A (𝑑𝐴 ) dan dokumen B (𝑑𝐵 ) berisi kalimat sebagai berikut. 𝑑𝐴 = "𝐶ℎ𝑟𝑖𝑠𝑡𝑜𝑝ℎ𝑒𝑟 ℎ𝑎𝑠 𝑡𝑤𝑜 𝑔𝑟𝑒𝑒𝑛 𝑎𝑝𝑝𝑙𝑒𝑠"
(1)
𝑑𝐵 = "𝐶ℎ𝑟𝑖𝑠𝑡𝑜𝑝ℎ𝑒𝑟 ℎ𝑎𝑠 𝑡𝑤𝑜 𝑟𝑒𝑑 𝑎𝑝𝑝𝑙𝑒𝑠"
(2)
· Bentuk vektor dari masing-masing dokumen tersebut.
122
⃗ (𝑑𝐴 ) = ["𝐶ℎ𝑟𝑖𝑠𝑡𝑜𝑝ℎ𝑒𝑟", "ℎ𝑎𝑠", "𝑡𝑤𝑜", "𝑔𝑟𝑒𝑒𝑛", "𝑎𝑝𝑝𝑙𝑒𝑠"] 𝑉
(3)
⃗ (𝑑𝐵 ) = ["𝐶ℎ𝑟𝑖𝑠𝑡𝑜𝑝ℎ𝑒𝑟", "ℎ𝑎𝑠", "𝑡𝑤𝑜", "𝑟𝑒𝑑", "𝑎𝑝𝑝𝑙𝑒𝑠"] 𝑉
(4)
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
· Bentuk vektor gabungan dari vektor (4) dan vektor (5) di atas. ⃗ (𝑑𝐴 𝑑𝐵 ) = ["𝐶ℎ𝑟𝑖𝑠𝑡𝑜𝑝ℎ𝑒𝑟", "ℎ𝑎𝑠", "𝑡𝑤𝑜", "𝑔𝑟𝑒𝑒𝑛", "𝑎𝑝𝑝𝑙𝑒𝑠", "𝑟𝑒𝑑"] 𝑉
(5)
· Bentuk vektor frekuensi kemunculan kata-kata berdasarkan vektor gabungan (6) untuk masing-masing vektor. ⃗ 𝐹 (𝑑𝐴 ) = [1,1,1,1,1,0] 𝑉
(6)
⃗ 𝐹 (𝑑𝐴 ) = [1,1,1,0,1,1] 𝑉
(7)
· Lakukan perkalian titik (dot product) untuk kedua vektor frekuensi (6) dan (7) di atas. ⃗ 𝐹 (𝑑𝐴 ) ∙ 𝑉 ⃗ 𝐹 (𝑑𝐵 ) = [1,1,1,1,1,0] ∙ [1,1,1,0,1,1] 𝑉 = [(1 ∙ 1) + (1 ∙ 1) + (1 ∙ 1) + (1 ∙ 0) + (1 ∙ 1) + (0 ∙ 1)] = [1 + 1 + 1 + 0 + 1 + 0] =4
(8)
· Hitung panjang Euclidean dari masing-masing vektor dokumen. ⃗ (𝑑𝐴 )| = √12 + 12 + 12 + 12 + 12 + 02 = √5 |𝑉
(9)
⃗ (𝑑𝐵 )| = √12 + 12 + 12 + 02 + 12 + 12 = √5 |𝑉
(10)
· Hitung nilai cosine similarity kedua dokumen tersebut · 𝑠𝑖𝑚(𝑑1 , 𝑑2 ) =
⃗ (𝑑1 )⋅𝑉 ⃗ (𝑑2 ) 𝑉
′
⃗ (𝑑1 )||𝑉 ⃗ (𝑑2 )| |𝑉
=
4 √5×√5
= 0,8
Maka nilai cosine similarity dari dokumen A dan dokumen B adalah 0,8.
3.
Memungkinkan pengguna melihat berita dari berbagai situs-situs berita ekonomi online yang sudah ditentukan sebelumnya oleh pengguna secara terintegrasi pada satu tempat dan bersifat real-time dan menyediakan fasilitas penambahan kategori berdasarkan kata kunci sehingga berita-berita yang terintegrasi tersebut dapat dicari berdasarkan kategori, waktu, serta sumber berita.
TAHUN 6, VOLUME 2, DESEMBER 2014
123
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Arsitektur Sistem
Gambar 2. Arsitektur sistem
Penjelasan dari arsitektur sistem di atas dapat dilihat pada tabel 1 berikut ini:
Tabel 1. Penjelasan arsitektur sistem dan teknologi yang digunakan Penjelasan
News source 1, 2, ..., n
Item ini merupakan representasi dari beritaberita yang tersebar di situs-situs berita ekonomi online yang telah ditentukan atau disebut juga berita mentah. Ketika sistem mengambil berita ini secara otomatis, maka isi berita-berita ini akan masuk ke dalam basis data. Item ini merupakan input untuk proses Meta-data & News Parser dan News Parser Item ini merupakan proses yang mengolah News Source. Pada proses ini terjadi pemisahan-pemisahan elemen-elemen berita, yaitu judul, headline, waktu asal berita, isi berita, penulis, editor, sumber berita, serta waktu pengambilan berita dari situs oleh sistem
Meta-data & News Parser
124
Teknologi yang
Nama Item
Digunakan Crawler
Wrapper, jsoup library
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Nama Item Similarity Checker
Unique News 1, 2, ..., k
Paragraph Separator
Numbers Recognition
Sentence Combiner
News Summary 1, 2, ..., k Ms. Word Generator
Downloada ble News Summary File
Penjelasan Proses ini merupakan proses pengecekan kesamaan antara dua berita. Berita-berita yang ada saling dibandingkan satu dengan yang lain. Output dari proses ini adalah Unique News Item ini menerima input dari proses sebelumnya yaitu Similarity Checker. Unique News merupakan berita-berita yang unik yang sudah tidak memiliki kesamaan satu dengan yang lainnya. Item ini merupakan input untuk proses selanjutnya yaitu Paragraph Separator. Nilai k adalah kurang dari atau sama dengan n Proses ini melakukan pemisahan isi berita Unique News dari yang semula merupakan satu kesatuan paragraf menjadi kalimatkalimat individu yang dimasukkan dalam sebuah array Proses ini membaca kalimat-kalimat yang telah terbentuk dari proses sebelumnya. Pada proses ini, kalimat-kalimat yang mengandung angka tetap disimpan dan kalimat-kalimat yang tidak mengandung angka dibuang atau tidak akan dipergunakan untuk proses selanjutnya Proses ini merupakan kelanjutan dari proses sebelumnya. Pada proses ini terjadi penggabungan kalimat-kalimat yang mengandung angka (seperti yang terjadi pada proses sebelumnya) menjadi satu kesatuan paragraf yang baru. Output dari proses ini adalah News Summary Item ini merupakan output dari rangkaian proses sebelumnya. Item ini merupakan rangkuman dari input awal sistem yaitu News Source (berita mentah dari internet). Pada proses ini terjadi konversi berita dari basis data ke dalam format Micosoft Word. Pada proses ini juga terjadi perapihan dan penyamaan format berita sehingga gampang dan nyaman dibaca oleh user Item ini merupakan output akhir dari sistem, yang merupakan file rangkuman berita yang secara otomatis masuk ke dalam komputer pengguna atau bisa diunduh sendiri. File ini memiliki format Microsoft Word
TAHUN 6, VOLUME 2, DESEMBER 2014
Teknologi yang Digunakan Cosine Similarity
Tidak ada
Tidak ada
Tidak ada
Tidak ada
Tidak ada
Apache POI library
Tidak ada
125
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Nama Item News Parser
Teknologi yang
Penjelasan
Digunakan
Proses ini berbeda dengan proses Meta-data & News Parser. Pada proses ini terjadi pembacaan dan pencocokan kata-kata yang terdapat dalam berita dengan kata kunci yang ada dalam basis data Categorizati Proses ini merupakan kelanjutan dari proses on sebelumnya, dimana proses ini mengkategorikan berita-berita yang ada sesuai dengan proses pencocokan berita yang terjadi sebelumnya. Output dari proses ini adalah Categorized News Categorized Item ini merupakan output dari proses News sebelumnya. Item ini merupakan berita yang sudah terkategori dan ditampilkan secara real-time pada sistem aplikasi Category Item ini merupakan input untuk sistem Names & aplikasi ini. Input ini diberikan oleh pengguna Keywords 1, 2, ..., i Category Pada proses ini terjadi validasi kata kunciNames and kata kunci dan kategori yang dimasukkan Keywords oleh pengguna sehingga dapat diproses lebih Processor lanjut oleh sistem Category Item ini merupakan basis data yang Names & menyimpan kata kunci-kata kunci dan Keywords kategori yang dimasukkan oleh pengguna Database yang kemudian akan dibandingkan oleh berita-berita yang telah diambil dari internet
Tidak ada
Tidak ada
Tidak ada
Tidak ada
Tidak ada
Tidak ada
Rancangan Basis Data Gambar 3 merupakan ERD (Entity Relationship Diagram) dari rancangan logik basis data, yang menunjukkan entitas yang digunakan dalam sistem yang akan dibangun.
126
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Gambar 3. Entity relationship diagram rancangan logik basis data
Use Case Diagram Gambar
4
merupakan
diagram
use
case,
yang
menggambarkan
actor
(pelaku/pengguna) dengan masing-masing kasus penggunaan dalam sistem yang akan dibangun.
TAHUN 6, VOLUME 2, DESEMBER 2014
127
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Gambar 4. Use case diagram
3. Development Dari rancangan dan pemodelan tersebut, penulis telah membangun sebuah sistem aplikasi yang dapat mengakomodir kegiatan riset media seperti yang telah diuraikan di atas. Sistem aplikasi ini terdiri atas dua bagian, yaitu bagian back-end dan bagian front-end. Bagian back-end yang berjalan di belakang layar ini dikembangkan dengan bahasa pemrograman Java. Bagian ini tidak memiliki graphical user interface (GUI) sehingga proses yang terjadi pada bagian ini hanya dapat dilihat atau dipantau dengan output baris-baris yang berupa command line. Bagian ini berfungsi untuk mengambil berita-berita dari situs asalnya, mengecek kesamaan, memilih kalimat yang hanya mengandung angka, serta membuat file rangkuman dalam format Microsoft Word. Bagian ini dijalankan pada saat startup komputer, sehingga ketika komputer pengguna dinyalakan, maka program akan langsung mulai melakukan crawling dan wrapping berita. Proses crawling dan wrapping ini berlangsung secara berulang-ulang pada interval tertentu yang ditentukan oleh pengguna dan berhenti pada pukul 15.00 ketika jam kerja akan berakhir. Pada pukul 15.00, bagian ini akan melakukan pengecekan kesamaan, pemilihan kalimat yang mengandung angka, dan pembentukan file rangkuman dalam format Microsoft Word sehingga file yang terbentuk merupakan hasil dari crawling dan wrapping berita-berita sejak komputer dijalankan sampai pukul 15.00.
Gambar 5 di bawah ini merupakan screenshot tampilan command line dari bagian back-end.
128
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Gambar 5. Screenshot sistem usulan bagian back-end
Bagian front-end dikembangkan dengan bahasa pemrograman PHP dan Javascript serta menggunakan framework Yii sehingga pengguna dapat melihat output yang dihasilkan oleh bagian back-end dalam bentuk halaman web. Berita-berita asli (yang bukan berupa rangkuman) yang telah diambil dari situs aslinya dapat dilihat pada halaman web tersebut. Pada bagian front-end ini juga pengguna dapat melakukan olah kategori (hapus dan tambahkan kategori). Salah satu screenshot dari bagian front-end dapat dilihat pada Gambar 6 berikut.
Gambar 6. Screenshot sistem usulan menu home
4. Evaluation Pada tahapan ini dilakukan evaluasi terhadap sistem yang sudah dibangun. Rincian evaluasi yang ada disesuaikan dengan rincian suggestion yang sudah dibuat sebelumnya.
TAHUN 6, VOLUME 2, DESEMBER 2014
129
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
1.
Keterlibatan pengguna Pada poin yang pertama ini, dapat dilihat perbedaan keterlibatan pengguna sebelum dan sesudah menggunakan sistem aplikasi yang dibangun. Perbedaan ini dapat dilihat pada tabel 2 di bawah ini.
Tabel 2. Perbandingan total aktivitas dan total waktu antara sistem berjalan dengan sistem usulan (dengan jumlah pengguna 1 orang)
Sistem Berjalan Membuka situs berita Bisnis Membuka situs berita Kontan
Aktivitas yang dilakukan pengguna dan sistem Estimasi Estimasi Waktu Total Sistem Waktu yang Waktu Usulan yang Dibutuhkan Dibutuhkan Crawling 30 detik 30 detik situs berita Bisnis dan Kontan dan wrap berita @1 detik yang baru 30 detik 30 detik ada setiap 15 menit sekali *)
Membuka link berita 1, 2, ..., n pada situs berita Bisnis Membuka link berita 1, 2, ..., n pada situs berita Kontan Skimming berita 1, 2, ..., n pada situs berita Bisnis Skimming berita 1, 2, ..., n pada situs berita Kontan
130
@60 detik
@60 detik
@120 detik
@120 detik
60 detik x 30 berita (kurang lebih) = 1800 detik 60 detik x 30 berita (kurang lebih) = 1800 detik 120 detik x 30 berita (kurang lebih) = 3600 detik 120 detik x 30 berita (kurang lebih) = 3600 detik
Membentuk file XML dari beritaberita yang telah di-wrap
@1 detik
Total Waktu untuk 7 jam dalam sehari (jam 08.0015.00), 28 kali = 28 detik 1 detik x 60 berita (kurang lebih) = 60 detik
*)
Memeriksa kesamaan dari beritaberita yang telah ada *)
Untuk kombinasi 60 berita sekitar 360 detik
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Sistem Berjalan
Aktivitas yang dilakukan pengguna dan sistem Estimasi Estimasi Waktu Total Sistem Waktu yang Waktu Usulan yang Dibutuhkan Dibutuhkan
Menyalintempel (copy-paste) berita 1, 2, ..., n dari @60 detik situs berita Bisnis ke dalam file Microsoft Word Menyalintempel (copy-paste) berita 1, 2, ..., n dari @60 detik situs berita Kontan ke dalam file Microsoft Word Merapikan dan menyamakan format600 detik format dalam file Microsoft Word
Total Waktu
60 detik x 30 berita (kurang lebih) = 1800 detik Membuat rangkuman berita *)
@2 detik
1 detik x 60 berita (kurang lebih) = 60 detik
Membentuk file Microsoft Word dari rangkumanrangkuman berita tersebut *)
2 detik
2 detik
60 detik x 30 berita (kurang lebih) = 1800 detik
600 detik
Total Waktu: Total 15.060 Aktivitas: 9 detik ≈ 251 menit ≈ 4,2 jam *) Keterangan: dilakukan oleh sistem aplikasi
Total Aktivitas: 5
Total Waktu: 510 detik ≈ 8,5 menit
Dari tabel 2 di atas dapat dilihat bahwa perbandingan total aktivitas dan total waktu pada sistem berjalan dan sistem usulan cukup berbeda secara signifikan. Total aktivitas yang dilakukan oleh sistem usulan hampir setengah dari total aktivitas yang dilakukan oleh sistem berjalan, yaitu 5 : 9 (55,56%, terjadi reduksi sebesar 44,4%). Artinya, sistem usulan mampu mereduksi aktivitas yang dilakukan oleh sistem berjalan sebesar hampir 50%. Namun jika kita telaah lebih lanjut lagi, seluruh aktivitas yang terjadi pada sistem usulan merupakan aktivitas
TAHUN 6, VOLUME 2, DESEMBER 2014
131
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
yang dilakukan secara otomatis oleh sistem aplikasi. Sehingga dapat disimpulkan bahwa sistem usulan mereduksi keterlibatan pengguna hingga hampir 100%. 2.
Proses perangkuman Jika kita mengamati tabel 2 yang sebelumnya, dapat dilihat bahwa dari sisi waktu, perbandingan antara total waktu yang digunakan oleh sistem usulan dengan sistem berjalan adalah 8,5 : 251 atau sekitar 3,386%. Dengan demikian, dapat disimpulkan bahwa sistem usulan mereduksi total waktu yang diperlukan untuk membuat rangkuman berita hingga 96,614%. Sebagai perbandingan dari segi estimasi total waktu yang dibutuhkan dengan sumber daya manusia yang diberdayakan, maka disajikan juga tabel yang menggambarkan total waktu yang dilakukan oleh pengguna pada sistem berjalan berdasarkan jumlah sumber daya manusia yang terlibat.
Tabel 3. Perbandingan total aktivitas dan total waktu antara sistem berjalan dengan sistem usulan (dengan jumlah pengguna 2 orang) Aktivitas yang dilakukan pengguna dan sistem (2 orang) Sistem Berjalan Membuka situs berita Bisnis Membuka situs berita Kontan
Membuka link berita 1, 2, ..., n pada situs berita Bisnis Membuka link berita 1, 2, ..., n pada situs berita Kontan
132
Estimasi Waktu yang Dibutuhkan 30 detik
30 detik
@60 detik
@60 detik
Total Waktu
30 detik
30 detik
60 detik x 15 berita / orang (kurang lebih) = 900 detik 60 detik x 15 berita / orang (kurang lebih) = 900 detik
Estimasi Waktu yang Dibutuhkan
Sistem Usulan Crawling situs berita Bisnis dan Kontan dan wrap berita yang baru ada setiap 15 menit sekali *)
Membentuk file XML dari beritaberita yang telah diwrap *)
@1 detik
@1 detik
Total Waktu untuk 7 jam dalam sehari (jam 08.0015.00), 28 kali = 28 detik 1 detik x 60 berita (kurang lebih) = 60 detik
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Aktivitas yang dilakukan pengguna dan sistem (2 orang) Sistem Berjalan
Estimasi Waktu yang Dibutuhkan
Total Waktu
120 detik x 15 berita / orang (kurang lebih) = 1800 detik 120 detik Skimming x 15 berita berita 1, 2, ..., / orang @120 detik n pada situs (kurang berita Kontan lebih) = 1800 detik Menyalintempel (copy60 detik x paste) berita 15 berita / 1, 2, ..., n orang dari situs @60 detik (kurang berita Bisnis lebih) = ke dalam file 900 detik Microsoft Word Menyalintempel (copy60 detik x paste) berita 15 berita / 1, 2, ..., n orang dari situs @60 detik (kurang berita Kontan lebih) = ke dalam file 900 detik Microsoft Word Skimming berita 1, 2, ..., @120 detik n pada situs berita Bisnis
Merapikan dan menyamakan formatformat dalam file Microsoft Word
600 detik
600 detik
Sistem Usulan
Total Waktu
Memeriksa kesamaan dari beritaberita yang telah ada *)
Untuk kombinas i 60 berita sekitar 360 detik
Membuat rangkuman berita *)
@2 detik
1 detik x 60 berita (kurang lebih) = 60 detik
Membentuk file Microsoft Word dari rangkumanrangkuman berita tersebut *)
2 detik
2 detik
Total Waktu: 7.860 Total Total detik ≈ Aktivitas: 9 Aktivitas: 5 131 menit ≈ 2,18 jam *) Keterangan: dilakukan oleh sistem aplikasi TAHUN 6, VOLUME 2, DESEMBER 2014
Estimasi Waktu yang Dibutuhkan
Total Waktu: 510 detik ≈ 8,5 menit
133
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Tabel 4. Perbandingan total aktivitas dan total waktu antara sistem berjalan dengan sistem usulan (dengan jumlah pengguna 5 orang) Aktivitas yang dilakukan pengguna dan sistem (5 orang) Sistem Berjalan Membuka situs berita Bisnis Membuka situs berita Kontan
Estimasi Waktu yang Dibutuhkan 30 detik
30 detik
Total Waktu
30 detik
30 detik
Estimasi Waktu yang Dibutuhkan
Sistem Usulan Crawling situs berita Bisnis dan Kontan dan wrap berita yang baru ada setiap 15 menit sekali
@1 detik
*)
Membuka link berita 1, 2, ..., n pada situs berita Bisnis Membuka link berita 1, 2, ..., n pada situs berita Kontan Skimming berita 1, 2, ..., n pada situs berita Bisnis Skimming berita 1, 2, ..., n pada situs berita Kontan Menyalintempel (copy-paste) berita 1, 2, ..., n dari situs berita Bisnis ke dalam file Microsoft Word
134
60 detik x 6 berita / orang @60 detik (kurang lebih) = 360 detik 60 detik x 6 berita / orang @60 detik (kurang lebih) = 360 detik 120 detik x 6 berita / orang @120 detik (kurang lebih) = 720 detik 120 detik x 6 berita / orang @120 detik (kurang lebih) = 720 detik
@60 detik
60 detik x 6 berita / orang (kurang lebih) = 360 detik
Membentuk file XML dari beritaberita yang telah di-wrap
@1 detik
Total Waktu untuk 7 jam dalam sehari (jam 08.0015.00), 28 kali = 28 detik
1 detik x 60 berita (kurang lebih) = 60 detik
*)
Memeriksa kesamaan dari beritaberita yang telah ada *)
Untuk kombinasi 60 berita sekitar 360 detik
Membuat rangkuman berita *)
1 detik x 60 berita (kurang lebih) = 60 detik
@2 detik
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Aktivitas yang dilakukan pengguna dan sistem (5 orang) Sistem Berjalan
Estimasi Waktu yang Dibutuhkan
Menyalintempel (copy-paste) berita 1, 2, ..., n dari @60 detik situs berita Kontan ke dalam file Microsoft Word Merapikan dan menyamakan format600 detik format dalam file Microsoft Word
Total Waktu
Sistem Usulan
Estimasi Waktu yang Dibutuhkan
Total Waktu
60 detik x 6 berita / orang (kurang lebih) = 360 detik
600 detik
Total Waktu: Total 3.540 Aktivitas: 9 detik ≈ 59 menit ≈ 0,98 jam Keterangan: *) dilakukan oleh sistem aplikasi
Membentuk file Microsoft Word dari rangkumanrangkuman berita tersebut *)
Total Aktivitas: 5
2 detik
2 detik
Total Waktu: 510 detik ≈ 8,5 menit
Dari gambar 7 dapat dilihat bahwa penurunan total waktu untuk melakukan rangkaian proses perangkuman berita terjadi secara signifikan jika jumlah sumber daya manusia yang melakukan proses perangkuman berita tersebut berubah dari 1 orang menjadi 2 orang. Untuk jumlah sumber daya manusia yang lainnya yaitu 5 orang, 10 orang, 20 orang, dan 30 orang, perubahan total waktu yang terjadi kurang signifikan. Hal ini terjadi karena ada beberapa proses perangkuman berita yang tidak bisa dibagi sesuai jumlah orang, seperti membuka situs berita dan merapikan dan menyamakan format dalam file Microsoft Word. Untuk diketahui bahwa dalam perhitungan perbandingan sumber daya manusia ini, jumlah berita dalam satu hari dari dua situs berita ekonomi online yang berbeda dibagi sesuai jumlah orang yang mengerjakannya.
TAHUN 6, VOLUME 2, DESEMBER 2014
135
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Waktu yang dibutuhkan untuk melakukan rangkaian perangkuman berita (menit)
300 250 200 150 100 50 0 1
2
5
10
20
30
Jumlah SDM (orang) Gambar 7.
Perbandingan waktu antara sistem usulan dengan sistem berjalan untuk
melakukan rangkaian proses perangkuman berita dengan jumlah sumber daya manusia (SDM) yang bervariasi
Selain itu, dari gambar 7 dapat juga dilihat bahwa untuk jumlah sumber daya manusia sebanyak 30 orang, yang berarti bahwa 1 orang hanya perlu mengerjakan satu berita saja dari masing-masing situs berita ekonomi online, estimasi total waktu yang dibutuhkan untuk melakukan rangkaian proses perangkuman tersebut adalah 19 menit. Jika dibandingkan dengan estimasi total waktu yang dilakukan oleh sistem usulan, yaitu sebesar 8,5 menit, tentunya angka tersebut masih cukup besar. Dengan demikian, dapat disimpulkan bahwa dengan jumlah sumber daya manusia sebanyak 30 orang masih belum dapat mengimbangi efisiensi sistem usulan dari segi waktu.
3.
Pembacaan berita streaming Berita-berita dari situs berita ekonomi online akan dibentuk dalam format XML, kemudian file XML tersebut akan dipindahkan ke dalam basis data.
5. Conclusion Dari evaluasi yang telah dilakukan, kelebihan yang dimiliki oleh sistem aplikasi ini adalah sebagai berikut: a.
Sistem sudah bisa melakukan perangkuman berita secara otomatis dari situs-situs berita ekonomi online yang ditentukan oleh pengguna, dengan meminimalisir berita yang mirip satu dengan yang lain.
b.
Sistem sudah bisa mengintegrasikan berita-berita online dari situs-situs yang berbeda ke dalam sistem aplikasi yang telah dibuat sehingga dapat dibaca pada satu tempat.
136
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
c.
Sistem sudah bisa membantu pengguna untuk mencari berita yang telah terambil berdasarkan kategori, waktu, dan sumber berita. Namun, masih ada beberapa kelemahan yang dimiliki oleh sistem aplikasi ini, yaitu:
a.
Metode perangkuman berita yang hanya mengandung angka belum dilakukan dengan memperhatikan arti semantik.
b.
Situs-situs berita ekonomi online yang diambil belum terlalu banyak.
c.
Wrapper yang dibuat masih secara manual dan belum dinamis sehingga ketika layout dari halaman web yang ditentukan sebagai sumber wrapping berubah, elemen-elemen di dalamnya akan gagal diambil. Selain itu, wrapper yang dibuat secara manual ini menyebabkan kesulitan dalam mengakomodir jumlah situs yang banyak. Secara keseluruhan, sistem aplikasi ini sudah dapat membantu pengguna untuk menyelesaikan pekerjaannya dengan melakukan perangkuman berita yang diawali dari crawling situs berita ekonomi online, wrapping berita, dan meminimalisasi kesamaan dari dua atau lebih berita.
V. KESIMPULAN DAN SARAN Kesimpulan Kesimpulan yang didapatkan dari penelitian ini adalah sebagai berikut. a. Sistem aplikasi sudah mampu mengurangi waktu dan tenaga yang dibutuhkan untuk melakukan perangkuman berita. Waktu yang digunakan untuk perangkuman berita direduksi sebesar kurang lebih 96,614%. Sementara itu, tenaga yang dinyatakan dengan total aktivitas yang dilakukan pengguna untuk melakukan perangkuman mulai dari membuka halaman situs berita ekonomi online sampai membentuk rangkuman dalam format Microsoft Word direduksi hingga 44,4%. b. Sistem aplikasi sudah bisa membantu pengguna untuk membuat rangkuman berita dalam format Microsoft Word setiap hari. c. Sistem aplikasi sudah bisa membantu pengguna untuk membaca berita-berita online secara terintegrasi pada satu tempat. d. Sistem aplikasi sudah bisa membantu pengguna untuk menemukan berita yang telah terambil yang menjadi kehendaknya berdasarkan kategori, waktu, dan sumber berita. e. Sistem aplikasi sudah bisa membantu pengguna untuk pembuatan riset media serta pembacaan berita ekonomi secara cepat dan dalam waktu singkat dengan melakukan perangkuman berita secara otomatis mulai dari crawling situs berita ekonomi online, wrapping berita, meminimalisasi kesamaan dari dua atau lebih berita, sampai pada perangkuman berita. TAHUN 6, VOLUME 2, DESEMBER 2014
137
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Saran Adapun saran-saran yang dapat diberikan untuk penelitian selanjutnya adalah sebagai berikut. a. Dapat dilakukan penelitian lebih lanjut mengenai metode penggabungan kalimat yang berisi angka saja, sehingga rangkaian kalimat yang terbentuk memiliki arti yang baku sebagai satu kesatuan paragraf. b. Dapat diimplementasikan wrapper yang bersifat dinamis (unsupervised wrapper) sehingga bisa digunakan pada situs-situs yang berbeda. c. Daftar situs-situs berita online yang ada dapat lebih dikembangkan, bukan hanya dalam bidang ekonomi saja namun dalam bidang ilmu lainnya. Selain itu kuantitasnya juga dapat ditambah menjadi lebih dari dua situs sehingga cakupan beritanya makin luas.
DAFTAR PUSTAKA Badiyanto. (2013). Buku Pintar Framework Yii: Cara Mudah Membangun Aplikasi Web PHP. Jakarta: Gramedia. Departemen Pendidikan Nasional. (2002). Kamus Besar Bahasa Indonesia (Edisi Ketiga). Jakarta: Balai Pustaka. Huang, A. (2008). Similarity Measures for Text Document Clustering. Proceedings of the New Zealand Computer Science Research Student Conference, Christchurch, New Zealand. 9 April 2014.http://www.milanmirkovic.com/wpcontent/uploads/2012/10/pg049_Similarity_Measures_for_Text_Document_Clustering.p df Liu, B. (2011). Web Data Mining: Exploring Hyperlinks, Content, and Usage Data (2nd edition). New York: Springer-Verlag Berlin Heidelberg. Jackson, J. C. (2007). Web Technologies: A Computer Science Perspective. New Jersey: Pearson Education, Inc. Manning, C. D., Raghavan, P., Schutze, H. (2008). Introduction to Information Retrieval (2nd edition). New York: Cambridge University Press. Nurudin (2007), Pengantar Komunikasi Massa, Raja Grafindo Persada, Jakarta. Rizkiansyah, N. (2010). Pengembangan Aplikasi Pendeteksi Plagiarisme Tulisan Ilmiah pada Sistem Informasi Terpadu STIS [Skripsi]. Jakarta: Sekolah Tinggi Ilmu Statistik. Safitri, K. (12 Oktober 2010). Pengaruh Waspada Online terhadap Pengetahuan Politik Pembacanya (Studi Korelasi pada Komunitas Waspada Online). USU Institutional Repository, 6. 4 September 2014. http://repository.usu.ac.id/bitstream/123456789/20372/5/Chapter%20I.pdf Sekolah Tinggi Ilmu Statistik. (2010). Pedoman Penyusunan Skripsi Jurusan Komputasi Statistik Sekolah Tinggi Ilmu Statistik (Edisi Keempat, Revisi 1/2014). Jakarta: Sekolah Tinggi Ilmu Statistik.
138
TAHUN 6, VOLUME 2, DESEMBER 2014
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
Yogantara, I. (2010). Pengembangan Sistem Aplikasi Pengelolaan Resume Berita Media Cetak dan Online secara Terpadu [Skripsi]. Jakarta: Sekolah Tinggi Ilmu Statistik. Young, M. J. (2001). Step by Step XML. Terjemahan oleh Imam Mustaqim. Jakarta: PT Elex Media Komputindo. http://en.wikipedia.org/wiki/Apache_POI/, diakses pada 30 Agustus 2014, 15:39 WIB. http://jsoup.org/, diakses pada 30 Agustus 2014, 15:39 WIB.
TAHUN 6, VOLUME 2, DESEMBER 2014
139
Petunjuk Penulisan JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK Naskah dikirim dalam bentuk softcopy ke alamat email
[email protected] disertai dengan daftar riwayat hidup ringkas penulis. Format naskah mengacu pada Petunjuk Penulisan Naskah berikut: Naskah dibuat menggunakan Microsot Office Word 2010. Seluruh bagian dalam naskah diketik dengan huruf Times New Roman, ukuran 12, spasi 1,5, ukuran kertas A4 dan marjin 2 cmuntuk semua sisi, serta jumlah halaman 15-20. Untuk kepentingan penyuntingan naskah, seluruh bagian naskah (termasuk tabel, gambar dan persamaan matematika) dibuat dalam format yang dapat disunting oleh editor. Gaya penulisan naskah untuk Jurnal Aplikasi Statistika dan Komputasi Statistik ditulis dalam Bahasa Indonesia dengan gaya naratif. Pembabakan dibuat sederhana dan sedapat mungkin menghindari pembabakan bertingkat. Tabel dan gambar harus mencantumkan sumber jika dari data sekunder. Tabel, gambar dan persamaan matematika diberi nomor secara berurut sesuai dengan kemunculannya. Semua kutipan dan referensi dalam naskah harus tercantum dalam daftar pustaka, dan sebaliknya sumber bacaan yang tercantum dalam daftar pustaka harus ada dalam naskah. Bagian naskah berisi: Judul. Judul tidak melebihi 12 kata dalam Bahasa Indonesia. Data Penulis. Berisi nama lengkap semua penulis tanpa gelar, asal institusi, dan alamat email. Abstrak. Ditulis dalam Bahasa Inggris dan Bahasa Indonesia, maksimum 100 kata untuk masing-masing abstrak dan berisikan tiga hal yaitu topik yang dibahas, metodologi yang dipergunakan dan hasil yang didapatkan. Kata Kunci. Berisi kata atau frasa (maksimum 5 subjek) yang sering dipergunakan dalam naskah dan dianggap mewakili dan atau terkait dengan topik yang dibahas. Pendahuluan. Memuat latar belakang, studi sebelumnya yang relevan, permasalahan ataupun hipotesis yang akan diuji dalam penelitian, ruang lingkup penelitian, serta tujuan dari penelitian. Metodologi terdiri atas: a. Tinjauan Referensi. Bagian ini menguraikan landasan konseptual dari tulisan dan berisi alasan teoritis mengapa pertanyaan penelitian dalam artikel diajukan. Di samping itu penulis dapat mengutip studi yang relevan sebelumnya untuk melengkapi justifikasi mengenai kerangka pikir penelitian. b. Metode Analisis. Bagian ini berisi informasi teoritis dan teknis yang cukup memadai untuk pembaca dapat mereproduksi penelitian dengan baik termasuk di dalamnya uraian mengenai jenis dan sumber data serta variabel yang digunakan. Dalam hal keperluan verifikasi hasil, editor dan mitra bestari (reviewer) berhak meminta data mentah (raw data) yang digunakan penulis. Hasil dan Pembahasan. Tuliskan hasil yang didapat berdasarkan metode yang digunakan disertai analisis terhadap variabel-variabelnya . Dapat disajikan berupa tabel, gambar, hasil pengujian hipotesis dengan disertai uraian analitis yang mengangkat poin-poin penting berdasarkan konsepsi teoritisnya.
Kesimpulan dan Saran. Bagian ini memuat kesimpulan dari hasil dan implikasinya secara akademis, dan saran yang dapat diberikan berdasarkan temuan dari pembahasan. Bagian ini juga memuat keterbatasan penelitian dan kemungkinan penelitian lanjutan yang dapat dilakukan dengan penggunaan/pengembangan variabel, metode analisis ataupun cakupan wilayah penelitian lainnya. Daftar Pustaka. Daftar pustaka disusun berdasarkan urutan abjad dengan ketentuan sebagai berikut: Publikasi Buku 1. Penulis satu orang Enders, Walter. 2010. Applied Econometric Time Series, Third Edition. New Jersey: Wiley. 2. Penulis dua orang Pyndick, Robert. S. dan Rubinfeld, Daniel L. 2009. Microeconomics, Seventh Edition. New Jersey: Pearson Education. 3. Penulis tiga orang Fotheringham, A. S., Brunsdon, C, dan Charlton, M. 2002. Geographically Weighted Regression: The Analysis of Spatially Varying Relationships. West Sussex: John Wiley & Sons. Artikel dalam jurnal Romer, P. 1993. Idea Gaps and Object Gaps in Economic Development. Journal of Monetary Economics, Vol. 32 (3), 543–573. Artikel online Woodward, Douglas P. 1992. Locational Determinants of Japanese Manufacturing Start-Ups in the United States. Southern Economic Journal, Vol. 58 (3), 690-708. http://www.jstor.org/discover/10.2307/1059836 (Diakses 1 Sepetember, 2014). Buku yang ditulis oleh lembaga atau organisasi BPS. 2009. Analisis dan Penghitungan Tingkat Kemiskinan 2008. Jakarta: BPS. Kertas kerja (working papers) Edwards, S. 1990. Capital Flows, Foreign Direct Investment, and Debt-Equity Swaps in Developing Countries. NBER Working Paper, 3497. Makalah yang direpresentasikan Zhang, Kevin H. 2006. Foreign Direct Investment and Economic Growth in China: A Panel Data Study for 1992-2004. Conference of WTO, China, and Asian Economies. Beijing. Karya yang tidak dipublikasikan Hartono, Djoni. 2002. Analisis Dampak Kebijakan Harga Energi terhadap Perekonomian dan Distribusi Pendapatan di DKI Jakarta: Aplikasi Model Komputasi Keseimabangan Umum (Computable General Equilibrium Model. Tesis. Jakarta. Artikel di koran, majalah, dan periodik sejenis Reuters. (2014, September 17). Where is Inflation?. Newsweek.