Temu Teknis Fungsional non Penehtk 2000
C. MAKALAH PRANATA KOMPUTER
MANAJEMEN DATABASE DAN APLIKASI PROGRAM SAS UNTUK ANALISA DATA Djoko Trijono Pusat Penelitian Sosial Ekonomi Pertanian, A. Yani No . 70, Bogor
RINGKASAN Kebutuhan akan manajemen database mutlak diperlukan, demikian juga dengan program-program aplikasi guna mendukung analisis kebijakan . Oleh sebab itu diperlukan pertimbangan seksama dalam pemilihan dan keputusan untuk memanfaatkan aplikasi yang akan digunakan. Kegunaan manajemen database adalah untuk mengorganisir data agar mudah digunakan, jenis data yang dapat diinformasikan dalam manajemen database adalah berupa gugusan data yang tersusun ber dasarkan kata kunci yang sudah terdifinisi dengan balk. Dalam manajemen database perlu dijelaskan kondisi dan isi dari data yang terkoleksi . Keterangan dapat berupa hand-out yang berisi alur/diagram atau berupa matrik tabulasi yang dapat memberikan informasi lengkap kepada pengguna . Hal yang sering kurang diperhitungkan adalah pemilihan media/hardware yang akan dipakai dalam operasional, dimana sering dijumpai hardware yang dipakai kurang mendukung dengan program aplikasi yang relatif maju selangkah dibanding dengan perkembangan hardware . Kata kunci : Database, program SAS.
PENDAHULUAN Manajemen data di dalam suatu penelitian sangat diperlukan, oleh karena itu untuk menghimpun, menvimpan dan mengelola database memerlukan sistem organisasi yang balk . Selanjutnya sangat diperlukan langkah-langkah yang tepat di dalam pemilihan program maupun media penyimpanannya .
PENYIAPAN DAN SPESIFIKASI DATABASE Untuk mengatur dan menyimpan data agar mudah dibaca dan diambil seluruh atau sebagian secara cepat dan mudah . Hal ini merupakan suatu keharusan dalam manajemen data. Didalam penyimpanan data perlu dilakukan pemisahan data berdasarkan kata kunciyang mudah dikenali dan dimengerti oleh manajer maupun pengguna, hal ini sangat diperlukan agar pengambilan data dapat dilakukan dengan cepat dan akurat .
264
Temu Teknis Fungsional non Penelid 2000
Sebelum melakukan analisa data, ada beberapa hal yang perlu untuk diperhatikan diantaranya adalah (1) Spesfikasi variabel; (2) Jumlah variabel yang akan diolah ; (3) Output dari analisa yang diharapkan ; (4) Program untuk pemasukan data : dan (5) Program paket untuk analisa data . Spesifikasi variabel meliputi jenis variabel, panjang karakter dan format dari masing-masing variabel tersebut . Jenis variabel bisa berupa numerik atau alpha numerik, sedangkan panjang dan formatnya adalah fixed point/desimal atau Integer . Jumlah va iabel yang akan diolah kaitannya dengan program apa yang akan diputuskan untuk mengolah data tersebut (Tabel 1) hal ini berkaitan dengan harapan dari hasil pengolahan yang akan dilakukan (Tabel 2) . Setelah diketahui jumlah dan jenis variabel yang akan disimpan dalam manajemen data, maka barulah ditentukan jenis media yang akan dipakai dalam penyimpanan data tersebut. Lokasi penyimpanan Untuk menyimpan data yang sudah dipilah-pilah menunit kata kunci, langkah berikutnya adalah menyiakan lokasi pada media simpan . Agar didalam pengambilan data dapat dilakukan dengan cepat maka pembuatan lokasi pads media simpanpun harus dibuat secara terorganisir Pengelompokan data dapat dilakukan dengan membuat kata kunci lokasi sebagai pedoman atau judul penelitian . Dengan memilah-milah data berdasarkan lokasi maupun judul penelitian maka organisasi data lebih rapi dan mullah untuk dikenali . Pemilihan program paket yang digunakan Program-program paket statistik yang dipakai adalah paket program Statistical Analysis System (SAS) . Program ini merupakan paket yang cukup handal, dimana dengan program mi dapat melakukan perhitungan-perhitungan atau pengujianpengujian data dengan menggunakan model-model analisa yang dibutuhkan, khususnya bagi peneliti di dalam melihat keragaan pengamatan lapang yang dituangkan dalam bentuk analisa frekuensi dan regresi, baik analisa regresi sederhana maupun analisa dengan cara simultan . Disamping program SAS, program-program lain juga dapat melakukan analisa seperti SYSTAT, SHAZAM dll. Demikian juga dengan paket program spreadsheet seperti Lotus, Microsoft Acces, Excel, Qpro dli, disamping sebagai program spreadsheet juga dapat melakukan analisa data seperti analisa regressi dan lain-lain . Sedangkan untuk koleksi data diperlukan program utility seperti dBase, Dataease maupun program database lainnya, yang pads dasamya dapat menyimpan data dengan rapi, mudah dipanggil ulang, mudah dimodifikasi atau divalidasi, dan mempunyai banyak pilihan output yang dapat dibaca oleh program lainnya tanpa mengalami kesulitan .
265
Temu Teknis Fung tonal non Penehh 2000
Pilihan-pilihan database manajemen seperti ini adalah program dataease yang dapat diandalkan, dengan berbagai pertimbangan antara lain kebutuhan hardware tidak terlalu tinggi, kapasaitas hard disk untuk program im cukup 1,5 MB, dan RAM cukup 4 atau 8 MB sedangkan kemampuan untuk simpan data cukup besar (hingga 16 juta observasi per dataset) . PERTIMBANGAN DALAM MENENTUKAN PROGRAM a. Pemasukan data Dalam program pemasukan data yang hares menjadi pertimbangan adalah jumlah variabel dan spesifikasi dari variabel. Jumlah variabel dan jenis variabel yang akan dihimpun dalam database dapat dilihat pads tabel berikut . Tabel 1 . Spesifikasi program dan kapasitas hard disk yang diperlukan menurut klasifikasi variabel yang akan diolah. Jumlah variabel Kurang dari 50 variabel 200 Sampai dengan variabel Diatas 200 variabel
Program yang diperlukan Spreadsheet (lotus, excel atau qpro) Dataease, dBase Dataease, SAS
Kapasitas byte yang diperlukan 7 - 8 MB 1,5 - 2 MB 1,5 - 274 MB
b. Analisa data Untuk keperluan analisa data, program yang dapat digunakan adalah program paket statistik seperti SAS, Shazam dan program paket statistik lain yang tersedia di pasaran . Tetapi yang perlu diperhatikan dalam pemilihan program ini adalah jenis output yang diharapkan . Tabel 2 . Jenis dan alat program yang dapat digunakan dalam pengolahan data . Analisa yang diharapkan Input/output Liniar programming Cross tabulasi Regresi, time siries dll
Program yang disarankan &4S, 1/0 QSB, LP88, QM &4S, SPSS, MSTA T, SYSTA T MS
PENYIAPAN DATA Data yang akan diolah harus diidentifikasi terlebih dahulu, dalam pengidentifikasian data, yang perlu diperhatikan adalah jenis atau jatidiri variabel yang akan dibentuk, apakah data yang akan dimasukkan kedalam database berupa numerik
266
Temu Teknis Fungsional non Penelit 2000
atau alpha numeric, identifikasi ini sangat perlu dilakukan untuk tahap berikutnya yakni dalam rangka pengolahan dan pengelompokkannya . Pengelompokan data mutlak diperlukan apabila data yang akan diolah adalah data primer/hasil survei, demikian juga dengan data sekunder . Pengelompokan data ini dapat dicirikan dengan meciptakan nomor identifikasi pada masing-masing kuesioner yang ada, sistem penomoran sebaiknya dimulai dari lokasi kemudian kepada obyek penelitian . Hal ini dimaksudkan untuk memudahkan didalam pensortiran data dalam rangka pengolahan selanjutnya . Dengan pengelompokan diatas, maka jika diinginkan gambaran mengenai desa (lokasi) terkecil dengan berbagai ragamnya dapat dilakukan dengan mudah . Menghimpun data dengan menggunakan fasilitas databease adalah cara yang paling cepat, karena fungsi kunci didalam program im mudah dipahami . Setiap langkah selalu diikuti oleh key functions, sehingga memudahkan pemakai dalam melakukan eksekusi program. Disamping fasilitas penampungan data, juga fasilitas ekspor data kedalam format program utility lain juga tersedia, seperti dalam format Lotus, Columnar, dBase maupun dalam format WordPerfect .
PROSEDUR PENULISAN DAN CONTOH PROGRAM SAS a. Prosedur MEANS Penulisan program untuk prosedur means dapat dilakukan dengan cars berkelompok maupun secara individu . Untuk cars berkelompok yang perlu diperhatikan adalah key word atau Identitas vaniabel yang akan dikelompokkan, jika terdapat dua atau lebih kelompok yang akan diurutkan maka prosedur ini hares didahului oleh prosedur sort, sedangkan untuk cara individu tidak hares menggunakan . Penulisan prosedur means sebagai berikut : Data a ; Input x 1 k 10 ; Cards; 9 list data i$a; iiĀ§; Proc means data=sasdataset options : Var variable ""i iii : Output Out =sasdataset MEAN =variabelname SUM=variabelname ; Options : N = Frekuensi dari jumlah observasi Mean = Rata-rata dari data yang terisi SUM = Jumlah nilai pada variabel ybs . Max = nilai terbesar Min = Nilai terkecil STD = Standard deviasi/simpangan baku Range = Nilai antara : ii
3~:a
267
Temu Teknis Fungstonal non Peneliti 2000
Output out adalah dataset yang sudah terseleksi menurut kelompok atau kumulatif dari variabel yang bersangkutan . b . Prosedur FORMAT dan FREQUENSI Prosedur ini bertujuan untuk melihat persentase antar variabel baik secara horisontal maupun secara vertikal . Seperti halnya pada prosedur means maka pada prosedur frequensi ini juga dapat dilakukan secara individu maupun secara berkelompok. Pengelompokan data tersebut juga dapat diikuti dengan menggunakan prosedur forinat.Tujuan prosedur format disini adalah untuk memberi identitas dart kelompok tersebut . Persyaratan umum dalam prosedur format adalah sebagai berikut Proc FORMAT ; Value ddname 1='variable label' >r; . . ; Prosedur-prosedur lainnya' ~" '~ ; . . Format variable ddname . ; diakhir prosedur . Sedangkan untuk prosedur frequensi sebagai berikut : Proc FREQ options ; TABLES variable*variable/options ; BY variable ; Options dalam Statistical Analysis ALL informasi yang akan diberikan total test dan analisa yang dibuat beiupa CHISQ, MEASURES dan CMH . Jumlah CMH yang disajikan sebagai control adalah CMH1 dan CMH2 .
Statement tabulasi dalam prosedur frequensi Tabel yang dapat disajikan dalam frequensi ini dapat berupa label tunggal, ganda maupun bertingkat. Penulisan dalam prosedur sebagai berikut : Tables a*(b c) ; Tables (a b)*(c d) ; Tables (a b c)*d ; Tables a- -c ; Tables (a- c)*d
sama dengan tables a*b a*c ; sama dengan tables a*c a*d b*c b*d ; sama dengan tables a*d b*d c*d ; sama dengan tables a b c ; sama dengan tables a*d b*d c*d ;
c . Prosedure Tabulasi Salah satu program analisa dalam bentuk tabulasi didalam program SAS telah dibahas secara khusus antara lain bagaimana cars menampilkan bentuk label . jenis hitungan yang dapat tersaji dalam Label analisa dan bentuk/format tabelnya . Sehingga mudah untuk dibaca dan dimengerti isinya . Secara umum jenis hitungan yang dapat dikeluarkan dalam tabulasi antara lain n (frequensi) mean (Nilai rata-rata) sum (Total) Std (Simpangan baku) Max/Min (Terbesar/terkecil) Range (jarak/kisaran) dan masih banyak lagi uji diskripsi statistik
268
Temu Tekms Fungsional non Peneliti 2000
lainnya yang dapat diminta pads statement ini . Kesemuanya dapat dipilih sesuai dengan keperluan analisa yang dibutuhkan . Disamping hitungan-hitungan diatas format tabel juga dapat disusun menurut kebutuhan, baik secara individual maupun dengan cars berkelompok . Spesifikasi umum dalam penulisan tabulasi PROC TABULATE option ; TABLE [(page expression,]row expression,jcolumnexpression /option ; CLASS variables ; V AR variabes; FORMAT variables (format] LABEL variable='text' . . . . ;
KEYLABEL key vrd='text' . . . BY variables ; FREQ variable ; WEIGHT variable ;
.;
Statement prosedur tabulasi PROC TABULATE dapat diikuti dengan menggunakan option sebagai berikut : DATA = adalah kumpulan dataset yang telah terhimpun sebelumnya, data dapat juga berupa data yang sudah terklasifikasi maupun data yang masih berupa source bebas. MISSING = nilai observasi termasuk yang tidak ada, jika menginginkan nilai kosong dalam ruang hitungan ditampilkan maka penggunaan option ini dapat digunakan. FORMAT = Penggunaan format ruang ini untuk menampilkan jumlah karakter yang digunakan dalam masing-masing shell/nuang sehingga kata/label variabel tidak terputus oleh besarnya ruang tersebut . Jika format tidak digunakan dalam options ini maka standar format yang digunakan adalah 12 .2 NOSEPS = tidak menggunakan garis separator pada tiap-tiap shel . Penggunaan separator im bertujuan untuk memisahkan antar kolom dan bans . sehingga nilai dari masing-masing bans dan kolom dapat dengan mudah dibaca . Tetapi penggunaan separator ini kadang-kadang membuat jumlah halaman menjadi lebih banyak dibanding dengan tidak menggunakan separator . T_ABLEI page expression, J row expression,]column expression /options; Penggunaan Statemen TABEL antara lain
2 69
Temu Teknis Fungsional non Peneliti 2000
(comma) untuk memisahkan antara judul dimensi label, kolom dan bans Label (asteriks) silang elemen tabel antar variabel yang akan dihitung (blank space) menghilangkan variabel label pads dimensi baris/kolom ()parentheses adalah untuk mengelompokkan variabel menurut baris/kolom < > (Brackets) adalah spesifikasi dari definisi dari pembagi dalam persen = (equal) adalah untuk memodifikasi format balk bans maupun kolom secara individual, sehingga masing-masing baris/kolom dapat disesuaikan dengan kebutuhannya . Penggunaan Options didalam statemen label antara lain -
RTS=n (Row Title Space) adalah untuk keperluan ukuran dan besarnya kolom pads shel dimensi label . Box=value penggunaan options ini ditujukan untuk mengisi label pads shel kolom utama Label, disamping nama variabel juga dapat diisi dengan menggunakan string pads label yang akan dimasukkan dalam kolom tersebut .
Statemen CLASS Penggunaan Statement klas ini diperuntukkan bagi variabel yang menjadi kunci pengelompokkan bukan variabel yang akan diuji statistiknya . Statemen VAR : Adalah variabel-variabel yang akan dihitung dalam label Statemen FORMAT Penggunaan statemen ini harus didahului dengan penggunaan prosedur format (PROC FORMAT) yang diikuti oleh wakil dan nilai-nilai variabel yang bersangkutan. Penulisan dalam program : FORMAT variabel [format.] . . ; Statemen LABEL : Penggunaan statemen ini bertujuan untuk memberikan ciri pads variabel yang akan dihitung atau dianalisa. Penulisan label : LABEL variabel='teks ; Statemen KEYLABEL Penggunaan stamenet keylabel int adalah untuk mencirikan jenis analisa yang digunakan seperti n dapat dicirikan dengan kata jumlah, mean dengan rataan dsb . Pada dasarnya penggunaan keylabel merupakan variabel label dan kata disknpsi statistik .
270
Terns Teknis Fungsional non Peneliti 2000
FORMAT TABULASI Page expression BOX='strings' Row expression
Column expression Key label Key label I Dapat berisi nilai hitungan yang diinginkan
Row_expression dapat bertingkat sesuai dengan klasifikasi yang diinginkan, demikian juga dengan column_expression. Membuat klasifikasi data Untuk membuat klasifikasi data dapat dilakukan dengan menuliskan prosedur format seperti berikut : PROC FORMAT; VALUE LHN 0 .000='Tidak punya' 0 .001-0.250=' < 0.250 ha' 0 .251-0 .500='0.250 - 0 .500 ha' 0 .501-1 .000='0 .500 - 1 .000 ha' others ='> 1 .000 ha' ; PROC TABULATE ; CLASS LAHAN ; FORMAT LAHAN LHN. ; TABLE LAHAN ; RUN ; Dengan program diatas maka hasil tabulasi yang tersaji seperti berikut : Tidak Punya N
<0 .250 HA N
LAHAN 0 .250 - 0 .500 0 .500 - 1 .000 ha ha N
> 1 .000 ha
N N
Pada bans ini akan berisi frekuensi masing-masing orang berdasarkan kelompoknya
27 1
Temu Teknis Fungsional non Peneli6 20010
KESIMPULAN Mengingat pentingnya organisasi data, maka database manajemen merupakan salah satu cars yang paling tepat dalam mengelola maupun menyediakan database . Disamping dalam penyedia data, manajemen database juga merupakan media informasi yang cukup handal, karena disusun berdasarkan kata kunci yang jelas dan mudah untuk dimengerti .
DAFTAR BACAAN Anonimous . DataEase, User Manual. Vol . 3 . 1988 Harisno, MM . 1999 . Pedoman Pembuatan Dokumentasi Sistem, Pusat Data Pertanian. Statistical Analysis System TABULTE, Edisi 6 .0, 1987 . SAS/STAT, Guide fpr Personal Computers, Version 6 Edisi, SAS Institute Inc, 1987 .
272
Terry Teknis Fungsional man Penetiti 2000
Lampiran 1 Contoh program 1 Pada contoh program ini, ingin melihat nilai rata-rata dari produksi dan harga menurut desa dan komoditas . Data a; Input desa petani produksi harga komod ; Cards ; 2500 1 1 1 4000 1 1 2 4000 2500 1 3 5400 2700 1 1 4 4500 2800 1 1 5 4020 2800 1 1 6 4100 2500 1 1 7 4200 2500 1 1 8 4000 2500 1 1 9 4000 2500 1 4000 1 10 2500 1 1 11 4000 2500 1 2 1 4000 2500 1 4000 1 2 2 2500 2 3 5400 2700 1 2 4 4500 2800 1 2 5 4020 2800 1 2 6 4100 2500 1 proc tabulate ; class desa komod ; var produksi harga; tables desa*komod, (produksi harga)*mean='Rata-rata' ; run ; Hasil perhitungan sebagai berikut
Desa
Komoditas
1 2
1 1
Produksi Rata-rata
Harga Rata-rata
4201 .82
2572 .73
4338.67
2633 .33
273
Tensu Teknis Fungsional non Penelitz 2000
Contoh program 2 Pada program ini bertujuan untuk memberikan label pads desa yakni untuk desa pertama diberikan label desa Wailan dan kedua diben nama Karegesan, disamping memberikan label juga penulisan options yang dapat digunakan dalam program yang berisi antara lain : posisi basil ditengah atau rata kiri (center/nocenter), menggunakan tanggal atau tidak (date/nodate), panjang bans (page size/ps=) clan panjang karakter per bans (line size/is= ) . options nocenter nodate ls=65 ps=54 ; proc format ; value ds 1='Wailan' 2='Karegesan' ; Data a; Input desa petani produksi harga komod, Cards ; 4000 2500 1 1 1 2 6 4100 2500 1 data proc tabulate format=12 .0; class desa komod; var produksi harga; tables desa*komod, (produksi harga)*mean='Rata-rata'/rts=25 ; format desa ds. ; run ; Hadl perhitangan sbb :
Desa Wilayah Karegesan
Produksi Rata-rata
Harp Rata-rata
4202
2573
4337
2633
Komod 1 1
Contob program 3 Pada contoh ini, disamping nilai rata-rata juga dikeluarkan frekuensi dari masing-masing desa dan komoditi, baik produksi maupun harp dan data yang terisi . Tujuan menampilkan frekuensi disini adalah untuk mengecek jumlah observasi yang ada dalam gugus data . Dengan demikian maka dapat diketahui jumlah observasi yang terisi datanya maupun yang tidak terisi.
2 74
Temu Teknis Fungsional non Penelid 2000
options nocenter nodate ls=65 ps=54 ; proc format ; value ds 1 'Wailan' 2='Karegesan' ; value diti 1='Padi' ; Data a ; Input desa petani produksi harga komod ; Cards ; 1 1 4000 2500 1 2 6 4100 2500 1 data proc tabulate format=12 .0; class desa komod ; var produksi harga; tables desa*komod, (produksi harga)*(n='Frek' mean='Rata-rata')/rts=25 ; format desa ds. Komod diti. ; run; Hasil perhitungan sbb Produksi Frekuensi Rata-rata Desa Wailan K
Harp Frekuensi Rata-rata
Komod Padi Padi
11 6
4202
11
2573
4337
6
2633
275