SEAMEO - TROPMED 1 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
I. PENGENALAN SOFTWARE (SPSS) UNTUK ANALISIS DATA 13 Desember 2005
Membuat Database Untuk membuat database di SPSS, langkah pertama yang harus dilakukan adalah membuat variabel di layar tampilan variable view (lihat gambar 1.1) 1. Membuat nama variabel (name): maximum 8 karakter, bisa terdiri dari huruf semuanya (contoh: vaprogpp) atau kombinasi antara huruf dan angka (contoh: hb1; berat_3). 2. Menentukan tipe data (type). Ada berbagai macam pilihan tipe data di SPSS, tapi yang paling sering digunakan adalah numeric, date, dan string. Numeric dipilih untuk semua data dalam bentuk angka, baik untuk data non-categorical maupun data categorical. Date dipilih jika kita mau memasukkan data berupa tanggal; formatnya bermacam-macam dan dapat dipilih sesuai dengan kebutuhan. Sementara string dipilih jika kita akan memasukkan data berupa kata/huruf. 3. Menentukan lebar kolom di database (width): disesuaikan dengan kebutuhan, misalnya untuk data numeric yang terdiri dari 6 angka, maka lebar kolom harus lebih dari 6. Atau contoh lain untuk data string yang maksimalnya terdiri dari 21 huruf, maka lebar kolom harus lebih dari 21. 4. Menentukan desimal: hanya untuk tipe data interval atau ratio (decimals) 5. Membuat variabel label (label) 6. Membuat value label: hanya untuk tipe data nominal atau ordinal (values; lihat gambar 1.2.). Value label berguna untuk memberikan keterangan tentang kategori yang ada pada suatu variabel dengan tipe data nominal atau ordinal. Contoh: 1 = baseline; 2 = endline 7. Adakalanya beberapa data point di dalam suatu variabel harus ”dilabel” sebagai missing value. Missing value mengacu pada semua data point yang akan diabaikan dalam analisis karena: a. Catatan data hilang b. Sudah tidak ada saat pengumpulan data yang dapat disebabkan oleh beberapa hal, misalnya: • Responden tidak memberikan jawaban pada pertanyaan (tidak bisa atau tidak mau menjawab) • Pertanyaan tidak dapat diaplikasikan pada responden tertentu • Pengukuran tidak dilakukan pada responden tertentu sehingga datanya tidak ada • Dll. ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 2 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Pada saat memasukkan data, biasanya missing value akan diberi kode berupa angka kembar seperti: 66, 88, 99, 999. Kode ini diisikan dalam kolom missing.
Gambar 1.1. Variable View
Gambar 1.2. Membuat Value Label ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 3 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Setelah pembuatan variable dilakukan, langkah berikutnya adalah memasukkan data (data entry) di layar tampilan data view (lihat gambar 1.3.)
Gambar 1.3. Data View Value label dari data categorical dapat ditampilkan pada saat memasukkan data (data entry) dengan menekan tombol View lalu klik Value Labels hingga muncul tanda √ di sebelah kiri Value Labels (lihat gambar 1.4.).
Gambar 1.4. Menampilkan Value Label di Data View ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 4 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Transformasi data dengan recoding dan compute Setelah proses memasukkan data (data entry) selesai, seringkali kita ingin membuat variabel baru dengan cara mentransformasikan data dari suatu variable yang sudah ada menjadi data dalam bentuk yang lain. Ada berbagai cara untuk mentransformasi data sebagai berikut: 1. Mengelompokkan data (recode). Cara ini biasanya digunakan untuk mentransformasi: • Variabel non-categorical menjadi variabel categorical Contoh: jika kita mempunyai data hasil pengukuran level Hb (hemoglobin) dari subyek survei, kemudian kita ingin mengelompokkan subyek tersebut kedalam 2 kategori berdasarkan level Hb-nya: anemia dan normal. Maka yang harus kita lakukan pertama-tama adalah menentukan titik potong (cut off point) pada level Hb berapa seseorang dikategorikan dalam kelompok normal dan pada level Hb berapa seseorang dikategorikan dalam kelompok anemia. Jika kita menggunakan titik potong 11,00 g/L (harus mengacu pada literatur), dengan kategori normal adalah subyek dengan level Hb ≥ 11,00 g/L dan kategori anemia adalah subyek dengan level Hb < 11,00 g/L; maka kita bisa mentransformasi data level Hb (variabel non-categorical) menjadi data status Hb (variabel categorical) •
variabel categorical yang kompleks (terdiri dari banyak kategori) menjadi variabel categorical yang lebih sederhana (sedikit kategori) Contoh: jika kita ingin membuat variabel categorical yang lebih sederhana dengan 3 kategori (output variable: totalva1) untuk menyederhanakan variabel totalvac yang mempunyai 8 kategori, maka kita dapat mengelompokkan beberapa kategori di totalvac menjadi kategori I di totalva1 dan beberapa kategori yang lain di totalvac menjadi kategori II di totalva1 dan seterusnya (lihat gambar 1.5c.)
Langkah-langkah yang harus dilakukan untuk recode adalah sebagai berikut: • Klik Transform – Recode – into different variable (lihat gambar 1.5.) • Sorot (klik mouse) variabel yang akan dikelompokkan dan kemudian klik tanda í untuk memasukkan variabel tersebut dalam kotak input variable > output variable: (lihat gambar 1.5a.) • Buat nama variabel baru dalam kotak dibawah Output Variable, lalu klik Change (lihat gambar 1.5b.) • Klik Old and New Values untuk memunculkan layar tampilan recoding (lihat gambar 1.5c.) • Untuk setiap Old Value (dalam bentuk rentang/range angka atau angka tunggal) harus digantikan oleh New Value dalam bentuk angka tunggal (lihat gambar1.5c.) • Tekan tombol Continue – OK. Variabel baru (contoh: totalvac1) akan muncul di kolom paling kanan di layar tampilan Data View ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 5 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Gambar 1.5. Pengelompokan Data (Recode)
Gambar 1.5a. Pengelompokan Data (Recode) ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 6 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Gambar 1.5b. Pengelompokan Data (Recode)
Gambar 1.5c. Pengelompokan Data (Recode) ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 7 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
2. Menggunakan perhitungan matematika, misalnya mengalikan, menjumlahkan, mengurangi, atau membagi data dari suatu variabel dengan angka tertentu (compute). Contoh: jika kita ingin mengetahui berapa jumlah/persentase ibu yang dapat menjawab lebih dari satu kegunaan supplementasi vitamin A saat nifas, dan jika kita lihat variabel vappeye, vappbod, vappasi, dst; asumsikan kode 1 untuk jawaban ”ya” adalah skor bagi mereka yang memberikan jawaban dan kode 0 untuk jawaban ”tidak” adalah skor untuk mereka yang tidak memberikan jawaban; maka kita dapat ”menjumlahkan” data dari variabel-variabel tersebut dengan langkah sebagai berikut: • Klik Transform – Compute • Ketik nama variabel baru dibawah Target Variable, misalnya: vappsum • Sorot (klik mouse) variabel yang akan dijumlahkan kemudian klik tanda í untuk memasukkan variabel tersebut dalam kotak Numeric Expression (lihat gambar 1.6.) setelah itu klik tanda +, lanjutkan dengan memasukkan variabel yang lain, dan seterusnya. Contoh: vappeye + vappasi + vappbody + ...... • Kemudian tekan tombol OK. Variabel baru (vappsum) akan muncul di kolom paling kanan di layar tampilan Data View
Gambar 1.6. Compute dengan SPSS File Info Keterangan lengkap tentang variabel apa saja yang terdapat dalam suatu database di SPSS dapat diperoleh dengan meng-klik Utilities – File Info. Hasilnya akan muncul dalam layar tampilan Output8 – SPSS Viewer (lihat gambar 1.7.). ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 8 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Gambar 1.7. File Information
Menampilkan Variable Name dalam kotak Dialog Pada saat kita akan mengolah data, jika Variable Label terlalu panjang untuk ditampilkan di kotak dialog, maka kita dapat mengubahnya dengan menampilkan Variable Name sebagai pengganti. Tekan tombol Edit – Options – Variable Lists – Alphabetical – Display Names – OK (lihat gambar 1.8.).
Gambar 1.8. Menampilkan Variable Name di setiap Kotak Dialog ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED 9 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________
Data cleaning sederhana Sebelum masuk dalam tahapan analisis data, proses data cleaning seharusnya dilakukan terlebih dahulu. Tujuan dari data cleaning adalah membersihkan data yang sudah dimasukkan dalam database dari outlier (data yang ekstrim). Melihat pola data adalah langkah awal yang harus dilakukan untuk mengetahui ada tidaknya outlier. Salah satu cara termudah untuk melihat pola data adalah dengan cara mengurutkan data, dari yang terbesar ke yang terkecil atau sebaliknya. Klik kanan pada nama variabel di layar tampilan data view, kemudian pilih perintah Sort Ascending (mengurutkan data dari yang terkecil ke yang terbesar) atau Sort Descending (mengurutkan data dari yang terbesar ke yang terkecil; lihat gambar 1.9.). Adanya outlier seringkali disebabkan oleh tiga hal sebagai berikut: 1. Kesalahan/error pada saat pengumpulan data (data collection), misalnya karena salah persepsi, salah pencatatan hasil interview, salah pengukuran, dsb. Jika kesalahan terjadi pada tahapan pengumpulan data/data collection, maka beberapa hal dapat dilakukan seperti: • Pelatihan untuk enumerator guna menyamakan persepsi terhadap pertanyaan/kemampuan mengukur • Kalibrasi alat ukur atau pre-testing kuesioner • Supervisi hasil interview • Dll. 2. Adakalanya sejumlah kecil responden/subyek survei atau studi memang mempunyai karakter yang sangat berbeda (misalnya: berat badan, tinggi badan, dll) dari yang lainnya. Dalam hal ini, data dari subyek tersebut dapat ”diabaikan/dihapus” atau tetap dipertahankan/dipakai saat analisis data, tergantung dari tujuan dan ukuran sampel (sample size) yang diambil dalam survei atau studi. 3. Kesalahan pada saat memasukkan data (data entry), misalnya karena kesalahan mengetik. Dua hal yang dapat dilakukan: • memeriksa kembali kuesioner atau hasil pengukuran • ”mengabaikan/menghapus” outlier saat analisis data, tergantung dari ukuran sampel (sample size) yang diambil dalam survei atau studi.
Gambar 1.9. Mengurutkan Data dalam suatu Variabel ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module