Modul Pembelajaran SPSS (Statistical Package for the Social Sciences)
Pusat Data dan Statistik Pendidikan Kementerian Pendidikan dan Kebudayaan Republik Indonesia 2014
Kata Pengantar
Buku “Modul Pembelajaran SPSS (Statistical Package for the Social Sciences)” ini merupakan salah satu hasil kegiatan Pusat Data dan Statistik Pendidikan (PDSP), Kementerian Pendidikan dan Kebudayaan (Kemdikbud) yang terkait dengan pendayagunaan data pendidikan. Penyusunan modul ini bertujuan antara lain untuk memudahkan para pembacanya agar memahami cara penggunaan program SPSS khususnya yang terkait dengan data pendidikan. Modul pembelajaran ini membahas cara-cara pengolahan data dengan menggunakan perangkat lunak SPSS, diantaranya mengenai analisis statistik, pembuatan grafik dan pembuatan tabel-tabel pengolahan data. Dengan memahami setiap bab dalam modul ini, serta ditambah dengan mencari informasi dari berbagai media, dilanjutkan dengan sebanyak mungkin berlatih untuk mengolah data dengan SPSS, diharapkan dapat memberikan keterampilan pengolahan data pendidikan secara sistematis dan informatif. Ucapan terima kasih diberikan kepada berbagai pihak yang terlibat dalam penyiapan dan penyusunan buku ini. Saran dan masukan dalam rangka penyempurnaan buku ini sangat diharapkan.
Jakarta, 28 Mei 2014 Kepala,
Dr.-Ing. Yul Yunazwin Nazaruddin
i|PDSP
Daftar Isi Kata Pengantar ....................................................................................................... i Daftar Isi ................................................................................................................ 1 Merge Files ............................................................................................................ 3 Identify Duplicate Data ........................................................................................ 11 Compute Data ...................................................................................................... 19 Recode Data ........................................................................................................ 30
1|PDSP
MERGE FILES
2|PDSP
Merge Files Merge file adalah menggabungkan beberapa file dokumen spss, yang dilakukan dengan penggabungan kolom-kolom variabelnya. Cara merge file : 1. Buka dua file yang ingin di merge (llihat cara import database) 2. Selanjutnya gabung beberapa variable menjadi satu dengan cara. Pilih menu transform → compute variable
3|PDSP
Pilih Target Variable dan buat variabel baru ex: Kode_New Pada kolom String Expression isi dengan : “CONCAT(kd_prop,kd_rayon,kd_sek,jns_uji)“ Atau Pilih String pada Function Group -> pilih concat pada Functions and Special Variable -> kemudian isi dalam kurungnya dengan “kd_prop,kd_rayon,kd_sek,jns_uji” Ubah type & label menjadi string
4|PDSP
Ulangi kembali pada file yang satunya. 3. Short Cases dua file tersebut menurut variabel “kode”. dengan cara pilih menu menu data → Short Case
Pilih variabel yang telah kita buat “Kode_New” kemudian klik OK 5|PDSP
Ulangi terhadap file yang lain
4. Kemudian gabungkan kedua file tersebut dengan cara : Pilih menu data → merge files → add variables
6|PDSP
5. Pilih file mana yang akan di gabungkan (merge)
7|PDSP
6. Pilih variabel apa yang akan digabungkan (merge)
7. Pilih key Variable Kode_new checklist match case dan pilih both file provide cases
8|PDSP
8. Hasilnya kedua file akan tergabung.
9|PDSP
IDENTIFIKASI DUPLICATE DATA
10 | P D S P
Identify Duplicate Data Duplikasi atau data ganda pada umumnya terjadi dalam data berskala besar. Identify Duplicate Cases berfungsi untuk mengidentifikasi data duplikasi (ganda). Fungsi ini memungkinkan untuk mendeteksi data mana saja yang duplikasi. Misalnya akan mencari data yang duplikasi (ganda) berdasarkan NPSN atau nama sekolah. Secara automatis fungsi ini akan mengelompokkan data yang duplikasi dan akan di beri keterangan data mana yang merupakan primary.
Langkah-langkah penggunaan Identify Duplicate Cases adalah sebagai berikut : 1. Buka file 2. Dari menu toolbar, pilih Data Identify Duplicate Cases....
Akan terlihat tampilan seperti diatas. Pilih menu identify Duplicate Cases, maka akan terlihat tampilan seperti dibawah ini :
11 | P D S P
a. Define matching cases by diisi dengan variabel apa yang akan digunakan untuk mencari data yang duplikasi. Misalnya diisi dengan nm_sek, maka identifikasi data duplikasi akan dilakukan berdasarkan variabel nm_sek. Identifikasi data duplikasi dapat dilakukan berdasarkan lebih dari satu variabel. Jika akan dilakukan berdasarkan lebih dari satu variabel maka pada kolom ini dapat diisi dengan lebih dari satu variabel. b. Sort within matching groups by yaitu hasil proses identifikasi akan ditampilkan secara urut (sort) berdasarkan variabel yang isikan pada kolom ini. Misalnya akan diurut (sort) berdasarkan nm_rayon. Secara Ascending atau Descending tergantung pilihan dibawah kolom ini. c. Indicator of primary cases (untuk primary = 1, duplikat = 0). Ada beberapa pilihan kolom yang bisa diisi, yaitu : Last case of each group is primary data yang sama akan dikelompokkan dan data primary akan ditampilkan pada baris terakhir pada tiap kelompok yang sama. Dan primary data akan diberi kode 1 (satu). First case of each group is primary data yang sama akan dikelompokkan dan data primary akan ditampilkan pada baris awal tiap kelompok yang sama. Dan primary data akan diberi kode 1 (satu). 12 | P D S P
Filter by indicator value filter berdasarkan indikator (urutan pertama dari tiap kelompok yang sama). Hasil tampilan berupa toolbar di sebelah kiri yaitu nomor baris yang dicoret miring untuk data yang duplikasi. Kemudian pada kolom name diisi dengan nama (judul) kolom yang akan ditampilkan
d. Sequential count of matching cases each group akan menghitung dan mengurutkan sebanyak data duplikat dalam tiap kelompok yang sama. e. Move matching cases to the top of the file, jika memilih pilihan ini berarti jika ditemukan data yang duplikasi maka akan diurutkan ke atas (urutan pertama untuk setiap kelompok yang sama). f. Display frequencies for created variables, pilihan ini akan menampilkan frekuensi hasil proses identifikasi duplikasi.
Sebagai contoh misalnya akan dilakukan identifikasi data duplikasi berdasarkan satu variabel maka pada kolom define matching cases by nm_sek dan sort when matching group by Indo_12. Di sort secara Descending.
13 | P D S P
First case in each group is primary dipilih pada Indicator of primary cases dan diberi nama (judul) kolom Test1. Untuk Sequential count of matching tetap diberi identitas MatchSequence1. Setelah semua kolom dan pilihan sudah diisi maka klik ‘ok’. Karena ‘Display frequencies for created variables’ sudah dipilih maka akan tampil ‘Output1’ seperti dibawah ini :
Terjadi 97.996 data yang duplikasi, dan terdapat 44.441 primary Case.
14 | P D S P
Dan pada display ‘DataSet1’ akan tampil hasilnya sebagai berikut : Define matching cases by nm_sek
Hasil sort variabel Indo_12 (Descending)
Sequential count of matching = MatchSequence1
Indicator of primary cases = Test1
Contoh : identifikasi data duplikat berdasarkan lebih dari 1 variabel.
15 | P D S P
Sebagai contoh diatas adalah dataUN tahun 2011 yang akan kita identifikasi data yang duplikat berdasarkan 3 variabel, yaitu :
Pilih Data > Identify Duplicate Cases. Isi kolom dengan isian seperti dibawah ini : a. Define matching cases by : 1. nm_sek 2. jns_uji 3. tot_11 b. Sort within matching groups by : kd_sek (Ascending) c. Indicator of Primary cases > name : Test1 > pilih First case in each group is primary d. Sequential count of matching > name : MatchSeq1
Kemudian klik : OK
16 | P D S P
Hasil yang dapat kita lihat adalah sebagai berikut :
17 | P D S P
COMPUTE DATA
18 | P D S P
Compute Data Transformasi Compute akan menciptakan variabel baru atau memodifikasi nilai-nilai variabel untuk setiap case. Variabel baru tersebut akan menampung hasil dari proses computer yang diberikan seperti pemakaian fungsi maupun operasi matematik lainnya.Transformasi yang dapat dilakukan dengan Compute adalah transformasi untuk data yang bertipe numeric dan string. Untuk melakukan compute data menu yang digunakan adalah menu Compute Variable pada menuTransform dari menu bar di bagian atas. Kotak dialog Compute variable terlihat seperti gambar berikut ini (Gambar I)
(Gambar I. Kotak dialog Compute Variable)
19 | P D S P
Adapun keterangan dari masing-masing menu dapat didefinisikan sebagai berikut: 1) Kotak Target Variabel digunakan untuk memasukkan nama variabel penampung yang akan dibuat 2) Menu Fuction group dan Fuction and Special Variabel dan tombol-tombol numeric berisi fungsi-fungsi dan operasi matematik yang dapat digunakan untuk menyusun perintah dalam memodifikasi variabel 3) Bagian no.3 merupakan daftar variabel-variabel dari data 4) Kotak Numeric Expression akan menampilkan ekspresi perintah yang dibuat 5) Type & Label digunakan untuk merubah tipe data dan mengatur width variabel baru yang akan dibuat 6) Menu if digunakan jika dalam transformasi data dibutuhkan himpunan bagian dari data yang ada, misalnya data kabupaten tertentu dari data seluruh kabupaten yang ada dalam suatu provinsi 7) Menu Ok untuk memproses perintah
Beberapa contoh penggunaan menu Compute Variable a. Menghitung rataan Langkah untuk menghitung rataan adalah sebagai berikut: 1) Pilih menu Transform > Compute Variabel (lihat Gambar 2) lalu akan muncul kotak dialog (lihat Gambar 3) 2) Isi nama Target Variabel, Misalnya Mean_12 karena dalam latihan ini yang akan dihitung rataannya adalah nilai UN tahun 2012. 3) Dalam menu Function Group pilih Statistical 4) Pada menu Function and Special Variabel pilih menu MEAN 5) Masukkan data yang akan dihitung rata-ratanya dengan cara double klik data hingga muncul dalam kotak Numeric Expression. Dalam latihan ini adalah data nilai bahasa Indonesia, bahasa inggris, matematika dan IPA 6) Klik Ok. Hasilnya dapat dilihat pada Gambar 4
20 | P D S P
(Gambar 2. Menu Compute Variable dalam Menu Bar)
(Gambar 3. Langkah-Langkah dalam Menghitung Rataan)
21 | P D S P
(Gambar 4. Hasil hitungan rataan)
b. Menghitung rataan dengan perintah if Pada dasarnya sama dengan menghitung rataan seperti pada butir a di atas. Namun, penggunaan menu if diterapkan karena yang dicari adalah rataan salah satu kota/kabupaten saja. Misalnya Kota Jakarta Pusat Langkah untuk menghitung rataan adalah sebagai berikut: 1) Pilih menu Transform > Compute Variabel lalu akan muncul kotak dialog 2) Isi nama Target Variabel, Misalnya Mean_12_JP. Dalam latihan ini yang akan dicari adalah rataan Kota Jakarta Pusat. Lihat Gambar 5 3) Dalam menu Function Group pilih Statistical 4) Pada menu Function and Special Variabel pilih menu MEAN 5) Masukkan data yang akan dihitung rata-ratanya dengan cara double klik data hingga muncul dalam kotak Numeric Expression. Dalam latihan ini adalah data nilai bahasa Indonesia, bahasa inggris, matematika dan IPA 6) Klik menu if hingga muncul kotak dialog if (lihat Gambar 6) 7) Pada kotak dialog if pilih Include if satisfies condition 8) Masukkan data dengan cara Double klik hingga muncul dalam kotak Numeric Expression. Dalam latihan ini data nm_rayon 9) Dalam kotak Numeric Expression beri tanda sama dengan lalu ketik kota yang dipilih dengan diapit tanda “” sehingga menjadi nm_rayon=”KOTA JAKARTA PUSAT”. Penulisan harus sama dengan format penulisan datanya 22 | P D S P
10) Klik Continue 11) Kembali ke kotak dialog Compute Variable klik OK. Hasilnya dapat dilihat pada Gambar 7
(Gambar 5. Langkah Menghitung Rataan Dengan If)
23 | P D S P
(Gambar 6. Kotak Dialog If)
(Gambar 7. Hasil Menghitung Rataan dengan If )
24 | P D S P
c. Menggabungkan data dari beberapa kolom Untuk menggabungkan data dari beberapa kolom, misal kode dengan nama sekolah, dapat dilakukan dengan cara berikut ini: 1) Pilih menu Transform lalu klik Compute Variabel 2) Isi Target Variabel, misalnya Kode_sklh (lihat Gambar 8) 3) Dalam menu Function Group pilih String, 4) Pada menu Function and Special Variabel pilih menu CONCAT 5) Masukkan data. Dalam latihan ini kode prov, kode rayon, kode sekolah, jenis uji, nama sekolah. 6) Klik menu Type and Label 7) Pada kotak dialog Type and Label pilih data STRING dan isikan width data. Pengaturan width data tergantung berapa kebutuhan karakter dari data baru yang hendak dibuat, misalnya 50, lalu klik continue. Lihat Gambar 9 8) Klik Ok. Hasilnya dapat dilihat pada Gambar 10
(Gambar 8. Langkah Menggabungkan Data ) 25 | P D S P
(Gambar 9. Kotak Dialog Type & Label )
(Gambar 10. Hasil Penggabungan)
26 | P D S P
d. Membuat data baru dengan ekspresi kondisi Data baru dapat dibuat dengan cara menyusun ekspresi kondisi sesuai dengan persyaratan data yang diinginkan. Misalnya akan membuat data jumlah peserta yang tidak lulus ujian. Data ini diperoleh dari hasil pengurangan antara jumlah peserta dengan jumlah yang lulus. Adapun langkah-langkahnya adalah sebagai berikut: 1) Pilih menu Transform lalu klik Compute Variabel 2) Isi Target Variabel, misalnya jm_tdk_lls. Lihat Gambar 11 3) Buatlah ekspresi kondisi dalam kotak Numeric Expression. Dalam latihan ini jm_pes - jm_lulus 4) Klik Ok. Hasilnya perhitungannya dapat dilihat pada Gambar 12
(Gambar 11. Langkah Membuat Data Baru dengan Ekspresi Kondisi )
27 | P D S P
(Gambar 12. Hasil Menghitung Jumlah yang Tidak Lulus Ujian)
28 | P D S P
RECODE DATA
29 | P D S P
Recode Data Recode Data digunakan sebagai fungsi untuk mengkelompokkan atau mengklasifikasikan data. Berikut beberapa contoh penggunaan Recode Data :
Pengelompokkan Data untuk pembuatan Data Nasional = 00, Data Provinsi = 1 dan Data Kabupaten/Kota = 2. Langkah – Langkah : 1. Jalankan program SPSS dan import data yang diinginkan. 2. Pada Recode Data ada 2 perintah : a. Recode Into Same Variables, maksudnya hasil perubahan akan di overwrite variabel yang direcode. b. Recode Into Different Variables, maksudnya hasil perubahan akan ditempatkan di variabel yang baru. 3. Klik Transform → Compute Variables
30 | P D S P
4. Kemudian ketikkan Target Labels = NEW_CODE dan numeric expression = 0
5. Kemudian untuk melakukan Recode Data dengan variabel yang sama, pilih menu Transform dari menu bar, kemudian pilih Recode Same Variables
31 | P D S P
6. Pilihlah Variabel yang akan direcode, misalkan : NEW_CODE.
7. Untuk menentukan Data Provinsi, misalkan : Provinsi DKI Jakarta. Pilih IF, kemudian akan tampil kotak dialog seperti ini, kemudian pilih Include If Case Satistfies Condition.
32 | P D S P
8. Pilih nm_prop, kemudian ketikkan : DKI (Pastikan sesuai dengan yang ada pada data), kemudian Continue.
9. Akan kembali muncul kotak dialog seperti pada langkah 8, kemudian pilih Old and New Values. Sehingga akan tampil kotak dialog seperti berikut ini, kemudian masukkan Old Value = 0 dan New Value = 1, kemudian Add.
33 | P D S P
10. Kemudian Continue, lalu OK.
11. Sehingga akan tampil pada Data View seperti berikut.
34 | P D S P
12. Untuk menentukan Data Kabupaten/Kota, misalkan : Kota Jakarta Selatan. Pilih Transform →Recode into Same Variables. Pilih IF, kemudian akan tampil kotak dialog seperti ini, kemudian pilih Include If Case Satistfies Condition.
13. Pilih nm_rayon, kemudian ketikkan : KOTA JAKARTA SELATAN (Pastikan sesuai dengan yang ada pada data), kemudian Continue.
35 | P D S P
14. Akan kembali muncul kotak dialog seperti pada langkah 8, kemudian pilih Old and New Values. Sehingga akan tampil kotak dialog seperti berikut ini, kemudian masukkan Old Value = 1 dan New Value = 2, kemudian Add.
15. Kemudian Continue, lalu OK.
36 | P D S P
16. Sehingga akan tampil pada Data View seperti berikut.
Untuk membuat pengelompokkan data berdasarkan Nilai Rata – Rata UN 2012 dengan kriteria (Range) sebagai berikut : Kriteria 1 : Nilai UN < 5 Kriteria 2 : Nilai UN antara 5 dan 6 Kriteria 3 : Nilai UN antara 6 dan 7 Kriteria 4 : Nilai UN antara 7 dan 8 Kriteria 5 : Nilai UN > 8 Langkah – Langkah :
37 | P D S P
1. Pilih Transform →Recode into Different Variables
2. Pilih Variable yang akan direcode, misalkan : MEAN_12. Pada Output Variable, Name : CODE_12, kemudian Change.
38 | P D S P
3. Untuk menentukan Range, pilih Old and New Values. Contoh : (1) Nilai UN < 5
2
1
3
Untuk menentukan Kriteria Nilai UN < 5, langkah - langkah : 1) Pada Range Lowest through value, kemudian isikan nilainya yaitu 5 (perhatikan lingkaran merah 1). 2) Nama Kriteria, pada kolom New Value ketikkan 1 sebagai Kriteria 1 (perhatikan lingkaran merah 2). 3) Pilih Add (perhatikan panah). 4. Sehingga akan kriteria akan tampil di kolom kanan (perhatikan lingkaran merah)
39 | P D S P
5. Untuk Kriteria 2 dengan Nilai UN = 5 – 6, langkah – langkah : 1) Pilih Range = 5 dan Trough = 6 (perhatikan lingkaran merah 1). 2) Nama Kriteria pada kolom New Value ketikkan 2 (perhatikan lingkaran merah 2). 3) Pilih Add (perhatikan panah)
2
1 3
6. Lakukan kembali langkah 5 untuk membuat Kriteria 3 untuk Nilai UN = 6 – 7 dan Kriteria 4 dengan Nilai UN = 7 – 8. 7. Untuk membuat Kriteria 5 dengan nilai UN > 8, langkah – langkah : 1) Pada Range Highest through value, kemudian isikan nilainya yaitu 8 (perhatikan lingkaran merah 1). 2) Nama Kriteria, pada kolom New Value ketikkan 5 sebagai Kriteria 5 (perhatikan lingkaran merah 2). 3) Pilih Add (perhatikan panah).
40 | P D S P
2
3
1
8. Setelah semua Kriteria dibuat (perhatikan lingkaran merah), kemudian pilih Continue (perhatikan tanda panah).
41 | P D S P
9. Muncul kotak dialog Recode into Different Variables, pilih OK.
10. Untuk menampilkan histogram, pilih Graphs → Legacy Dialogs → Histogram.
42 | P D S P
11. Akan tampil kotak dialog sebagai berikut, Variable dipilih CODE_12 berdasarkan hasil recode yang sudah dilakukan sebelumnya.
12. Sehingga tampilan grafik histogramnya sebagai berikut pada Output.
43 | P D S P
13. Untuk mengubah label, pilih Variable View. Kemudian pilih label yang akan diganti. Misalkan : CODE_12 → Values, Values = 1 dan Labels = < 5 kemudian Add. Lakukan yang sama untuk Kriteria 2, 3, 4 dan 5.
14. Setelah semua label terisi, kemudian OK.
44 | P D S P
15. Untuk melihat perubahan yang terjadi, Pilih Data View → Value Labels (perhatikan lingkaran merah). Kemudian perubahan akan terlihat pada Variables CODE_12 (perhatiakan kotak merah).
45 | P D S P