PENGANTAR SPSS Saptawati Bardosono
Pendahuluan Pada saat merancang usulan penelitian, maka pengolahan datanya sudah harus direncanakan pula: ١)
Teknik pengolahan data meliputi: editing, coding, entry dan cleaning serta analisis
٢)
Tabel, grafik atau ringkasan angka2 yang akan dihasilkan
Masalah yang sering timbul: Model analisis muncul setelah data terkumpul
Editing Dilakukan pemeriksaan seluruh kuesioner atau seluruh formulir isian setelah data terkumpul, apakah: ١)
Dapat dibaca
٢)
Semua pertanyaan terisi (lengkap)
٣)
Terdapat ketidakserasian antara jawaban yang satu dengan yang lainnya (konsisten)
٤)
Terdapat kesalahan2 lain yang dapat mengganggu pengolahan data selanjutnya (akurat)
Editing Kegiatan editing dapat dilakukan dengan cara: ١)
Editing lapangan, dimana supervisor mengadakan pengecekan ulang terhadap beberapa pertanyaan penting biasanya kepada 10% responden segera setelah data terkumpul semuanya
٢)
Editing menyeluruh, dilakukan secara menyeluruh terhadap jawaban responden, sehingga dapat diperoleh konsistensi jawaban
Editing Yang sering terjadi misalnya ١)
Jawaban tidak tepat dikolom yang tersedia
٢)
Salah menulis jawaban pertanyaan, misalnya data kelamin diisi di kolom jawaban umur
٣)
Umur diisi 25 tahun tetapi di jumlah anak diisi 10
٤)
Salah menggunakan unit ukuran
Koding Memberi angka2 atau kode2 tertentu yang telah disepakati terhadap jawaban2 pertanyaan dalam kuesioner, sehingga memudahkan pada saat memasukkan data ke komputer Misalnya untuk variabel pendidikan: ١)
Tidak sekolah
٢)
SD
٣)
SMP
٤)
SMA
٥)
PT
Koding Persyaratan dalam koding: ١)
Kesesuaian, variabel harus sesuai dengan tujuan
٢)
Klasifikasi, perlu dibuat kategorisasi untuk pengelompokkan jawaban sesuai rujukan/ alasan tertentu, misal: pendapatan
٣)
Jawaban tidak mendua, pilihan jawaban yang tersedia harus jelas definisi operasionalnya
٤)
Harus tersedia buku definisi variabel
Data Entry Menyiapkan lembar kerja yang berisi variabel2 dalam kuesioner secara lengkap (program SPSS, Stata, Epi-Info, dll) Masukkan data jawaban kuesioner sesuai kode yang telah ditentukan untuk masing-masing variable sehingga menjadi suatu data dasar Siapkan file khusus untuk menyimpan data dasar tersebut yang tidak boleh dianalisis. Untuk melakukan analisis data maka gunakan file khusus
Data Cleaning Merupakan analisis data awal, dimana dilakukan penggolongan, pengurutan dan penyederhanaan data, sehingga mudah dibaca dan diinterpretasi Untuk data nominal dan ordinal, dibuat tabulasi distribusi frekuensi untuk setiap variabel Untuk data interval/rasio, dianalisis nilai tengah dan tes normalitas datanya
Data Cleaning Tabel distribusi frekuensi untuk: ١)
Deskripsi ciri-ciri atau karakteristik dari suatu variabel
٢)
Mempelajari distribusi dari variabel pokok
٣)
Memilih klasifikasi2 pokok untuk tabulasi silang
Data Cleaning Tabel silang, yaitu teknik untuk membandingkan atau melihat hubungan antara dua variabel atau lebih: ١)
Dihitung persentase responden untuk setiap kelompok
٢)
Variabel bebas pada baris (faktor risiko)
٣)
Variabel terikat pada kolom (penyakit)
Selanjutnya, data siap dianalisis untuk membuktikan hipotesis penelitian dengan analisis statistik bivariat dan multivariat
SPSS (statistical program for social sciences)
Tampilan layar SPSS ada 2: Sebagai lembar kerja seperti Excel, dBase = data view Sebagai definisi operasional = variable view Dengan menu2 yang mudah dijalankan
Data view Variabel Variabel Variabel dst 1 2 dst
Variabel view Name
1
2
dst
Type
Width
Decimals Label
Values dst
Penggunaan SPSS Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Membantu data cleaning (analisis awal) Analisis statistik untuk membuktikan hipotesis Analisis statistik untuk penyajian data
Skala dan Sifat Data Sifat
Nominal (seks) +
Ordinal (pendidikan) +
Interval (suhu) +
Rasio (BB) +
Urutan susunan Jarak
-
+
+
+
-
-
+
+
Titik nol absolut
-
-
-
+
Klasifikasi
Cara penyajian data:
Data nominal/ordinal: distribusi frekuensi (proporsi) last education
Valid
SD SLTP SMU Akademi Perguruan Tinggi Total
Frequency 15 18 45 7 5 90
Percent 16.7 20.0 50.0 7.8 5.6 100.0
Valid Percent 16.7 20.0 50.0 7.8 5.6 100.0
Cumulative Percent 16.7 36.7 86.7 94.4 100.0
Cara penyajian data:
Data interval/rasio: Distribusi
normal: mean ± SD Distribusi tidak normal: median (min-maks)
Distribusi normal? 1.
Signifikansi KS >0,05
2.
Signifikansi SW >0,05
3.
Nilai kerampingan dan kemiringan
4.
Histogram dalam area kurva normal
Nilai kemiringan dan kerampingan Nilai kemiringan (skewness) dan nilai kerampingan (kurtosis) digunakan untuk menentukan distribusi normal/simetris dari data bergantung dari bentuk kurva distribusi data
Nilai kemiringan dan kerampingan Distribusi normal/ simetris
Miring (skew) ke kiri
Miring (skew) ke kanan
Nilai kemiringan dan kerampingan Contoh: Bila diketahui skewness -0,316 dan standard error skewness 0,254 maka rasio skewness = -0,316/0,254 = -1,244 Dengan kurtosis 0,284 dan standard error kurtosis 0,503 maka rasio kurtosis = 0,284/0,503 = 0,564 Sehingga rasio skewness dan kurtosis keduanya berada di antara interval angka -2 dan +2 atau distribusi data normal atau simetris
Histogram
Count
12
8
4
0 10.00
11.00
12.00
13.00
14.00
hemoglobin concentration after intervention
Histogram: Bentuk kurva simetris Mean = median = mode Kiri = kanan = 50%
Latihan Penggunaan SPSS 1. 2. 3. 4.
Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Membantu data cleaning (analisis awal) Analisis statistik untuk membuktikan hipotesis Analisis statistik untuk penyajian data
Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Data latihan: File – open – data – pilih file - open Lihat data view: jumlah kasus Lihat variabel view: jumlah variabel Buat code book variable: utilities – file info
Menyiapkan sarana untuk data entry: penyusunan lembar kerja Menyiapkan data dasar Data entry
Analisis data: data cleaning Uji normalitas data (KS, histogram) Analisis univariat (deskriptif, frekuensi, explore) Analisis bivariat (crosstab)
Analisis data: data cleaning Uji normalitas data: analyze – pilih descriptive statistics – pilih explore – masukkan variabel rasio dalam dependent list – pada pilihan display pilih plots – klik plots – pilih normality plots with test (non-aktifkan yang lainnya) – pilih continue – pilih OK. Perhatikan tampilan tabel test of normality dan grafik plot
Uji Kolmogorov-Smirnov (KS) dan Shapiro-Wilk (SW) Tests of Normality
Kolmogorova Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
hemoglobin concentration after intervention .047 90 .200* .987 90 .508
*. This is a lower bound of the true significance. a. Lilliefors Significance Correction
Analisis data: data cleaning Explore: Analyze – pilih descriptive statistics – pilih explore – dalam dependent list masukkan variabel rasio – pilih OK. Perhatikan outputs: descriptives
Descriptives hemoglobin concentration after intervention
Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis
Lower Bound Upper Bound
Statistic 12.2244 12.0166
Std. Error .10460
12.4323 12.2494 12.2000 .985 .99233 9.38 14.50 5.12 1.4250 -.316 .284
.254 .503
Analisis data: data cleaning Analisis bivariat (crosstab) Analyze – pilih descriptive statistics – pilih crosstab – pada row masukkan data kategorik variabel bebas – pada coulumn(s) masukkan data kategorik variabel terikat – pada display aktifkan clustered bar chart dan supressed tablespilih OK. Perhatikan outputnya
Analisis data: data cleaning 40
Analisis bivariat (crosstab)
30
20
working status 10
Count
Bekerja Tidak Bekerja/Ibu Ru 0
mah Tangga SD
SMU SLTP
last education
Perguruan Tinggi Akademi
Analisis data: untuk membuktikan hipotesis Analisis bivariat crosstab, korelasi, uji T dua sampel bebas dan berpasangan) Analisis multivariat (ANOVA)
Analisis data: untuk membuktikan hipotesis Analisis bivariat crosstab: Analyze – pilih crosstab – pada row masukkan variabel bebas – pada coulumn(s) masukkan variabel terikat – pilih statistics – aktifkan chi-square dan contengency coefficient – klik continue – OK. Perhatikan hasilnya.
research location * working status Crosstabulation Count
research location
working status Tidak Bekerja/Ibu Rumah Bekerja Tangga 3 42 26 19 29 61
Lembang Jakarta
Total
Total 45 45 90
Chi-Square Tests
Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
Value 26.914b 24.624 29.802 26.614
df 1 1 1 1
Asymp. Sig. (2-sided) .000 .000 .000
Exact Sig. (2-sided)
Exact Sig. (1-sided)
.000
.000
.000
90
a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 14.50.
Analisis data: untuk membuktikan hipotesis Korelasi: Analyze – pilih correlate – pilih bivariate – masukkan dua variabel numerik – pilih Pearson – pilih two tailed – aktifkan flag significant correlation – pilih option – aktifkan exclude case pairwise – OK. Perhatikan hasilnya
Analisis data: untuk membuktikan hipotesis Korelasi: Analyze – pilih correlate – pilih bivariate – masukkan dua variabel numerik – pilih Spearman – pilih two tailed – aktifkan flag significant correlation – pilih option – aktifkan exclude case pairwise – OK. Perhatikan hasilnya
Correlations
weight after intervention
height
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
weight after intervention 1 . 90 .457** .000 90
height .457** .000 90 1 . 90
**. Correlation is significant at the 0.01 level (2-tailed). Correlations
Spearman's rho
weight after intervention
height
Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N
**. Correlation is significant at the 0.01 level (2-tailed).
weight after intervention 1.000 . 90 .402** .000 90
height .402** .000 90 1.000 . 90
Analisis data: untuk membuktikan hipotesis Uji T dua sampel bebas: Analyze – pilih compare means – pilih independent samples t-test – pada test variable(s) pilih variabel numerik – pada grouping variable masukkan variabel 2 kategorik – pada define group masukkan 1 untuk group 1 dan 2 untuk group 2 – pilih continue – pada option aktifkan tingkat kepercayaan 95% dan exclude cases analysis by analysis – pilih continue dan OK. Perhatikan hasilnya
Group Statistics
hemoglobin concentration after intervention
working status Bekerja Tidak Bekerja/Ibu Rumah Tangga
29
Mean 11.8855
Std. Deviation .90385
Std. Error Mean .16784
61
12.3856
.99876
.12788
N
Independent Samples Test
Levene's Test for Equality of Variances t-test for Equality of Means
hemoglobin concentration after intervention Equal variances Equal variances assumed not assumed .557 .457 -2.287 -2.370 88 60.439 .025 .021
F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference
Lower Upper
-.5001
-.5001
.21869
.21100
-.93466 -.06545
-.92207 -.07805
Ranks hemoglobin concentration after intervention
working status Bekerja Tidak Bekerja/Ibu Rumah Tangga Total
N 29
Mean Rank 36.48
Sum of Ranks 1058.00
61
49.79
3037.00
90
Test Statisticsa
Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed)
hemoglobin concentration after intervention 623.000 1058.000 -2.259 .024
a. Grouping Variable: working status
Analisis data: untuk membuktikan hipotesis Uji T dua sampel berpasangan): Analyze – pilih compare means – pilih paired samples t-test – pada paired variable(s) masukkan variabel numerik sebelum intervensi dan variabel numerik sesudah intervensi - pada option aktifkan tingkat kepercayaan 95% dan exclude cases analysis by analysis – pilih continue dan OK. Perhatikan hasilnya
Paired Samples Statistics Mean Pair 1
hemoglobin concentration before intervention hemoglobin concentration after intervention
N
Std. Deviation
Std. Error Mean
12.5712
90
1.08891
.11478
12.2244
90
.99233
.10460
Paired Samples Test Pair 1
Paired Differences
Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference
t df Sig. (2-tailed)
hemoglobin concentration before intervention hemoglobin concentration after intervention .3468 .72686 .07662 Lower Upper
.1945 .4990 4.526 89 .000
Ranks N hemoglobin concentration after intervention hemoglobin concentration before intervention
Negative Ranks
a
65
Mean Rank 46.27
Sum of Ranks 3007.50
Positive Ranks
23b
39.50
908.50
Ties Total
2c 90
a. hemoglobin concentration after intervention < hemoglobin concentration before intervention Test Statisticsb b. hemoglobin concentration after intervention > hemoglobin concentration before intervention hemoglobin c. hemoglobin concentration after intervention =concentration hemoglobin concentration before intervention after
Z Asymp. Sig. (2-tailed)
intervention hemoglobin concentration before intervention -4.371a .000
a. Based on positive ranks. b. Wilcoxon Signed Ranks Test
Analisis data: untuk membuktikan hipotesis Analisis multivariat (ANOVA): Analyze – pilih compare means – pilih one-way anova – pada dependent list pilih variabel numerik – pada factor pilih variabel lebih 2 kategorik – pada option aktifkan descriptive dan homogeneity of variance – pilih continue – pada post-hoc pilih bonferroni – pilih continue dan OK. Perhatikan hasilnya
Descriptives hemoglobin concentration after intervention SD N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean
Lower Bound Upper Bound
Minimum Maximum
15 12.0080 1.17833 .30424 11.3555 12.6605 9.65 13.70
SLTP 18 12.8278 .97426 .22964 12.3433 13.3123 11.10 14.50
SMU 45 12.0773 .94923 .14150 11.7922 12.3625 9.38 13.70
Akademi 7 11.9571 .73905 .27933 11.2736 12.6406 11.00 13.40
Perguruan Tinggi 5 12.4000 .25495 .11402 12.0834 12.7166 12.20 12.80
ANOVA hemoglobin concentration after intervention
Between Groups Within Groups Total
Sum of Squares 8.883 78.757 87.640
df 4 85 89
Mean Square 2.221 .927
F 2.397
Sig. .057
Total 90 12.2244 .99233 .10460 12.0166 12.4323 9.38 14.50
Multiple Comparisons Dependent Variable: hemoglobin concentration after intervention LSD
(I) last education SD
SLTP
SMU
Akademi
Perguruan Tinggi
(J) last education SLTP SMU Akademi Perguruan Tinggi SD SMU Akademi Perguruan Tinggi SD SLTP Akademi Perguruan Tinggi SD SLTP SMU Perguruan Tinggi SD SLTP SMU Akademi
Mean Difference (I-J) Std. Error -.8198* .33652 -.0693 .28698 .0509 .44061 -.3920 .49707 .8198* .33652 .7504* .26845 .8706* .42877 .4278 .48661 .0693 .28698 -.7504* .26845 .1202 .39109 -.3227 .45376 -.0509 .44061 -.8706* .42877 -.1202 .39109 -.4429 .56363 .3920 .49707 -.4278 .48661 .3227 .45376 .4429 .56363
*. The mean difference is significant at the .05 level.
Sig. .017 .810 .908 .433 .017 .006 .045 .382 .810 .006 .759 .479 .908 .045 .759 .434 .433 .382 .479 .434
95% Confidence Interval Lower Bound Upper Bound -1.4889 -.1507 -.6399 .5013 -.8252 .9269 -1.3803 .5963 .1507 1.4889 .2167 1.2842 .0181 1.7231 -.5397 1.3953 -.5013 .6399 -1.2842 -.2167 -.6574 .8978 -1.2249 .5795 -.9269 .8252 -1.7231 -.0181 -.8978 .6574 -1.5635 .6778 -.5963 1.3803 -1.3953 .5397 -.5795 1.2249 -.6778 1.5635
Ranks hemoglobin concentration after intervention
last education SD SLTP SMU Akademi Perguruan Tinggi Total
N 15 18 45 7 5 90
Test Statisticsa,b
Chi-Square df Asymp. Sig.
hemoglobin concentration after intervention 7.841 4 .098
a. Kruskal Wallis Test b. Grouping Variable: last education
Mean Rank 41.70 59.78 41.93 35.50 51.60
Analisis data: untuk penyajian data Hasil analisis statistik Diagram batang (bar) Histogram Boxplot Scatterplot Pie chart dll
Bars show counts
60
Count
40
20
0 Bekerja
Tidak Bekerja/Ibu Rumah Tangga
working status
Count
12
8
4
0 10.00
11.00
12.00
13.00
14.00
hemoglobin concentration after intervention
hemoglobin concentration after intervention 14.00
13.00
12.00
11.00
10.00
Linear Regression
170.00
height
160.00
150.00
he ight = 141.89 + 0.23 * w e ight_2 R-Square = 0.21
40.00
50.00
60.00
70.00
80.00
weight after intervention
90.00
5.56% 7.78%
last education
16.67%
SD SLTP SMU Akademi Perguruan Tinggi Pies show percents 20.00%
50.00%