Kuliah IV-VII Kompetensi: Mahasiswa mengenal beberapa paket program statistika dan matematika dan penggunaannya Materi: Pengenalan beberapa program statistika dan matematika: SPSS, Splus, Statgraphics, R, Statistica, Eviews, Shazam, Minitab, SAS, Stata, Lisrel, Resampling,, Matlab, Maple, dll.
JENIS-JENIS PAKET PROGRAM STATISTIKA DAN MATEMATIKA • Proprietary: -
SPSS SPLUS STATISTICA Minitab SAS EViews, Lisrel, Statgraphics Stata StatPlus SYSTAT
• GPL, freeware, Open Source: -
R GRETL Dataplot MacAnova XGoby Xlisp-Stat MANET
PROPRIETARY SOFTWARE • KELEBIHAN – UPDATE TERJAMIN
• KEKURANGAN – HARGA MAHAL
GPL • KELEBIHAN – HARGA MURAH (FREE)
• KEKURANGAN – UPDATE KURANG TERJAMIN (biasanya)
WXP1
SPSS • SPSS
(Statistical
Package
for
the
Social
Science) merupakan paket program statistika yang
cukup
komprehensif
dengan
menggunakan menu-menu yang user friendly. Selain itu, sebagai proprietary software, juga dilengkapi dengan dukungan pelayanan yang memadai.
Slide 5 WXP1
Silahkan dobel Klik untuk mengetahui lebih lanjut tentang SPSS Windows XP Professional, 2/1/2008
Kemampuan SPSS • SPSS memiliki banyak fungsi dan prosedur untuk statistika dan serta memiliki fleksibilitas dalam menangani data. SPSS dapat membaca data dalam berbagai format seperti numeric, alphanumeric, binary, dollar, tanggal dan waktu. Mulai versi 6, SPSS dapat membaca file yang dibuat dengan menggunakan software spread sheet/data base software. Selain itu SPSS dapat melakukan manipulasi data.
Kemampuan SPSS Beberapa kemampuan SPSS: • • • • • • • • • • •
Data transformations Data Examination Descriptive Statistics Contingency tables Reliability tests Correlation T-tests ANOVA MANOVA General Linear Model (Release 7.0 and higher) Regression
• • • • • • • • • • • •
Nonlinear Regression Logistic Regression Loglinear Regression Discriminant Analysis Factor Analysis Cluster anlaysis Multidimensional scaling Probit analysis Forecasting/Time Series Survival analysis Nonparametric analysis Graphics and graphical interface.
SPSS Windows SPSS memiliki 6 jenis windows yang berbeda, yaitu: 1. Data Editor 2. Output Navigator 3. Pivot Table Editor 4. Chart Editor 5. Text Output Editor 6. Syntax Editor
Data Editor • •
Data editor merupakan jendela yang pertamakali muncuk ketika SPSS dibuka Data Editor merupakan spreadsheet dimana kita mendefinisikan variabel dan memasukkan data. Setiap variabel dituliskan dalam kolom, sedang baris menyatakan nilai data untuk masing-masing variabel. Tampilan data editor:
Output Navigator • • •
Jendela Output Navigator menampilkan hasil perhitungan statistik, tabel, dan grafik hasil analisis yang kita lakukan. Output Navigator terbuka secara otomatis jika kita mengeksekusi suatu prosedur. Kita dapat melakukan editing, menghapus, atau mengkopi jendela Output Navigator
Text Output Editor • output Text yang tidak ada dalam suatu tabel dapat dimodifikasi dengan Text Output Editor. • Kita dapat mengedit output atau mengubah karakteristik font (type, style, color, size).
Pivot Table Editor •
Output ada dalam tabel pivot dapat dimodifikasi dengan beberapa cara dengan Pivot Table Editor.
•
Kita dapat mengedit text, menukar data baris dan kolom, menambah warna, membuat tabel multidimensi,menyembunyikan atau menunjukkan hasil sesuai yang kita inginkan Untuk mengetahui lebih jauh tentang jendelajendela yang ada dalam SPSS serta cara penggunaannya silahkan klik How to?
KEMAMPUAN SPSS YANG LAIN Selain kemampuan yang telah disebutkan di depan, SPSS juga memiliki kemampuan yang lain seperti: •
Penyusunan model regresi logistik multinomial, analisis runtun waktu, dan advanced model. Advanced Models yang terdiri dari: Multivariate and repeated measures general linear models Variance components analysis Linear mixed models Loglinear analysis, including model selection (hierarchical), general loglinear models, and logit loglinear models Ordinal regression analysis Survival analysis, including life tables, Kaplan-Meier survival analysis, and Cox regression
Tetapi untuk penyusunan model-model tersebut di atas perlu dilakukan penambahan file SPSS 12.0 Base (untuk SPSS 12)
SPLUS •
WXP2
S-PLUS dirancang oleh AT&T Bell Labs dengan menggunakan bahasa S yang merupakan object-oriented language.
•
S-PLUS dapat menangani data, functions, dan fitted models sebagai objects, sehinga membuat analisis data menjadi lebih fleksibel. Dengan fleksibilitas dari S-PLUS kita dapat mencocokkan model dengan metode klasik atau modern.
Slide 14 WXP2
Silahkan dobel klik untuk mengetahui lebih jauh tentang SPlus Windows XP Professional, 2/1/2008
Kemampuan SPlus Beberapa kemampuan S-PLUS: • Statistical Inference: One and Two Sample Problems • Statistical Inference for Counts and Proportions • Cross-Classified Data and Contingency Tables • Regression and Smoothing • Generalized Linear Model • Local Regression Model • Classification and Regression Trees • Univariate and Multivariate ANOVA • Principal Components Analysis • Factor Analysis • Cluster Analysis • Time Series Analysis • Survival Analysis • Quality Control Charts • Mathematical Computing
Tampilan SPLUS
SPLUS 2000 •
SPLUS 2000 direlease oleh AT&T Bell Labs pada tahun 1999 dalam 2 versi:S-PLUS 2000 Professional dan S-PLUS 2000 Standard
•
Edition.
•
Persamaan: SPLUS 2000 Standard Edition dan keduanya sudah berbasis graphical user
•
Interface
•
Perbedaan: S-PLUS 2000 Professional memiliki Commands atau Script windows, Commands History dan access to libraries and modules sedang SPLUS 2000 Standard Edition Tidak memiliki.
•
S-PLUS 2000 memiliki jenis-jenis plot yang lengkap, compatible dengan Microsoft Officeuserinterface sehingga memberikan banyak kemudahan dalam manipulasi data, grafik dan statistik.
•
Dengan S-PLUS 2000 Professional kita dapat memprogram dengan S-PLUS programming language berbasis bahasa S yang dikembangkan Lucent Technologies. Dengan demikian kita dapat membuat functions sesuai kehendak kita (fleksibel).
R Software R didistribusikan secara bebas oleh R Project (the R Foundation) yang dapat berjalan di platform Windows 95 dan sesudahnya, Mac OS 8, 9, X, Linux dan Unix systems. Untuk memperoleh software R dapat diunduh di http://cran.r-project.org Banyak fungsi-fungsi tambahan yang dibuat oleh kontributor lainnya seperti Thomas Lumley (Department of Biostatistics, University of Washington). Software R memiliki banyak kesamaan dengan SPLUS. Functions ditulis dalam bahasa pemrograman S sehingga kode-kode yang dibuat dapat digunakan dalam SPLUS.
kemampuan R Beberapa Kemampuan R: •
Design untuk stratifikasi, Klustering, multistage sampling, unequal/weighted sampling probabilities,
•
Type estimasi dan analisis statistik: mean, quantiles, variance, tables, ratios, total.
•
generalised linear models (misal linear regression, logistic regression, Poisson models, dst.)
•
model hazards proporsional
•
post-stratifikasi dan ranking tests untuk asosiasi dalam tabel dua arah.
MENJALANKAN R • Dobel klik ikon R yang ada di desktop atau melalui start menu. Maka akan muncul tampilan:
R sebagai alat hitung • R dapat digunakan sebagai alat hitung dengan cara mengetikkan secara langsung diikuti dengan enter sehingga hasilnya ditampilkan. • Contoh: Perintah (command) dalam R > 12*(127/13)-sqrt(2001/5) [1] 97.22577 Hasil perhitungan
Vektor dan matriks R dapat menampilkan perhitungan data dalam bentuk vektor atau matriks. Contoh: > x=c(1,3,5,7,9) >x [1] 1 3 5 7 9 > y=c(12,15,19,24,30) >y [1] 12 15 19 24 30 > x+y [1] 13 18 24 31 39 > sd(x) [1] 3.162278 > var(x+y) [1] 106.5 X Y > z=c(x,y) >z [1] 1 3 5 7 9 12 15 19 24 30
> dim(z)<-c(2,5) >z [,1] [,2] [,3] [,4] [,5] [1,]
1
5
9 15 24
[2,]
3
7 12 19 30
> w=c(z,x^2,y^2,x*y) > dim(w)<-c(5,5) >w [,1] [,2] [,3] [,4] [,5] [1,]
1 12
1 144 12
[2,]
3 15
9 225 45
[3,]
5 19 25 361 95
[4,]
7 24 49 576 168
[5,]
9 30 81 900 270
X Y X^2 Y^2 X*Y
win.graph() > x=0:20 plot(x,dbinom(x,size= 20,prob=0.3),type= "o",lwd=4)
0.15 0.10 0.05 0.00
• R dapat digunakan untuk menampilkan beberapa distribusi probabilitas dengan mudah. • Contoh
dbinom(x, size = 20, prob = 0.3)
Distribusi probabilitas
0
5
10 x
15
20
Plot distribusi binomial dengan n=20 dan p=0.3
Plot distribusi normal mean berbeda variansi sama Plot dua distribusi normal dengan mean berbeda variansi sama
0.4
0.5
Kode untuk membuat plot distribusi normal (sebelah kanan):
> win.graph()
m=c(0,0.5))
0.3 0.2
>plot(x,dnorm(x,5,1),type="l",lty=1,lwd=2,yli
dnorm(x, 5, 1)
> x=seq(-1,10,length=1000)
mean berbeda variansi sama")
0.0
> title("Plot dua distribusi normal dengan
0.1
> lines(x,dnorm(x,3,1),type="l",lty=4,lwd=2)
0
2
4
6 x
8
10
Plot distribusi normal mean sama variansi berbeda Plot distribusi normal dengan mean sama variansi berbeda
0.4 0.2 0.0
> x=seq(-5,5,length=1000) > plot(x,dnorm(x,0,0.5),type="l",lty=4, lwd=2) > lines(x,dnorm(x,0,1),type="l",lty=3, lwd=2) > lines(x,dnorm(x,0,2),type="l",lty=2, lwd=2) > title("Plot distribusi normal dengan mean sama variansi berbeda")
dnorm(x, 0, 0.5)
0.6
0.8
Kode untuk membuat plot distribusi normal (sebelah kanan):
-4
-2
0
2
4
PAKET FUNGSI DALAM R Semua fungsi dan basis data R disimpan dalam paket. Jika ingin digunakan maka paket harus dipanggil. Untuk melihat isi paket yang ada digunakan perintah: > library() Jika ingin memnggil paket tertentu, argumen dapat diisi, misal: > library(boot) Untuk melihat paket yang ada gunakan perintah: > search() Akan ditampilkan paket-paket yang tersedia: [1] ".GlobalEnv"
"package:boot"
[4] "package:stats"
"package:graphics" "package:grDevices"
[7] "package:utils"
"package:datasets" "Autoloads"
[10] "package:base"
"package:methods"
EViews Pada awalnya EViews digunakan dalam analisis data runtun waktu (time-series analysis). Dengan EViews kita dapat mengembangkan relasi statistik dari data kita dan menggunakan relasi tersebut untuk tujuan peramalan (forecasting). EViews dapat melakukan estimasi berbagai model time series seperti ARCH, GARCH, dan VAR. EViews juga dapat digunakan dalam analisis regresi dan analisis panel data. •
EViews memiliki platform Windows
Kemampuan EViews Beberapa Kemampuan EViews : • Single and Multiple Equation Estimation • Limited Dependent Variable Models: Binary, ordered, censored and truncated (Tobit), and count data • Vector Autoregression and Vector Error Correction Models • Pooled Time Series-Cross Section Data Analysis: Fixed and random effects models, balanced and unbalanced data sets • Seemingly Unrelated Regression • Time-varying Parameter • Multi-equation ARMA • Recursive Estimation Models • User-Defined Maximum Likelihood Estimation • Model Evaluation and Diagnostic Tests • Forecasting and Simulation • Data Management • Graph Generation
Statgraphics STATGRAPHICS merupakan software statistika yang bersifat proprietary. Namun demikian kita dapat menggunakan versi evaluation copy dengan cara mendownload di http://www.statgraphics.com yang berfungsi sama dengan versi lengkapnya. Jika kita menginginkan untuk terus menggunakannya, kita dapat melakukan aktivasi dengan membayar lisensinya. Jika tidak, maka versi evaluation copy otomatis akan tidak berfungsi setelah 30 hari. • Ketika pertama kali dibuka, maka kita akan diminta untuk memilih menu standar atau menu six sigma:
Menu Statgraphics • menu standar/klasik memiliki judul (heading): Plot, Describe, Compare, Relate, Forecast, SPC, dan DOE. • menu Six Sigma terdiri dari prosedur-prosedur: Define, Measure, Analyze, Improve,Control dan Forecast. • Meskipun demikian sebetulnya kedua menu tersebut memiliki prosedueda penataannya. • Jika kita ingin mengubah menu, dapat dilakukan dengan mengganti Preferences dari menu Edit dalam program, kemudian keluar (exit) dulu sebelum pilihan kita berlaku.
Jendela Utama STATGRAPHICS •
• • •
Ketika dibuka, jendela utama akan menampilkan dialog box yang berisi informasi tentang StatWizard yang membantu kita memilih analisis statgraphics yang akan kita lakukan: memasukkan data baru/mengimpor data dari sumber lain, membuat rancangan percobaan, penyusunan peta kendali statistika, rencana sampling, atau melakukan analisis yang tidak memerlukan data. StatWizard ini didesain untuk membantu pengguna untuk membuat data file dan menganalisisnya. Kita dapat mengikuti petunjuk-petunjuk dalam StatWizard atau mengklik cancel jika tidak ingin mengikutinya. Jika kita tidak ingin StatWizard muncul ketika membuka STATGRAPHICS Centurion, kita dapat menghapus tanda centang (uncheck ) pada Show the StatWizard pada saat Startup sebelum meninggalkan dialog box.
Entry data dalam STATGRAPHICS •
Jika kita mengikuti StatWizard maka kita akan membuka file yang memuat data sensus penduduk Amerika tahun 2000.
•
Ketika membuka data dalam STATGRAPHICS Centurion datasheet tersebut, informasi tentang masing-masing state (negara bagian) ditempatkan dalam baris yang berbeda. Ada lima kolom yang berisi nama negara bagian dan data sensusnya.
•
Untuk memasukkan data seperti tersebut di atas dalam STATGRAPHICS Centurion, ada dua pilihan:
•
1. Mengetikkan data secara langsung ke dalam STATGRAPHICS Centurion DataBook, atau
•
2. memasukkan data ke program lain seperti Excel dan kemudian membaca atau mengcopynye ke dalam STATGRAPHICS Centurion.
•
Jika menggunakan StatWizard, ketika muncul dialog box (“Enter New Data or Import It from an External Source”) , tekan OK
•
Selanjutnya kita dihadapkan pada sejumlah dialog box untuk mengidentifikasi informasi yang akan dimasukkan ke masingmasing kolom dalam datasheet:
•
Setiap kolom dalam STATGRAPHICS Centurion datasheet memuat nama (name), komentar (comment), dan tipe (type) data yang berkaitan;
•
Name– berilah masing-masing kolom sebuat nama yang terdiri dari 1 sampai 32 karakter. Nama ini digunakan oleh program untuk mengidentifikasi variabel-variabel yang akan dianalisis ketika prosedur statistik dipilih. Juga berfungsi sebagai label pada grafik yang dibuat. Nama boleh memuat karakter selain operator arithmetic, seperti + atau – tetapi tidak boleh diawali dengan numerik. Jika kita memberi nama dengan tidak benar, maka akan muncul pesan kesalahan dalam program
•
Comment – Tambahkan comment yang mengidentifikasi data dalam column. Comment adalah optional.
•
Type – menspesifikasi type data yang kan dimasukkan dalam kolom. Contoh tipe: Character, Numeric, Integer , Fixed Decimal.
•
Setelah mendefinisikan masing-masing kolom tekanlah OK. Jika kelima kolom telah selesai didefinisikan, tekanlah Cancel. Akhirnya akan ditampilkan suatu data sheet yang kosong untuk diisi.
Selanjutnya masukkan datanya dalam lembar kerja. Gunakan Tanda panah untuk berpindah sel.
Hasilnya adalah:
Untuk menyimpan file, pilih: File-Save_Save Data File dari menu utama dan ketikkan nama file yang diinginkan dalam kotak File nama:
Sebagai default dari tipe data adalah “.sf6” yang hanya dapat dibaca oleh statgraphics.
Membaca file data yang tersimpan • Setelah data dientrikan ke dalam data sheet, maka data siap dianalisis. • Sebagai contoh, data sensus di 50 negara bagian dan Distrik Columbia, yang telah disimpan dalam STATGRAPHICS Centurion dengan nama file census2000.sf6. • Untuk membuka data file, pilih File – Open – Open Data Source dari menu utama. Kemudian kita diminta menentukan lokasi data yang akan diakses:
• StatWizard didesain untuk membantu pengguna baru secara cepat membuat data file dan menganalisisnya. Kita dapat mengikuti instruksi dari StatWizard atau meng-Cancel nya. • Jika kita tidak ingin StatWizard muncul setiap kali membuka STATGRAPHICS Centurion, maka tanda centang pada “Show the StatWizard at Startup” dapat dihilangkan sebelum menutup dialog box. • Jika kita mengikuti StatWizard untuk memperoleh data file dari sensus di US tahun 2000, maka diperoleh data:
Memasukkan/Entry Data • Untuk melakukan analisis data dalam STATGRAPHICS Centurion, data harus disimpan dalam STATGRAPHICS DataBook. DataBook terdiri atas 10 datasheets, yang diberi nama dengan huruf A sampai J, yang masingmasing terdiri atas baris dan kolom:
• Dalam datasheet, setiap baris memuat informasi tentang sampel individu, kasus atau observasi, sedang kolom menyatakan variabelnya. • Sebagai contoh, data sensus US tahun 2000:
•
Ketika memasukkan data ini ke dalam STATGRAPHICS Centurion datasheet, informasi untuk masing-masing negara bagian akan ditempatkan dalam baris-baris yang berbeda. Akan disediakan lima kolom untuk menampung nama negara bagian dan data sensusnya.
•
Untuk memasukkan data tersebut ke dalam STATGRAPHICS Centurion, ada dua pilihan:
•
1.
mengetikkan data secara langsung dalam STATGRAPHICS Centurion databook
2.
Memasukkan data ke program lain seperti Excel kemudian mengcopikannya ke STATGRAPHICS Centurion.
Jika kita memilih cara pertama, ketika statWizard dialog box muncul, kita tekan OK pada saat muncul pertanyaan (“Enter New Data or Import It from an External Source”. Pad
Dialog box yang kedua, pilih untuk mengetikkan data dengan keyboard:
• Kemudian muncul dialog box untuk mengisi nama komentar dan tipe var:
SAS SAS (statistical analysis system) SAS pertama kali dikembangkan pada tahun 1960an di Department of Experimental Statistics,North Carolina State University. Kemudian didirikan the SAS Institute pada tahun 1976. yang bertujuan mengembangkan SAS sebagai software untuk manajemen dan analisis data. SAS System meliputi produk untuk: •
manajemen data base berukuran besar;
•
analisis statistik untuk time series;
•
analisis statistik untuk hampir semua problem dalam statistika klasik,
•
analisis multivariat,
•
model linear dan model linear diperumum (generalized linear models),
•
clustering;
•
visualisasi data;
•
Plotting
•
Sistem informasi geografi (geographic information system)
SAS System tersedia dalam platform PC dan UNIX, serta komputer mainframe.
•
Kita dapat menggunakan SAS untuk melakukan simulasi dengan bilangan acak (random number generators) untuk distribusi yang bermacam-macam. Manajemen basis data berukuran esar dapat dilakukan dengan mudah. Kita dapat mengambil sebagian (subset), menggabung (merge), dan menyusun kembali (rearrange), mentransformasi atau menggunakan teknik pencarian (queries) basis data dengan mudah. Program SAS ditulis dalam bahasa yang mirip dengan PL/1 atau C. Namun demikian pemakai SAS tidak perlu mempelajari bahasa pemrogramannya kecuali jika ingin melakukan transformasi khusus. Untuk mengoperasikannya cukup dengan point and click. Jika pengguna memerlukan untuk menulis program aplikasi yang menggunakan bahasa matrix tersedia SAS/IML yang memiliki kemampuan membuat program yang menggunakan matrik sebagai objek.
•
Untuk import dan export data menggunakan SAS/ACCESS . Dalam SAS, data dapat diimport dari hampir semua software spread sheet atau database.
•
analisis type data dalam SAS/STAT: –
Linear models (regression, analysis of variance, analysis of covariance),
– generalized linear models ( logistic regression dan Poisson regression), – multivariate methods (MANOVA, canonical correlation, discriminant analysis, factor analysis, clustering), – categorical data analysis (termasuk log-linear models), – Semua teknik standard untuk analysis statistik deskriptif dan konfirmasi. •
analysis statistik dapat dibuat interface dengan grafik yang menghasilkan plot yang relevan seperti q-q plots, residual plots, lain-lain. Untuk menangani grafik digunakan SAS/GRAPH.
•
Untuk melakukan analysis data runtun waktu (multiple time series dan linear systems of time series) digunakan SAS/ETS.
•
ARIMA models dan state space models serta Spectral analysis juga dapat dilakukan
•
Animasi 3-d plots, Box plots, scatterplot matrices, distribution plots
•
The SAS/GIS digunakan untuk pengolahan data geographic information system. Data Spatial dapat disimpan, dilink, dianalisis, and displayed dan ditampilkan dengan SAS/GIS.
•
SAS banyak digunakan sebagai software paket statistika standar industri yang mungkin memerlukan kemampuan yang jauh lebih tinggi daripada penggunaan di bidang akademik.
MINITAB •
MINITAB dibuat oleh Minitab Inc. yang didirikan 1980an.
•
MINITAB menyediakan tool-tool untuk menganalisis data dalam berbagai bidang dan digunakan di bidang scientists, business and industri.
•
Kemampuan MINITAB meliputi basic statistics, quality control, designed experiments, dll
•
MINITAB tersedia untuk komputer dengan platform Windows, DOS, Macintosh, OpenVMS, dan Unix.
•
Untuk penggunaan di bidang akademis dipakai MINITAB Student Edition
•
MINITAB mudah dipelajari dan digunakan karena tersedia menu Pull-down dan dialog box yang membimbing langkah demi langkah. Penggunaannya pun hanya dengan klik atau double-klik pada ikon programnya.
•
Data yang akan dientrikan dalam MINITAB dapat diimport langsung dari beberapa format seperti Lotus, Excel, Symphony, Quattro Pro, dan text (ASCII).
•
MINITAB macros disediakan untuk mengkustomasi. Tersdia juga statemen DO loops, IF THEN ELSE dan GOTO.
•
Beberapa kemampuan minitab dapat dilihat di sini
Tugas II • Tugas Kelompok Buatlah makalah yang membahas tentang perbandingan kinerja beberapa (minimal dua) software statistika. Tugas dikumpulkan selambat-lambatnya pada minggu ke enam. Presentasikan tugas yang anda buat di depan kelas (Minggu ke tujuh).