Universitas Gadjah Mada Fakultas Teknik Departemen Teknik Sipil dan Lingkungan
ANALISIS FREKUENSI Statistika dan Probabilitas
Regresi Linear 2
Tabel data
Grafik/kurva data yi = f(xi) 0.5 2.5 2 4 3.5
6 7
6 5.5
http://istiarto.staff.ugm.ac.id
Hubungan antara variabel pertama, x, dengan variabel kedua, y, yang merupakan fungsi variabel pertama, y = f(x).
8 6 y = f(x)
xi 1 2 3 4 5
4 2 0 0
1
2
3
4
5
6
7
X Analisis Frekuensi
18-Oct-16
Regresi Linear
Y
3
7 6 5 4 3 2 1 0
data
Kurva regresi merepresentasikan pola hubungan (tren, perilaku) variabel y terhadap x.
0
1
http://istiarto.staff.ugm.ac.id
2
3
4 X
5
6
7
regresi 8
Analisis Frekuensi
18-Oct-16
Sebaran Data 4
q
Situasi q q
Bagaimana kalau kita ingin mengetahui perilaku salah satu variabel itu sendiri? Misalnya: ingin mempelajari pola sebaran data X (X tentu saja adalah variabel random) Berilah contoh data X di bidang teknik sipil dan lingkungan.
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Temperatur Udara Harian Maksimum 5
Tahun
Temperatur [°C]
Tahun
Temperatur [°C]
Tahun
Temperatur [°C]
Tahun
Temperatur [°C]
1971
31.8
1981
30.7
1991
30.1
2001
32.1
1972
32.9
1982
32.3
1992
31.1
2002
29.1
1973
32.7
1983
31.8
1993
31.9
2003
31.5
1974
30.7
1984
32.8
1994
33.9
2004
32.4
1975
30.4
1985
31.9
1995
31.9
2005
30.7
1976
29.0
1986
31.4
1996
30.3
2006
29.9
1977
31.5
1987
31.1
1997
29.7
2007
33.8
1978
32.6
1988
30.7
1998
33.8
2008
30.0
1979
32.0
1989
32.7
1999
34.1
2009
33.9
1980
30.2
1990
31.4
2000
30.4
2010
29.6
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Temperatur Udara Harian Maksimum 6
35
Temperatur [oC]
34 33 32 31 30 29 28 1971 1974 1977 1980 1983 1986 1989 1992 1995 1998 2001 2004 2007 2010
Tahun http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Temperatur Udara Harian Maksimum 7
q
Pertanyaan q q q q
Apa nama instrumen untuk mengukur temperatur udara? Dapatkah kalian menceritakan cara data tersebut diperoleh? Dapatkah kalian mendeskripsikan data tersebut secara statistis? Bandingkan presentasi data dalam bentuk tabel dan grafik; yang manakah yang lebih baik?
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Distribusi Normal 8
pX(x)
N(μ,σ2)
pdf (probability density function)
(
pX ( x) = 2πσ
2
)
− 12
e
− 12 ( x−µ ) σ 2
+∞
luas =
∫ p ( x) dx = 1 X
−∞
−∞ μ−3σ
μ−2σ
http://istiarto.staff.ugm.ac.id
μ−σ
μ
μ+σ
μ+2σ
μ+3σ +∞
Analisis Frekuensi
18-Oct-16
X
Distribusi Normal 9
q
Jika X berdistribusi normal, N(µ,σ2), maka prob(X ≤ x) dapat dicari dengan: x
prob (X ≤ x ) = PX (x ) =
∫p
−∞
x
X
(t ) d t =
1 2 − 2
∫ (2πσ )
e
− 1 2 (t −µ ) σ 2
dt
−∞
luas di bawah kurva pdf (dari −∞ s.d. x) à cdf
cdf (cumulative distribution function) −∞ http://istiarto.staff.ugm.ac.id
x
+∞ Analisis Frekuensi
18-Oct-16
pdf - cdf 10
PX(x)
cdf
pX(x)
1
pdf
–∞ http://istiarto.staff.ugm.ac.id
µ
+∞ Analisis Frekuensi
0 18-Oct-16
Distribusi Normal Standar 11
pX(x)
ZX =
X −µ σ
−∞ μ−3σ μ−2σ −∞ −3 −2 http://istiarto.staff.ugm.ac.id
PX(x) 1
cdf
pdf
μ−σ −1
μ 0
μ+σ 1
μ+2σ 2
0
μ+3σ +∞ X +∞ Z 3
Analisis Frekuensi
18-Oct-16
Tabel Frekuensi 12
Rentang temperatur [°C]
Temperatur [°C]
frek
frek rel
28 −
29
28.5
1
0.025
29 −
30
29.5
5
0.125
30 −
31
30.5
9
0.225
31 −
32
31.5
12
0.300
32 −
33
32.5
8
0.200
33 −
34
33.5
4
0.100
34 −
35
34.5
1
0.025
40
1
Jumlah
Temperatur udara harian maksimum tahunan minimum maksimum rerata simp. baku
29.0°C 34.1°C 31.5°C 1.4°C
jika memakai MSExcel, gunakan fungsi =FREQUENCY(…,…) control+shift+enter http://istiarto.staff.ugm.ac.id
nilai median rentang temperatur
Analisis Frekuensi
18-Oct-16
Histogram Frekuensi 13
0.35
Frekuensi relatif
0.3 0.25 0.2 0.15 0.1 0.05 0 28 - 29
29 - 30
30 - 31
31 - 32
32 - 33
33 - 34
34 - 35
Temperatur [°C] http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Histogram Frekuensi 14
0.35
Frekuensi relatif
0.3 0.25 0.2 0.15 0.1 0.05 0 28 - 29
29 - 30
30 - 31
31 - 32
32 - 33
33 - 34
34 - 35
Temperatur [°C] http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Pengamatan vs Teoretik 15
q
Ekspektasi frek. relatif (frek. relatif teoretis menurut distribusi normal) q
klas ke-2: temperatur 29 – 30°C −1 2
30
fT (t = 29.5) = frek. relatif (dist. normal)
∫(
2πsT 2
29
)
e
−1 2(t−T )
2
sT 2
−1 2
30
dt =
∫(
29
2× π ×1.42
)
e
2
−1 2(t−32.1) 1.42
dt
% 30 − 31.5 ( % 29 − 31.5 ( = FT (30) − FT (29) = FZ ' * − FZ ' * & 1.4 ) & 1.4 ) = FZ (−1.0714) − FZ (−1.7857) = 0.1420 − 0.0371 = 0.1049
http://istiarto.staff.ugm.ac.id
baca di tabel distribusi normal standar
Analisis Frekuensi
18-Oct-16
Frekuensi Teoretik (Distribusi Normal) 16
Temperatur [°C]
z
FZ(z)
frek rel
28
−
29
28.5
-2.5000
−
-1.7857
0.0062
−
0.0371
0.0309
29
−
30
29.5
-1.7857
−
-1.0714
0.0371
−
0.1420
0.1049
30
−
31
30.5
-1.0714
−
-0.3571
0.1420
−
0.3605
0.2185
31
−
32
31.5
-0.3571
−
0.3571
0.3605
−
0.6395
0.2790
32
−
33
32.5
0.3571
−
1.0714
0.6395
−
0.8580
0.2185
33
−
34
33.5
1.0714
−
1.7857
0.8580
−
0.9629
0.1049
34
−
35
34.5
1.7857
−
2.5000
0.9629
−
0.9938
0.0309
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Pengamatan vs Teoretik 17
q
Cara lain untuk memperkirakan frekuensi relatif dalam suatu interval klas fT (ti ) = Δti ⋅ pT (ti ) dz p Z ( zi ) pT (ti ) = p Z ( zi ) = dt sT
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Pengamatan vs Teoretik 18
q
Cara lain (lanjutan…) i =2: Δti = 1°C 29.5 − 31.5 = −1.4286 1.4 p Z ( zi ) = p Z (−1.4286) = 0.1480
ti = 29.5 ⇒ zi =
pT (ti ) =
p Z ( zi ) sT
baca di tabel distribusi normal standar
$ 0.1480 ' =& ) = 0.1027 % 1.4 (
fT (ti ) = sT pT (ti ) = 1× 0.1027 = 0.1027 http://istiarto.staff.ugm.ac.id
frek. relatif teoretis (distribusi normal)
Analisis Frekuensi
18-Oct-16
Frekuensi Teoretik (Distribusi Normal) 19
Temperatur [°C]
z
pz(z)
pT(t)
frek rel
28
−
29
28.5
-2.1429
0.0402
0.0287
0.0287
29
−
30
29.5
-1.4286
0.1438
0.1027
0.1027
30
−
31
30.5
-0.7143
0.3091
0.2208
0.2208
31
−
32
31.5
0.0000
0.3989
0.2850
0.2850
32
−
33
32.5
0.7143
0.3091
0.2208
0.2208
33
−
34
33.5
1.4286
0.1438
0.1027
0.1027
34
−
35
34.5
2.1429
0.0402
0.0287
0.0287
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Kurva Pengamatan vs Kurva PDF Teoretis 20
0.35
PDF Distribusi Normal
Frekuensi relatif
0.3 0.25 0.2
Kurva data
0.15 0.1 0.05 0 28 - 29
29 - 30
30 - 31
31 - 32
32 - 33
33 - 34
34 - 35
Temperatur [°C] http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Frekuensi Kumulatif Pengamatan vs Teoretis 21
Pengamatan
Temperatur [°C]
Distribusi Normal
frek rel
frek rel kum
frek rel
frek rel kum
28
−
29
28.5
0.025
0.025
0.0287
0.0287
29
−
30
29.5
0.125
0.15
0.1027
0.1314
30
−
31
30.5
0.225
0.375
0.2208
0.3522
31
−
32
31.5
0.3
0.675
0.2850
0.6372
32
−
33
32.5
0.2
0.875
0.2208
0.8580
33
−
34
33.5
0.1
0.975
0.1027
0.9607
34
−
35
34.5
0.025
1
0.0287
0.9894
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Kurva Pengamatan vs Kurva CDF Teoretis 22
Frekuensi relatif
1.2
CDF Distribusi Normal
1 0.8 0.6 0.4 0.2 0 28 - 29
29 - 30
30 - 31
31 - 32
32 - 33
33 - 34
34 - 35
Temperatur [°C] http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Kurva CDF pada Kertas Khusus 23
q
Kurva CDF q q
Berupa garis lengkung. Ada satu cara tertentu yang memungkinkan kurva CDF berupa garis lurus, yaitu dengan melakukan transformasi koordinat. n
Ordinat: magnitud data. n
n
Absis: probabilitas, PX(x) atau kadang dituliskan pula dengan notasi prob(X < x). n
q
Skala dibuat sedemikian hingga kurva CDF distribusi normal berupa garis lurus.
Pada tempo doeloe, kertas grafik seperti di atas dibuat dulu à priori sebelum pemplotan data. n n
q
Skala biasa.
Kertas grafik seperti itu dikenal dengan nama kertas probabilitas. Pemplotan (penggambaran) data dilakukan pada kertas probabilitas tersebut.
Pada saat ini, langkah automatisasi dengan program aplikasi komputer dapat dilakukan sehingga kertas probabilitas dibuat bersama-sama dengan pemplotan data.
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Untuk memplotkan data pengamatan dan kurva CDF teoretis Dapat diunduh dari http://istiarto.staff.ugm.ac.id/
Kertas probabilitas distribusi normal 24
prob(X > x) atau 1 − PX(x) ordinat adalah magnitud data (skalar)
absis adalah probabilitas, prob(X < x) atau PX(x) à frekuensi relatif kumulatif skala dibuat sedemikian hingga CDF berupa garis lurus
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Plot Data pada Kertas Probabilitas 25
q
Data temperatur udara harian maksimum diplotkan pada kertas probabilitas. q
q
Urutkan data dari kecil ke besar, m = 1, 2, …, n m adalah nomor urut data, n adalah jumlah data. Posisi titik data pada kertas probabilitas adalah: n n
q
absis: m/(n+1), ordinat: magnitud data.
Cara penempatan titik data tersebut adalah cara Weibul. Ada beberapa cara yang lain, yang akan dikenalkan pada kuliah Hidrologi.
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Temperatur Udara Harian Maksimum (Data Urut) 26
m
m/(n+1) [%]
Temperatur [°C]
m
m/(n+1) [%]
Temperatur [°C]
m
m/(n+1) [%]
Temperatur [°C]
m
m/(n+1) [%]
Temperatur [°C]
1
2.44
29.0
11
26.83
30.4
21
51.22
31.5
31
75.61
32.6
2
4.88
29.1
12
29.27
30.7
22
53.66
31.8
32
78.05
32.7
3
7.32
29.6
13
31.71
30.7
23
56.10
31.8
33
80.49
32.7
4
9.76
29.7
14
34.15
30.7
24
58.54
31.9
34
82.93
32.8
5
12.20
29.9
15
36.59
30.7
25
60.98
31.9
35
85.37
32.9
6
14.63
30.0
16
39.02
31.1
26
63.41
31.9
36
87.80
33.8
7
17.07
30.1
17
41.46
31.1
27
65.85
32.0
37
90.24
33.8
8
19.51
30.2
18
43.90
31.4
28
68.29
32.1
38
92.68
33.9
9
21.95
30.3
19
46.34
31.4
29
70.73
32.3
39
95.12
33.9
10
24.39
30.4
20
48.78
31.5
30
73.17
32.4
40
97.56
34.1
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Plot Data pada Kertas Probabilitas 27
q
q
Data temperatur udara harian maksimum adalah time series data, data runtut waktu. Memperhatikan prosedur pemplotan data temperatur udara harian maksimum, yaitu data diurutkan, maka: q
q
q
diartikan bahwa data adalah seri data independent sehingga urut data terhadap waktu boleh tidak diperhatikan, data diurutkan dari kecil ke besar dan percentile rank setiap titik data dianggap merupakan nilai pendekatan probabilitas, prob(T < t).
Arti notasi prob(T < t) = a q q
probabilitas temperatur udara kurang daripada t°C adalah a contoh: prob(T < 32°C) = 0.64
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
28
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Plot Data pada Kertas Probabilitas 29
q
Kurva CDF distribusi normal (kurva cdf teoretis) q
Dapat dengan mudah digambarkan pada kertas probabilitas
q
Langkah n n
Tetapkan dua titik data, misal pada temperatur 29°C dan 34°C Hitung prob(T < 29°C) dan prob(T < 34°C) dengan menggunakan tabel distribusi normal standar " 29 − 31.5 % PT (29) = PZ $ ' = PZ (−1.7857) = 0.0371= 3.71% # 1.4 & " 34 − 31.5 % PT (34) = PZ $ ' = PZ (1.7857) = 0.9629 = 96.29% # 1.4 &
n
Tarik garis lurus yang melewati titik (3.71%,29°C) dan (96.29%,34°C)
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
30
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Uji Kesesuaian Sebaran Data terhadap Distribusi Normal 31
q
Dengan mencermati plot data temperatur dan garis CDF distribusi normal, tampak bahwa sebaran data temperatur tersebut mendekati CDF distribusi normal. q
q
Artinya, data temperatur udara harian maksimum tahunan tersebut berdistribusi normal.
Kesesuaian antara sebaran data dengan CDF distribusi normal perlu diuji q q
q q
Dikenal dengan istilah best fit test. Jenis uji, yang lazim dilakukan di bidang hidrologi, adalah uji Smirnov-Kolmogorov dan uji chi-kuadrat. Kedua jenis cara menguji kesesuaian tersebut akan dibahas pada kuliah Hidrologi. Pada kuliah Hidrologi, akan dikenalkan pula beberapa jenis distribusi teoretis selain distribusi normal.
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Tugas/PR 32
q
q
Rapikan hitungan dan plot data temperatur udara harian maksimum tahunan tersebut. Unduh data debit aliran dari weblog saya dan lakukan analisis frekuensi dengan langkah kerja seperti yang telah dibahas pada kuliah ini. q
q
q q
http://istiarto.staff.ugm.ac.id/index.php/kuliah/kuliah-sarjana-s1/statistika-danprobabilitas/ Nama fail: Data debit puncak Sungai XYZ.xlsx
Tugas/PR dikumpulkan di ruang saya atau di Sekretariat MTPBA. Saran q
Selain menghitung dan menyajikan data, berilah deskripsi tentang data dan interpretasi Saudara tentang data tersebut.
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Debit Puncak Tahunan Sungai XYZ 33
Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) 1 473 12 470 23 1110 34 687 45 843 56 871 2 544 13 663 24 717 35 801 46 450 57 705 3 872 14 809 25 961 36 323 47 284 58 777 4 657 15 800 26 925 37 431 48 460 59 442 5 915 16 523 27 341 38 770 49 804 60 206 6 535 17 580 28 690 39 536 50 550 61 850 7 678 18 672 29 734 40 708 51 729 62 829 8 700 19 115 30 991 41 894 52 712 63 887 9 669 20 461 31 792 42 626 53 468 64 602 10 347 21 524 32 626 43 1120 54 841 65 403 11 580 22 943 33 937 44 440 55 613 66 505
Data debit di atas berasal dari data debit rerata harian selama 66 tahun, yang kemudian dicuplik nilai maksimum pada setiap tahun.
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
Debit Puncak Tahunan Sungai XYZ 34
1200
Debit [m3/s]
1000 800 600 400 200 0
0
10
20
30
40
50
60
70
Tahun kehttp://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16
35
http://istiarto.staff.ugm.ac.id
Analisis Frekuensi
18-Oct-16