TKE 2403
SISTEM PENGOLAHAN ISYARAT
Kuliah 2 – Sinyal Acak
Indah Susilawati, S.T., M.Eng.
Program Studi Teknik Elektro Fakultas Teknik dan Ilmu Komputer Universitas Mercu Buana Yogyakarta 2009
1
KULIAH 2
SISTEM PENGOLAHAN ISYARAT SINYAL : SINYAL ACAK Pada pembahasan yang lalu telah dijelaskan bahwa jenis sinyal yang berlawanan dengan sinyal deterministik adalah sinyal acak (random). Untuk sinyal jenis acak ini maka nilai sinyal pada suatu saat tidak dapat diperkirakan. Hal dapat dipelajari pada jenis sinyal ini adalah probabiltas sinyal untuk mempunyai suatu nilai tertentu. Untuk kepentingan pembahasan sinyal acak, berikut akan di-review mengenasi konsep dasar probabilitas dan statistik.
Probabiltas : Definisi Dasar Probabilitas P(E) dari sebuah kejadian E yang terjadi pada suatu kejadian atau suatu eksperimen didefinisikan sebagai
P( E ) = N ( S ) lim it → ∞
N (E) N (S )
(12)
Dengan N(S) adalah jumlah kejadian atau eksperimen yang dilakukan dan N(E) adalah jumlah terjadinya kejadian E. Jelas bahwa 1 ≥ P(E) ≥ 0, jika P(E) = 1 maka hal itu manandakan bahwa kejadian E pasti terjadi. Sedangkan jika P(E) = 0 maka berarti kejadian E adalah tidak mungkin (impossible). Misalkan dengan melemparkan dadu yang ideal (bermuka 6), jika jumlah lemparan mendekati tak hingga maka muka nomor 6 dapat diharapkan muncul 1/6 kali jumlah lemparan, sehingga P(6) = 1/6. Jika dua kejadian E1 dan E2 dua kejadian yang terpisah (bersifat mutually exclusive) maka pada kedua kejadian tersebut berlaku,
2
P( E1 ∪ E 2 ) = P( E1 ) + P( E 2 )
(13)
Dimana simbol ∪ menyatakan operasi logika “OR”, sehingga P(E1 ∪ E2) adalah probabilitas terjadinya kejadian E1 atau E2. Jika dua kejadian E1 dan E2 adalah dua kejadian sebarang (bersifat tidak mutually exclusive) maka berlaku hubungan,
P( E1 ∪ E 2 ) = P( E1 ) + P( E 2 ) − P( E1 ∩ E 2 )
(14)
Dimana simbol ∩ menyatakan operasi logika “AND”. Jika satu himpunan kejadian yang bersifat mutually exclusive (E1 ... EN) adalah exhaustive dalam arti bahwa Ei pasti terjadi, maka menurut definisi di atas berlaku, P( E1 ∪ E 2 ∪ ... ∪ E N ) = P( E1 ) + P( E 2 ) + ... + P( E N ) = 1
(15)
Dengan demikian dalam sebuah pelemparan dadu berlaku, P(1) + P(2) + P(3) + P(4) + P(5) + P(6) =1
(16)
Dan jika dadu tersebut ideal maka semua muka mempunyai probabilitas kemunculan yang sama, yaitu P(1) = P(2) = P(3) = P(4) = P(5) = P(6) =1/6
(17)
Jika dua kejadian E1 dan E2 bersifat statistically independent (independen secara statistik) maka kejadian yang satu sama sekali tidak mempengaruhi kejadian yang lain. Dalam hal ini berlaku,
P( E1 ∩ E 2 ) = P( E1 ) × P( E 2 )
(18)
Variabel dan Distribusi Acak Hasil satu kali lemparan dadu sama sekali tidak dapat diperkirakan. Meskipun
demikian,
nilainya
mempunyai
probabilitas
yang
dapat
ditentukan. Variabel yang mempunyai tipe demikian disebut variabel acak (random). Untuk sebuah dadu maka variabel acaknya hanya dapat
3
mempunyai satu dari enam nilai yang ada; nilai tersebut diskret. Pada pembahasan yang berikut akan diuraikan varibel acak yang mempunyai nilai kontinyu. Bayangkan sebuah pesta dimana diadakan tebakan untuk tinggi badan tamu yang akan datang berikutnya, maka ini adalah sinyal acak yang kontinyu. Misalkan diasumsikan bahwa P(3m) = 0 dan P(0,1m) = 0. Dengan asumsi inipun masih ada sejumlah tak berhingga nilai yang mungkin sebagai keluaran. Berdasarkan persamaan (15) maka, P(h1) + P(h2) + ... + P(hi) + ... = 1
(19)
Sehingga dengan demikian maka probabilitas individual bernilai nol. Bagaimana metode statistik dapat diaplikasikan dalam hal semacam ini? Pada prakteknya, dapat dispesifikasikan sebuah jangkauan tinggi badan yang tertentu saja. Hal ini mengarah pada kebutuhan suatu struktur matematis, untuk variabel acak X dapat didefinisikan PDF (Probability Density Function) yaitu p(x) sebagai berikut. p(x) adalah probabilitas bahwa X mempunyai nilai diantara x dan x + dx Seperti apa gambaran p(x)? Dengan asumsi awal bahwa P(3m) = 0 dan P(0,1m) = 0, dapat diharapkan bahwa kemungkinan P(1,8m) akan bernilai maksimum. Jika anak-anak diperbolehkan masuk pesta maka nilai 60 cm di bawah maksimum akan lebih besar daripada nilai 60 cm di atas maksimum. Maka gambaran PDF-nya adalah sebagai berikut. Misalkan bahwa tebakan tinggi badan tamu adalah 1,75 ± 0,01. Berapa probabilitas bahwa tinggi badan tamu yang datang berada pada jangkauan tersebut? Analogi dari persamaan (13) adalah integral, sehingga dapat dinyatakan, 1, 76
P( X = x; 1,75 ≤ x ≤ 1,76) =
∫ p( x) dx
1, 74
4
(20)
Gambar 13. PDF untuk tebakan tinggi badan tamu pesta
Secara umum dapat dinyatakan, b
P( X = x; a ≤ x ≤ b) = ∫ p( x) dx
(21)
a
Secara geometris, nilai probabilitas ini dinyatakan dengan luas wilayah di bawah kurva PDF antara a dan b, perhatikan Gambar 14.
Gambar 14. Probabilitas nilai berada pada interval a dan b
5
Total wilayah di bawah kurva PDF harus sama dengan 1, sehingga dapat dinyatakan, ∞
∫ p( x) dx = 1
(22)
−∞
Perlu dicatat bahwa dalam hal ini disyaratkan p(x) Æ 0 saat x Æ ±∞.
Nilai Harapan (Expected Value) Misalkan setiap tamu yang mengikuti permainan dalam pesta di atas mengetahui PDF-nya. Bagaimana cara para tamu tersebut menggunakan informasi dari PDF untuk menghitung tebakan terbaik atau nilai harapan (expected value) dari variabel acak itu? Untuk
menyederhanakan
permasalahan,
misalkan
lemparan
sebuah dadu ideal (variabel acak diskret). Dalam kasus ini setiap keluarannya berpeluang sama (equally likely) dan menjadi agak samar untuk mendefinisikan mengenai nilai harapan untuk variabel acak tersebut. Misalkan sebuah dadu dilemparkan sebanyak Nc kali, berapakah nilai harapan dari jumlahannya? Nilai ini dapat dihitung sebagai berikut.
Nilai harapan dari jumlahan = N (1) × 1 + N (2) × 2 + N (3) × 3 + N (4) × 4 + N (5) × 5 + N (6) × 6 (23) Dengan N(i) adalah nilai harapan dari kejadian dengan nilai i sebagai keluaran. Jika Nc kecil, misalnya 12, maka fluktuasi statistik akan mempunyai pengaruh yang cukup besar. Jika Nc besar dan dadu yang digunakan ideal, maka berlaku
N (i) ≈ P(i) × N c
(24)
6
dan fluktuasi akan mempunyai pengaruh yang lebih kecil. Maka nilai harapan dari jumlahannya dapat dinyatakan sebagai, 6
E ( jumlahan dari N c lemparan dadu) = ∑ N c P(i ) i
(25)
i =1
dengan E merupakan notasi yang digunakan untuk menyatakan nilai harapan. Jika dadu hanya dilempar sebanyak satu kali, maka persamaan (25) menjadi 6
E (lemparan tunggal) = ∑ P(i ) i
(26)
i =1
Maka secara umum dapat dinyatakan,
E ( X ) = ∑ P ( X = xi ) xi
(27)
xi
Dimana variabel acak dapat mempunyai nilai diskret xi. Misalnya untuk dadu ideal, maka 1 1 1 1 1 1 ×1 + × 2 + × 3 + × 4 + × 5 + × 6 6 6 6 6 6 6 = 3,5
E (lemparan tunggal ) =
(28)
Persamaan (28) dapat ditulis kembali sebagai E (lemparan tunggal ) =
1+ 2 + 3 + 4 + 5 + 6 = 3,5 6
(29)
Dengan memperhatikan persamaan (29), maka dapat dikatakan bahwa nilai adalah rerata dari semua nilai variabel acak yang mungkin. Hal ini hanya berlaku jika semua keluaran mempunyai peluang yang sama. Namun nilai harapan sebuah variabel acak seringkali disebut sebagai rerata dan dinotasikan dengan x .
7
Generalisasi persamaan (27) untuk variabel acak kontinyu dinyatakan, ∞
X = E( X ) =
∫ x p( x) dx
(30)
−∞
dengan p(x) adalah PDF untuk variabel acak kontinyu X. Perlu dicatat bahwa nilai harapan dari sebuah variabel acak tidak sama dengan nilai maksimal PDF-nya. Nilai maksimum PDF disebut mode distribusi (mode of the distribution). Kembali ke permainan tebakan tinggi badan tamu. Jika seorang tamu datang dan kemudian diukur tinggi badannya maka pasti akan ada selisih dari nilai tebakannya (eror). Bagaimana ukuran untuk menentukan baik atau tidaknya nilai harapan atau rerata? Pada Gambar 15 diperlihatkan dua buah kurva PDF. Kurva yang pertama, nilai harapan (rerata) akan selalu menjadi tebakan bagus. Pada kurva yang kedua, rerata akan seringkali menjadi tebakan yang kurang bagus. Yang perlu diketahui adalah nilai harapan dari eror yang terjadi yaitu E(∈), dimana ∈= X − x , E (∈) = E ( X − x ) = E ( X ) − E ( x)
(31)
Hal ini juga berarti bahwa E ( X ) − E ( x) = x − x = 0
(32)
Dan persamaan tersebut menjadi kurang berguna. Untuk menjadikannya lebih bermanfaat adalah dengan menggunakan nilai harapan dari eror kuadrat yaitu E(∈2). Dalam hal ini akan didefinisikan nilai statistik yang disebut varians yang dinotasikan sebagai σ2 pada persamaan (33).
8
probabilitas
tinggi badan tamu
probabilitas
(a)
tinggi badan tamu
(b) Gambar 15. PDF dengan varians kecil(a) dan varians besar (b)
σ 2 = E (∈2 ) = E[( X − x ) 2 ]
(33)
Atau dapat dinyatakan
σ 2 = E (∈2 ) = E[( X − x) 2 ] 2
= E ( X 2 ) − E (2 x X ) + E ( x ) = E( X 2 ) − 2 x E( X ) + x = E( X 2 ) − 2 x x + x = E( X 2 ) − 2 x
2
9
2
2
(34)
Untuk kasus dimana variabel acak X mempunyai peluang yang sama maka persamaan (33) menjadi
1 σ = N 2
N
∑ (x i =1
i
− x) 2
(35)
Dengan xi adalah nilai-nilai yang mungkin untuk X dan i = 1, 2, ..., N. Dalam beberapa penerapan yang memerlukan analisis yang teliti maka penyebut pada persamaan (35) diganti dengan N – 1. Untuk kasus variabel acak kontinyu, maka varians dapat dinyatakan sebagai, ∞
σ = ∫ ( x − x) 2 p ( x) dx 2
(36)
−∞
Standar deviasi (standard deviation) didefinisikan sebagai akar kuadrat dari varians.
Distribusi Gaussian Distribusi Gaussian atau distribusi normal merupakan distribusi yang sangat penting. Salah satu sifat penting adalah bahwa rerata dan
probabilitas
varians-nya dapat diketahui secara pasti.
variabel acak
Gambar 16. Distribusi Gaussian N(0,1)
10
Distribusi Gaussian dinyatakan dengan persamaan berikut.
p ( x) =
1 2π σ 2
⎡ 1 ⎛ x − x ⎞2 ⎤ ⎟ ⎥ exp ⎢− ⎜⎜ ⎢ 2 ⎝ σ ⎟⎠ ⎥ ⎣ ⎦
(37)
Distribusi seperti pada persamaan (37) dinotasikan sebagai N ( x, σ ) , sebagai contoh pada Gambar 16 adalah N(0,1) yang berarti distribusi Gaussian dengan rerata nol dan standar deviasi 1. Pentingnya distribusi Gaussian juga dinyatakan dengan apa yang disebut Central Limit Theorem yang menyatakan bahwa jika Xi (dengan i=1, 2, ..., N) adalah N varriabel acak yang independen yang mungkin mempunyai distribusi yang berbeda, maka variabel acak jumlahannya yaitu XΣ XΣ = X1 + X2 + .... + XN
(38)
juga mempunyai distribusi Gaussian. Dalam pengolahan sinyal, jika terdapat banyak derau yang berasal dari sumber yang berbeda maka dapat diasumsikan bahwa derau totalnya adalah Gaussian.
Sinyal-Sinyal Acak Telah dibahas mengenai variabel acak. Lalu apa yang dimaksud dengan sinyal acak? Untuk hal ini maka diperlukan konsep mengenai proses stokastik (stochastic process). Ini adalah jenis variabel acak Xt yang memiliki parameter t (biasanya t adalah waktu). Parameter waktu ini dapat bersifat kontinyu t ∈ [0, T) atau diskret t ∈ {t1, t2, ..., tN}. Setiap variabel acak mengambil nilai dari distribusi peluang pt(x). Secara umum variabel acak pada saat t dapat bergantung pada nilai variabel acak pada saat sebelumnya, yaitu nilai x(t) pada t yang lebih kecil.
Namun
seringkali
Xt
dianggap
independen
terhadap
sebelumnya. Proses yang seperti ini disebut proses independen.
11
nilai
Pada umumnya setiap pt(x) dapat mempunyai distribusi yang berbeda. Untuk kasus dimana distribusinya sama, maka sequence yang seperti itu disebut terdistribusi identik (identically distributed). Proses stokastik yang terpenting adalah proses stokastik yang independen dan terdistribusi identik (independent and identically distributed) atau disingkat i.i.d. Untuk proses yang demikian maka hanya perlu ditentukan satu distribusi saja yaitu p(x). Hingga pembahsan ini maka sinyal acak dapat dibagi dua yaitu i.i.d dan non – i.i.d.
Gambar 17. Sinyal acak; i.i.d dan non – i.i.d Proses i.i.d yang terpenting adalah jika distribusinya Gaussian seperti dinyatakan pada persamaan (37), sehingga proses i.i.d dapat dibagi lagi menjadi i.i.d terdistribusi Gaussian dan i.i.d terdistribusi non – Gaussian.
Gambar 18. Sinyal i.i.d ; i.i.d Gaussian dan i.i.d non – Gaussian Pada Gambar 19 diperlihatkan contoh suatu sinyal acak terdistribusi Gaussian.
12
Gambar 19. Sebuah sinyal acak terdistribusi Gaussian
Karakterisasi Sinyal Acak Satu pertanyaan penting adalah bagaimana cara menentukan distribusi pt(x) atau distribusi p(x) sebuah sinyal acak. Dalam praktek biasanya hanya diperlukan nilai-nilai statistik tingkat rendah saja yaitu rerata dan varians. Misalkan ditanyakan bagaimana cara mendapatkan E[Xt] ? Untuk menjawab hal ini maka dapat dilakukan dengan membuat beberapa contoh proses yang dimulai pada kondisi awal yang sama x(i)(t) dengan i=1, 2, ..., Np, yang mungkin adalah satu himpunan dari Np eksperimen yang identik. Maka rerata variabel acak Xt dapat ditentukan sebagai,
1 E[ X t ] = Np
Np
∑x
(i )
(t )
i =1
(39)
Proses yang seperti ini disebut perataan ensembel (ensemble averaging). Masing-masing x(i)(t) disebut realisasi proses.
13
Jika prosesnya merupakan proses i.i.d, maka pt(x) adalah sama untuk semua t dan nilai statistiknya dapat diestimasikan dengan cara mererata sepanjang waktu tertentu. T
1 E[ X t ] = ∫ x p( x) dt T 0
(40)
Pada dasarnya sinyal dalam hal ini tidak harus i.i.d, namun jika suatu proses mempunyai perataan waktu (persamaan (40)) dan perataan ensemble (persamaan (39)) yang sama maka proses tersebut disebut proses ergodik (ergodic process). Dengan demikian sinyal i.i.d secara otomatis pasti ergodik. Jika sebuah sinyal mempunyai sifat statistik yang tidak berubah terhadap waktu maka sinyal tersebut disebut stasioner. Jika hanya rerata dan standar deviasi saja yang konstan maka disebut stasioner lemah (weakly stationary). Ada banyak hal yang dapat menyebabkan sebuah sinyal menjadi tidak stasioner, misalnya karena rerata atau varians-nya berubah. Perhatikan Gambar 20 dan Gambar 21.
Gambar 20. Sinyal non – stasioner dalam hal rerata
14
pergeseran
waktu
Gambar 21. Sinyal non – stasioner dalam hal varians
15