BAB II DASAR TEORI
2.1 Photogrammetry
Photogrammetry adalah suatu teknik yang digunakan untuk menentukan koordinat suatu titik pada ruang tiga dimensi yang berasal dari dua atau lebih gambar dua dimensi titik tersebut [5]. Ilustrasi metode photogrammetry dapat dilihat pada gambar 2-1.
Gambar 2-1
Photogrammetry proses [10].
Secara garis besar, Photogrammetry terbagi menjadi dua, yaitu: 1. Far range Photogrammetry. Photogrammetry yang jarak antara kamera dan objek sangat jauh. Teknik ini dikenal sebagai Aerial Photogrammetry. 2. Close range Photogrammetry. Photogrammetry dengan jarak antara kamera dan
objek
relatif
dekat.
Teknik
ini
dikenal
sebagai
Terrestrial
Photogrammetry. 2.1.1 Dasar-dasar Photogrammetry
Untuk memahami lebih jauh mengenai teknik Photogrammetry bekerja, perlu diketahui beberapa dasar teori yang mempunyai kaitan terhadap teknik ini.
2.1.1.1 Camera model
Kamera adalah alat yang berfungsi untuk memetakan gambar tiga dimensi menjadi gambar dua dimensi. Secara garis besar model kamera dibagi menjadi dua, yaitu
8
kamera dengan pusat proyeksi pada jarak berhingga (finite cameras) dan kamera dengan pusat proyeksi pada jarak tak terhingga (infinite cameras) [13]. Penjelasan mengenai camera model dibahas pada sub bab berikut ini. a. Finite camera
Model kamera yang paling sederhana dikenal dengan istilah pinhole model. Geometri dari pinhole model dapat dilihat pada gambar 2-2 di bawah ini. Berdasarkan gambar 2-2 dimana Z = f adalah jarak image plane terhadap pusat proyeksi (camera center) maka titik M ( X , Y , Z ) pada ruang tiga dimensi dipetakan T
oleh sebuah kamera menjadi titik m ( x, y ) pada image plane kamera tersebut. Titik m
tersebut merupakan titik potong antara image plane dan garis yang
menghubungkan pusat proyeksi dan posisi titik dalam ruang tiga dimensi [13].
Gambar 2-2
Geometri pinhole model.
Berdasarkan geometri pada gambar 2-2, pemetaaan posisi titik pada ruang tiga dimensi terhadap image plane dapat dirumuskan sebagai berikut [13]: T
Y⎞ T ⎛ X M ( X ,Y , Z ) = ⎜ f , f ⎟ Z⎠ ⎝ Z
(2.1.1)
persamaan diatas dapat juga dinyatakan dalam bentuk perkalian matriks, yaitu:
9
⎛X⎞ ⎛X⎞ ⎜ ⎟ ⎛ fX ⎞ ⎡ f 1 1 0⎤⎜ ⎟ ⎜Y ⎟ ⎜ ⎟ ⎢ ⎥⎜ Y ⎟ ⎜ Z ⎟ → ⎜ fY ⎟ = ⎢ 1 f 1 0⎥⎜ Z ⎟ ⎜ ⎟ ⎜⎝ Z ⎟⎠ ⎢⎣ 1 1 f 0⎥⎦⎜ ⎟ ⎜1⎟ 123 1442443 ⎜⎝ 1 ⎟⎠ ⎝ ⎠ { x P
(2.1.2)
X
Matriks P disebut sebagai camera projection matrix. Sehingga persamaan tersebut dapat disederhanakan menjadi:
{ x} = [ P ]{ X }
(2.1.3)
Pergeseran principal point. Persamaan (2.1.1) mengasumsikan pusat koordinat
image plane pada gambar 2-2 terletak pada principal point. Akan tetapi, pada kenyataannya tidak demikian, seperti yang terlihat pada gambar 2-3, sehingga secara umum pemetaan suatu titik pada ruang tiga dimensi terhadap image plane dapat dituliskan sebagai berikut [13]: T
Y T ⎛ X ⎞ M ( X ,Y , Z ) = ⎜ f + px , f + p y ⎟ Z Z ⎝ ⎠
(2.1.4)
Y
P
y
X
x Gambar 2-3
Koordinat sistem image plane (x,y) dan koordinat sistem kamera (X,Y).
Seperti persamaan (2.1.1) dan (2.1.2), persamaan (2.1.4) dapat juga dinyatakan dalam bentuk matriks seperti di bawah ini, ⎛X⎞ ⎛X⎞ ⎜ ⎟ ⎛ fX + px ⎞ ⎡ f 1 px 0⎤⎜ ⎟ ⎟ ⎢ ⎜Y ⎟ ⎜ ⎥⎜ Y ⎟ fY p → + ⎜ ⎟ = ⎢ 1 f p y 0⎥ ⎜ ⎟ y ⎜Z ⎟ Z ⎜ ⎟ ⎜⎝ Z ⎟⎠ ⎢⎣ 1 1 f 0⎥⎦⎜ ⎟ ⎜ 1 ⎟ 14243 1442443 ⎜ 1 ⎟ ⎝{⎠ ⎝ ⎠ x P
(2.1.5)
X
10
{ x} = K [ I | 0]{ X }
(2.1.6)
Dimana ( px , p y ) adalah koordinat principal point dan K adalah camera calibration T
matrix yang didefinisikan sebagai berikut, ⎡f K = ⎢⎢ 1 ⎢⎣ 1
px ⎤ p y ⎥⎥ f ⎥⎦
1 f 1
(2.1.7)
Rotasi dan Translasi. Suatu titik pada ruang tiga dimensi dapat dinyatakan dalam
dua sistem koordinat yang berbeda, yaitu sistem koordinat kamera dan sistem koordinat ruang. Kedua koordinat tersebut mempunyai hubungan rotasi dan translasi yang dapat diilustrasikan seperti tampak pada gambar 2-4 [13].
Gambar 2-4 Tranformasi antara sistem koordinat kamera dan sistem koordinat ruang 3D.
Bila X w adalah posisi suatu titik pada sistem koordinat ruang dan X adalah posisi
{ }
titik tersebut pada sistem koordinat kamera ( X = { X } ), relasi antara kedua koordinat tersebut dapat diekspresikan sebagai:
{ X } = [ R ]{ X
w
}
−C
(2.1.8)
C adalah posisi camera center pada sistem koordinat ruang. R adalah matriks rotasi yang mengorientasikan posisi sistem koordinat kamera terhadap sistem koordinat ruang. Persamaan ini secara umum dapat dituliskan seperti di bawah ini [13].
11
⎛ Xw ⎞ ⎡ R -RC ⎤ ⎜⎜ Yw ⎟⎟ ⎡ R -RC ⎤ =⎢ X =⎢ ⎥ ⎥ Xw 1 ⎦ ⎜ Zw ⎟ ⎣ 0 1 ⎦ ⎣0 ⎜ ⎟ ⎝ 1 ⎠
{ }
{ }
(2.1.9)
dengan menggabungkan persamaan (2.1.6) dan (2.1.9) akan didapat posisi suatu titik pada ruang tiga dimensi yang diproyeksikan pada image plane, yaitu:
{ x} = KR ⎡⎣ I|-C ⎤⎦ { X w }
(2.1.10)
Sehingga didapat matriks P (camera projection matrix) untuk persamaan (2.10) yang didefinisikan sebagai: P = KR ⎡⎣ I|-C ⎤⎦
(2.1.11)
X w adalah sistem koordinat ruang yang ditranformasi ke dalam sistem koordinat image plane menggunakan matriks P. Matriks P mempunyai 9 derajat kebebasan, 3 derajat kebebasan didapat masing-masing dari matriks K, R, dan C . Parameter yang terdapat pada matriks K disebut intrinsic parameter dan parameter yang terdapat pada matriks R dan C disebut extrinsic parameter [13]. Sensor kamera digital. Model pinhole camera mengasumsikan koordinat image
plane mempunyai skala yang sama pada arah x dan y. Pada sensor kamera digital yang berfungsi sebagai image plane, sensor tersebut mempunyai skala yang tidak sama, sehingga pixel pada sensor tersebut tidak berbentuk bujur sangkar. Bila koordinat gambar kemudian dinyatakan dalam bentuk pixel, bentuk sensor yang tidak bujur sangkar akan menyebabkan distorsi. Tranformasi dari koordinat ruang ke koordinat pixel dihasilkan dengan mengalikan matriks K pada persamaan (2.1.7) dengan suatu matriks tranformasi berikut ini: diag ( mx , m y ,1)
(2.1.12)
sehingga matriks K untuk kamera digital adalah sebagai berikut: ⎡α x s K = ⎢⎢ 1 α y ⎢⎣ 1 1
x0 ⎤ y0 ⎥⎥ 1 ⎥⎦
(2.1.13)
12
Dimana (mx , m y ) adalah jumlah pixel per satuan panjang pada sistem koordinat image plane. α x = mx f dan α y = m y f adalah focal length dalam dimensi pixel. Parameter x0 = mx px dan y0 = m y p y adalah principal point dalam dimensi pixel. s dikenal dengan istilah skew yaitu parameter yang disebabkan oleh bentuk sensor yang tidak persegi. Dari perumusan di atas, matriks P pada kamera digital mempunyai 11 derajat kebebasan [13].
b. Infinite Camera
Infinite camera didefinisikan sebagai kamera dengan camera center terletak pada jarak yang tak terhingga. Secara garis besar, model infinite camera diklasifikasikan menjadi dua jenis, yaitu affine cameras dan non-affine cameras. Pada sub bab ini hanya akan dibahas affine cameras karena model kamera ini marupakan salah satu bagian terpenting dalam photogrammetry. Affine camera adalah model infinite camera yang baris terakhir dari matriks P nya bernilai ( 0 0 0 1) . Untuk memahami tentang affine camera, akan digunakan penjelasan menggunakan gambar 2-5. Gambar tersebut mengilustrasikan pengambilan gambar dari jarak dekat (finite) yang divariasikan sampai jarak jauh (infitine) tanpa mengubah ukuran benda dengan cara memperbesar focal length selama perubahan jarak tersebut. Untuk menganalisis teknik ini, pertama-tama dilakukan analisis terhadap finite camera yang perumusannya (persamaan 2.1.11) dapat dituliskan dalam bentuk sebagai berikut:
13
Perspective Perspective
Gambar 2-5
Weak Perspective
Efek penambahan panjang fokus dan jarak kamera terhadap objek [13].
⎡ r1T − r1T C ⎤ ⎡ r1T ⎢ ⎥ ⎢ P0 =KR ⎣⎡ I|-C ⎦⎤ =K ⎢ r 2T − r 2T C ⎥ = K ⎢ r 2T ⎢ 3T ⎥ ⎢ r 3T 3T ⎢⎣ r − r C ⎥⎦ ⎢⎣
− r1T C ⎤ ⎥ − r 2T C ⎥ d 0 ⎥⎥ ⎦
(2.1.14)
dimana r iT adalah matriks rotasi yang disimbolkan sebagai matriks R pada persamaan (2.1.11). Principal axis dari kamera terletak pada vektor r 3 , sehingga − r 3T C = d 0 adalah jarak camera center terhadap pusat sistem koordinat ruang pada
arah principal axis. Apabila pusat kamera digerakkan menjauh dari objek sepanjang principal axis pada saat t (waktu), sehingga jarak camera center terhadap objek menjadi C − tr 3 , persamaan camera projection matriks pada saat t menjadi,
( ( (
) ) )
⎡ r1T − r1T C − tr 3 ⎤ ⎡ r1T ⎢ ⎥ ⎢ Pt =KR ⎡⎣ I|-C ⎤⎦ =K ⎢ r 2T − r 2T C − tr 3 ⎥ = K ⎢ r 2T ⎢ ⎥ ⎢ r 3T ⎢ 3T 3T 3 ⎥ ⎢⎣ r r C tr − − ⎢⎣ ⎥⎦
− r1T C ⎤ ⎥ − r 2T C ⎥ dt ⎥⎥ ⎦
(2.1.15)
dimana dt = − r 3T C + t yang didefinisikan sebagai kedalaman pusat koordinat ruang terhadap koordinat kamera pada arah z. Selain itu, terdapat pula pengaruh perbesaran focal length, k, terhadap matriks P yang disebabkan oleh penambahan focal length tanpa
mengubah
ukuran
benda.
Perbesaran
focal
length
oleh
faktor
14
k=
dt dirumuskan dengan mengalikan matriks K dengan diag (k d0
k 1) . Sehingga
pengaruh perubahan jarak camera center terhadap objek dan perbesaran focal length adalah, ⎡ dt ⎢d ⎢ 0 ⎢ Pt =K ⎢ ⎢ ⎢ ⎢ ⎣
dt d0
⎤ ⎡ ⎥ ⎡ r1T − r1T C − tr 3 ⎤ ⎢ r1T ⎥⎢ ⎥ ⎥ ⎢ 2T d t ⎢ 2T 2T 3 ⎥ − − = K⎢ r r r C tr ⎥⎢ ⎥ d0 ⎢ ⎥ ⎢ 3T 3T 3 ⎥ ⎢ r 3T dt 1⎥ ⎢⎣ r − r C − tr ⎥⎦ ⎢⎣ d 0 ⎥ ⎦
( ( (
) ) )
⎤ −r1T C ⎥ ⎥ − r 2T C ⎥ ⎥ d0 ⎥ ⎥⎦
(2.1.16)
apabila kamera digerakkan menjauh pada jarak yang tak terhingga (t → ∞ ) , matriks P menjadi
⎡ r1T ⎢ lim P∞ = t ⎯⎯ →∞ Pt =K ⎢ r 2T ⎢ 0 ⎢⎣
− r1T C ⎤ ⎥ − r 2T C ⎥ d 0 ⎥⎥ ⎦
(2.1.17)
Persamaan (2.1.17) di atas adalah persamaan (2.1.14) dengan baris terakhir bernilai
(0
0 0 1) [13].
2.1.1.2 Triangulation
Triangulation adalah penentuan koordinat suatu titik di dalam ruang tiga dimensi dari dua atau lebih gambar dua dimensi titik tersebut. Gambar 2-6 adalah ilustrasi proses triangulation. Gambar-gambar dua dimensi tersebut diambil menggunakan kamera yang telah terkalibrasi dan diketahui posisinya didalam ruang tiga dimensi [9].
15
Gambar 2-6
Ilustrasi proses triangulation [10].
Terdapat beberapa teori yang mendasari triangulation yang akan dibahas satu persatu dibawah ini.
a. Epipolar geometry
Epipolar geometry antara dua sudut pandang pada dasarnya adalah geometri yang memotong
image plane dari 2 buah kamera. Geometri tersebut dibentuk oleh
principal axis masing-masing kamera tersebut. Sebuah titik X pada suatu sistem koordinat ruang ditranformasikan ke dalam dua dimensi oleh kamera dari dua sudut pandang yang berbeda, menjadi titik x pada kamera 1 dan titik x' pada kamera 2. pada gambar 2-7 tampak bahwa sinar dari pusat kamera menujut titik x dan x' berpotongan di titik X dan membentuk satu bidang datar π .
Gambar 2-7
Korespondesi titik pada ruang 3D oleh dua kamera [13].
16
Diasumsikan hanya titik x yang diketahui dan bidang datar π hanya dapat dibentuk oleh garis sinar x - X dan baseline sehingga titik x' menjadi titik yang tidak diketahui pada garis perpotongan (garis l ' ) antara bidang datar π dan image plane kamera 2. Garis l ' adalah garis proyeksi dari garis sinar x - X terhadap image plane kamera 2. Garis ini yang disebut sebagai garis epipolar dari titik x . Dari penjelasan ini dapat dibuat beberapa definisi, antara lain: •
Epipolar titik, titik perpotongan antara baseline dengan image plane.
•
Epipolar plane, bidang datar yang mengandung baseline.
•
Epipolar line, perpotongan antara Epipolar plane dengan image plane.
Ilustrasi dari geometri Epipolar dapat dilihat pada gambar 2-8 di bawah ini.
Gambar 2-8
Epipolar geometry [13].
b. Fundamental matriks F
Matriks F adalah representasi aljabar dari geometri Epipolar. Dari pembahasan pada sub bab geometri Epipolar, Epipolar line dapat direpresentasikan sebagai x → l'
(2.1.18)
Gambar 2-9
Geometri matriks F [13].
17
Bidang datar π pada gambar 2-9 berada pada ruang tiga dimensi memotong camera center dari kedua kamera. Garis sinar pertama yang melalui camera center 1 dan titik x berakhir pada bidang π di titik X . Kemudian titik X diproyeksikan menuju titik x' yang terletak pada garis l ' . Langkah ini disebut dengan transformasi melalui bidang datar π (tranfer via the plane π ). Dari pernyataan ini dapat disimpulkan bahwa titik x dan x' adalah gambar dua dimensi dari titik X yang terletak pada ruang tiga dimensi. Apabila terdapat titik xi pada image plane 1 yang berkoresponsi dengan titik x'i pada image plane 2 melalui titik X i pada bidang datar π , maka akan terdapat 2D Homography H π antara xi dan x'i yang dirumuskan sebagai; x'i = H π xi
(2.1.19)
dan Epipolar line l ' yang melalui titik x' dan epipolar e' yang dapat dirumuskan sebagai, l ' = e ' × x ' = [ e ']x x '
(2.1.20)
Berdasarkan persamaan (2.1.19), maka persamaan (2.1.20) dapat ditulis sebagai berikut, l ' = [ e ']x H π x = Fx
(2.1.21)
F = [ e ']x H π disebut sebagai fundamental matrix F. Secara geometri, F adalah suatu
matriks yang memetakan proyeksi bidang datar P 2 pada image plane 1 menjadi epipolar line pada image plane 2 yang melalui epipolar e' [13].
c. Rekontruksi 3D
Metode untuk melakukan rekontruksi 3D dari dua gambar suatu benda yang dilihat dari dua sudut pandang yang berbeda adalah sebagai berikut: 1. Menghitung Fundamental matrix F dari titik-titik yang bersesuaian. 2. Menghitung camera projection matrix P dari matriks F.
18
3. Dari titik-titik yang bersesuaian xi ↔ x'i , dapat ditentukan posisi titik tersebut pada ruang 3D.
Fundamental matriks F
Gambar 2D
Ekstrinsic parameter (Orientasi kamera)
Camera projection matriks P
Intrinsic parameter (focal length, distorsi, principle titik, forma size)
Posisi pada ruang 3D Gambar 2-10
Diagram alir proses rekontruksi 3D.
2.1.1.3 Orientasi
Rekontruksi benda tiga dimensi yang berasal dari gambar dua dimensi benda tersebut membutuhkan orientasi dari koordinat kamera terhadap koordinat ruang tiga dimensi. Seperti tampak pada gambar 2-11.Terdapat dua jenis orientasi, yaitu inner orientation dan outer orientation. Hubungan antara koordinat gambar ( x, y ) dan koordinat ruang tiga dimensi
( X w , Yw , Z w ) dinyatakan
dengan persamaan berikut
[12]:
x − px = − f y − py = − f
r11 ( X w − X ) + r21 (Yw − Y ) + r31 ( Z w − Z ) r13 ( X w − X ) + r23 (Yw − Y ) + r33 ( Z w − Z ) r12 ( X w − X ) + r22 (Yw − Y ) + r32 ( Z w − Z ) r13 ( X w − X ) + r23 (Yw − Y ) + r33 ( Z w − Z )
(2.1.22)
(2.1.23)
Ketiga parameter tersebut termasuk dalam inner orientation/ internal parameter yang mendefinisikan posisi dari projection center relatif terhadap bidang gambar atau image plane (film/chip). rij adalah element dari matriks R (matriks orientasi akibat rotasi).
19
Gambar 2-11
Orientasi koordinat kamera terhadap koordinat ruang tiga dimensi [10].
2.2 Teknik rekontruksi dengan Photogrammetry
Terdapat beberapa teknik Photogrammetry yang dapat diterapkan tergantung terhadap ketersediaan kamera dan hasil yang diharapkan (dua dimensi atau tiga dimensi). Bila dilihat dari jumlah gambar yang digunakan untuk merekontruksi suatu benda, teknik Photogrammetry dibagi menjadi tiga bagian, yaitu:
a. Rekontruksi dari satu gambar
Teknik ini hanya berlaku untuk merekontruksi benda dua dimensi. Untuk mendapatkan hasil yang baik, benda yang akan direkontruksi harus bidang datar, dan karena hanya menggunakan satu gambar dua dimensi, gambar dua dimensi tersebut diambil dari arah tegak lurus benda [5].
b. Stereophotogrammetry
Metode ini dapat disebut juga Stereomatric camera, yaitu metode yang digunakan jika hanya terdapat satu kamera untuk mengambil dua gambar dua dimensi dari
20
suatu titik. Dua gambar dua dimensi dari benda yang akan direkontruksi dapat diambil dari dua posisi yang berbeda menggunakan satu kamera tersebut [5].
c. Rekontruksi dari beberapa gambar
Metode ini pada umumnya menggunakan lebih dari dua gambar untuk melakukan rekontruksi sebuah benda yang diambil dari beberapa sudut pandang yang dapat meliputi seluruh permukaan benda. Pada gambar-gambar tersebut minimal terdapat sebuah titik yang berada pada dua gambar. Gambar-gambar dua dimensi tersebut dapat dimbil menggunakan kamera yang berbeda (kamera SLR atau kamera autofocus) pada waktu yang berbeda pula, dengan syarat benda yang akan direkontruksi tetap diam (tidak bergerak) [5].
2.3 Kamera digital
Untuk memahami cara kerja kamera digital, perlu diketahui terlebih dahulu beberapa pengetahuan dasar yang berhubungan dengan kemera digital yang dijelaskan pada sub bab dibawah ini.
2.3.1 Prinsip-prinsip dasar kamera
Rekontruksi tiga dimensi menggunakan teknik photogrammetry dilakukan menggunakan perangkat sebagai alat untuk mengambil gambar dua dimensi dari benda yang akan direkontruksi. Dalam penelitian ini, perangkat tersebut adalah kamera digital. Oleh karena itu, perlu diketahui terlebih dahulu pengetahuan dan cara kerja kamera khususnya kamera digital. Dasar-dasar kamera digital sama dengan kamera pada umumnya yaitu posisi perspektif suatu objek di dalam ruang tiga dimensi (R3) M = ( X , Y , Z )
T
pada bidang (R2) m = ( x, y )T yang dapat dilihat
pada gambar 2-12 dan 2-13 berikut [14]:
21
Gambar 2-12
Ilustrasi penangkapan gambar oleh kamera digital [14].
Gambar 2-13
Model kamera perspektif [14].
Dengan menelaah lebih jauh gambar-gambar model kamera perspektif, maka gambar-gambar tersebut dapat dimodelkan dengan persamaan dasar sebagai berikut, x= f
X ; Z
y= f
Y Z
(2.3.1)
Persamaan (2.3.1) diatas sebagai dasar pembahasan lebih lanjut pada sub bab 2.1. Dalam pembahasan model kamera perspektif, terdapat beberapa istilah mengenai kamera, khususnya kamera digital yang perlu diketahui. Istilah-istilah tersebut adalah:
22
a. Focal length/ Panjang fokus
Focal length dapat didefinisikan sebagai jarak antara permukaan gambar atau image plane (dalam hal ini adalah film atau CCD/CMOS chip pada kamera digital) terhadap suatu titik pada lensa yang dilalui oleh semua berkas cahaya, titik tersebut adalah pusat kamera. Besaran focal length menunjukkan luas daerah yang dapat diambil oleh kamera. Semakin kecil focal length luas daerah yang dapat diambil semakin besar dengan jarak antara lensa dan benda tetap [4].
b. Zoom lens / Fixed lens
Zoom lens adalah sebuah lensa yang dapat merubah focal length. Pada saat ini, Kebanyakan kamera digital mempunyai Zoom lens. Akan tetapi pada kamera tertentu yang harganya relatif lebih mahal mampunyai mode Fixed lens sehingga kamera tersebut dapat menggunakan Zoom lens atau Fixed lens sesuai kebutuhan [4].
c. Format size
Format size adalah ukuran gambar digital dua dimensi dalam satuan millimeter. Ukuran tersebut bukan ukuran gambar dua dimensi yang telah dicetak [4].
e. Principal axis dan Principal point
Principal axis adalah garis yang berasal dari camera center tegak lurus terhadap image plane. Titik potong antara principal axis dan image plane disebut principal point [13].
f. Pixel
Pixel adalah elemen-elemen atau kode warna pembentuk gambar digital dua dimensi hasil dari pemotretan oleh kamera digital. Elemen-elemen tersebut disimpan dalam bentuk matriks. Ilustrasi dari pixel dapat dilihat pada gambar 2-15 [14]. Proses pengambilan gambar dua dimensi dari benda tiga dimensi menggunakan kamera merupakan tahapan yang sangat penting dalam Photogrammetry karena hasil akhir rekontruksi tiga dimensi dipengaruhi oleh kualitas gambar dua dimensi
23
tersebut. Terdapat dua aspek utama yang mempengaruhi hasil pengambilan gambar 2D, yaitu [10]:
a. Field of View
Field of View dari kamera adalah luas daerah dua dimensi yang dapat diambil oleh kamera. Field of View dipengaruhi oleh panjang fokus dari lensa dan ukuran format. Semakin besar format semakin besar pula field of View nya dan semakin kecil panjang fokus, semakin luas daerah daerah yang dapat diambil oleh kamera digital. Hubungan antara panjang fokus dan ukuran format terhadap field of view dapat dilihat pada gambar 2-14 di bawah ini [10].
Gambar 2-14
Ilustrasi Field of View pada sistem kamera digital [10].
b. Focusing
Focusing Menentukan ketajaman dari gambar dua dimensi. Rentang ketajaman gambar yang dihasilkan disebut depth of focus yang dipengaruhi oleh beberapa faktor, diantaranya adalah panjang fokus dari lensa, ukuran format, jarak antara kamera dengan benda uji, dan jumlah lensa.
2.3.2 Dasar-dasar gambar digital
Sistem pengambilan gambar secara digital terdiri atas 3 bagian, yaitu kamera yang terdiri atas optik dan sensor array, frame grabber, dan host computer seperti tampak pada gambar 2-15. Berkas cahaya sebagai input pada sistem kamera digital ditangkap oleh lensa dan diteruskan menuju image plane. Pada sistem kamera
24
digital, sensor array bertindak sebagai sensor. Terdapat berbagai tipe sensor array yang digunakan oleh kamera digital, antara lain CCD dan CMOS. Sensor array adalah sebuah bidang datar segiempat yang terbagi dalam N x M bidang segiempat yang peka terhadap intensitas cahaya. sensor array dapat mengubah energi cahaya menjadi tegangan listrik (sinyal elektrik) sebagai output yang disebut juga sebagai video signal. Sinyal elektrik tersebut diteruskan menuju frame grabber yang berfungsi mengubah sinyal elektrik dari tiap bidang tersebut menjadi sinyal digital dan menyimpannya dalam bentuk matriks seperti tampak pada gambar 2-16. Matriks tersebut dikenal juga dengan pixels. Setelah data sinyal digital disimpan di dalam memori, data tersebut dapat diproses lebih lanjut oleh host computer.
Gambar 2-15
Sistem pengambilan gambar secara digital [14].
Gambar digital (gambar 2-16 a) direpresentasikan sebagai matriks N x M yang tiap komponenennya (pixel) berisi kode digital sebagai representasi dari intensitas cahaya. Kode digital tersebut terdiri atas 256 kode atau dari angka 0 sampai 255 pada tiap level warna. Untuk warna hitam-putih (grey level) atau monochromatic 0 adalah kode warna hitam dan 255 adalah warna putih (gambar 2-16 b). Angka-angka antara 0 dan 255 adalah warna abu-abu dengan berbagai intensitas cahaya. Untuk gambar berwarna, dibutuhkan tiga level warna dasar yaitu merah, hijau, dan biru yang lebih dikenal dengan istilah RGB [14].
25
Gambar 2-16
(a). Gambar monochrome. (b). Kode penyimpanan warna monochrome dalam format digital [14].
2.3.3 Jenis kamera digital
Gambar dua dimensi hasil pemotretan suatu benda adalah gambar perspektif. Yang artinya, setiap garis sinar sebelum mengenai permukaan sensor selama pemotretan, terlebih dahulu melalui lensa yang secara metematika dianggap melalui suatu titik. Untuk menentukan posisi suatu titik dari gambar dua dimensinya, perlu dilakukan rekontruksi pada garis-garis sinar yang melalui titik tersebut. Oleh karena itu, internal geometri dari kamera yang digunakan harus diketahui terlebih dahulu. Berdasarkan penjelasan diatas, para ahli Photogrammetry membagi kamera digital menjadi tiga kategori, yaitu:
Kamera SLR (Single Lens Reflex)
Kamera SLR mempunyai banyak keunggulan, antara lain besar fokus dan panjang fokus dapat diatur sesuai keinginan, jenis kamera yang stabil dan internal geometrinya diketahui dengan sangat teliti serta distorsi pada lensa sangat rendah. Akan tetapi, harganya sangat mahal. Principal distance kamera ini konstan, artinya tidak terjadi perubahan posisi lensa pada waktu pengambilan gambar. Pada saat ini,
26
kamera SLR mempunyai ukuran format 23 x 23 milimeter. [5]. Contoh dari kamera SLR dapat dilihat pada gambar 2-17.
Gambar 2-17
Kamera SLR Canon EOS 30D sensor kamera CMOS [7].
Kamera autofocus
Geometri internal dari kamera autofocus tidak stabil dan tidak diketahui. Kamera jenis ini dapat juga dikalibrasi akan tetapi, ketelitiannya tidak akan sebaik kamera SLR karena panjang fokus dan besar fokusnya tidak dapat diatur sesuai dengan keinginan. Contoh dari kamera autofocus dapat dilihat pada gambar 2-18.
Gambar 2-18
Kamera autofocus Sony DSC-T20/S [8].
2.4 Kalibrasi kamera
Kalibrasi kamera adalah sebuah proses untuk menemukan parameter internal dari kamera yang digunakan untuk merekontruksi suatu benda. Parameter-parameter tersebut adalah focal length, format size, principal point, and lens distortion [4].
2.4.1 Parameter kamera
Rekontruksi 3D menggunakan metode Photogrammetry membutuhkan persamaanpersamaan yang menghubungkan koordinat suatu titik di dalam ruang tiga dimensi terhadap koordinat titik tersebut di atas bidang gambar (image plane) seperti
27
dijelaskan pada bab-bab sebelumnya. Akan tetapi proses rekontruksi tersebut menggunakan asumsi: •
Pusat koordinat kamera telah diketahui.
•
Koordinat dari principal point di atas image plane dapat ditentukan menggunakan pixel coordinate.
Dengan kata lain, parameter-parameter kamera yang digunakan telah diketahui. Untuk melakukan rekontruksi menggunakan Photogrammetry, perlu diketahui terlebih
dahulu
parameter-parameter
tersebut,
bukan
sebaliknya.
Untuk
memperkirakan besaran dari beberapa parameter tersebut dilakukan kalibrasi terhadap kamera yang akan digunakan [14]. Terdapat dua jenis parameter yang terdapat pada kamera, yaitu: 1. Intrinsic parameter: parameter yang menghubungkan antara koordinat pixel pada image plane terhadap koordinat kamera. Ilustrasi dari Intrinsic parameter dapat dilihat pada gambar 2-19. Untuk kamera perspektif, terdapat tiga karakteristik yang perlu untuk didefinisikan, yaitu: •
Panjang focus/ focal length, f
•
Transformasi antara referensi koordinat kamera dan koordinat pixel pada image plane yang terdiri atas format size dan principle point.
•
Distorsi geometri akibat lensa.
Gambar 2-19
Geometri intrinsic parameter [13].
Untuk mendapatkan parameter-parameter yang diilustrasikan pada gambar 2-19 tersebut, harus dilakukan transformasi antara koordinat kamera
28
( X C ,YC )
dan koordinat gambar pada image plane
(x, y )
menggunakan
persamaan: X C = −( x − O X )s X
(2.4.1)
YC = −( y − OY )sY
persamaan diatas mengasumsikan bidang pada sensor array berbentuk bujur sangkar dan mengabaikan adanya distorsi dari lensa.
(OX , OY )
(s
X
= koordinat image center dalam pixel yang disebut juga principal point.
, sy )
= ukuran efektif pixel dalam millimeter pada arah x dan y.
akan tetapi gambar yang dihasilkan oleh kamera mengalami distorsi terutama di bagian pinggir dari gambar dan disebabkan oleh beberapa hal seperti penggunaan field of view yang besar. Distorsi yang terjadi dapat dimodelkan secara sederhana dengan persamaan:
( y = y (1 + k r
) +k r )
x = xd 1 + k1r 2 + k2 r 4 d
1
2
4
(2.4.2)
2
(xd , yd ) adalah koordinat titik yang mengalami distorsi dan r 2 = xd2 + yd2
(2.4.3)
Principal point tidak mengalami distorsi dan distorsi akan semakin besar pada jarak yang semakin jauh dari principal point. k1 dan k2 adalah koefisien distorsi yang nilainya sangat kecil dan nilainya dapat diabaikan bila menggunakan kamera dengan ketelitian yang sangat tinggi. Distorsi yang terjadi dipengaruhi oleh kualitas lensa [14]. Dari pembahasan di atas, intrinsic parameter ditentukan oleh: •
Focal length (f)
•
Lokasi dari principal point ( x0 .y0 )
•
Ukuran efektif pixel (s x , s y )
•
Koefisien distorsi radial k1 dan k2
2. Extrinsic parameter: parameter yang mendifinisikan referensi koordinat kamera terhadap koordinat ruang tiga dimensi yang diilustrasikan pada
29
gambar 2-20. Paremeter ini didefinisikan oleh parameter geometri yang mentransformasikan antara referensi koordinat kamera yang belum diketahui terhadap referensi koordinat ruang tiga dimensi yang telah diketahui. Sehingga dibutuhkan dua matriks tranformasi, yaitu [14]: •
3D translation vector, T. Mendefinisikan posisi relatif antara kedua koordinat.
•
3 × 3 rotation matrix, R. Matriks orthogonal
( RR
T
=R T R=I ) yang
mentransformasikan sumbu-sumbu yang bersesuaian pada kedua koordinat berada pada satu garis lurus.
Gambar 2-20
Referensi koordinat kamera terhadap koordinat ruang tiga dimensi.
Mw adalah vektor posisi titik M terhadap koordinat ruang tiga dimensi dan Mc adalah vektor posisi titik M terhadap koordinat kamera. Persamaan (2.4.4) dan (2.4.5) menghubungan Mw dan Mc, dan telah dibahas lebih jauh pada sub bab 2.1. M C =R ( M W -T ) ⎡ r11 [ R ] = ⎢⎢ r21 ⎣⎢ r31
r12 r22 r32
(2.4.4) r13 ⎤ r23 ⎥⎥ r33 ⎦⎥
(2.4.5)
2.4.2 Metode kalibrasi
Terdapat dua metode kalibrasi yang sering digunakan, yaitu metode direct atau langsung dan metode proyeksi matriks [14].
30
Kalibrasi menggunakan metode Direct/ Langsung.
Titik M yang mempunyai koordinat dimensi dan
( X C , YC , ZC )T pada
( X W ,YW , ZW )T
sistem koordinat ruang tiga
sistem koordinat kamera yang belum diketahui
posisi dan orientasinya. Pusat proyeksi terletak pada pusat koordinat kamera dan sumbu Z dari koordinat kamera merupakan principal axis. Sehingga posisi titik M pada sistem koordinat kamera dapat dirumuskan sebagai: ⎡XC ⎤ ⎡ XW ⎤ ⎢ Y ⎥ = R⎢ Y ⎥ + T ⎢ C⎥ ⎢ W⎥ ⎢⎣ Z C ⎥⎦ ⎢⎣ ZW ⎥⎦
(2.4.6)
dengan mengasumsikan tidak terjadi distorsi, posisi titik M pada image plane dapat dirumuskan sebagai:
x=−
f XC + OX sX ZC
(2.4.7)
f XC x=− + OY sY Z C
Telah diketahui pada sub bab 2.4.1 bahwa persamaan di atas tergantung pada lima
intrinsic parameter yaitu f (focal length), sX dan
sY (ukuran pixel dalam arah
horizontal dan vertikal), dan OX dan OY (pusat koordinat gambar). Kelima parameter tersebut saling bergantung. Akan tetapi, bila didefinisikan
fX =
f s dan α = Y sX sX
(2.4.8)
akan didapat empat parameter yang tidak saling terikat, yaitu f, OX, OY, dan α
(aspect ratio). Dengan memasukkan persamaan (2.4.7) dan persamaan (2.4.8) ke dalam persamaan (2.4.6) akan didapat persamaan seperti di bawah ini:
x − oX = − f X
r11 X W + r21YW + r31 X Z + T X r13 X W + r23YW + r33 Z W + TZ
x − oY = − f Y
r11 X W + r21YW + r31 X Z + TY r13 X W + r23YW + r33 Z W + TZ
(2.4.9) (2.4.10)
Ide dasar metode kalibrasi ini adalah mengasumsikan image center ( OX , OY ) telah diketahui. Dengan diketahuinya image center, dapat diperkirakan besaran dari
31
parameter-parameter lainya f X , α , R, T dari N image titik sebagai proyeksi dari N
titik pada sistem koordinat ruang. Karena persamaan (2.4.9) dan (2.4.10) mempunyai pembagi yang sama, maka kedua persamaan tersebut dapat dituliskan sebagai berikut:
(
)
(
xi f Y r21 X iW + r22 YiW + r23 Z iW + TY = y i f X r11 X iW + r12 YiW + r13 Z iW + T X
)
(2.4.11) karena dari persamaan (2.4.8) α =
fX , maka persamaan (2.4.11) dapat ditulis fY
seperti persamaan (2.4.12) sebagai persamaan linier dengan 8 variabel yang tidak diketahui jika N ≥ 7 dan N titik tersebut tidak coplanar.
(
)
x i X iW v1 + xi YiW v 2 + x i Z iW v 3 + x i v 4 − y i X iW v 5 + y i YiW v 6 + y i Z iW v 7 + y i v8 = 0
(2.4.12)
Dimana
v1 = r21
v 5 = αr11
v 2 = r22
v 6 = αr12
v 3 = r23
v 7 = αr13
v 4 = TY
v 8 = αT X
Untuk N image titik, persamaan linier (2.4.12) dapat disingkat menjadi persamaan berikut
[ A] vi = 0
(2.4.13)
Dengan A adalah sebuah matriks yang dituliskan sebagai berikut, ⎡ x1 X 1W + x1Y1W + x1Z1W + x1 − y1 X 1W − y1Y1W − y1Z1W − y1 ⎤ ⎢ ⎥ W W W W W W ⎢ x2 X 2 + x2Y2 + x2 Z 2 + x2 − y2 X 2 − y2Y2 − y2 Z 2 − y2 ⎥ ⎢ ⎥ L [ A] = ⎢ ⎥ L ⎢ ⎥ ⎢ ⎥ L ⎢ ⎥ W W W W W W ⎢⎣ xN X N + xN YN + xN Z N + xN − yN X N − yN YN − y N Z N − y N ⎥⎦
(2.4.14)
32
Bila matriks A mempunyai Rank 7, dan persamaan
[ A] vi = 0
mempunyai solusi
nontrivial (mempunyai solusi yang unik sampai scale factor tertentu) yang dapat
diselesaikan dengan cara SVD (Singularity Value Decomposition) dari matriks A.
Kalibrasi menggunakan metode projection matrix.
Metode projection matrix terdiri atas dua tahap, yaitu: 1. Memperkirakan matriks transformasi (projection matrix) dari sistem koordinat ruang ke sistem koordinat gambar. 2. Menghitung parameter kamera yang mempunyai besaran sedekat mungkin dengan projection matrix. Hubungan antara posisi suatu titik di dalam sistem koordinat ruang (X iW , YiW , Z iW ) dan posisi titik di atas sistem koordinat image plane ( x, y ) yang dibahas pada sub bab 2 dapat dituliskan seperti persamaan (2.4.15) di bawah ini. ⎛ X iW ⎞ u ⎛ i⎞ ⎜ W ⎟ ⎜ ⎟ ⎜ Yi ⎟ ⎜ vi ⎟ = [ M ] ⎜ Z W ⎟ ⎜w ⎟ ⎜⎜ i ⎟⎟ ⎝ i⎠ ⎝ 1 ⎠
(2.4.15)
M adalah 3 x 4 projection matrix, dan nilai dari x dan y didefinisikan sebagai
berikut: x=
ui m X W + m12YiW + m13 Z iW + m14 = 11 iW wi m31 X i + m32YiW + m33 Z iW + m34
(2.4.16)
y=
vi m21 X iW + m22YiW + m23Z iW + m24 = wi m31 X iW + m32YiW + m33 Z iW + m34
(2.4.17)
Matriks M persamaan linier homogen dengan 11 variabel yang tidak saling terikat. Matriks ini memerlukan paling sedikit enam titik yang bersesuaian. Semakin banyak titik-titik yang bersesuaian, semakin banyak persamaan yang dapat dibentuk sehingga matriks M dapat dipecahkan menggunakan teknik least square. Jika diasumsikan terdapat N titik yang bersesuaian pada sistem persamaan linier, maka matriks M dapat dituliskan sebagai berikut:
33
[ A] m = 0
(2.4.18)
Dengan A adalah sebuah matriks yang dituliskan sebagai berikut, ⎡ X1 ⎢ 0 ⎢ ⎢ X2 ⎢ ⎢ 0 [ A] = ⎢ . ⎢ ⎢ . ⎢ . ⎢ ⎢XN ⎢ 0 ⎣
− x1Y1
− x1Z1
1 − y1 X 1 0 − x2 X 2 1 − y2 X 2 . . . . . . 0 − xN X N
− y1 X 1 − x2 X 2 − y2 X 2 . . . − xN X N
− y1 X 1 − x2 X 2 − y2 X 2 . . . − xN X N
1 − yN X N
− yN X N
− yN X N
Y1
Z1
1
0
0
0
0
0 Y2 0 . . . YN
0 Z2 0 . . . ZN
0 1 0 . . . 1
X1 0 X2 . . . 0
Y1 0 Y2 . . . 0
Z1 0 Z2 . . . 0
0
0
0
XN
YN
ZN
− x1 X 1
− x1 ⎤ − y1 ⎥⎥ − x2 ⎥ ⎥ − y2 ⎥ . ⎥ ⎥ . ⎥ . ⎥ ⎥ − xN ⎥ − yN ⎥⎦ (2.4.19)
Dan m = [ m11 , m12 ,L , m33 , m34 ]
(2.4.20)
Karena matriks A mempunyai Rank 11, vektor m dapat dapat dipecahkan menggunakan SVD (Singularity Value Decomposition).
34