2. Eszközök 2.1. A digitális képhez kapcsolódó alapfogalmak A különféle digitális képalkotó eszközök hozzák létre a digitális képet, amit legegyszerűbben egy mátrix-szal reprezentálhatjuk. A digitális képek sajátossága, hogy több rétegből is állhatnak, ezért a matematikai megvalósítása több, egymásra tehető mátrix. A számítógépes világ nyelvén tömbnek szokás nevezni. A digitális kép elemeinek elnevezése az angol képelem (picture element) szavak összevonásából született: pixel (3. ábra a része). Rövidíteni pel-ként szokták. Fontos hangsúlyozni, hogy a földrajzi információs rendszerek (geographic information system – GIS) egyik tárolásfilozófiája raszteres, ahol a raszterelemek szinonímájaként a pixel szót is használják. Jelen könyvben az egyértelműség megtartásával kizárólag képek alapelemeként használom.
a) A kép, mint mátrix
b) A digitális kép koordinátarendszere c) Blokkok képzése a pixelekből 3. ábra A digitális kép alapfogalmai
5
A mátrixelemekben szereplő értékek elnevezése digitális szám (angol rövidítéssel DN) vagy szürkeségi (denzitás) érték. Űrfelvételek kapcsán az intenzitásérték elnevezés is használatos. A mátrixként tárolt digitális képhez néhány járulékos információra is szükség van. A mátrix méretét – sorainak és oszlopainak számát – a kép geometriai felbontása határozza meg. A geometriai felbontás a pixel méretéről tájékoztat valamely hosszúságegységben vagy annak származtatott mennyiségében. A szóba jöhető hosszegységek igen változatosak a fotogrammetriában használt mikrométertől a milliméteren, centiméteren és méteren át a meteorológia kilométeréig. A származtatott mértékegységek a hosszúságegység reciprokaként számíthatók. Míg a hosszúságegységekkel a pixel méretét adjuk meg (pl. 30 µm/pixel), addig a reciprok mennyiség a hosszegységre eső pixelszámot jelenti (a példát folytatva 1 pixel/30 µm = 0.033 pixel/µm). Ezek között a reciprok mennyiségek között a leggyakoribb a számítástechnikában is jól ismert dpi (dot per inch), ami az egy hüvelykre (25.4 mm) eső pixelszámot adja meg. Ritkán ppi-nek (pixel per inch) rövidítik. A digitális fotogrammetriai gyakorlatban továbbá használatos a ppmm (pixel per millimeter) és a dpmm (dot per millimeter) mértékegység is. A gyakran használt dpi és µm felbontások között a következő ökölszabályok alapján lehet gyorsan átszámolni: y[µm] =
25400 x[dpi ]
(1)
x[dpi ] =
25400 y[µm]
(2)
és
Néhány gyakran előforduló értéket az 1. táblázat tartalmaz. A digitális fotogrammetriában a finomabb felbontásokat használják. dpi µm µm dpi
300 84.7
400 63.5
60 423.3
30 846.7
600 42.3
800 31.8
15 1693.3
1200 21.2 7.5 3386.7
1600 15.9 7 3628.6
1. táblázat Néhány gyakran előforduló felbontásérték dpi-ben és µm-ben A pixelek a digitális képfeldolgozásban túlnyomórészt négyzet alakúak. Némely különleges esetben téglalap, igen ritkán háromszög vagy hatszög alakúak is lehetnek. A későbbiekben a képelemeket négyzeteknek tekintem. A digitális kép koordinátarendszerének kezdőpontja leggyakrabban a bal felső sarokban található. Ehhez képest adjuk meg valamely pixel helyzetét sorának és oszlopának azonosítójával (3. ábra b része). A kép pixeljeiből tárolási és adatkezelési szempontok miatt négyzetes blokkokat szoktak képezni (3. ábra c része). Ezek a blokkok 2 hatvány szerinti méretűek: 8×8, 64×64, 128×128 stb. Gyakran ezeket a blokkokat csempének (tile) hívják. Nagyobb 6
méretű képek megjelenítésekor vagy rosszul paraméterezett képtömörítésnél igen könnyen "tetten lehet érni" őket. A 4. ábrán különböző geometriai felbontással lehet ugyanazt a képet megnézni. A megjelenítéskor az egyre kisebb felbontás egyre homályosabban, darabosabban jelenik meg. Azt, hogy a képelem mátrixbeli helyére milyen számérték kerülhet, a képalkotó eszköz radiometriai felbontása határozza meg. E fogalom a digitális kép adott sávjában elméletileg előfordulható árnyalatok számát, másképpen a színmélységet vagy pixelmélységet adja meg. A képalkotó eszközök különös tulajdonsága, hogy a radiometriai felbontás mindig kettő hatványa szerint alakul. Ebből következően a tároláshoz szükséges bitek számát jelenti e felbontásérték. Mértékegységként is használják: bpp (bits per pixel). A 2. táblázat néhány előforduló értéket mutat be.
a) eredeti felbontás
b) az eredeti felbontás negyede
c) az eredeti felbontás nyolcada
d) az eredeti felbontás tizenhatoda
4. ábra Különböző geometriai felbontások összehasonlítása
7
bitek száma n 1 4 5 6 8 12 16 64
árnyalatok száma 2n 2 16 32 64 256 4096 65536 1.8 1019
2. táblázat Előforduló radiometriai értékek Az iménti értékek közül az egybites képek külön elnevezéssel rendelkeznek: bináris képek. Sok mérnöki alkalmazásnál elegendő ennyi árnyalat. Például gépészeti rajzot, vonalas térképeket kitűnően lehet binárisan szkennelni és kezelni. Bináris képek keletkezhetnek tónusos képek manipulációjával is. A leggyakoribb radiometriai felbontás a 8 bit vagyis a 256 árnyalat. Ekkor képpontonként 1 bájtra van szükség. A legtöbb képfeldolgozó szoftverben ez kötöttségként jelentkezik. A 4096 árnyalatot jelentő 12 bites felbontás a különböző szkennerek, digitális kamerák belső munkafelbontása, csupán a szoftverek felé rontják le a jobb felbontást. Használatuknak technológiai oka van: nagy mennyiségben olcsón lehet ilyen analóg-digitál (A/D) átalakítókat gyártani. Némely műholdrendszer 16 bites felbontást használ, s az amerikai űrkutatási szervezet, a NASA kísérletezett az óriási árnyalatszámot adó 64 bites felbontással. Az eltérő radiometriai felbontások az 5. ábrán hasonlíthatók össze. Különösen szembetűnők a különbségek a vonat füstjének árnyalataiban.
8
a) 64 színárnyalat
b) 16 színárnyalat
c) 8 színárnyalat
d) 4 színárnyalat
5. ábra Különböző radiometriai felbontású képek A digitális kép sávjainak (csatornáinak) számát a spektrális felbontás jellemzi. Azonban nem csupán a sávok száma, hanem azok spektrális kiterjedése is ide tartozik. Ha egy kamera csupán egyetlen, a látható fény hullámhossz-tartományában képes képet készíteni, akkor a berendezést monokrómnak, egyszínűnek vagy feketefehérnek tituláljuk. Ha ellenben 300 nm, 500 nm és 700 nm körüli hullámhosszakon rögzíti a képet, színes képet kapunk. A többsávos képalkotó eszközöket idegen szóval multispektrális képalkotóknak nevezzük. Ilyen például a későbbiekben részletesen tárgyalt LANDSAT TM, amelynek 7 (újabban 8) sávja van. Amennyiben a sávok száma nagy (30 fölött), a berendezést hiperspektrálisnak nevezzük. Erre példa a 224 sávval rendelkező AVIRIS (Airborne Visible Infrared Imaging Spectrometer). Az ennél is sokkal több sávval rendelkező – ma még csak jórészt tervezett – eszközöket ultraspektrális képalkotóknak nevezik. A digitális képek megjelenítésekor gyakran összemosódik a radiometriai és a spektrális felbontás. A színes képeket sokan 24 bites képeknek nevezik, mert a három független színösszetevő – a vörös (red R), a zöld (green G) és a kék (blue B) – mindegyikét 8 biten tároljuk. Az így elméletileg 8+8+8, összesen 24 biten sávonként 256 független árnyalattal elméletileg megközelítőleg 16.8 millió szín adható meg. Ezt a módot valódi színes (true color) megjelenítésnek hívjuk. A szkennerek és digitális kamerák összes lehetséges színárnyalatainak számát is könnyen ki lehet számítani. A háromsávos 10 bites eszközök megközelítőleg 1 milliárd, a 12 bites panorámakamerák több, mint 68 milliárd színt "látnak". (Az
9
emberi színlátás vizsgálatakor kiderült, hogy a képzett szem – például festők, grafikusok, textiltervezők – ezzel szemben csupán néhány ezer árnyalatot tudnak megkülönböztetni.) A számítástechnikában nem mindig használják a valódi színes módot, hanem csökkentett színfelbontást alkalmaznak. Viszonylag gyakori a sávonkénti 32 árnyalat használata, ekkor 25+5+5 a lehetséges tónusok száma. A keletkező 32768 színt tartalmazó üzemmód a Hi-color mód. Az ennél is kevesebb szín használatakor két megoldást lehet alkalmazni. Az egyik a színek indexelése, amikor egy táblázatban (colormap) tároljuk a színek összetevőinek értékét, a pixelek értékei pedig e táblázat valamely sorára mutató index. A színindexelés megoldását a 6. ábra szemlélteti.
6. ábra A színindexelés lényege A másik megoldás a színek számának "virtuális" növelése. Ekkor két tárolt színérték közötti árnyalatokat ún. patch-ek (magyarul folt) segítségével képzik a 7. ábra szerint. Ezzel a megoldással két színérték közé további hármat lehet létrehozni. A megoldás feltétele, hogy a képpontok megfelelően kicsik legyenek. A jó geometriai felbontású színes vagy fekete-fehér képeket ezzel a dithering-nek nevezett eljárással kis színfelbontással is jó minőségben lehet megjeleníteni.
7. ábra A dithering eljárás alapja 2 ×2-es patch-ek a fehér és a fekete szín között A dithering gyakrabban alkalmazott további módjai: • diffúziós (Floyd-Steinberg) dithering: véletlenszerűen elszórt pontok alkotják a képet (8. ábra a része) • minta (pattern) dithering: geometriai alakzatok, pl. háromszögek, négyzetek, körök segítségével jön létre a kép (8. ábra b része).
10
a) diffúziós dithering
b) minta-dithering
8. ábra Dithering-módok hatása Az utolsó felbontásfogalom az időbeli felbontás. Ez az érték adja meg, hogy mikor, milyen időközönként készülhet digitális kép az adott eszközzel. A mértékegysége a műholdak néhány napjától a digitális kamerák másodpercei között változik. A már említett LANDSAT TM 16 naponként kerül ugyanazon felszíndarab fölé; a Kodak DCS EOS 5 digitális kamerával 8 másodpercenként lehet egy képet készíteni. Gyakran a digitális képnek csupán egy részét kívánjuk feldolgozni. Ebben az esetben szükségtelen a számításigényes műveleteket elvégezni az egész képre, hanem ehelyett maszkolhatjuk a képet, ami csak a vizsgált részre korlátozza a feldolgozást. A maszkot gyakran érdeklődési területnek vagy régiónak is nevezik (Area of Interest – AOI, Region of Interest – ROI). Némelyik képfeldolgozó szoftver különbséget tesz a maszk és az AOI/ROI között. Az ERDAS Imagine például AOI-vel definiál az osztályozáshoz tanulóterületeket, míg a maszkolást a tényleges munkaterület lehatárolásra használja. A maszkolást kiválóan lehet használni a kép egyes részeinek eltérő mértékű vagy stílusú manipulációjára. Nagy fényességkülönbségek esetén például így eltérő módon lehet a nagyon világos és a nagyon sötét részek fényességét megváltoztatni. A maszk lehet szabályos (tipikusan négyzet, téglalap, kör esetleg ellipszis) vagy konvex illetve konkáv szabálytalan alakzat. Néha a maszkot pixelenkénti rámutatással is lehet definiálni. A komoly rendszerekben lehetőség van a maszkok tárolásása és visszatöltésére, módosítására, több maszk közötti logikai művelet kiértékelésére. Maszkolás hatását mutatja a 9. ábra.
11
9. ábra Képterület maszkolása (Landsat TM kép – Budapest) A többsávos képek megjelenítéséhez kompozit-képeket kell készíteni. A kompozitok lehetnek valódiszínesek, ha a képalkotó eszköz vörös sávját a vörös, kék sávját a kék s zöld csatornáját a zöld színösszetevőnek tekintjük és jelenítjük meg a képet. A LANDSAT TM esetén ez rendre a 3, 2 és 1 sávok hozzárendelését jelenti. Az összes ettől eltérő színleképezést hamisszínes kompozitnak nevezzük. Igen gyakran használják ezeket, a TM képeinek megjelenítésére gyakrabban választják a 4-3-2 sávösszetételt. A különböző összetételű kompozitoknak a képek értelmezésében van fontos szerepe. Így készítenek olyan kompozitokat is, amelyek sávjai nem az eredeti képsávok, hanem elemző-feldolgozó munkafolyamat eredménye. Az indexképek készítésekor gyakori a kompozitok használata. Fontos alapfogalom a kontraszt. Sajnos a képfeldolgozás szakirodalma nem egységes a fogalom definiálásában. A kontraszt definiálásának lehetőségeit a 3.1. fejezetben lehet látni.
12
2.2. A digitális kép létrehozása A digitális kép létrejöttét elméletileg négy részfolyamatra lehet bontani (10. ábra).
Valós világ f(x,y,z,t...) Leképezés
f'(x,y)
Mintavételezés
f''(k,l)
Kvantálás f'''(k,l) Digitális kép
10. ábra A digitális képalkotási folyamat függvényreprezentációja Az első lépésben a valós világ egy adott helyen, adott időben, adott látási viszonyok közötti részletét a képalkotó eszköz optikai rendszere leképezi. A leképezési folyamat a – sokdimenziós függvénynek is felfogható – valóságból kétdimenziós folytonos függvényt állít elő. Ennek az elméleti részfolyamatnak a szempontjából teljesen közömbös, hogy az elkészítendő digitális képet például "hagyományos" filmes vagy közvetlenül digitális fényképezőgéppel készítjük el. A filmre dolgozó hagyományos fényképezőgépek ugyanúgy optikai rendszerek, objektívek segítségével rögzítik a valóság egy részletét, csak a film által megtestesített kétdimenziós analóg függvény formájában. E lépés szerint tehát a szkennerek használata sem lóg ki a digitális képalkotás sorából. Ott legfeljebb a leképezési függvény válik összetettebbé: a fényképezőgép elvégzett vetítését módosítja a szkenner. A leképezés az optika törvényei alapján történik. Ennek részletezésére éppen ezért nem térek ki, kitűnő szakirodalomban lehet a témának utánanézni. Azt azonban fontos hangsúlyozni, hogy a digitális képfeldolgozás műveleteinek alkalmazásakor tudnunk kell a képalkotás leképezési menetét (pl. műholdas szenzorok képalkotásának ismerete szükséges a torzulások kiküszöböléséhez). A leképezés művelete a spektrális felbontás szerint meghatározott sávok szerint történik, tehát az egyetlen leképezési csatorna (fekete-fehér képalkotás) modelljét kiterjeszthetjük a sokcsatornás hiperspektrális eszközökre is. Mivel a digitális képfeldolgozás számítógépes technika, ezért a következő lépésekben a számítógép által olvasható/kezelhető formára alakítjuk a kapott kétdimenziós folytonos (analóg) képet. A következő lépésben, a mintavételezésben tekintsük a bemenő képet analóg jelnek. E jel nem más, mint a rögzítendő folytonos információhordozó. A mintavételezéskor
13
a folytonos síkbeli jel meghatározott pontjait választjuk ki. A kiválasztás diszkrét helyekre vonatkozik – a digitálissá alakítás első lépése tehát ez. Matematikailag f ′′ függvényt a következők szerint állítjuk elő f ′ -ből f ′′(k , l ) = f ′( x, y ) ⊗ t ( x, y )
(1)
ahol f ′( x, y ) a leképezéssel kapott kétdimenziós folytonos képfüggvény, ⊗ a konvolúció műveleti jele és t ( x, y ) a mintavételező függvény. Definíciója ideális esetben t ( x, y ) =
+∞
+∞
δ ( x − m ⋅ ∆x, y − n ⋅ ∆y )
(2)
m = −∞ n = −∞
ahol ∆x, ∆y a mintavételi pontok x ill. y irányú távolsága, δ pedig az ún. Dirac-delta. Segítségével az (1) egyenlet átírható: f ′′(k , l ) =
+∞
+∞
∑∑
+∞ +∞
lim
∫
∫ δ ( x − m ⋅ ∆x, y − n ⋅ ∆y) f ( x, y )dxdy
(3)
x → ∆x m = −∞ n = −∞ y → ∆y − ∞− ∞
Az (1)-ben jelzett összefüggés végrehajtásához szükséges, hogy f ′ képfüggvény stacionárius legyen, tehát a mintavételezés során elhanyagolható mértékben vagy egyáltalán ne változzék. A műveletek elvégzésével megkapjuk f ′′ mintavételezett függvényt: f ′′(k , l ) =
+∞
+∞
¦ ¦ f ′(m ⋅ ∆x, n ⋅ ∆y)
(4)
m = −∞ n = −∞
A mintavételezett f ′′ függvényt már csupán diszkrét helyeken értelmezett, ezért szerepel a k,l argumentum x,y helyett. Igen szemléletesen a mintavételezést a frekvenciatartományban is megadják. Ekkor x ill. y irányban 2π ∆x 2π ∆v = ∆y
(5)
∆u =
(6)
A mintavételezési frekvenciát a 11. ábra szemlélteti.
14
11. ábra A mintavételezési frekvencia jelentése Az itt nem bizonyított részletek alapján a mintavételezési frekvencia értéke akkor elfogadható, ha teljesül Nyquist feltétele1: ∆u π = 2 ∆x ∆v π vk < = 2 ∆y
(7)
uh <
(8)
ahol u h és v h határfrekvenciák. Amennyiben (7) és (8) teljesülnek, a mintavételezett kép frekvenciaspektruma átfedésmentes, ezért a digitális képből az analóg egyértelműen visszaállítható. A mintavételezési folyamatot bizonyos képfeldolgozási műveleteknél megismétlik: újramintavételeznek. Ennek alkalmazásáról, végrehajtási módjairól később részleteseb szólok. A mintavételezéssel előállított, egyféle módon már diszkrét jel további digitalizálása a kvantálás során következik be. Ekkor az adott pozícióhoz tartozó folytonos jelet alakítja át az eszköz digitálissá. A 12. ábráról leolvasható, hogyan történik ez a folyamat. Az ábrán látható egydimenziós kvantálás kiterjeszthető kétdimenzióra.
1
A szakirodalom a Nyquist-feltételt nevezi Shannon-féle elvnek is.
15
12. ábra A kvantálás elve A minimum és maximum értékek között sávokba sorolja be az eszköz a folytonos jelet s továbbítja azok azonosítóit, mint digitális értéket. Matematikailag a felosztást a következők szerint formulázhatjuk meg: f ′′′(k , l ) = q ( f ′′(k , l ))
(9)
ahol q a kvantálási függvény. A függvény által használt sávok szélessége lehet azonos, ez az egyenletes vagy egyenközű kvantálás. Amennyiben nem azonosak a sávszélességek, akkor a gyakorlatban alkalmazzák az eloszlásfüggő (tapered) felosztást. A gyakorlatban fontos tudni, hogy a kvantálás miként realizálódik. A szkennerek néhány kategóriájában például a gyári minimális és maximális fényintenzitási küszöb kalibráció révén módosítható. Ilyen jellegű változtatást azonban csak tényleg hozzáértőnek szabad elvégezni, ellenkező esetben az eszköz nem lesz képes használható információt szolgáltatni! A mintavételezéssel és kvantálással előállítottuk az analóg kétdimenziós képjel digitális reprezentációját. Az A/D (analóg-digitális) átalakítás együttes szemléltetésére a következő egydimenziós jel ábrája szolgál:
16
13. ábra Az egyidejű mintavételezés és kvantálás A mintavételezési függvény gyakorlati mérőszáma a geometriai felbontás vagyis hogy milyen sűrűséggel helyezkednek el az érzékelők az eszközben2. Ennek analógiájára a kvantálást a radiometriai felbontás jellemzi: hány diszkrét értékre osztja fel az eszköz a beeső fény folytonos intenzitását. 2.3. Képalkotás a gyakorlatban: a CCD Az előző fejezetben leírt elméleri képalkotási folyamatot a digitális eszközök érzékelői valósítják meg. Ezek az érzékelők többfélék lehetnek, közülük a leggyakoribb a CCD. A betűszó az angol Charge Coupled Device (töltés halmozott eszköz) kifejezés rövidítése. Sematikusan a CCD alapelem a következő funkcionális blokkokból áll:
2
Fontos ehhez hozzátenni, hogy a kereskedők a szkennerek geometriai felbontásánál jobban szeretik az beépített interpolációs algoritmus által szolgáltatott felbontást megadni, hiszen ez nagyobb szám. Egy 600 dpi-s optikai felbontású szkenner például a gyári interpoláció révén 1200 dpi-s képet is tud produkálni. Ezt a megnövelt felbontást persze könnyen ki lehet mutatni.
17
beérkezõ fénynyaláb
Fotocella
Kondenzátor
Shift regiszter
A/D átalakító
114
14. ábra A CCD működési blokkjai Az ábra első működési lépésében a beérkező fénynyalábot a fotocella elektromos jellé, feszültséggé alakítja. Az átváltás csak meghatározott tartományba történhet; a túl kis erősségű fény nem vált ki elektromos jelet, míg a túl nagy sem tud a maximális feszültségnél erősebbet produkálni. Az előbbi eset a csillagászati képfeldolgozásnál fordul elő; megfelelő áramköri elemekkel már egészen kis fénymennyiséget detektálni lehet. Ezek a berendezések azonban drágák és különleges felszerelést, például hűtőberendezést igényelnek. A kondenzátor blokk feladata az elektromos jelek rövid idejű tárolása, vagyis tárolása addig, amíg a fotocella kiolvasásra kerül. A shift regiszter az adatkiolvasásnál játszik kulcsfontosságú szerepet. Rajta keresztül kapja meg az analóg/digitális átalakító a kondenzátor tartalmát. Az A/D átalakító végzi el az elméleti képalkotás során bemutatott kvantálást, s szolgáltatja a digitális jelet – a szörkeségi értéket. A CCD-ből épített szenzoroknak két fajtája van az elemek elrendezése szerint. Az egyik csoport a lineáris CCD (linear array CCD), ahol egymás mellett sorosan helyezkednek el a fényérzékelők (15. ábra b része). Mivel az érzékelők egyetlen sorban vannak, s a valóságban a digitális képeknek nemcsak egyirányú kiterjedésük van, a tárgyaknak és az érzékelők relatív mozgatását kell megoldani. Ezt a megoldást kizárólag szkennerekben használják, ott lehet megvalósítani a tárgy mozdulatlanságát (síkágyas szkennerek) illetve azok pontosan és finoman párhuzamos mozgatását (dobszkennerek). Egyszínű, monokróm kép készítésekor (ilyen a fekete-fehér kép) egyetlen szélesspektrumú érzékelősort alkalmaznak, A színes képek készítésekor már több variációt lehet találni. Az első lehetséges megoldásnál a három alapszínnek, a vörösnek, a zöldnek és a kéknek egy-egy érzékelősort alakítanak ki, melyek érzékenységi tartományát ezekre a hullámhosszokra teszik. Ezt a megoldást hívják trilineáris szenzornak. A megoldás szerint egymás alatt helyezkednek el az ugyanahhoz a ponthoz tartozó érzékelők (16. ábra a része). Az iménti megoldás olcsóbb változatát jelentik a színszűrők használata. Ekkor csupán egyetlen általános érzékelősorra van szükség, amelyhez három – az alapszíneknek 18
megfelelő szűrő – tartozik. Innen a megoldás elnevezése is: RGB filter CCD (16. ábra b része). Az egyes színösszetevőkre bontást az egyes szűrők adják. Az olcsóságnak természetesen ára van: e megoldásnál háromszori letapogatás után kapjuk meg a képet. Az elrendezés szerinti másik nagy csoport a tömbös CCD-k (area array CCD) csoportja. Ennél a megoldásnál mátrixba foglaltan működnek az érzékelők (15. ábra a része).
b) lineáris CCD vázlata
a) tömbös CCD vázlata
c) tömbös és lineáris szenzorchipek 15. ábra A CCD szenzorok két nagy csoportja A tömbös elrendezésű érzékelők nagy előnye a sorosakkal szemben, hogy egyidejűleg több érzékelőre jut a fény, ezáltal gyorsabb letapogatást tesz lehetővé. A gyorsaság persze a képalkotó eszköz árában is megmutatkozik. A fő alkalmazási területe ezeknek az érzékelőknek a fényképezőgépek és a digitális kamerák. A monokróm eset ismét egyetlen érzékelő mátrixot jelent s a színes képalkotásnál lehet több ötlettel találkozni. Az igen gyors megoldásoknak kedvez a három alapszínre érzékeny háromchipes kamera-megoldás. Ebben az eszközben az RGBszínekre bontást a három tömb hajtja végre (16. ábra c része). A digitális televíziózásban kizárólag ezzel a megoldással lehet találkozni. A soros CCD szenzoroknál már bemutatott második megoldást a tömbös érzékelőknél is alkalmazzák, nevezetesen a színszűrőket (16. ábra d része). Itt is háromszori letapogatásra van szükség, ezért a megoldás szkennerekben található.
19
R CCD
vörös szûrõ zöld szûrõ kék szûrõ
G CCD B CCD
CCD
a) trilineáris szenzor
b) lineáris RGB filter CCD
vörös szûrõ
R tömb
G tömb
zöld szûrõ
kék szûrõ
B tömb
c) háromchipes megoldás CCD tömb
d) tömbös RGB filter CCD 16. ábra Színes képalkotási megoldások A kétségkívül legszellemesebb megoldást a Kodak dolgozta ki. Az egychipes kamera az ún. számított színtechnológiát használja. A módszerhez különleges elrendezésű CCD-tömböt alakítottak ki (17. ábra).
17. ábra A Kodak egychipes megoldása Az egymás melletti három színérzékelő által szolgáltatott színösszetevők egy belső beépített függvénybe kerülnek, ami interpolációval számítja a vizsgált pixel mindhárom színkomponensének értékét. A végeredmény pedig egy szokásos háromsávos színes kép. A módszer korlátjának ma még a geometriai felbontást
20
tartják, azonban a technika fejlődésével egyre tökéletesebb képet lehet ezzel a megoldással is készíteni. Felmerül a kérdés, ha vannak tömbös elrendezésű szenzorok, miért készítenek mégis sorosat? Nos azért, mert a költségkímélésen kívül rendelkeznek még egy komoly előnnyel, a megövekedett felbontással. A soros elrendezésű szenzorok geometriai felbontása jócskán meghaladja a tömbösökét. A digitális fotogrammetria céljaira készített szkennerek túlnyomó többsége ezért használ lineáris CCD-ket. 2.4. A digitális képalkotású eszközök A digitális képalkotású eszközök ismertetése elé egy csoportosítás kívánkozik. Általában véve a digitális képfeldolgozás szempontjából érdekes eszközöket, a 18. ábrán látható felosztást lehet felrajzolni. digitális képalkotású eszközök
digitális kamerák
állóképes kamerák
mozgóképes kamerák
mûholdas képalkotó eszközök
szkennerek
síkágyas szkennerek
dobszkennerek
18. ábra A digitális képalkotó eszközök csoportosítása A digitális képet létrehozó berendezések három nagyobb csoportját lehet megkülönböztetni., a digitális kamerák a szkennerek és a műholdas képalkotó eszközök kategóriáját. A következő fejezetekben eszerint a felosztás szerint ismertetem az eszközöket. 2.5. A digitális kamerák A digitális kamerák az új képalkotó eszközök között igen gyors és látványos fejlődésen mentek keresztül. A digitális fényképezőgépek és mozgóképes kamerák az utóbbi években ugrásszerű minőségi javulást mutatnak, ugyanakkor a korábban igen borsos árak mára az átlagember számára is elérhetővé szelidültek. A fejlődés nemcsak az elektronikának köszönhető, hanem lényeges szerepet játszott az is, hogy komoly fotográfiai cégek kezdtek digitális eszközöket fejleszteni. Egyre több profi fényképész alkalmaz már digitális eszközöket is. A harctéri tudósító fotós vagy az árvízsúlytotta területekről jelentést készítő riporter a digitális fényképezőgéppel elkészített felvételeket egyszerűen kiolvashatja gépéből s töltheti át laptop-jába, majd műholdas esetleg mobiltelefonon keresztül nagyon gyorsan eljuttathatja a szerkesztőségbe. A későbbi képmanipulációkat, archiválásokat, sőt – a digitális nyomdák révén – a
21
megjelentetést is egyszerűbb digitális formában végezni. Mára egyre több termékkatalógus készül digitális kamerával készült képekből. Mivel a tematikus térképezési és egyéb tematikus feldolgozási célok elérésére jelenleg még nem használunk mozgóképes rendszereket, ezért azok ismertetésétől eltekintek. A digitális feényképezőgépeket tulajdonképpen két nagyobb csoportra tudjuk felosztani: •8 a hagyományos fényképezőgépek digitálissá átépített változatai •8 a közvetlenül digitális kamerának kifejlesztett gépek. Az előbbi kategóriában szinte az összes nagy fotográfiai gyártót megtaláljuk: Canon, Fuji, Hasselblad, Mamiya, Minolta, Nikon, Rollei stb. Ezek a gépek az átépítés révén nem változtak optikai rendszerükben (19. ábra a része), az amúgy igen drága, precíz objektívek változatlanul felhasználhatók a többi kiegészítő tartozék (állvány, vaku, távkioldó szűrők stb.) mellett. Az a fotós, aki már az igen költséges felszerelését megvette, íly módon csupán a vázat3 kell kicserélnie. A moduláris fébnyképezőgépek, mint például a svéd Hasselblad vagy a japán Mamiya esetében csupán a gép hátlapját kell lecserélni (19. ábra b része).
b) Digitális hátlap Hasselblad kamerákhoz (6 × 7 cm-es formátum)
a) Átépített Canon EOS 1N gép (DCS520) (24 × 36 mm-es formátum)
19. ábra Digitálissá átépített hagyományos fényképezőgépek Ezekhez a fényképezőgépekhez általában a Kodak gyártja a CCD-tömböt tartalmazó hátlapot és a kiszolgáló elektronikát. Emiatt a gépek nevét is megváltoztatják, például a Canon EOS 1N professzionális fényképezőgép átszerelt változata Kodak EOS DCS 1 néven szerepel. A digitálissá átépítés meglehetősen eredeti ötletét találta ki az Imagek nevű cég, aki a szokásos filmkazetták helyére helyezhető digitális patront készített (20. ábra). Az általuk javasolt megoldás szerint a fényképezőgépeken semmiféle utólagos átépítésre nincs szükség.
3
Fényképész szóhasználattal így nevezik a fényképezőgép házát objektívek és tartozékok nélkül.
22
20. ábra A filmkazetta helyére helyezhető digitális szenzor A digitális fényképezőgépek másik csoportját a közvetlenül digitálisnak tervezett és gyártott gépek családja képezi (21. ábra). Általában ezek a gépek kompaktak s jóval kisebb tudással rendelkeznek. A megcélzott felhasználók is inkább a fényképezéshez kevésbé értő amatőrök. A nagy fényképezőgép gyártók szinte mindegyike készít ilyen kategóriájú gépeket is.
a) A tradícionálisan furcsa alakú Olympus digitális fényképezőgépe (D620 L)
b) Kompakt digitális fényképezőgép (Canon Powershot A5)
21. ábra Közvetlenül digitálisnak tervezett fényképezőgépek A kereskedelmi forgalomban kapható néhány digitális fényképezőgép fontosabb adatait a 3. táblázat tartalmazza.
23
Gyártó
Felbontás [pixel × pixel] 1000 × 810
Színmélység [bit] 24
CF kártya1
2560 × 2000
24
3000 × 2000
42
1344 × 971
24
1524 × 1012 3060 × 2036 1728 × 1152
12; 364 12; 364 36
3060 × 2036 1344 × 1008
36 24
Olympus
RZ 675 Dimâge EX Zoom 1500 D 620L
HS memória kártya2 közvetlen kiolvasás Kodak Picture Card PCMCIA III PCMCIA III PCMCIA I, II, III PCMCIA III CF kártya1
1280 × 1024
24
Olympus
C 1400L
1280 × 1024
24
Sony Sony
DSC-D700 MVC-FD7
1344 × 1024 640 × 480
24 24
Canon Fuji Hasselblad Kodak Kodak Kodak Kodak Mamiya Minolta
Típus Powershot A5 Fujix DS-515A 501 CM3 DC 240 Zoom DCS 420 DCS 460 DCS 520
Tárolási mód
SmartMedia kártya SmartMedia kártya PCMCIA II 3.5" floppy
Ismétlés szám [kép/s] n.a.
Súly [kg]
3
n.a.
0.67
n.a.
n.a.
0.33
2.22 1 3.5
1.70 1.70 1.65
0.13 3.5
n.a. 0.31
3.3
0.47
n.a.
0.47
n.a. n.a.
0.82 0.60
0.23
n.a. nincs adat 1 Compact Flash 2 High Speed (nagysebességű) memóriakártya 3 Phase One hátlappal 4 a fekete-fehér és színes változatokban 5 Kodak hátlappal 3. táblázat Néhány digitális kamera adatai 2.6. Szkennerek A digitális képalkotó eszközök második nagy csoportját a szkennerek jelentik. Az angol eredetű szó (scanner) jelentése pásztázó, letapogató berendezés, magyarul többnyire a módosított szkenner szó mellett lapolvasónak nevezik. A legtöbb szkennerben lineáris CCD található, mert ezeknél az eszközöknél a képalkotási sebesség nem akkora kényszer, mint amekkora a fényképezésnél. A soros CCD alkalmazásával ugyanakkor megnövelhetik az eszköz geometriai felbontását. Az érzékelő egyetlen sorához azonban valamilyen módon hozzá kell rendelni a letapogatandó tárgy, a dokumentum teljes egészét. Emiatt a szenzor és a dokumentum egymáshoz viszonyított (relatív) nagypontosságú mozgatását kell megvalósítani az optikai leképezés mellett. A műszaki megoldást tekintve kétféleképpen lehet ezt a relatív mozgatást realizálni, s e két megoldás alkotja a szkennerek főbb csoportjait. Ezek •8 a síkágyas szkennerek •8 a dobszkennerek. A síkágyas szkennereknél (flatbed scanner) (22. ábra) a dokumentumot egy üveglapra kell helyezni, ami alatt található a megvilágító és letapogató berendezésből álló kombinált fej. A fej precíziósan kiképzett rudazaton mozog (22. ábra c része). A
24
rudak kialakításával igen nagypontosságú mozgatást lehet megvalósítani; az eltérés akár csupán 2 µm-t sem haladja meg. A síkágyas szkennereknél az üveglap mérete és a rudazat határozzák meg a hasznos digitalizálási méretet. A gyakorlat az A4-es méretű, 297 × 210 mm-es dokumentumok befogadására képes eszközöket jelenti. Néhány kivételes esetben, ilyen például a fotogrammetria, ennél kismértékkel nagyobb berendezést is készítenek. Az UMAX nevű amerikai cég A3-as méretű szkennerek is gyárt (22. ábra b része), ennél azonban nagyobb síkágyas kialakítású berendezés nincs.
a) A4-es méretű síkágyas szkenner (Visioneer Paperport OneTouch 5300)
b) A3-as méretű síkágyas szkenner (UMAX Mirage IIse)
c) Síkágyas szkenner felépítése 22. ábra Síkágyas szkennerek és felépítésük A dobszkennerek (drum scanner) régen nagy hengerek voltak, amikre felerősítették a dokumentumot, majd a rögzített helyzetben levő megvilágító/letapogató fej előtt fokozatosan forgatva végeghaladt a henger. Ezeknek az eszközöknek a méretkorlátját hengerpalást hossza és a henger szélessége jelentette. A modern dobszkennereknél ma már csupán a nyomdatechnikában használják a dobot, ezek a berendezések igen nagy felbontásra képesek. Például az Isomet 405HR digitális dobszkenner 355 × 279 mm-es dokumentumokat 12500 dpi-vel képes beszkennelni! (23. ábra) 25
23. ábra Nyomdai célú dobszkenner (Isomet 405HR) A hétköznapi dobszkennerekben a henger mérete lecsökkent, formatervezett állványra szerelt szerkezet. A henger feladata a dokumentum rögzítése és egyenletes sebességű mozgatása. A letapogatási szélesség nem változott, viszont a dokumentumok hossza elméletileg végtelen lehet. A mai ilyen típusú eszközök akár 162 cm széles és 15 m hosszú dokumentumot képesek beszkennelni (24. ábra a része).
b) A4-es méretű sheet-fed szkenner (Visioneer Paperport Strobe)
a) Nagyméretű dokumentumokhoz készült Anatech Evolution Pro
24. ábra Dobszkennerek
26
A mozgatási elv megváltoztatásával sokan átkeresztelték a szkennercsaládot, ezek az eszközök a sheet-fed szkennerek. Ezek többnyire kisebb méretű eszközök, például A4-es formátumúak (24. ábra b része). A dobszkennerek általában nagyobb méretű dokumentumokat, ám alacsonyabb geometriai felbontást tesznek lehetővé. A dokumentumok precíz mozgatását ezen a módon nem lehet olyan tökéletesen megoldani, mint a síkágyas eszközöknél, így a hasznos felbontást nem érdemes 800 dpi-nél nagyobbra növelni. Ebbe a kategóriába tartoznak a kéziszkennerek (hand held scanner), mivel nagypontosságú, műszaki feladatok megoldására nem alkalmasak, ezért ezekkel nem foglalkozom. Ejtsünk szót a dokumentumokról is! Digitálissá alakíthatunk papírt, papír és műanyag, valamint alubetétes térképet, fényképet, filmet, fóliát s még lehetne sorolni. A hordozókat tulajdonképpen két kategóriába sorolhatjuk: átlátszók és nem átlátszók. E tulajdonság figyelembevételével kétféle megvilágítási módot találunk a szkennereknél. Az első mód a fény visszaverődésén alapul; ezek a reflexív szkennerek (25. ábra a része), ezeket használjuk a nem átlátszó dokumentumok (pl. papírdokumentumok) szkennelésére. Ezzel szemben az átlátszó dokumentumokat (pl. filmet) az átbocsátáson alapuló transzmisszív szkennerekkel alakítjuk digitálissá (25. ábra b része). A reflexív szkennereknél a megvilágító berendezés és a szenzorchip a dokumentum azaonos oldalán helyezkednek el, míg a transzmisszív szkennereknél éppen az ellentétes oldalon. dokumentum lámpatest dokumentum
lámpatest
CCD
a) Reflexív szkenner
CCD
b) Transzmisszív szkenner 25. ábra Megvilágítási módok Vannak olyan síkágyas szkennerek, amelyeknél mindkét féle dokumentumtípust digitalizálni lehet. Ezeknél az eszközöknél a szokásos síkágyas megoldáson kívül egy kiegészítőként kapható átvilágító adapter (transparency adapter) segítségével a szkenner transzmisszívvá alakítható. A szkenner elektronikája érzékeli, hogy a felső lámpatestet bekapcsoltuk-e, ilyenkor az alsó megvilágítást kikapcsolja. A nem átlátszó dokumentumok digitalizálása a szokásos módon történik (26. ábra).
27
26. ábra Átvilágító adapterrel bővített síkágyas szkenner (HP Scanjet 6100 C) Külön érdemes megemlíteni a filmszkennereket, amelyeket a hagyományos filmre fényképező, digitális képmanipulációkat használó fotográfusok alkalmaznak. Ezek a szkennerek a szokásos kisfilmes (24 × 36 mm-es) tekercs vagy bekeretezett diák befogadására alkalmasak. Igen jó felbontással rendelkeznek, általában támogatják a tömörített képtárolási formátumokat és a FotoCD-t. A 27. ábrán látható Kodak Professional RFS 2035 Plus filmszkenner 2000 dpi-s felbontással 40 s alatt szkennel be egy képkockát. A 4. táblázatban a kereskedelmi forgalomban kapható néhány szkennertípus adatait tüntettem fel.
27. ábra Kisfilmes formátumú filmszkenner (Kodak Professional RFS 2035 Plus)
28
Gyártó
Típus
Acer
Vuego Scan Brisa 610S
Agfa Anatech Anatech Canon Devcom Epson
Működési elv
Optikai felbontás [dpi]
Interpolált felbontás [dpi]
Belső színmélység [bit]1
Adatátviteli mód
síkágyas
1200
9600
30
SCSI-2
síkágyas
600
4800
30
ph2
dob
800
n.a.
n.a.
SCSI-2
dob
800
n.a.
n.a.
n.a.
Canoscan FB310
síkágyas
600
9600
30
ph
Black Widow 4830 Pro
síkágyas
600
4800
30
ph
síkágyas
600
9600
36
n.a.
216 × 297
Snapscan 310 Eagle 4080C Evolution Pro
1120 × 860 216 × 297 215× 300
Perfection 636
216 × 297
Scanjet 4100 C
síkágyas
600
1200
36
USB
Hewlett Packard
Scanjet 5100 C
síkágyas
600
1200
36
ph
Hewlett Packard
Scanjet 6200 Cse
síkágyas
1200
–3
36
USB SCSI
Isomet
405HR dob
12500
–
n.a.
SCSI
film
2000
n.a.
36
SCSI
film
1230
n.a.
n.a.
n.a.
Scan Express 12000 SP
síkágyas
1200
9600
36
SCSI
Novatech/Opt rox
Photo Maker 6E
síkágyas
1200
9600
30
ph
Umax
Mirage IIse síkágyas
1400
9800
36
SCSI-2
sheet-fed
400
n.a.
n.a.
n.a.
síkágyas
600
2400
36
n.a.
sheet-fed
600
2400
n.a.
ph
Kodak Mustek
Visioneer Visioneer Visioneer
Pro RFS 2035 Plus
216 × 297 216 × 297 216 × 356 279 × 355 203 × 254 24 × 36
Pro RFS 4050
35 × 127 216 × 292 219 × 297 290 × 432
PaperPort mx PaperPort OneTouch 5300 PaperPort Strobe
216 × 297 1575 × –
Hewlett Packard
Kodak
Dokumentum méret [mm]
305 × 762 219 × 297 216 × 762
n.a. nincs adat 1 Az eszközök mindegyike kifelé 24 bites színes képeket tudnak szolgáltatni. 2 Párhuzamos port 3 Nincs elvi szoftverkorlát 4. táblázat Néhány szkenner legfontosabb adata
29
2.7. Fotogrammetriai célú szkennerek Az előző fejezetben bemutatott szkennerek számos képfeldolgozási feladathoz alkalmasak. A digitális fotogrammetria azonban rendelkezik két igen fontos követelménnyel: •8 a légifényképeket teljes nagyságukban szükséges digitalizálni, ellenkező esetben a szabatos belső tájékozás meghiúsul, s ez a teljes további feldolgozás pontosságát lerontja •8 a légifényképeken nagypontosságú méréseket kell tudnunk végrehajtani, különben nem lesz megfelelően pontos a készített termék. Az első feltétel azt jelenti, hogy a szkennernek legalább 23 × 23 cm aktív felülettel kell rendelkeznie. Ha pedig még a kereten kívüli műszerek (magasságmérő, libella stb.) képét is szeretnénk digitálisan tárolni, még nagyobb befogadóképességű szkennert kell beszerezni. Az irodai szkennereket az A4-es és a Letter-lap méretéhez igazították – ezek 210 × 297 mm és 216 × 279 mm –, a lehetséges dokumentumméret így többnyire 216 × 297 mm-re adódik. Az egész légifénykép tehát nem fér be ezekbe az eszközökbe. (Kis ügyeskedéssel azonban a keretjeltől keretjelig néhány eszköznél lehet szkennelni.) A második feltétel pedig a szkennerek geometriai felbontására vonatkozik. Ha például egy 600 dpi-s szkennert használnánk, akkor 1:20000-es méretarányú topográfiai célú légifényképnél ez körülbelül 85 cm-es földi pontosságot jelentene. A megoldás tehát nagyobb aktív felülettel rendelkező eszközt kell használni (1. követelmény), ráadásul megnövelt optikai felbontással (2. követelmény). E két előírás tükrében fejlesztették ki a fotogrammetriai célú szkennereket. A megnövelt aktív felület érdekében több eszközgyártó a fotogrammetriai műszerek szokásos képtartóját használta fel (pl. Zeiss-Intergraph PhotoScan 1). A nagyfelbontású digitális képalkotásra precíziós síkágyas megoldásokat dolgoztak ki. Néhány, fotogrammetriai feladat megoldására alkalmas eszközt a 28. ábrán, műszaki adataikat az 5. táblázatban mutatom be. Néhány fotogrammetriai szkenner kiegészítőkkel képes tekercsben lévő légifelvételek digitalizálására. Például a Zeiss PHODIS SCAI vagy az LH Systems DSW 300 jelű berendezéseihez tartozik rollfilm adapter. A hihetetlen méretű geometriai felbontás (pl. Lenzar Lenzpro 2000 Multimedia szkenner 3 µm vagyis 8467 dpi felbontás) mellé igen jó geometriai pontosság (3 µm) párosul. Említésre méltó még az eszközök sebessége is. A Zeiss PHODIS SCAI szkennere 4 MB/s-ra képes. Ez azt jelenti, hogy egy színes légifénykép szkennelése 7 µm-es felbontással megközelítően 13 percig tart! Ezalatt összesen kb. 3 GB-nyi adatot kell lementeni. Az átvitel óriási mérete miatt gyors átviteli csatornát (pl. SCSI-2) és csatlakozó kiszolgáló számítógépet használnak. A gyors adattárolási eszköznek (winchester) is nagy jelentősége van. A fotogrammetriai célú szkennerek ára 55 és 350 ezer dollár esik (1998-as árszint). Az árakat a tartozékok 10-15 %-kal növelik.
30
a) Zeiss PHODIS SCAI b) DSW 300 (LH Systems)
c) Zeiss-Intergraph PhotoScan TD d) ISM XL-10 28. ábra Néhány fotogrammetriai célú szkenner
31
Vexcel Imaging
LH Systems
Lenzar
ISM3
ISM3
DBA Systems
Gyártó
VX 4000 HT
Lenzpro 2000 Multimedia DSW 300
XL-10
DiSC
DFS
Típus
Érzékelő
Photoscan 1 (PS1)
Wehrli and Assoc. RM-2 Rastermaster PHODIS SCAI7 Zeiss
4 × 5000 lineáris CCD; 2000 × 2000 tömbös CCD1 3 × 8000 lineáris CCD 3 × 8000 lineáris CCD 2000 × 2000 tömbös CCD4 2029 × 2044 tömbös CCD 1024 × 1024 tömbös CCD 96 × 2048 lineáris CCD 3 × 8640 lineáris CCD 1 × 2048 lineáris CCD
Zeiss-Intergraph
1 Két változatban is létezik 2 Választható 3 International Systemap Corp. 4 Vagy választhatóan 1000 × 1000 tömbös CCD 5 Reflexíven 6 Transzmisszíven Intergraph PhotoScan TD néven is forgalmazzák. 7
Formátum [mm] 240 × 240
320 × 320 254 × 254 559 × 8895 406 × 6106 265 × 265 508 × 254 245 × 245 275 × 250 260 × 260
A fotogrammetria számára készült szkennerek fontosabb adatai
12
8
10
10
10
10
2
5
4
2
3
3
5
Geometriai pontosság [µm] 1
2
4
1.6
0.35
1.7
1.3
0.73
2.5
Szkennelési sebesség [MB/s] 4
Intergraph Unix
Silicon Graphics
Pentium PC
PC
Sun, Silicon Graphics2 Sun
Dual Pentium PC
PC
Kiszolgáló számítógép
12
2
Sun, GPIB2
10
Minimális Belső színmélység pixelméret [µm] [bit] ([dpi]) 4 12 (6350) 10 (2540) 10 (2540) 3 (8467) 4 (6350) 7.5 (3387) 10 (2540) 7 (3629) 7.5 (3387)
5. táblázat
32