Eötvös Loránd Tudományegyetem Informatikai Kar Algoritmusok és Alkalmazásaik Tanszék
Szegmentáló algoritmusok légi- és űrfelvételek osztályozásában Diplomamunka
Készítette: Gera Dávid Ákos programtervező matematikus szak nappali tagozat
Témavezetők: Dr. Fekete István egyetemi docens ELTE Informatikai Kar
László István osztályvezető Földmérési és Távérzékelési Intézet
Budapest 2011
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg (a támogatás száma TÁMOP 4.2.1./B09/1/KMR-2010-0003).
Tartalomjegyzék 1. Bevezetés ...................................................................................................................... 3 2. A távérzékelés alapjai................................................................................................. 6 2. 1. Fizikai alapok........................................................................................................ 7 2. 2. Felvételkészítés..................................................................................................... 9 2. 3. Előfeldolgozás .................................................................................................... 11 3. A távérzékelt felvételek kiértékelése ....................................................................... 13 3. 1. Intenzitástér......................................................................................................... 14 3. 2. Klaszterezés ........................................................................................................ 14 3. 3. Felügyelt osztályozás .......................................................................................... 15 3. 4. Maximum-likelihood módszer............................................................................ 16 3. 5. Távolságfüggvények........................................................................................... 17 4. Szegmensalapú képfeldolgozás ................................................................................ 18 4. 1. A textúra ............................................................................................................. 18 4. 2. Szegmensalapú osztályozás ................................................................................ 20 4. 3. Objektum alapú képelemzés ............................................................................... 21 5. Szegmentáló eljárások .............................................................................................. 23 5. 1. A szegmentáló eljárások áttekintése ................................................................... 23 5. 1. 1. Hisztogram alapú szegmentálás.................................................................. 23 5. 1. 2. Él alapú szegmentálás ................................................................................. 25 5. 1. 3. Régió-alapú szegmentálás........................................................................... 26 5. 1. 4. A szegmentálás, mint gráfelméleti probléma ............................................. 27 5. 2. Összevonás-alapú szegmentálás ......................................................................... 27 5. 2. 1. Szekvenciális csatolás................................................................................. 27 5. 2. 2. Legjobb összevonás .................................................................................... 29 5. 2. 3. Gráf alapú összevonás ................................................................................ 30 5. 3. Vágás-alapú szegmentálás .................................................................................. 31 5. 3. 1. Minimális átlagsúly alapú vágás................................................................. 31 5. 3. 2. Minimális arány alapú vágás ...................................................................... 33 5. 3. 3. Normált minimális vágás ............................................................................ 34 6. Gyakorlati feladatok megoldása a Definiens eCognition programrendszerrel .. 36 6. 1. Gyakorlati alkalmazások..................................................................................... 36 6. 2. A Definiens eCognition programrendszerről...................................................... 37 6. 3. Az eCognition szegmentáló eljárásai.................................................................. 38 6. 4. Osztályozás végrehajtása .................................................................................... 46 7. Fák lehatárolása (MePAR felújítás)........................................................................ 48 7. 1. A felhasznált felvételek ...................................................................................... 49 7. 2. A feldolgozás folyamata ..................................................................................... 49 7. 3. Szegmentálás ...................................................................................................... 50 7. 4. Osztályozás ......................................................................................................... 54 7. 5. Utófeldolgozás .................................................................................................... 59 7. 6. Pontosság ............................................................................................................ 60 7. 7. Javítási lehetőségek............................................................................................. 61 8. Vörösiszap-elöntés (katasztrófa-felmérés).............................................................. 62 8. 1. A felhasznált felvételek ...................................................................................... 62 8. 2. A feldolgozás folyamata ..................................................................................... 63 8. 3. Spektrális indexek............................................................................................... 63 8. 4. Szegmentálás ...................................................................................................... 64
8. 5. Osztályozás ......................................................................................................... 67 8. 6. Pontosság ............................................................................................................ 69 8. 7. A RapidEye felvétel feldolgozása, összehasonlítás ............................................ 69 8. 7. 1. A RapidEye felvétel szegmentálása............................................................ 69 8. 7. 2. A RapidEye felvétel osztályozása............................................................... 70 9. Parlagfű kimutatás objektum alapon ..................................................................... 74 9. 1. Felhasznált felvételek ......................................................................................... 74 9. 2. A feldolgozás folyamata ..................................................................................... 75 9. 3. Szegmentálás ...................................................................................................... 75 9. 4. Osztályozás ......................................................................................................... 76 9. 5. Pontosság ............................................................................................................ 77 10. Összegzés.................................................................................................................. 79 A. Függelék .................................................................................................................... 80 A. 1. Adatszerkezetek ................................................................................................. 80 Éllistás gráfreprezentáció........................................................................................ 80 Bináris kupac .......................................................................................................... 80 A. 2. Négyfa alapú szegmentálás................................................................................ 81 Irodalomjegyzék............................................................................................................ 82
1. Bevezetés A bevezető fejezetben röviden összefoglalom azokat az általános ismereteket, amelyek diplomamunkám jobb megértéséhez szükségesek.
A távérzékelés, mint a térinformatika speciális része egyetemi tanulmányai során keltette fel érdeklődésemet. A térképek iránti érdeklődésem gyermekkorom óta megvan, így a térképek és az informatika kapcsolódása, a térinformatika irányába való fogékonyságom is természetes. Ez az érdeklődés a Térinformatikai sáv keretében tanulmányaimban is fontos helyet kaphatott. Döntésem helyességét a sáv tantárgyai megerősítették, a Távérzékelt Felvételek Elemzése kurzusban pedig megtaláltam azt a szűkebb szakmai irányvonalat, melyet követni szeretnék. Ennek a specializált érdeklődésnek megfelelően kooperatív képzésre jelentkeztem a Földmérési és Távérzékelési Intézetbe (FÖMI), a Távérzékelési Igazgatóságra (TÁI). A képzés után az Intézet részmunkaidős munkatársa maradtam.
Diplomamunkám témáját is meghatározta ez a körülmény. A FÖMI-ben olyan feladatokat kaptam, amelyek illeszkednek az ELTE IK – FÖMI TÁI közötti együttműködés keretében több éve folyó kutatáshoz. A közös kutatás témája a távérzékelt felvételek szegmentálási módszereinek, és a felvételek szegmensalapú kiértékelésének a vizsgálata. Az együttműködés eddigi eredményeit (fejlesztéseket és publikációkat) a dolgozat 4. fejezetében részletesen ismertetem.
A FÖMI-ben végzett munkáim közül három olyan feladat is szerepel, amelyek megoldásban a felvételek szegmentálását kellett, illetve lehetett alkalmazni. A szegmentálás a Definiens eCognition objektum-alapú képfeldolgozó program-rendszer felhasználásával történt. A szegmentálás és az annak eredményére épülő objektumalapú elemzés kulcslépése a széleskörű paraméterezési lehetőségek megfelelő kihasználása, ami az alkalmazást nagyon hatékonnyá teheti, ugyanakkor komoly nehézségek forrása is lehet a rendszer érzékenysége a paraméterek helyes megválasztására. A helyes alkalmazáshoz nélkülözhetetlen az emberi szakértelem,
-3-
amely egyaránt kiterjed a felvételek interpretációjára és a szegmentáló eljárások működésére.
A FÖMI egyik legfontosabb, legnagyobb emberi erőforrásokat igénylő feladata a mezőgazdasági támogatási rendszert felügyelő Mezőgazdasági Parcella Azonosító Rendszer (MePAR) üzemeltetése és folyamatos felújítása. A bemutatott első alkalmazás célja a rendszerben legelőként támogatható területeken megjelenő fás, bokros területek légifelvételeken történő lehatárolása. A feladat jellege szükségessé teszi a szegmens (objektum) alapú megközelítést. A bemutatott alkalmazás egy összetett térinformatikai folyamat része, melynek célja a lehatárolás automatizálása.
A távérzékelés egyik legnagyobb erőssége a légi- és űrfelvételeken is látható környezeti és ipari katasztrófák gyors és érintkezésmentes felmérésének és elemzésének lehetősége. A FÖMI-ben rendszeres feladatok az ár- és belvízfelmérés, aszályfelmérés, vagy például valamilyen mezőgazdasági kártevő kártételének vizsgálata. A másodikként bemutatott alkalmazás azonban egy egyedi esemény, a 2010 októberében bekövetkezett vörösiszap-elöntés hatását mérte fel. Ezen vizsgálatok keretében – elsősorban kutató jellegű – szegmensalapú elemzéseket végeztem szuperfelbontású űrfelvételeken.
Minden évben ismétlődő fontos feladata az Intézetnek a parlagfű-fertőzöttség elleni közérdekű védekezés támogatása távérzékeléses módszerrel. A hagyományosan alkalmazott terepi ellenőrzésekkel megerősített idősor-alapú módszer mellett a 2010-es évben egy a szuperfelbontású felvételek feldolgozási lehetőségeire irányuló kutatási folyamat részeként az ilyen felvételek parlagfű-kimutatásra való alkalmasságát is megvizsgáltuk. Ennek a folyamatnak része a harmadik gyakorlati alkalmazásként a 9. fejezetben bemutatott általam végzett objektum-alapú feldolgozás.
Diplomamunkám felépítése a következő. A 2-3. fejezetben nagyon röviden összefoglalom a távérzékelés (tanult) alapjait, az alkalmazott tartományra (passzív távérzékelés az optikai tartományban) szűkítve. A 4-5. fejezetben áttekintem a felvételek szegmentálásának és a szegmensalapú kiértékelésének módszereit, különös tekintettel az ELTE-FÖMI közös kutatás eredményeire. A 6-7-8-9. fejezetekben bemutatom a fenti három alkalmazást és az alkalmazott programrendszert. Végül, a 10. fejezetben a dolgozat összegzése olvasható. Az Irodalomjegyzésben – tematikus -4-
csoportosításban – csak olyan források szerepelnek, amelyeket a dolgozat megírásában felhasználtam, hivatkozás azonban a szövegben nem történik rájuk.
A bemutatott alkalmazások a leírtaknál összetettebb, komplex feladatok részei, e feladatokról – melyek csapatmunka eredményei – több társszerzős publikációban (három angol, egy magyar nyelvű cikk, egy poszter, két előadás) számoltam be.
-5-
2. A távérzékelés alapjai A távérzékelés elektromágneses hullámok rögzítését és az így nyert információrendszer feldolgozását jelenti. A vizsgálat tárgya általában a föld- és a vízfelszín, a növénytakaró és a talaj felső rétegei. A érzékelő műszer nincs közvetlen kapcsolatban a vizsgálat tárgyával, általában repülőgépen, vagy műholdon elhelyezett szenzor, de léteznek eszközök, melyek csupán a felszín felett néhány méterrel dolgoznak. A levegőből vagy a világűrből történő felvételezés lehetővé teszi nagy területek átfogó vizsgálatát, továbbá a terepi viszonyok, a célterület megközelíthetetlensége nem nehezítik az elemzést. A mért elektromágneses sugárzás forrása lehet a Nap, az érzékelő műszer, vagy maga a vizsgált objektum is. Az első két esetben a felszín által visszavert sugárzást mérjük. Ez esetben megkülönböztetünk passzív, illetve aktív távérzékelést. Passzív rendszer esetén a sugárzás forrása a Nap, a mért hullámhossz-tartomány az optikai tartomány egy része. Aktív rendszer esetén a sugárzás forrása maga a mérőeszköz, a mért hullámhossz a mikrohullámú tartományba esik. A nyert adatok általában képszerű, többsávos felvétel formájában kerülnek feldolgozásra. A távérzékelt felvétel kiértékelése a felvételezett objektumok, folyamatok paramétereinek matematikai alapon történő meghatározását jelenti, a kiértékelés eredménye általában a kiértékelési szempontok szerinti kategóriákat tartalmazó tematikus térkép. A felszíni objektumok tematikus kategóriákba sorolása az osztályozás.
1. ábra: légifelvétel és tematikus térképe
-6-
Természetesen a távérzékelés első alkalmazása is katonai célokkal történt. A civil felhasználásra a környezeti erőforrás-kutatás hatékonyságának növekvő jelentősége adott
lehetőséget.
Napjainkban
környezetvédelmi
célokkal,
változáskövetésre
(pl.
a
távérzékelést
természeti
városok
alkalmazzák
katasztrófák
terjeszkedése).
Jelen
mezőgazdasági,
hatásának
vizsgálatára,
dolgozatban
elsősorban
mezőgazdasági, és a mezőgazdasághoz kapcsolódó katasztrófavédelmi (a 2010 őszén történt vörösiszap elöntés) alkalmazásokról lesz szó.
A távérzékeléses elemzés átfogó mivolta és terepfüggetlensége mellett további előnye a gyorsasága, és a képi jellegű adatok feldolgozhatósága, valamint relatív olcsósága. Ugyanakkor megemlítendő nehézséget jelent a leggyakrabban használt, optikai
tartományban
történő
felvételezés
időjárás-függősége,
a
felvételek
kiértékelésének rendszer-, és szakember-igénye, illetve a kiértékelés pontosságának kérdése.
2. 1. Fizikai alapok A már említett passzív és aktív távérzékelési rendszerek közül a továbbiakban csak a passzív rendszerrel foglalkozunk. E rendszereknél az érzékelt elektromágneses hullámok forrása általában a Nap, a szenzor a felszínről visszavert sugárzást rögzíti. A passzív távérzékelésben használt hullámhossz-tartomány jellemzően a 0.3 - 15µm közötti, úgynevezett optikai tartomány.
2. ábra: az optikai hullámhossz-tartomány részei
-7-
A mezőgazdasági távérzékelés elsősorban az optikai tartomány látható, közeli és közepes infravörös részét használja. A passzív távérzékelés időjárás-függő módszer, a felszínről kiértékelhető felvétel csak nappal és tiszta időben készíthető, továbbá figyelembe kell venni az optikai tartomány légköri vízelnyelési sávjait, azaz azon hullámhossz-tartományokat, ahol a légkörben lévő víz a sugárzást elnyeli. A szenzorok ezen intervallumokban nem felvételeznek. Fontos fizikai tényezők továbbá a Nap állása, és a légköri szórás, melyek befolyásolják a készített felvételt. E hatások kiküszöbölésére, különösen több felvétel együttes kiértékelésénél fontos a légköri korrekció, az ún. Top-of-the-Atmosphere (ToA) reflektanciakép előállítása. (az ehhez szükséges adatok a felvétellel együtt elérhetőek).
A reflektancia függvény: a hullámhossz tartományban a visszavert sugárzási érték a különböző felszíni objektumokra jellemző görbét ír le. Ez alapján elkülöníthető felszínborítások például a vízfelület, különböző talajtípusok, zöld növényzet.
3. ábra: jellemző reflektanciagörbék
Az ábrán látható a zöld növényzetre jellemző reflektancia görbe összetettsége. A látható hullámhossz-tartomány visszaverési minimumait a klorofill-elnyelés, a közepes infravörös tartomány minimumait a növény víztartalma okozza. Ezekből az adott növénytípus fejlettségi szintjére, egészségességére is következtethetünk. A görbe a növény fejlődésének különböző szakaszaiban jellemző módon változik. Hasonló módon a különböző talajok tulajdonságai is leolvashatóak. Az egymáshoz spektrálisan nagyon
-8-
hasonló növénytípusok elkülönítéséhez a felvételezés időpontja, több időpontban készült felvétel együttes elemzése (idősor) ad segítséget.
Az egyes felszíni objektumok egyértelmű azonosítása ugyanakkor nem lehetséges a reflektancia görbék alapján, ugyanis a mért értékeket technikai (pl. felbontás) és környezeti tényezők (pl. az objektum állapota, környezetében található más felszíni objektumok) erősen befolyásolják.
2. 2. Felvételkészítés A felvételeket többféle fizikai mértékkel jellemezhetjük. A spektrális felbontás a felvételezhető hullámhossz-tartomány szélességét és részletességét jellemzi. A térbeli felbontás az egy képpontra eső felszín területét adja meg. Műholdakon elhelyezett szenzoroknál további fontos jellemzők a visszatérési idő – azaz a műhold milyen gyakran halad át ugyanazon földi pont felett, illetve az egy felvétellel lefedhető terület nagysága.
A felvételkészítő eszköz hordozója általában repülőgép, vagy műhold. Az optikai tartományban működő passzív rendszerek két fő típusa a fényképező típusú és digitális pásztázó letapogató rendszer.
Az analóg és digitális fényképező rendszerek a látható és a közeli infravörös sáv egy részét használják (kb. 0,4 – 0,9 µm). A szenzor a teljes felvételezendő területet egyszerre rögzíti. Fontos szerepe van a színes infravörös (CIR – color infra red) felvételeknek, a dolgozatban bemutatott egyik gyakorlati alkalmazás bemenő adatai is CIR
orthokorrigált
(térképhelyes)
légifelvételek.
Ezen
rendszereket
általában
repülőgépek hordozzák, a felvételekre gyenge spektrális felbontás mellett nagyon jó térbeli felbontás jellemző.
A többsávos digitális pásztázó letapogatók elsősorban műholdak fedélzetén működnek.
A
szenzor
a
földfelszín
repülésre
merőleges
sávjáról
érkező
elektromágneses sugárzás-intenzitást rögzíti, a teljes felvétel e sávokból áll össze. Az így készült digitális felvétel egy mátrix, melyet soronként tölt fel a szenzor. Az egyes
-9-
mátrixértékek (a pixelek) vektorok, melyek dimenziószámát a felvételnél használt sávok száma adja. A digitális felvételek a fényképező rendszereknél nagyobb spektrális felbontást tesznek lehetővé, térbeli felbontásuk a kis felbontású (1100m) elsősorban meteorológiai célú eszközöktől a nagyon nagy felbontásúig (akár 0,5m) terjed.
A mezőgazdasági távérzékelésben elsősorban nagyfelbontású (HR - High Resolution) és nagyon nagy-, vagy más néven szuperfelbontású (VHR - Very High Resolution) felvételeket alkalmazunk, a jelen dolgozatban leírt módszerek és alkalmazások is ilyen típusú felvételeken használhatóak. HR felbontású felvételeket szolgáltatnak például az Awifs (60m-es térbeli felbontás), a Liss (20m), a SPOT (20m illetve 10m) és a Landsat TM (25m) szenzorok, VHR felbontásúak például a RapidEye (5m), és a WorldView2 (2m), az orthofotók szintén VHR felbontásúak.
A felvételek feldolgozása a szükséges geometriai és radiometriai korrekciók elvégzése után számítógépes úton, a digitális képelemzés módszereivel történik. Az optikai tartományban jellemzően használt sávok a látható zöld és vörös, valamint a közeli és közepes infravörös hullámhossz-tartomány egyes részei. Egyes szenzorok felvételeznek az optikai kék tartományban, vagy a vörös és közeli infravörös sáv határán, az ún. „red edge” (vörös-határ) sávban.
A felvételkészítés során a szenzor a felszíni objektumok reflektanciafüggvényét az egyes sávoknak megfelelő hullámhossz-intervallumokban mintavételezi, majd kvantálja. A kvantálás finomsága szintén fontos jellemzője az egyes felvételkészítő eszközöknek.
Egyes szenzorok alkalmasak ún. pankromatikus felvétel készítésére is, ekkor a felvételezés általában a látható kék – vörös-határ tartományban történik, egy sávon, a multispektrális (nem pankromatikus) felvételezésnél nagyobb térbeli felbontással és finomabb kvantálással.
A többsávos távérzékelt felvételek képként való megjelenítésekor ki kell választani a megjelenítendő sávokat, és hozzárendelni azokat a megjelenítő eszköz (vörös, zöld és kék) színpuskáihoz. Az így megjelenített képet kompozitnak nevezzük. Gyakran alkalmazott a valódi színes kompozit, ami a természetes megjelenítésnek felel - 10 -
meg, vagyis a felvétel vörös, zöld és kék komponensét rendre a megjelenítő vörös, zöld és kék színpuskájához rendeljük. Szintén sokszor előfordulnak az ún. hamisszínes kompozitok, amikor a megjelenítő vörös, zöld, kék színpuskáihoz rendre a felvétel közeli infravörös, vörös és zöld, vagy közeli infravörös, közepes infravörös, vörös sávjait rendeljük. Hamis színes kompozitokon a növénytakaró jellegzetes vörös színben látszik.
2. 3. Előfeldolgozás Már említettük, hogy az elkészült felvételt a légkör állapota, a Nap állása befolyásolja. E mellett a felvételt számos további hiba terheli. Ezek egy része geometriai hiba, melyeket a műhold mozgása, a Föld forgása és a nagy látószögből valamint a felszín görbületéből adódó torzítás okoz. A durva geometriai hibák korrekcióját a felvevő rendszer (a földi vevőállomáson) elvégzi. További szükséges geometriai
korrekció
referenciapontok
a
alapján,
felvétel vagy
vetületi vetületi
rendszerbe rendszerek
transzfomálása, közötti
melyet
transzformációs
függvényekkel végeznek. Természetesen az utóbbi módon csak már valamilyen vetületben lévő felvétel transzformálható. Magyarországon általában az Egységes Országos Vetületi Rendszert (EOV) használjuk.
A geometriai mellett adódnak radiometriai hibák is. Ezek egy részének kiküszöbölését szolgálja a már említett ToA reflektancia előállítása. További, elsősorban a vizuális kiértékelést segítő korrekciók a digitális képfeldolgozásból ismert hisztogram-műveletek, élesítés, konvolúciós szűrések. Míg a ToA reflektancia előállítása elengedhetetlen a további feldolgozáshoz, a képi látványt javító műveletek oly módon változtatják meg a képet, hogy utána nem alkalmazhatjuk a képanalízis egyes lépéseit.
A radiometriai hibák javítása mellett a további feldolgozásban is szükség van az elemi képstatisztikák kiszámítására. Ezek egyrészt a sávonkénti statisztikák (átlag, intervallum, szórás, hisztogram), valamint a több sáv együttes viselkedését leíró kovariancia és korrelációs mátrix. A spektrális indexek szintén fontos elemei a feldolgozásnak. Ezek több sáv pixelenkénti értékeiből számolt újabb képrétegek. A
- 11 -
leggyakrabban használt index az NDVI (Normalized Difference Vegetation Index – vegetációs index), mely a közeli infravörös (NIR) és a látható vörös (R) sávokból, a következő képlettel adódik: NDVI = (NIR-R)/(NIR+R), ennek értéke a [-1, 1] intervallumba esik. A vegetációs index a zöld (fotoszintetizáló) növényzetre jellemző spektrális tulajdonságot (magas visszaverés a közeli infravörös, alacsony a látható vörös tartományban) emeli ki. Hasonló módon más sávokból is képezetők spektrális indexek.
- 12 -
3. A távérzékelt felvételek kiértékelése A szükséges előfeldolgozási műveletek után a felvétel alkalmas a tényleges kiértékelésre.
A
kiértékelés
célja
a
felszínborítási
elemek
minél
több
állapothatározójának pontos, megbízható becslése, és ezek alapján a célkategóriák tematikus térképének előállítása. E célkategóriákat az elvégzendő feladat határozza meg. Ezek lehetnek különböző haszonnövények, talajtípusok, katasztrófa-felmérésnél (pl. belvíz) érintettségi fokozatok. A tematikus térkép elkészítése minden egyes képpont (pixel) valamely kategóriába sorolását jelenti, a lehető legkisebb hiba mellett. A térképet előállító eljárástól elvárt a megfelelő (és igazolható) pontosság, gyorsaság és ismételhetőség.
A kiértékelés alapmódszerei a vizuális értelmezés és a digitális képelemzés. Az eljárás általában komplex, mindkét módszer elemeit használja, az adott feladat függvényében. A vizuális kiértékeléssel szemben a számítógépes feldolgozástól természetes elvárás a gyorsaság, a nagy adatmennyiségek együttes hatékony kezelése, ezek mellett a tónusbeli különbségek (az emberi szem még a könnyebben elválasztható színekben is csak 8-10 árnyalatot képes megkülönböztetni) és a textúrák mérésében is erősebb. Ugyanakkor nem elhanyagolandó, hogy a megfelelő szaktudású személy által végzett vizuális interpretáció a geometriai összefüggések, textúrák felismerésében jóval hatékonyabb a számítógépes kiértékelésnél. A kiértékelő módszer tudományosan megalapozott kell legyen, a folyamatnak csak egy része a felvétel készítése (beszerzése) és feldolgozása. Még ezek előtt szükséges a célok pontos meghatározása, és a fizikai, adat és megoldási modellek létrehozása. Az adatgyűjtést is megfelelően alaposan kell elvégezni, egyes feladatokban terepi adatgyűjtésre is szükség lehet.
Ezek után a tematikus térkép elkészítésének fő lépése az osztályozás. Az osztályozás során minden egyes képpont besorolást nyer valamely – pontosan egy tematikus osztályba. A célosztályok mellett használunk egy ún. „egyéb” kategóriát is, a semelyik célosztálynak sem megfelelő képpontok számára.
- 13 -
A felvételezett sugárzási kép visszaszámítása földi paraméterekre lehetetlen, az osztályozás
statisztikai
döntéselméleti
módszerekkel
végezhető.
Alkalmazunk
felügyelet nélküli és felügyelt osztályozást. A klaszterező eljárások felügyelet nélküli osztályozást valósítanak meg. Ezek bemutatása előtt definiáljuk az intenzitástér fogalmát.
3. 1. Intenzitástér A felvétel a képtérben természetes módon jelenik meg. A tengelyek a térbeli (síkbeli) koordináták, a tér elemei intenzitásvektorok. Ugyanakkor a felvétel ábrázolható az intenzitástérben is, ahol a koordináta-tengelyek az egyes spektrális sávok, az értékek pedig az adott intenzitású pontok száma. A hisztogramhoz hasonlóan az intenzitástér is független az egyes képpontok térbeli elhelyezkedésétől, azaz a felvétel pixeljeit a képtérben tetszőlegesen permutálva az intenzitástérben nem változik meg. Az intenzitástér dimenziója a kép spektrális sávjainak száma, ábrázolása értelemszerűen két (vagy három) sáv felhasználásával történik. Az intenzitástérben az egyes sávokra jellemző viselkedés mellett az „együttmozgások”, vagyis a különböző sávok értékei közötti összefüggések is megfigyelhetőek. Az azonos felszíni objektumok képpontjai az intenzitástérben jellemző csoportokat alkotnak.
4. ábra: Landsat TM felvétel az intenzitástérben
3. 2. Klaszterezés Az intenzitástérben az egyes tematikus osztályok pixelei csoportosulnak, és e csoportok elkülönülnek egymástól. Ilyen adatcsoportosulások egy kategórián belül is
- 14 -
előfordulhatnak, illetve előfordulhat olyan csoport, amelynek elemei nem egy tematikus kategóriához tartoznak.
Az adatcsoportosulások neve spektrális adatosztály, röviden klaszter (cluster). A klaszterező eljárás az intenzitásteret bontja fel diszjunkt adatcsoportosulásokra, azaz minden képponthoz hozzárendel pontosan egy osztályt. Természetesen ezek az osztályok nem, vagy csak részben felelnek meg a tematikus kategóriáknak, a kapott klasztertérkép tekinthető spektrális sugárzási térképnek. Az eljárás felügyelet nélküli, ugyanis a klaszterek lehatárolása matematikai úton, előzetes információk (pl. tanulóterület) felhasználása nélkül történik.
Egy klaszterező eljárás az ISODATA klaszter-kereső algoritmus leegyszerűsítve: 1.
első lépésben kiválasztunk megfelelő számú klaszterközéppontot (pl. az intenzitástérben egyenletesen)
2.
minden képpontot besorolunk a hozzá legközelebbi klaszterhez
3.
meghatározzuk az új középpontokat (a klaszterbe tartozó képpontok átlagvektora)
4.
megvizsgáljuk a klaszterek változását, ha ez „nagy”, akkor vissza a 2. pontra,
különben 5.
kialakultak a klaszterek
A képpontok távolságának meghatározása legkisebb négyzetek módszerével történik. Ez adott darabszámú ci klaszter mellett a következő érték minimalizálását jelenti:
∑ ∑(x − c ) c i x∈ci
2
i
Az eljárás alkalmazásakor megszorítás tehető a méretre, elemszámra, lehetőséget adhatunk közeli klaszterek összevonására, túl nagy klaszter szétvágására.
3. 3. Felügyelt osztályozás A módszer alapja a célkategóriák rendelkezésre álló (pl. terepi felmérésből) reprezentatív mintája. Ezeket a mintákat kategóriánként két diszjunkt halmazba sorolva kapjuk az ún. tanuló- és tesztterületeket. Feltételezve az azonos tematikus kategóriába
- 15 -
tartozó objektumok spektrális hasonlóságát, a kategóriák tanulóterületen való spektrális viselkedéséből megkapjuk a felvétel egészének osztályozását. A kapott eredmény a tesztterület alapján ellenőrizhető, nem megfelelő eredmény esetén paraméterek megváltoztatásával javíthatunk a kiértékelésen.
Az egyes képpontok besorolására gyakran alkalmazott a becsléselméletből ismert maximum-likelihood döntés, de létezik különböző távolságfüggvényeket használó, valamint mesterséges neuronhálókon alapuló osztályozási eljárás is.
A felügyelt osztályozás pontossága vizsgálható a tévesztési mátrix segítségével. A mátrix sorait az osztályozás során kapott értékekből, oszlopait a referencia-adatokból (teszt-területek, referenciatérkép) kapjuk. A különböző kategóriába tartozó elemek közt előforduló spektrális átfedések miatt a „legpontosabb” osztályozási folyamatban is előfordul hibás döntés egyes képpontokról. A hibaelemzést mindig az adott feladat függvényében kell végezni, megkülönböztetve az első és másodfajú hibákat. A hibák statisztikai leírására szolgáló tévesztési mátrix mellett a térbeli jellemzésre hibatérkép készíthető.
3. 4. Maximum-likelihood módszer Az egyes kategóriák az intenzitástérben nem pontszerűen vannak jelen, spektrális értékeik az előfordulási valószínűségi értékekkel jellemezhetők. Ezt a valószínűséget a tanulóterületről vett értékek definiálják. Az ismeretlen hovatartozású képpont abba az osztályba kerül, amely osztályhoz a legnagyobb valószínűséggel tartozik. Az egyes kategóriák átfedései miatt az osztályozás nem hibamentes, ugyanakkor belátható, hogy a maximum-likelihood módszer optimális a hibák valószínűsége szempontjából. Gyakran
szükség
van
az
osztályozási
hibák
súlyozására,
ehhez
készíthető
veszteségmátrix, melyben a téves osztályozásokhoz rendelhetünk hibasúly-értékeket. A veszteségi mátrix figyelembe vételével zajló maximum-likelihood döntés elnevezése Bayes-osztályozás,
ekkor
a
hibákból
származó
minimalizálni.
- 16 -
összes
veszteséget
kívánjuk
5. ábra: sűrűségfüggvények átfedése - az osztályozási hibák forrása
3. 5. Távolságfüggvények Az
osztályozási
folyamat
befolyásolható
a
képpontok
vagy
osztályok
távolságának definiálása. A legkisebb négyzetek módszerét a felügyelet nélküli osztályozásnál már említettem. Osztályok távolságát sűrűségfüggvényük átfedésével mérhetjük. Ilyen távolságfüggvény a divergencia:
D(i, j ) = ∫ ( p( x | ωi ) − p( x | ω j )) ln x
p( x | ωi ) dx p( x | ω j )
ahol ωi és ωj az osztályok sűrűségfüggvényei, p ( x | ωi ) pedig az x elem i. osztályba való tartozásának valószínűsége. Hasonló mértékek a Jeffries-Matusita távolság: J (i, j ) = ∫ ( p ( x | ωi ) −
p ( x | ω j ) ) 2 dx
x
és a Bhattacharrya távolság: B(i, j ) = ∫ p ( x | ωi ) p ( x | ω j )dx x
- 17 -
4. Szegmensalapú képfeldolgozás A pixel-alapú osztályozás gyakori hibája a képpont önmagában, környezetétől függetlenül való vizsgálatából ered. Jellemzően egy homogén felszínborítás egyes pontjai az átlagtól eltérhetnek, emiatt az ilyen pixelek más kategóriába nyerhetnek besorolást, mint ahova környezetével együtt valójában tartozik. További problémát jelent, hogy szuperfelbontású felvételek esetén a képi egység kisebb lehet, mint a tematikus kategória egységei, azaz a felvételen egy objektum több, önmagukban helyesen nem értelmezhető képpontból épül fel.
A pixel-alapon végzett osztályozás az egyes képpontoknak csak a spektrális tulajdonságai alapján történik. Ugyanakkor a felvételek alkalmasak környezeti viszonyok, geometriai tulajdonságok, texturális mértékek figyelembe vételére is. Ahogy említettük, a geometriai összefüggések és texturális jellegzetességek felismerésében a számítógépes kiértékelésnél hatékonyabb a vizuális interpretáció.
4. 1. A textúra A textúra (mintázat) a képpont környezetének szabályos intenzitásváltozása. Létezik determinisztikus és sztochasztikus textúra. A determinisztikus textúrák szigorú szabályok szerint ismétlődő mintákból állnak, ilyen például egy sakktábla mintázata. A sztochasztikus textúrát valamilyen statisztikai törvényszerűség határozza meg, ilyenek például a szomszédos, azonos felszíni objektumot alkotó képpontokban kirajzolódó mintázatok (elsősorban HR és VHR felbontásban).
A textúra mérésére többféle texturális mértéket használhatunk, melyek megfogalmazása a pixelek közelében lévő többi képpont intenzitásával történik. Mérhető a környezetben lévő azonos, vagy eltérő intenzitások gyakorisága. E mértékek alapján vizsgálható szomszédos képpontok összetartozása vagy elkülönülése. Mérhető tulajdonságok például a homogenitás, a véletlenszerűség.
- 18 -
A textúra mérésre gyakran használt technika a GLCM mátrixon (Grey Level Cooccurence Matrix) alapuló mértékek használata. A GLCM-nek magyar elnevezése nincs, szabadfordításban: szürkeárnyalatok együttváltozása (mátrix).
Nevével ellentétben bármely egész értékekből álló spektrális sávban számítható, de a valamely sávhoz számított mátrix független a többi sáv értékétől. A GLCM mátrix négyzetes, sor és oszlopszáma az adott sáv radiometriai felbontásával (kvantálási szintek száma) egyezik meg. Legegyszerűbb esetben a mátrix (i, j) értékét úgy kapjuk meg, hogy a szomszédos i-j képpont-párokat összeszámláljuk. Szomszédosság helyett megadható egy pozitív egész d távolság, ekkor i és j képpontok távolsága d. Négy irányban számolható GLCM mátrix: 0°, 45°, 90°, és 135°, azaz (i, j) esetben az i képponthoz képest melyik szomszédos pixel (d > 1 esetben irány) adja a j pozíciót. A párok összeszámlálása után a mátrixot a transzponáltjával összeadva szimmetrikussá tesszük, majd az elemszámmal normalizáljuk.
6. ábra: a GLCM mátrix meghatározása
A GLCM mátrixból származtatható statisztikák jellemzik a textúrát. A statisztikák a következők, ahol Pij a normalizált szimmetrikus GLCM mátrix (i, j) eleme, n a mátrix sor vagy oszlopszáma: Entrópia: n−1
∑ − ln(P ) P
i , j =0
ij
ij
a textúra rendezetlenségét, véletlenszerűségét méri.
- 19 -
Kontraszt: n −1
∑ P (i − j )
i , j =0
2
ij
a lokális különbségeket méri.
Homogenitás: n −1
Pij
∑ 1 + (i − j )
i , j =0
2
az elemek eloszlásának közelsége a GLCM főátlóbeli elemekhez. A homogenitás értéke magas, ha a mátrixbeli értékes (nem nulla) elemek a főátló környezetében csoportosulnak.
Korreláció: a szomszédos pixelek lineáris függősége. Képlete: n −1
∑
Pij (i − µ )( j − µ )
i, j =0
σ2
ahol µ a GLCM mátrixelemek átlaga, σ2 pedig a szórásnégyzete.
GLCM-alapú texturális mértékeket használhatunk a később bemutatásra kerülő Definiens eCognition objektumalapú képfeldolgozó rendszerben is.
4. 2. Szegmensalapú osztályozás Szegmensalapú osztályozás során bevezetünk egy, a pixeleknél nagyobb képi egységet, a szemgenst. Röviden definiálva a szegmens: spektrálisan hasonló, szomszédos képpontok egybefüggő halmaza. Természetesen egy felszínborítási objektum több szegmensből is állhat. A szegmensek létrehozása az osztályozási folyamat első lépése lesz, ennek eredménye a szegmenstérkép. Az osztályozás a létrehozott szegmenseket sorolja be a tematikus kategóriákba. A szegmensalapú osztályozás pontosabb lehet a pixel-alapúnál, ugyanakkor a paraméterezésre nagyon érzékeny, továbbá a határpontok besorolásakor nem elég pontos, ez az eredmény pixelenkénti felülvizsgálatával javítható.
- 20 -
A szegmentálás feladata tehát a kritériumoknak megfelelő szomszédos pixelek összevonása. A szegmentálásnak többféle megközelítése létezik, ezek kombinálva is alkalmazhatóak.
4. 3. Objektum alapú képelemzés Az objektum alapú képelemzés (röviden OBIA – Object Based Image Analysis) új megközelítés a képfeldolgozásban. Az objektum orientált paradigmához bár részben kapcsolódik, a módszert objektum alapú (és nem objektum orientált) elnevezéssel szokás jelölni. Az OBIA a pixel-alapú kiértékelés már ismertetett hiányosságainak és korlátainak leküzdése érdekében, illetve a távérzékelt felvételek korábban ki nem használt lehetőségeinek kiaknázása céljából alakult ki.
Említettem már, hogy a vizuális interpoláció, az emberi szem és agy a képfeldolgozás egyes műveleteiben hatékonyabb a számítógépes feldolgozásnál. Az emberi látás a geometriai összefüggéseket és textúrákat jóval hatékonyabban ismeri és dolgozza fel, mint a számítógépes látás, mely minden egyes képpontot külön-külön, vagy néhány pixeles környezetben értelmez. A képelemzés objektum alapú megközelítésének célja az emberi látás hatékony modellezése, a számítógépi látás gyorsaságát és mérési pontosságát kihasználva. Azonban meg kell említeni, hogy a vizuális interpretáció eredménye sem mindig egyértelmű, így annak modellezése sem zárja ki a hibák lehetőségét.
Míg a pixelalapú képelemzés az egyes képpontok által hordozott információkon alapul, az objektumalapú elemzés egysége a képi objektum - hasonló képpontok halmaza. Az objektumok lehetővé teszik a már említett geometriai és texturális jellegzetességek mérését, alkalmazását az osztályozásban. Továbbá az objektumok között kialakítható hierarchikus rendszer, felbonthatók al-objektumokra, összefoghatók szuper-objektumba. Az osztályozásban e hierarchia is szerepet kaphat, illetve ha például a felvétel egyes objektumai az elemzési feladat szempontjából érdektelenek, ezen objektumok
egy
szuper-objektumba
szervezve
csökkentik
a
feldolgozandó
adatmennyiséget, erre a gyakorlati alkalmazásokban is láthatunk majd példát. A geometriai
jellemzők
alkalmazásával
azonos
- 21 -
kategórián
belüli
alosztályokat
különböztethetünk meg, például vízfelületeket tó és folyó alkategóriákba sorolhatunk (önmagában ez a döntés természetesen hibákat is eredményezhet), illetve minimális objektumméret meghatározásával kiküszöbölhetők a lokális inhomogenitások okozta téves osztályozások. Az objektum alapú elemzés eredménye vektoros formátumban áll rendelkezésre, így térinformatikai rendszerekbe könnyen beilleszthető. Megemlítendő ugyanakkor, hogy az OBIA nem egzakt módszer, a felkínált lehetőségek nehézségeket is okozhatnak. A kívánt eredmény eléréséhez hosszadalmas paraméterezésre, tesztelésre van szükség, továbbá ahogy ezt a későbbiekben bemutatom, a szuperfelbontású felvételeken tapasztalható egyedi jelenségek miatt a kidolgozott osztályozó folyamatok automatizálása nehezen megvalósítható.
Objektum alapú képelemzéshez szükségünk van objektumokra, melyek nem állnak rendelkezésre, mint a felvételből a pixelértékekhez hasonló módon kinyerhető adatok, azaz elő kell állítani őket. Az objektumok létrehozásának egyszerű módja a kép szegmentálása. Így értelemszerűen egy felvétel objektumairól nem adható egzakt leírás, hiszen a szegmentálás, és így az eredmény a feladat függvényében nagyon széleskörű lehet, akár egyazon felvétel esetében is. A szegmentálás a felhasználható attribútumok alkalmazhatóságát, az osztályozás eredményét jelentősen befolyásoló kulcslépés az elemzésben. Az osztályozás elve megegyezik a képpont alapú osztályozáséval, az egyes objektumokat a tulajdonságai alapján statisztikai döntésekkel valamely osztályba soroljuk.
- 22 -
5. Szegmentáló eljárások A szegmentálás alapgondolata és fontos alapfogalmai után a szegmentálás végrehajtásának módjait mutatom be. Az algoritmusok felépítése mind a technika (matematikai háttér), mind a felhasznált segédeszközök (pl. adatszerkezetek) igen sokszínű. Értelemszerűen a kapott szegmenstérkép is sokféle lehet, ugyanakkor az eltérő
módszerek
megfelelően
paraméterezve
hasonló
eredményt
adhatnak.
Megjegyzendő, hogy a szegmentálásnak nincs egzakt jó eredménye, az eredmény minőségét a cél és a feldolgozandó felvétel adta lehetőségek határozzák meg.
5. 1. A szegmentáló eljárások áttekintése A következőkben a szegmentáló algoritmusok három jelentősen eltérő megközelítését mutatom be. A hisztogram és él alapú módszerek a digitális képfeldolgozás más területein alkalmazott műveleteinek átfogalmazása, a módszerektől várható eredmény távérzékelt felvételek szegmentálására nem megfelelő, ugyanakkor a szegmentálás nem csak távérzékelt felvételek feldolgozására alkalmazható (hanem pl. orvosi képelemzés), ezért röviden ezeket is bemutatom. A távérzékelés számára megfelelő szegmentálást a harmadikként bemutatandó régió alapú módszerek adják. A gyakorlatban alkalmazott szegmentálás általában az itt leírt algoritmusokból felépített komplex eljárás.
5. 1. 1. Hisztogram alapú szegmentálás
A hisztogram alapú szegmentálás elve nagyon egyszerű, ugyanakkor a kapott eredmény nem felel meg a szegmenstől definíció szerint várt fontos követelménynek, a térbeli
összefüggőségnek.
Ettől
a
követelménytől
távérzékelt
felvételeknél,
térinformatikai alkalmazásokban nem tekinthetünk el, de például orvosi célú képfeldolgozásban alkalmazható a hisztogram alapú szegmentálás. A módszer a digitális képelemzésből ismert küszöbölés eljárását alkalmazza valamely spektrális sávokra, statisztikai úton meghatároz egy vagy több küszöbértéket, melyek mentén a
- 23 -
felvételt több részre vágja (az egydimenziós intenzitástérben), a hasonló intenzitású képpontok ugyanabba a kategóriába kerülnek. Alkalmazható globálisan, az egész képre, vagy lokálisan, az egyes képrészletekre egymástól függetlenül végrehajtva. A cél lehet egy küszöbérték meghatározása, ez a felvételezett objektum és a háttér szétválasztását jelenti, és létezik többszintű, több határértéket meghatározó küszöbölés is. Az eredmény „jóságát” a hisztogram alakja befolyásolja, értelmes küszöböléshez a hisztogramban jól elkülönülő lokális maximumok szükségesek, ekkor az optimális érték e maximumok közötti minimumhely.
Az egyik leggyakrabban alkalmazott módszer az Otsu-féle küszöbölés. Az eljárás megfelelő alakú hisztogram mellett optimális eredményt ad, azaz a kapott küszöbnél maximális a két osztály különbsége. Általában szürkeárnyalatos képeken alkalmazzuk, de bármely spektrális sáv küszöbölhető ily módon. Első lépésben legyen P(i) a sáv (az összes képpont számával) normalizált hisztogramja. Ennek átlaga és szórásnégyzete:
µ=
G max
∑ iP(i)
σ2 =
G max
∑ (i − µ )
i =0
2
P(i)
i =0
ahol Gmax a lehetséges maximális intenzitásérték. A t küszöb két részre osztja a hisztogramot, melyekre:
1 t µ1 = ∑ iP(i) q1 (t ) i=0
µ2 =
σ
1 G max ∑ iP(i) q2 (t ) i=t +1
2 1
1 t = (i − µ1 ) 2 P(i) ∑ q1 (t ) i=0
σ 22 =
1 G max (i − µ2 ) 2 P(i) ∑ q2 (t ) i=t +1
ahol t
q1 (t ) = ∑ P(i) i =0
q2 (t ) =
G max
∑ P(i)
i =t +1
q1 (t ) + q2 (t ) = 1
Adott t érték mellett az osztályon belüli ( σ W2 ) és az osztályok közötti ( σ B2 ) szórásnégyzet:
σ W2 (t ) = q1 (t )σ 12 (t ) + q2 (t )σ 22 (t )
σ B2 (t ) = σ 2 − σ W2 (t ) Mivel a két szórásnégyzet összege konstans, ezért két ekvivalens lehetőség adott: az optimális küszöb az a t érték, melyre σ W2 (t ) minimális vagy σ B2 (t ) maximális. Az Otsu-eljárás általánosítható többszintű küszöbölésre.
- 24 -
5. 1. 2. Él alapú szegmentálás
A módszer a homogén területeket elválasztó élek alapján építi fel a szegmenseket. Képi élnek a hirtelen intenzitás-változásokat tekintjük, azaz a szegmenshatárokat ezek az intenzitásváltozások adják.
Éldetektáláshoz használhatjuk a képanalízisben
alkalmazott Prewitt, Sobel, Canny, Laplace konvolúciós szűrőket (a Laplace-szűrő, bár éldetektor, zajérzékenysége miatt nem alkalmazható távérzékelt felvételeken).
Az
éldetektálás
gyors
művelet,
megfelelően
paraméterezve
a
kapott
szegmenshatárok jól követik az objektumok határait, ugyanakkor nincs lehetőség geometriai kritériumok alkalmazására, a keletkező szegmensek számát, méretét nem tudjuk kontrollálni.
Szuperfelbontású felvételeken lokális inhomogenitások, a domborzati és a fényárnyék viszonyok is okozhatnak nagy intenzitásváltozásokat, emiatt a módszer ezen felvételekre nem alkalmazható.
A gradiens alapú éldetektor az egyes képpontok közvetlen környezetében méri az intenzitásváltozást. A szomszédos képpontok intenzitásbeli különbsége a gradiens. A digitális képet, mint f(x,y) kétváltozós függvényt tekintve az (x,y) pontbeli gradiens: ∂f ∂f ∇f ( x, y ) = ( x, y ), ( x, y ) ∂y ∂x ahol
∂f ∂f , a pixelérték első deriváltjai. A gradiens alapú éldetektálás a gradiens ∂x ∂x
diszkrét közelítése, a felvételen az operátor az intenzitásváltozásokat kiemeli (a változás nagyságának függvényében), a homogén területeket elnyomja. A művelet eredményét éltérképnek nevezzük.
A Sobel és a Prewitt szűrő ugyanazon elven működik, a felvétel minden képpontját konvolválja egy adott magfüggvénnyel.
A Sobel-magfüggvények:
- 25 -
− 1 0 1 − 1 − 2 1 ∂f ∂ f : − 2 0 2 és : 0 0 0 , ∂x ∂y − 1 0 1 1 2 1 a Prewitt-magfüggvények:
− 1 0 1 ∂f ∂f : − 1 0 1 és ∂x ∂y − 1 0 1
− 1 − 1 − 1 : 0 0 0 . 1 1 1
A két irány menti konvolúció eredményét összefuttatva kapjuk az éltérképet.
A Laplace szűrő a második deriváltak diszkrét közelítését alkalmazza: ∂2 f ∂2 f g ( x, y ) = ∆f ( x, y ) = 2 + 2 ∂y ∂x
f
a konvolúcióban alkalmazott magfüggvény:
0 −1 0 − 1 4 − 1 0 − 1 0 A második deriváltak miatt a Laplace operátor zajérzékeny, ezért önmagában csak mesterséges képekre alkalmazható. Gauss-simítással kombinálva alkalmas természetes képek szűrésére is, ez az ún. LoG (Laplacian of Gaussian) szűrő.
5. 1. 3. Régió-alapú szegmentálás
Alapvetően kétféle régió-alapú szegmentálási módszert alkalmazunk. A módszerek iteratívak, minden lépésben a pillanatnyi állapotra alkalmazzák a műveletet. Az összevonás-alapú módszerek az eljárás első lépésében minden képpontot önálló szegmensnek tekintenek, és meghatározott módon, iterációs lépésekben a feltételeknek megfelelő szomszédos elemeket összevonják. A vágás-alapú szegmentáló eljárások első lépésben az egész felvételt egy szegmensnek tekintik, iterációs lépésekben a szegmenseket kisebb elemekre felbontja. A szakirodalom számos régió-alapú szegmentáló módszert ismer. Természetesen az alkalmazott eljárás lehet összetett, ahogy az a később bemutatott gyakorlati példákban is látható. A képpont-alapú
- 26 -
eljárások mellett a szegmentálásnak létezik gráfelméleti megközelítése is. Az algoritmusokban alkalmazható adatszerkezetről a Függelékben írok röviden.
5. 1. 4. A szegmentálás, mint gráfelméleti probléma
A kép reprezentálható irányítatlan gráffal, a következő módon. Az irányítatlan gráf egy G = (V, E, ω) hármas, V a csúcsok, E ∈ V × V az élek halmaza, ω ∈ E → ℝ súlyfüggvény. A reprezentáláshoz rácsgráfot használunk, ahol a képpontok a gráf csúcsai, az élek súlyozása a szomszédos pixelek viszonya alapján történik.
A gráfban a szegmenseket összefüggő részgráfokkal írhatjuk le. Mind az összevonás, mind a vágás-alapú szegmentálás megoldható gráfelméleti úton. A vágás a csúcshalmaz diszjunkt részhalmazokra bontását jelenti. Ekkor csak azok az élek maradnak meg, melyek az egyes szegmenseken belüli pontokat kötik össze.
Az eljárások az összevonást illetve vágást iteratívan ismétlik, valamilyen terminálási feltétel teljesüléséig. Ez lehet a szegmensek száma, további összevonási, vágási lehetőségek hiánya, vagy fix lépésszám is.
5. 2. Összevonás-alapú szegmentálás
Az összevonás-alapú szegmentálás alulról felfelé építkező folyamat. Első lépésben minden képpont (vagy meghatározott méretű cella) önálló szegmens. A szomszédos elemek összevonása adott homogenitási kritérium teljesülése esetén történik meg. A homogenitási kritérium mellett minimális méretet is előírhatunk a kapott szegmenseknek. Ilyenkor a kritérium alapján össze nem vonható szegmens a legkevésbé különböző szomszédhoz csatolható.
5. 2. 1. Szekvenciális csatolás
A pixel-alapú módszer 2x2-es cellákra osztja a képet, majd az egyes cellákról eldönti, hogy homogénnek tekinthető-e. A 2x2-es felosztás helyett más, kettő-hatvány
- 27 -
méretű kezdeti cellaméret is alkalmazható. A homogenitási kritériumot a cellában az egyes sávok átlagának és szórásának különbsége adja, a következő egyenlőtlenségben látható módon: ( xi − x ) 2 ≤ CH ∑ 2 i =1 ( n − 1) x n
ahol n a cella pixelszáma, jelen esetben 4. Az inhomogén cellákat nem soroljuk szegmensbe, a homogén cellákkal egy területnövelő algoritmust hajtunk végre. Ez szekvenciálisan, felülről lefelé és balról jobbra haladva a homogén cellákat valamelyik (a legközelebbi) szomszédos szegmenshez próbálja sorolni. Ha nem lehetséges összevonás, a cella egy új szegmens kezdete lesz.
Az összevonás lehetőségét a szegmensekhez tartozó intenzitások átlaga és szórása által meghatározott ANOVA-kritériumok döntik el. Legyen x és y a vizsgált szegmens elemei (x m elemű, y n elemű minta), z az összevonással kapott minta. Minden sávban kiszámoljuk az m
Ax = ∑ ( xi − x ) 2 i =1
m
B x = ∑ ( xi − z ) 2 i =1
n
Ay = ∑ ( y i − y ) 2 i =1
n
B y = ∑ ( yi − z ) 2 i =1
értékeket. Ezután legyen A = Ax + Ay és B =B x + B y . A szegmensek összevonhatók, ha az alábbi egyenlőtlenségek minden sávra teljesülnek:
( A / B) ( m + n ) / 2 ≥ C1 ( Ax / m) m −1 ( Ay / n) n −1 ( A /(m + n)) m + n −2
1/ 2
≥ C2
meghatározott C1 és C2 értékekre. Az eljárás eredménye egy szegmenstérkép, melyen egy szegmens várhatóan egy felszínborítási egységhez tartozik, de természetesen egy felszínborításhoz több szegmens is tartozhat. Az algoritmus műveletigénye Ο(n), azaz lineáris a képpontok számának függvényében.
- 28 -
5. 2. 2. Legjobb összevonás
Az eljárás első lépésben minden képpontot önálló szegmensnek tekint. A vizsgált szegmenst a hasonlósági kritériumnak legjobban megfelelő szomszéddal (esetleg szomszédokkal) összevonja. Az algoritmus iteratív, többször bejárja a képet, leállási feltétele egy adott szegmensszám elérése, vagy további összevonások lehetőségének hiánya lehet. Első megközelítésben az algoritmus sorrendfüggő, azaz előfordulhat, hogy egy az A és a B szegmenssel is szomszédos C szegmens az A-val kerül összevonásra, ha az A-t vizsgáljuk előbb, B-vel, ha a B-t vizsgáljuk előbb, ugyanakkor A-C-B szegmens már nem keletkezik. A sorrend-függőség elkerülésére ideális megoldás, hogy minden iterációban csak egy összevonás történik, majd újraszámoljuk minden szomszédos szegmens-pár hasonlóságát.
Az eredményt befolyásolja a hasonlósági (különbözési) kritérium és a leállási feltétel megválasztása. A következőkben két kritériumot mutatok be:
Tilton kritérium: Tilton kritériuma az átlagos négyzetes eltérés megváltozásának minimalizálásán alapul. Valamely spektrális sávra az átlagos négyzetes eltérést (MSE – Mean Square Error) a következő várható értékkel definiáljuk:
[
]
MSE = E ( P − P r ) 2 ≅
1 N ( Pp − Ppr ) 2 ∑ N − 1 p =1
ahol P az eredeti érték, Pr a régió átlaga, N a felvétel képpont-száma. A sáv szórásnégyzetével normalizálva: NMSE =
MSE
σ2
Vizsgáljuk az átlagos négyzetes eltérés megváltozását két szegmens összevonása után: ∆NMSE =
MSE c − MSE
σ2
ahol MSE az összevonás előtti, MSEc a az összevonás utáni érték. Több sáv alapján végzett szegmentálásnál minimalizálandó a sávonként kiszámolt ∆NMSE értékek átlaga, összege, vagy maximuma.
A minimumot adó két szegmens összevonása jelenti a
legjobb összevonást.
- 29 -
Beaulieu és Goldberg kritérium: Legyen f(x,y) a felvétel, mint kétváltozós függvény, és S1, S2, … Sn a felvétel szegmensei. Ekkor fi(x,y) az Si szegmens képpont-értékeit jelenti. Legyen továbbá ri(x,y) az f(x,y) polinomiális közelítése. Ekkor a szegmensbeli közelítés hibája az i. szegmensben:
H (Si ) =
∑( f (x, y) − r (x, y))
2
( x, y )∈Si
i
Minimalizálandó ennek a hibának a megváltozása (növekedése) két szegmens összevonásakor, azaz a feladat megtalálni azt a szegmenspárt, melyek összevonása a legkisebb növekedést eredményezi. A kritérium felírható a következő módon: C ij = H ( S i ∪ S j ) − H ( S i ) − H ( S j ) . A legjobb összevonás műveletigénye legrosszabb esetben négyzetes (Ο(n2)), optimalizálva, megfelelő adatszerkezeteket használva Ο(n·logn) lehet.
5. 2. 3. Gráf alapú összevonás
A korábban említett rácsgráfban az első lépésben minden képpont önálló szegmens. A szegmenseket heterogenitásukkal jellemezzük, ami az egyes szegmenseket reprezentáló részgráfok feszítőfájában a maximális él súlya, legyen ez az S szegmensben het(S). A szomszédos S1 és S2 szegmens összevonható, ha ez nem változtatja meg jelentősen a heterogenitást, azaz ha a következő egyenlőtlenség teljesül:
k k min het ( S1 ) + , het ( S 2 ) + > het ( S1 ∪ S 2 ) S1 S 2 ahol k alkalmas küszöbérték, ennek és a szegmens elemszámának hányadosa arányos korrekciós tényező.
Első lépésben az eljárás minden élt megvizsgál a súlyok növekvő sorrendjében, és lehetőség szerint összevon részgráfokat. A rendezettség miatt az az él, amely mentén összevonás történik, az új szegmensben a minimális feszítőfa maximális éle lesz, így a feszítőfát nem kell meghatározni. Az algoritmus futási idejét a rendezés határozza meg, megfelelő adatszerkezetet alkalmazva Ο(n·logn) hatékonyságú.
- 30 -
5. 3. Vágás-alapú szegmentálás A vágás-alapú szegmentálás felülről lefelé építkező módszer, első lépésében a teljes felvétel egy szegmens, melyet a kritériumok alapján minden lépésben több részre bont. A bemutatott algoritmusok mind gráf-alapúak, ugyanakkor a hisztogram-alapú eljárás alapgondolata is felhasználható, ahogy azt az eCogniution programrendszer kínálta egyik szegmentálásnál (contrast split segmentation) ezt látni is fogjuk.
5. 3. 1. Minimális átlagsúly alapú vágás
Az algoritmus gráf alapú, az élsúlyokat hasonlóság függvény adja, azaz a kisebb élsúly nagyobb intenzitáskülönbséget jelent a szomszédos képpontok között. A vágás minimális átlagsúlyú élhalmaz mentén történik, zárt vágásokat is megengedve.
A vágás egy lépésben a G gráfot két diszjunkt (G1 és G2) részgráfra vágja. A legegyszerűbb súlyfüggvény a két részgráfot összekötő élek súlyának összege:
∑ ω (u, v)
u∈G1 ,v∈G2 , ( u , v )∈E
Minimális vágás az, melyre a súlyfüggvény az összes lehetséges vágás közül a legkisebb értéket adja. Az eljárást így az élhalmazok mérete is befolyásolja, ezt elkerülendő az összeget a vágásban szereplő élek számával normáljuk:
∑ ω (u, v) ∑1 Az így definiált eljárás nem alkalmazható a gyakorlatban, ugyanis a minimális átlagsúlyú élhalmaz megtalálása az általános gráfok körében NP-nehéz, azaz polinomiális időben nem megoldható. Ugyanakkor a probléma áttranszformálható oly formára, melyre létezik polinomiális idejű algoritmus.
Első lépésben minimális átlagsúlyú vágás helyett minimális átlagsúlyú egyszerű kört keresünk. Az egyszerű kör feltétel azt jelenti, hogy a körben minden elem egyszer szerepel. Ez a lépés egy gráf-transzformáció, az új gráf elnevezése duális gráf: GD = (VD, ED, ωD).
- 31 -
GD duális gráf előállítása: 1.
Minden G-beli rácshoz rendelünk egy pontot a duális gráfban, amely a rács közepére kerül.
2.
Létrehozunk egy segédcsúcsot.
3.
Minden
e∈ E
élnek
megfeleltetünk
egy
ugyanakkora
költségű
e D ∈ E D duális élt. A duális gráf határoló csúcsaiból a segédcsúcsba futnak
az eredeti gráf határoló éleinek megfelelő duális élek. Ebben a GD gráfban keresünk minimális átlagsúlyú egyszerű kört. A kapott élhalmaznak megfelelő élek halmaza az eredeti gráfban lehet kör, így zárt vágást, vagy két szélső élt is tartalmazó halmaz, így nyílt vágást kapunk.
Minimális átlagsúlyú kör keresése irányítatlan gráfban ugyanúgy NP-nehéz, de irányított gráfon már megoldható polinomiális időben, ezért egy újabb transzformációra van szükség. Következő lépésben minden él súlyát csökkentjük úgy, hogy a keletkező gráfban legyen pontosan egy negatív kör. A megfelelő értéket a legkisebb és legnagyobb élsúlyból indított logaritmikus kereséssel határozhatjuk meg, szükség esetén megfelelő leállási feltételt adva a keresésnek.
A polinomiális időben való megoldhatósághoz még egy transzformációra van szükség, hogy az előálló gráfra alkalmazható legyen a tökéletes illesztés feladata. A tökéletes illesztés olyan részgráf előállítása, mely tartalmazza az összes csúcsot, és minden csúcshoz pontosan egy élt a teljes gráfból. E részgráfok közül kell kiválasztanunk a minimális átlagsúlyút. Ehhez a negatív kört tartalmazó duálisból elő kell állítani a GM = (VM, EM, ωM) gráfot. Első lépésben minden GD-beli u csúcshoz rendelünk egy u1 és u2 csúcsot, és az ezeket összekötő nulla súlyú élt. Majd minden (u , v) ∈ E D élhez további két csúcsot rendelünk, ezek jelölése uv és vu. Az uv és vu csúcsokat 0 súlyú éllel kötjük össze, továbbá éleket rendelünk az uv - u1, uv - u2, vu - v1, és vu - v2 csúcsok közé, ezek súlya ωD(u,v)/2. A GM gráfban keresünk negatív tökéletes illesztést, ami egyben a gráf minimális tökéletes illesztése. Ez a feladat Ο(n2·m) időben megoldható, ahol n a csúcsok, m az élek száma.
- 32 -
Természetesen ez a művelet egy vágást hajt végre, két szegmenst létrehozva. A keletkező szegmensekre a vágást - a teljes leírt folyamatot - iteratívan végrehajtva, leállási feltételeket előírva kapjuk a kép egy szegmentálását.
A módszer érzékeny a képzajokra, a környezettől önmagukban eltérő képpontokat önálló szegmensbe sorolja be. További probléma, hogy bizonyos esetekben hamis vágást is végrehajthat, ami felesleges szegmensek létrejöttét jelenti. A zajokból származó szegmensek okozta problémákat megoldhatja egy, a szegmentálás után alkalmazott keresés, amely egy adott korlátnál kisebb képpont-számú szegmenseket a hozzá legjobban hasonló szomszédjához csatolja.
5. 3. 2. Minimális arány alapú vágás
Az arány alapú vágás a minimális átlagsúly-alapú vágás egy továbbfejlesztett változata. Az eljárásban két súlyfüggvényt használunk, ω1-t és ω2-t, ω2 bármeny élre csak pozitív értékű lehet. A súlyok aránya ω1/ω2. Vezessük még be a határköltség (ci(A,B)) és a körköltség (ci(C)) függvényeket a következő módon:
∑ ω (u , v )
c1 ( A, B ) =
1 u∈ A ,v∈B , ( u , v )∈E
c1 (C ) =
∑ ω (u, v)
( u ,v )∈C
1
∑ω
c 2 ( A, B ) =
(u , v )
2 u∈ A ,v∈B ,( u ,v )∈E
c 2 (C ) =
∑ω
( u ,v )∈C
2
(u , v )
A határköltség az A és B részgráfok közötti összefüggés erejét adja meg, ezt a második költséggel normalizáljuk, így a részgráfok közötti arány c1(A,B)/c2(A,B). Ez a minimális
átlagsúly-alapú
vágás
súlyfüggvényének
általánosítása,
ha
minden
(u , v) ∈ E -re ω2(u,v)=1, akkor megegyezik vele, azaz a probléma a korábban leírt transzformációk után oldható meg polinomiális időben.
- 33 -
Az algoritmus régiókra (például egy szegmentálás eredménye) is alkalmazható, ekkor teljes tartományok szintjén történik a vizsgálat, ugyanakkor a régióalapú gráf nem feltétlenül rácsgráf. Régióalapú vágással korrigálhatóak a hamis vágások.
5. 3. 3. Normált minimális vágás
A minimális átlagsúly alapú vágás súlyfüggvényét itt is alkalmazzuk:
∑ ω (u , v )
u∈ A ,v∈B ,( u ,v )∈E
A normalizálás figyelembe veszi a vágás méretét, az osztás a szegmensből kivezető élek súlyának összegével történik, azaz a vágófüggvény: Ncut ( A, B ) =
∑ ω (u, v) ∑ ω (u, v) + ∑ ω (u , t ) ∑ ω ( v , t )
u∈ A, v∈ B
u ∈ A , v∈ B
u∈ A, t ∈G
v∈ B , t ∈G
Ahol a nevezők szokásos jelölése assoc(A,G) illetve assoc(B,G). Az optimális vágást az
Ncut(A,B) minimalizálásával kaphatjuk meg. Ez NP-nehéz probléma, ugyanakkor a valós számok körében jó közelítés adható rá.
Legyen D diagonális mátrix, melynek i. eleme:
d ii = ∑ ω (i, j ) j∈G
azaz az i. csúcsba vezető élek súlyának összege, továbbá W a gráf súlymátrixa, azaz:
Wij = ω (i, j ) Továbbá legyen x indikátorvektor, azaz xi = 1, ha az i. csúcs az A részgráfban van, különben xi = -1, és y = (1 + x) - b(1 - x), ahol:
b =
k 1− k
és
k
∑d = ∑d xi > 0
i
i
i
Ekkor a minimalizálás felírható, mint:
- 34 -
min x Ncut ( x) = min y
yT ( D − W ) y yT Dy
ami a Rayleigh hányados. Tovább egyszerűsítve a minimalizálás a következő sajátértékegyenlet:
( D − W ) y = λDy Az eljárás rekurzív módon működik. Egy gráfról minimális vágást alkalmazva eldönthető, hogy egy szegmest alkot-e. Amennyiben vágni kell, a normált vágással két részgráfot hozunk létre, majd a keletkező részgráfokra alkalmazzuk az eljárást. A rekurzió bizonyíthatóan optimálisan terminál, a vágásoknak polinomiális idejű megvalósítása ismert. A normált vágás a sajátérték-egyenlet megoldása jelenti, például Lanczos-módszerrel.
- 35 -
6. Gyakorlati feladatok megoldása a Definiens eCognition programrendszerrel Az eddigiekben leírt elméleti háttér után rátérek a szegmentálás gyakorlati alkalmazásának bemutatására. Az alkalmazások megvalósítása egy objektum alapú képfeldolgozó programrendszerben történt. Megjegyzendő, hogy a programrendszer kínálta szegmentáló eljárások nem az elméleti részben tárgyalt algoritmusok tükörfordításai, hanem azokból összetett komplex módszerek. Kereskedelmi program lévén az algoritmusok forráskódja nem áll rendelkezésre, de a hozzá tartozó leírás (Reference Book) elég részletet árul el az eljárások elméleti hátteréről.
6. 1. Gyakorlati alkalmazások A szegmentálás és az objektum alapú képelemzés gyakorlati alkalmazásaiból mutatok be néhány példát. Ezeket a feladatokat a Földmérési és Távérzékelési Intézetben (FÖMI) dolgoztam fel. Minden alkalmazás a FÖMI egy-egy fontos feladatához kapcsolódik, ugyanakkor az általam alkalmazott objektum alapú technikát ezen feladatkörökben az intézet korábban nem alkalmazta, bár kutatás-fejlesztés a szegmentálás témakörében régóta zajlik a FÖMI és az ELTE IK Algoritmusok és Alkalmazásai tanszék közös munkájában.
Végzett munkám célja nem a bevett módszerek kiváltása, de lehetőséget ad azok más szemszögből történő értékelésére, összehasonlításra, illetve megvizsgálhatjuk az OBIA módszerek későbbi operatív alkalmazásának lehetőségét is.
Az elemzéseket a Definiens eCognition 8.0 objektum alapú képfeldolgozó programrendszerben
végeztem.
A
feladatok
bemenő
adata
ortofotó,
illetve
szuperfelbontású űrfelvétel, elsődleges eredménye egy vektoros formátumú tematikus térkép, azaz ún. shapefile, mely alkalmas további feldolgozásra térinformatikai rendszerekben. Az elemzendő adatokat előfeldolgozott formában kaptam meg. A feldolgozási folyamat első lépése egy, a kitűzött célnak lehető legjobban megfelelő
- 36 -
szegmentálás kidolgozása. A programrendszer számos, a bemutatott algoritmusokból felépített eljárást kínál, a feladathoz alkalmas lépések kiválasztása és paraméterezése a szegmentálás elméletének ismerete mellett fotogrammetriai ismereteket is igényel, a paraméterezés finomhangolása kísérletezés, tesztelés útján történt. Mindemellett a szegmentálás eredményének értékelésekor az alkalmazott felvétel korlátait is figyelembe kell vennünk. A szegmentálás után a kapott objektumok osztályozása következik. Az osztályozás a feladat nehézségének függvényében több lépésből állhat, az objektum alapú elemzés lehetőségeire erősen támaszkodva. Az osztályozás alapja kijelölt tanulóterületeken történő mintavételezés. A tanulóterületek kijelölése egyes feladatokban a felvétel vizuális áttekintése alapján, a parlagfű-detektálás alkalmazásban terepi felmérés adatai alapján történt. A szegmentáláshoz hasonlóan az osztályozás pontosítása is kísérletezés és tesztelés útján, az egyes tematikus kategóriákat leíró valószínűségi görbék módosításával történt.
Először röviden bemutatom a használt programrendszert, majd az egyes alkalmazások fejlesztési folyamatát és eredményeit. Természetesen jóval szélesebb körű mind a objektum alapú elemzés, mind a konkrét programrendszer alkalmazási lehetősége. Célszerű lenne a mikrohullámú távérzékelt felvételek (RADAR) objektum alapú elemzési lehetőségének vizsgálata, az eCognition erre alkalmas, ugyanakkor a mikrohullámú technika elméleti háttere nem része dolgozatomnak, ezért e téren gyakorlati alkalmazást nem ismertetek.
6. 2. A Definiens eCognition programrendszerről A Definiens eCognition egy objektum alapú képelemző programrendszer, elsősorban távérzékelt illetve orvosi felvételek feldolgozására kifejlesztve. Kifejlesztője a müncheni illetőségű Definiens AG. A FÖMI-ben a 8.0-ás verzió érhető el. A rendszer három modulból áll, melyekből a feladatokban az elemző környezetet biztosító eCognition Developer és a kötegelt feldolgozást vezérlő eCognition Server kap szerepet.
A felvételek egyes sávjai a programban képrétegekként jelennek meg. A képi információ legalsó szintje a képréteg. A kép megjelenítésére tetszőleges sáv-színpuska
- 37 -
kombináció választható, a feldolgozást értelemszerűen nem befolyásolja a megjelenített kompozit. A képi rétegekből tematikus rétegek, illetve rétegműveletekkel további rétegek, például spektrális indexek hozhatóak létre.
A képi objektumok hierarchikus rendszert alkotnak. A legalsó szint a pixelek szintje. Az objektumok felépítése e szint alapján történik, ugyanakkor a szinten végrehajtható műveletek száma erősen korlátozott. Osztályozást, egyes szegmentáló lépéseket nem lehet pixel-szinten végrehajtani. Az objektumok szintje összetett, további hierarchikus szintekre bontható.
A
képelemző
folyamat
fejlesztése
ún.
szabályrendszerek
(Rule
Set)
megalkotásából áll. A szabályrendszer különböző folyamatokból áll, ezek a szegmentáló, osztályozó műveletek, morfológiai műveletek, rétegműveletek, exportálás. A folyamatok két szinten, a pixelek és az objektumok szintjén hajthatnak végre műveleteket. A művelet kiválasztásával van lehetőség a paraméterek beállítására, megadhatóak a bemenő rétegek, az eredmény helye (réteg, osztály). Lehetőség van változók definiálására is.
Megemlítendő
a
felvétel
cserepekre
(tiles)
osztásának
lehetősége.
A
feldolgozandó felvételek mérete miatt egyes műveletek erőforrás-igénye gyakran meghaladja a rendelkezésre álló kapacitást. A szegmentálás nagy memória-igényéről már volt szó, nagy méretű felvétel szegmentálása csak darabonként történhet. A cserepek mérete megválasztható. A szegmentálást a cserepeken végrehajtva majd a cserepeket egyesítve kapjuk a teljes felvétel szegmentálását, az éles határok megjelenése egy összevonó lépéssel kiküszöbölhető.
A kifejlesztett szabályrendszer végrehajtható a felvétel egy részén vagy egészén, illetve több felvételen is.
6. 3. Az eCognition szegmentáló eljárásai A programrendszer többféle feltételű és célú szegmentáló eljárást kínál. Az eljárások több szinten végrehajthatóak (az esetleges korlátozásokat az egyes
- 38 -
algoritmusoknál megemlítem), a képpontok szintjén az objektumok létrehozása, objektum-szinten a meglévő szegmentálás finomítása, szegmensek összevonása, vagy szétvágása lehet cél. Egyes eljárások csupán a feldolgozandó adatmennyiség csökkentésére szolgálnak, az általuk létrehozott objektumok nem tényleges szegmensek, ugyanakkor nagyméretű felvételek esetén szükséges a képpontok helyett ezek alkalmazása a szegmentálás bemenő adataként.
Az algoritmusok változatos paraméterezési lehetőséggel bírnak. Az eljárások részletezésekor csak a szegmentálás szempontjából érdekes paramétereket említem. Ezek mellett a kimenő adatokat is befolyásolhatjuk, például a küszöböléssel kapott szegmenseket osztályokba rendelhetjük. A szegmentálást befolyásoló paraméterek eljárás-függőek. Kiválaszthatóak a felvétel azon sávjai (képi és számolt sávok egyaránt), melyek alapján az algoritmus dolgozik, ezek súlyozására is lehetőség van. A küszöb alapú eljárásokban a küszöbérték meghatározását, a kritérium alapú eljárásokban a homogenitás mértékét és összetevőit állíthatjuk be a paraméterekkel.
A részletezés során az alkalmazható eljárások és lehetséges paramétereik angol nyelvű elnevezését használom, ezek magyar fordítása egyértelmű. Az egyes szegmentálások eredményeit a későbbiekben bemutatásra kerülő „facsoportok lehatárolása” feladatban is használt színes infravörös légifelvételen szemléltetem, ahol indokolt, ott többféle paraméterezés mellett.
Chessboard segmentation:
A sakktábla-szegmentálás a képet négyzetekre bontja. Értelmes jelentéssel bíró objektumok létrehozására nem használható, ugyanakkor további szegmentáló lépések előkészítésére
használhatjuk,
elsősorban
nagyméretű
felvételek
feldolgozását
gyorsíthatjuk meg. A képpontok helyett a létrehozott szegmenseket használjuk az értelmes objektumokat létrehozó algoritmusok bemenő adataként.
Paraméterei: a négyzet kívánt oldalhossza.
- 39 -
7. ábra: sakktábla szegmentálás eredménye 100 pixel oldalhosszal (a színes infravörös felvételek valamint a hamisszínes kompozit jellemzője a növények vörös színe)
Quadtree segmentation:
A sakktábla-szegmentálás összetettebb változata, a képet négyfa-ráccsal (l. Függelék) felosztja. A felosztást a méretre adott felső korlát, valamint paraméterezhető homogenitási kritérium befolyásolja. A homogenitási kritérium alkalmazásával a kapott objektumok az erős geometriai megkötöttség mellett spektrálisan is összefüggenek. Ezt az algoritmust is elsősorban nagy felvételeken, a további lépéseket segítendő alkalmazzuk.
A paraméterek: Scale: a szegmensen belüli spektrális eltérés maximuma a kiválasztott rétegeken. Layer weights: a szegmentálás során alkalmazni kívánt rétegek kiválasztása, súlyozása.
- 40 -
8. ábra: négyfa szegmentálás scale=50 és scale=100 paraméterezéssel
Contrast split segmentation:
Az eljárás az objektumokat sötét és világos szegmensekre bontja. Az algoritmus (a hisztogram alapú szegmentálásnál bemutatott módszerhez hasonlóan) minden objektumra meghatároz egy optimális küszöböt, mely a keletkező világos és sötét szegmensek közötti kontraszt maximuma. A küszöböt paraméterként megadható intervallumban keressük Az algoritmus meglévő objektumokat vág fel, pixelszinten alkalmazva ezért először végrehajt egy sakktábla-szegmentálást, melynek eredménye adja a vágandó objektumokat.
Paraméterezés: Chessboard tile size: pixelszinten a kezdeti objektumok mérete Minimum/maximum threshold: az intervallum, melyben a küszöb meghatározandó. Step size: a küszöb meghatározásán alkalmazott lépésköz (nagyobb érték-gyorsabb, kisebb érték-nagyobb kontraszt az objektumok között) Image layer: az alkalmazott réteg Contrast mode: a használandó mérték: él-alapú, objektum-alapú
Megadható egy-egy osztály a sötét és világos objektumok számára, változók a küszöb és a kontraszt számára, minimális objektumméretek.
- 41 -
9. ábra: contrast split szegmentálás a következő paraméterezéssel: chessboard tile size=256, step size=3, contrast mode=object difference
Multiresolution segmentation:
Az algoritmus képpontokat vagy objektumokat von össze, azaz összevonás-alapú. Optimalizáló módszer, adott objektumszám mellett minimalizálja az átlagos heterogenitást, és maximalizálja az objektum saját homogenitását. Olyan objektumokat von össze, melyek kölcsönösen legjobban illeszkednek egymáshoz.
Az algoritmus lépései: 1. kezdő lépésben minden képpont önálló objektum. Ezeket több lépésben nagyobb objektumokba vonja össze, amíg azok egy adott homogenitási küszöböt el nem érnek. Ez a küszöb a paraméterben megadható spektrális és alaki homogenitás értékekből keletkezik. 2. Az így keletkezett minden magobjektumhoz megkeresi a legjobban illeszkedő szomszédot 3. Ha a legjobban illeszkedés nem kölcsönös, az összehasonlításban szereplő objektum lesz a következő vizsgált objektum 4. Ha a legjobban illeszkedés kölcsönös, a két objektumot összevonja - 42 -
5. minden iterációs lépésben minden objektumot egyszer vizsgál 6. Az iteráció leáll, ha nincs további összevonási lehetőség.
Paraméterezés: Layer weights: a szegmentálás során alkalmazni kívánt rétegek kiválasztása, súlyozása. Scale parameter: a megengedett maximális heterogenitás egy objektumon belül Shape: a spektrális és geometriai homogenitás mértéke (color = 1 - shape) Compactness: az objektumok kompaktságának mértéke
10. ábra: a multiresolution segmentation kritériumának összetétele
- 43 -
11. ábra: multiresolution segmentation color=0,9, scale=50 paraméterek mellett
12. ábra: multiresolution segmentation scale=50 paraméter és nir=2, red=1, green=0 sávsúlyok mellett
- 44 -
13. ábra: multiresolution segmentation scale=10 paraméterek mellett
14. ábra: multiresolution segmentation color=0,1 (shape=0,9), scale=50 paraméterek mellett
Spectral difference segmentation:
Az algoritmus szomszédos objektumokat von össze, amennyiben az átlagos intenzitásértékeik különbsége a megadott küszöb alatt marad. Szegmentálás finomítására tervezett algoritmus, képpont szintből objektumok létrehozására nem használható.
- 45 -
Paraméterezés: Maximum spectral difference: két összevonandó objektum maximális eltérése.
15. ábra: spectral difference szegmentálás maximum spectral difference=5 paraméter mellett
Multi-threshold segmentation:
Az eljárás az objektumokat felosztja megadott pixel-szintű küszöbértékek alapján. Megadható tetszőleges számú küszöb, az objektumokat osztályokba is sorolhatjuk.
6. 4. Osztályozás végrehajtása A szegmentálással létrehozott objektumokon végrehajtható az osztályozás. Ahogy említettem,
az
objektum
alapú
osztályozás
menete
hasonló
a
pixel-alapú
osztályozáshoz, ugyanakkor az osztály definiálására jóval szélesebb körű lehetőség adott. A spektrális átlag és szórás mellett a programrendszer geometriai és texturális jellegzetességek, valamint az osztályhierarchiában betöltött szerep is megjelenhet az osztály leírásában. A leírásban megadhatóak küszöbértékek, vagy valószínűségi görbék az egyes jellegzetességekre. A fix küszöbérték az objektumok osztályhoz való illesztésében 0 vagy 1 valószínűséggel szerepel. Az osztályhoz tartozást a jellemzők
- 46 -
valószínűségének minimuma dönti el. Abba az osztályba soroljuk az objektumot, melyre ez a minimum maximális, amennyiben ez legalább 0,1 valószínűséget jelent. Ezt az osztályozást „classification” eljárással hajthatjuk végre. Az osztályozandó objektumok köre szűkíthető például korábbi osztályozás kategóriái alapján. A célosztályok szintén megválaszthatók, az illesztés csak a kiválasztott osztályokra történik meg.
A „classification” eljárás mellett az „assign class” eljárással lehetőség van objektumok egy adott osztályba sorolására küszöbértékek megadásával is, ekkor nincs szükség osztálydefinícióra. Ekkor is megadható az osztályozandó objektumok köre, valamint egy célosztály. A küszöbértéknek megfelelő objektum a kiválasztott osztályba kerül, az esetben is, ha az osztályhoz tartozik definíció, amelynek nem felelne meg az objektum.
Az osztályozás folyamatában bármikor alkalmazható a nem osztályozott („unclassified”) kategória is, osztályozott objektumokat visszasorolhatunk nem osztályozottba. Ennek például akkor van értelme, ha például egyes szomszédos objektumok egyenként eleget tesznek az osztálydefiníciónak, de összevonva már kiesnek a kategóriából.
Az osztályozás a jó eredmény érdekében a szegmentáláshoz hasonlóan tesztelést igényel. Javítás a küszöb vagy a valószínűségi görbe módosításával hajtható végre, ez utóbbi a tartomány tetszőleges helyén módosítható, ahol az értéke nem 0.
- 47 -
7. Fák lehatárolása (MePAR felújítás) Az eszköz rövid leírása után rátérek az egyes gyakorlati alkalmazások bemutatására. A FÖMI egyik legfontosabb, legnagyobb emberi erőforrásokat igénylő feladata a Mezőgazdasági Parcella Azonosító Rendszer (MePAR) üzemeltetése és folyamatos felújítása. A MePAR a területalapú támogatások kizárólagos hivatkozási rendszere (2004-től), melyben minden mezőgazdasági tábla egyértelműen azonosítható és lekérdezhető. A MePAR EU-szintű feladatai a terület alapú mezőgazdasági támogatások kezelése a kérelmezéstől a terepi és távérzékeléses ellenőrzésig. A rendszer alapegysége a fizikai blokk. A blokkok határvonalait jellemzően valamilyen időben állandó természetes vagy mesterséges terepi objektum, például patak, fasor, erdőszél, vagy utak, vasút adja. Teljes állandóság azonban ezen objektumoktól sem várható el, a MePAR-t folyamatosan fel kell újítani. A felújítás egyik alapvető forrásanyagát a minden évben elvégzett, az ország területének nagyjából egynegyedét (4-5 megye) érintő légifelvételezés, illetve a légifelvételekből előállított ortofotó adja.
A rendszerben szereplő blokkok egyik fontos tulajdonsága a támogathatóságra vonatkozik, azaz hogy igényelhető-e rá mezőgazdasági támogatás. Jellemző támogatható területek például a szántók és a legelők, jellemző nem támogatható területek az erdős, fás, bokros területek. A bemutatott alkalmazásom célja e területek elkülönítése. A cél elsősorban a legelőként támogatható területeken megjelenő fás, bokros területek automatikus lehatárolása, és a támogatható területekből való kivágása. A feladat jellege nagyon nagy pontosságot kíván meg, az ortofotók geometriai felbontása (0,4 m2) ezt lehetővé tenné, ugyanakkor pont e nagyon nagy felbontás a felszínborítás olyan jellegzetességeit is rögzíti, melyek tévesztéseket eredményeznek. E miatt a művelet teljes automatizációja nem megengedhető.
A feladattal kapcsolatban a pontosság mellett további geometriai elvárások adottak. A MePAR felbontása nem olyan részletes, mint a felvételekből származó vektoros eredményeké (MePAR méretű rendszert az ilyen felbontás kezelhetetlenné tenné). Ezért az eredményeket generalizálni kell. Továbbá a 0,1 ha-nál kisebb
- 48 -
területeket nem kívánjuk rögzíteni. A lehatárolt területeket egy ún. negatív bufferrel (1 pixel mérettel) szűkíteni kell, mivel nem a felszín, hanem a lombkorona kerül lehatárolásra. A programrendszerrel megoldható az ezen elvárásoknak való megfelelés, geometriai jellegű műveletek végrehajtásával az osztályozás után.
A feladat pixel-alapon nem megoldható, ugyanis a használt felvétel geometriai felbontása miatt a felszínborítási egységek nagyobbak a képpontnál. Ez a felbontás egyfelől nagy geometriai pontosságot tesz lehetővé, ugyanakkor lokális spektrális jellegzetességek megnehezítik az osztályozást, ugyanis nagyon nehéz elválasztani egymástól a valóban facsoporthoz tartozó objektumokat és az esetleg hozzájuk nagyon hasonló, de egyéb felszíni objektumhoz tartozó szegmenseket. Ilyen esetben előfordulhat, hogy vizuális kiértékeléssel sem dönthető el egyértelműen a kérdés.
7. 1. A felhasznált felvételek A MePAR felújításhoz minden évben megadott területről digitális légifelvételek készülnek. A felvételezés három sávban történik, készül a látható tartománynak megfelelő, illetve CIR felvétel, mindkét esetben sávonként 8 bites mélységben kvantálva. A légifelvételből állítható elő a képelemző rendszerekkel feldolgozható ortofotó. Az ortofotó térképileg helyes, területmérésre is lehetőséget adó felvétel.
Az alkalmazásban a CIR ortofotókat használom. A felvételek térbeli felbontása 0,4 (2009 évi felvételek esetén) és 0,5m. A szabályrendszer fejlesztése a 2009-es felvételeken történt, mely Bács-Kiskun, Fejér, Tolna és Baranya megyéket fedi.
A mezőgazdasági célú felhasználás miatt a felvételezés a nyár folyamán, a felhőtlenség érdekében általában a délelőtti órában történik.
7. 2. A feldolgozás folyamata A feldolgozás három fő lépésből áll. Első lépés a felvételek szegmentálása, majd a szegmentálással kapott objektumok osztályozása következik, végül az említett geometriai feltételeket utófeldolgozási lépésekben biztosítjuk. - 49 -
Elsősorban az osztályozásnál figyelembe kell venni a felvételek készítéséből faladó térbeli és időbeli tényezőket, melyek lokális sajátosságokat eredményeznek. A felvételek nem egy időpontban készülnek, emiatt elsősorban megvilágításbeli különbségek, a napsugárzás beesési szögének változása és így az árnyékolás módosulása tapasztalható a felvételeken. Térbeli változásokat egyrészt a nagy terület miatt, másrészt a domborzati viszonyok következtében tapasztalunk. Egyes, a kategorizáláskor fontos jellemzőket ugyanis befolyásolja, hogy az adott felvétel például a Kiskunságon, a Mezőföldön, vagy a Mecsek környékén készült. A domborzat szintén befolyásolja a megvilágítást. Ezen tényezők miatt több szabályrendszer készült, általában 1:100000-es EOV szelvényenként módosítva. A módosítások csak az osztálydefiníciókat érintik, a szegmentálást nem.
Az utófeldolgozás egy része a geometriai követelményeknek való megfelelés biztosítása, ez a szabályrendszerben megvalósított. Az eredmények MePAR-beli feldolgozásához további, térinformatikai adatbázisban végzendő műveletekre van szükség, melyek a dolgozat témájához nem kapcsolódnak, így ezeket nem részletezem.
A részletes leírás során kettő területet mutatok be, a Kiskunságon (IzsákOrgovány községek környezetében) és a Völgységben (Tolna- és Baranya megye határa) alkalmazott osztályozást. Az ábrákon a felvételek hamis színes kompozitjai láthatóak (R: közeli infravörös, G: vörös, B: zöld).
A fás, bokros területek elkülönítése más növénytakarástól elsősorban texturális jellegzetességek útján történhet, ezért a feldolgozás texturális mértékekre erősen épít. A textúra mérésére részben a már említett GLCM mátrix módszerrel, részben az objektumok képpont-értékeinek szórását vizsgálva történik.
7. 3. Szegmentálás A
szegmentálás
elsődleges
szempontja
a
lehatárolandó
objektumok
határvonalának pontos követése. Lehatárolt területek belüli megkülönböztetés nem része a feladatnak, ezért például a különböző fafajták határvonalának szegmensekkel való követésére nem törekedtem. További fontos szempont, hogy a várhatóan nem lehatárolandó homogén területek a lehető legnagyobb szegmenseket alkossák. Így az - 50 -
osztálydefiníciókban méretbeli korlátokat is bevezethetünk, továbbá a feldolgozandó objektumok száma jelentősen csökken.
A szegmentáláshoz a képi sávok mellett további rétegeket vezetünk be. Ezek a három sáv átlagából kapott fényesség (brightness), az NDVI, valamint a nir sáv alapján számolt éltérkép (Canny-féle éldetektálással). Az éltérkép az objektumhatárok megtalálása mellett jelen esetben a fák lombkoronájában megfigyelhető lokális intenzitásváltozások kiemelésére is alkalmas, elsősorban ez utóbbi tulajdonsága miatt alkalmazom.
A szegmentálás több lépésben történik, a kívánt eredményt fokozatosan közelítve. A felvételek nagy mérete miatt 2000x2000 pixel méretű cserepeken történik, de emellett is nagyon sok objektumra számítunk, ezt redukálom a szegmentálás első lépésében.
1. lépés: „quadtree segmentation” a vörös, a közeli infravörös és a fényesség sávok alapján, scale = 30 paraméter mellett. A lépés célja az objektum-szint létrehozása. Az algoritmusnak megfelelően a kapott objektumok négyzet-alakúak, a lokális homogenitásnak megfelelő méretben. Inhomogén területen előfordulhat 1 pixel méretű objektum is, határvonalakon jellemzően 4, lombkoronában 4-16 képpont méretű objektumokat kapunk, de homogén területeken ennél jóval nagyobb lehet egy objektum.
Ezek az objektumok felhasználható információt még nem hordoznak, további lépésekre van tehát szükség.
2. lépés: „multiresolution segmentation” a vörös, a nir, az ndvi, a fényesség és az éltérkép alapján, az éltérkép sávot kétszeresen súlyozva. A paraméterezése: Scale = 10, Shape = 0,1, azaz a spektrális homogenitást részesítjük előnyben, Compactness = 0,9, azaz kompakt objektumokat várunk.
A kapott eredmény az objektumhatárokat jól követi, ugyanakkor nagyon hasonló szomszédos objektumok maradnak, ezek összevonása szükséges, elsősorban homogén területeken.
- 51 -
16. ábra: szegmensek a második lépés után
Itt meg kell említeni, hogy a célkategóriákba nem tartozó homogén területeken is előfordulhatnak lokális jellegzetességek, amelyek a szegmentálás jelenlegi lépésében önálló objektumot alkotnak. Ezen objektumok tulajdonságaik alapján bekerülhetnek valamely kategóriába, ugyanakkor megfelelő mértékek alapján a szomszédos, homogén területekhez állnak közelebb, amivel összevonhatóak. Ennek megoldása legalább annyira fontos lépés, mint a határkövető szegmentálás, ennek érdekében újabb összevonást hajtunk végre.
3. lépés: „spectral difference segmentation”: a zöld, a vörös, a nir, a fényesség és az ndvi sávok alapján. Paraméterezése: Maximum spectral difference = 5. A lépés a homogénebb területeket nagy objektumokká összevonja, az inhomogén célterületeken kisebb összevonásokat hajt végre.
- 52 -
17. ábra: szegmensek a harmadik (utolsó) lépés után
A kapott eredmény megfelel az előzetes elvárásnak. Bár a szegmentálás itt lezárulhatna, még egy lépést alkalmazunk, a szomszédos cserepek határán létrejövő azonos tulajdonságú objektumok összevonására. Ehhez szükséges egy logikai változó definiálása az objektumokhoz, mellyel a határokat érintő objektumokat jelöljük. A cserepek összeillesztése után az osztályozó lépések előtt még egy „multiresolution segmentation” szegmentálást hajtunk végre a határobjektumokon. A paramétereket úgy állítjuk be, hogy csak a szomszédos cseréphatárokon található szegmenseket vonja össze (megismételve a korábbi lépés paramétereit - így az azonos cserépen lévő objektumok nem vonhatók össze).
A szegmentáló lépések minden célterületre fejlesztett szabályrendszerben megegyeznek.
- 53 -
18. ábra: szegmentálás eredménye más jellegű területen
7. 4. Osztályozás A szegmentálás azonos lépésekkel és paraméterezéssel alkalmazható a teljes célterületre, az osztályozó folyamat azonban erősen területfüggő. Egyes területeken jó eredményeket adó szabályrendszer más jellegű területeken nem elfogadható hibás osztályozáshoz vezet. A hibák forrása többek között az eltérő domborzati viszonyok, és az adott területre jellemző természetes és ültetett növényzet, az előforduló fa és bokorfajták. Mindemellett a cél minél általánosabb, a lehető legtöbb területre alkalmazható osztályozás fejlesztése.
Az osztályozási hibákat a rendelkezésre álló felvételek alapján nem lehet teljesen kiküszöbölni, az eredmények további felhasználásának szempontjából az első- és másodfajú hibák nem azonos súlyúak. Ha a nullhipotézis szerint az objektum nem tartozik a célkategóriába, akkor a tévesen osztályba sorolás jelenti az elsőfajú hibát. Mivel a beosztályozott terület a MePAR-ban nemtámogathatónak minősül, az ilyen tévedést nem engedhetjük meg. A másodfajú hibát a valójában osztályozandó, de
- 54 -
mégsem
beosztályozott
objektumok
adják.
Az
ilyen
hibák
teljesen
nem
kiküszöbölhetőek, ha az elsőfajú hiba teljes kizárására törekszünk. Ugyanakkor másodfajú hiba leggyakrabban a cél szempontjából érdektelen területeken, összefüggő erdőkben fordul elő. További hibaforrást jelenthet a lombkoronák által vetett árnyék. Az árnyékolt területet nem osztályozhatjuk be, ami például facsoportok vagy erdő szélén jó döntés, de összefüggő erdőterületen magasabb fák árnyékának kihagyása hibás eredményt ad. Itt ismét megemlítem, hogy összefüggő erdőterületekben előforduló hibák a feladat szempontjából nem jelentősek, illetve geometriai feltételek teljesülése esetén az ilyen hiba megszűntethető.
Az osztályozás bemutatására a korábban említettek szerint két jellemző területet választottam ki. A völgységi (és az ahhoz hasonló jellegzetességeket mutató) területek pontos osztályozása a nem osztályozandó növényzet tulajdonságai miatt nehezebb feladat.
19. ábra: jellegzetes kiskunsági és völgységi területrészlet
Az osztályozás első lépése az árnyékok leválasztása. A szegmenshatárok az árnyékokat is jól követik, így, és az árnyékra jellemző tulajdonságok következtében azok besorolása nem jelent problémát. Az osztály definíciója éles (azaz valószínűségi görbe nélküli) küszöbértékeket tartalmaz, a fényesség és a nir sávra felső, a nir sáv GLCM homogenitására alsó korlátot adunk. Az árnyékok leválasztása után a későbbi osztályozás könnyítésére a bármilyen növényzethez tartozó objektumok beosztályozása történik meg, a további lépések csak ezen objektumokat vizsgálják. A növényzet elkülönítésére értelemszerűen az ndvi indexet használjuk. Az ndvi értéke jellemzően a
- 55 -
[-1, 1] intervallumba esik, a magasabb érték magasabb klorofill-elnyelésre, így a zöld növényzet hangsúlyos jelenlétére utal. Korlátnak 0-t választva elfogadható eredményt kapunk, melyet geometriai tulajdonságok alapján tovább javíthatunk. A homogén területek (szántóföld, legelő, gyep) nagyméretű szegmenseket alkotnak, így alkalmas méretkorlát mellett ezeket a további vizsgálatból kizárhatjuk. Továbbá egy jellemző hibaforrás, a szántókban látható szekérutak, traktornyomok hatása is részben kiküszöbölhető. Ezek ugyanis a fákhoz spektrálisan hasonló tulajdonságokat mutathatnak, így tévesen beosztályozhatóak, ugyanakkor geometriai jellegzetességük (általában keskeny, hosszú szegmensek) alapján kiszűrhetőek. Ezek alapján a növényzet osztály definíciója az ndvi indexre valamint szegmensméretre és alakra vonatkozó korlátokból áll.
20. ábra: növénytakaró kiválasztása NDVI alapján
A következő lépés az osztályozás lényegi része. A fás, bokros területek spektrálisan és texturálisan is, bizonyos jellegzetességek mellett nagyon változatos képet mutatnak. A célkategórián belüli fajta-megkülönböztetés nem része a feladatnak, így a végeredmény alkategóriákat nem tartalmaz, a folyamatban mégis szükségszerű alosztályok bevezetése. Ezen alosztályokat fajtaismeret nélkül, csupán a mutatott jellegzetességek alapján vezetem be. A felvételek részletes vizuális áttekintése és kísérletezés alapján kilenc kategóriát határoztam meg. A kategóriák definiálásának első lépése a mintavételezés. Mintának minden kategóriából azt jól jellemző, lehetőleg minél nagyobb számú objektumot választottam. A minták az objektumok kiválasztott - 56 -
tulajdonságai alapján valószínűségi görbéket definiálnak, melyek az osztály leírásába kerülnek. Azaz ezek alapján maximum-likelihood döntéssel minden objektumról eldönthető, melyik osztályba tartozik a legnagyobb valószínűséggel. Értelemszerűen előfordulhat, hogy az objektum egyik osztályba sem tartozik, ezért csak a P > 0,1 valószínűségeket vesszük figyelembe. A valószínűségi görbéket csak spektrális tulajdonságok, az egyes sávok átlaga és szórása adják. Geometriai tulajdonságok ilyen leírására nincs szükség, a texturális tulajdonságok nagy számításigénye pedig kezelhetetlenül lassúvá teszi a feldolgozást. E tulajdonságok így fix küszöbként kerülnek be az osztályleírásokba. A leírásban logikai operátorokat is használhatunk, egyes tulajdonságok egymást kizáró, vagy együttes meglétének biztosítása érdekében. Az alkalmazott texturális mérték minden esetben a GLCM homogenitás.
21. ábra: egy osztályhoz tartozó valószínűségi görbék (eCognition felület)
Értelemszerűen mind a valószínűségi görbék, mind a fix küszöbértékek kísérletezéssel és teszteléssel folyamatosan javítandóak. A tesztelés kis területeket kiválasztva, és az osztályozást azon elvégezve történik. A görbéknek mind a határa, mind az alakja módosítható. Az egyes területekre fejlesztett szabályrendszerek között legnagyobb különbség e ponton van, a görbék jellemzőiben és a küszöbértékekben. Egyes területeken hasznosnak bizonyul további kategóriák hasonló módon történő bevezetése, melyekbe biztosan nem lehatárolandó objektumok kerülnek. Előfordul ugyanis, hogy ilyen objektumok, bár láthatóan nem tartoznak a célkategóriába,
- 57 -
tulajdonságaik alapján mégis besorolást nyernek valamelyik osztályba. Ezek kiküszöbölésére szűk tartományú görbékkel definiált osztály alkalmas lehet.
22. ábra: az osztályozás eredménye a mintaterületeken (zöld: nem fás jellegű növény, kék árnyalatok: fatípusok)
A folyamat következő lépése a kapott eredmény javítása szűkítéssel. A cél olyan, azonos kategóriába eső szomszédos objektumok kiválasztása, melyek egyenként megfelelnek az osztálydefiníciónak, összevonva azonban nem teljesítenek valamilyen feltételt. Elsősorban nagy területű, összefüggő, inhomogén textúrájú természetes növényzet (például felhagyott mezőgazdasági, gyomos területek) okozhat ilyen hibákat. Ennek
kiszűrésére az
azonos
kategóriába
tartozó
szomszédos objektumokat
összevonjuk, majd megvizsgáljuk az összevont objektum adott feltételnek való - 58 -
megfelelését. A kritériumok egyrészt geometriai jellegűek, valamilyen méret meghaladása esetén az objektum az osztályból kizárandó, illetve texturális, homogenitási korlát elérése lehet. Ezen kritériumok megadása az osztályozás nagyobb területen történő végrehajtásával, annak hibás eredményeinek vizsgálatával lehetséges.
A továbbiakban már csak geometriai lépésekre van szükség. A végeredményben csak egy kategória van, a jelenlegi osztályokat összevonhatjuk egy osztályba. A szomszédos objektumok összevonása után a nem besorolt objektumok egy részét, azon elemeket, melyek csak beosztályozott objektummal határosak, és egy méretkorlát alatt maradnak, beosztályozunk. A lépéssel az erdős területekben előforduló homogén foltokat, illetve árnyékként bekategorizált objektumokat, továbbá mezőgazdasági tevékenységre alkalmatlan (például nehezen megközelíthető, kis méretű) tisztásokat kezeljük. Az ilyen területek besorolása az eredmény felhasználóinak elvárása, része a feladatnak (a méretkorlát is adott).
23. ábra: teljesen körbezárt, be nem osztályozott szegmensek kiválasztása geometriai jellemzők alapján (sárga objektumok)
A további, a felhasználói elvárásokat biztosító geometriai lépések az utófeldolgozási folyamat részei.
7. 5. Utófeldolgozás A geometriai elvárásoknak való megfelelés is megoldható a szabályrendszerben. A generalizálás, valamint a szűkítés egy lépésben megvalósítható. A képfeldolgozásban
- 59 -
ismert morfológiai műveletek, a „shrinking” és „growing” alkalmazható a besorolt objektumokra. A szűkítést 1 képpont méretű „shrinking” megoldaná, azonban 3 képpont méretű „shrinking” majd 2 képpont méretű „growing” hasonló, de generalizáltabb eredményt ad, ugyanis a növelés nem a korábbi állapot, hanem az aktuális objektumhatár alapján dolgozik, így az eredeti cizellált határvonal leegyszerűsödik.
24. ábra: a generalizálás (régiócsökkentés és növelés) hatása
Utolsó lépésben a 0,1 ha-nál kisebb objektumok kiszűrése történik meg. Ezután az osztályba tartozó objektumokat exportáljuk, a kapott eredmény vektoros formában, ún. shapefile-ban áll rendelkezésre, mely térinformatikai rendszerekkel kezelhető.
25. ábra: az osztályozás végeredménye a mintaterületeken
7. 6. Pontosság A pontosság kérdését már többször említettem. Az eredmények támogatható területek méretét, és így a kifizetett támogatások összegét befolyásolja, ezért a módszer
- 60 -
automatikus felhasználásához nagyon pontos osztályozásra lenne szükség. Ugyanakkor az elérhető pontosságot több tényező is befolyásolja. A felvételezés technikájából fakadóan a légköri, megvilágításbeli tényezők nem egységesek, de űrfelvételekhez hasonló kalibrációra (ToA reflektancia) nincs lehetőség. E mellett a nagyon nagy térbeli felbontás olyan lokális jellegzetességeket is kiemel, amelyek következtében az adott objektum tulajdonságai eltérnek a saját kategóriájától, esetleg egy más kategóriára jellemző értékeket vehetnek fel, így téves osztályozáshoz vezetnek. Előfordulnak olyan objektumok, melyekről vizuális kiértékeléssel sem dönthető el egyértelműen, hogy milyen felszínborítási kategóriához tartoznak.
Mindezek mellett az elért pontosság általánosan elfogadható, a vizuális interpretációt nem válthatja ki, de az interpretátor feladatát jelentősen megkönnyítheti.
7. 7. Javítási lehetőségek A kapott eredményeknél kevesebb hibával járó, nagy területen, általánosan alkalmazható, teljesen automatikus feldolgozásra alkalmas osztályozás a bemenő adatok körének bővítésével lenne lehetséges. Több felvétel rendelkezésre állásával idősor-alapú módszert lehetne kidolgozni, illetve változáskövető vizsgálatra is lehetőség lenne. Ugyanakkor ilyen felbontásban nem áll rendelkezésre több különböző időpontban készült
felvétel
(idősor-alapú
elemzéshez
egyazon
évben,
meghatározott
időintervallumokban készült felvételek szükségesek). A rendelkezésre álló HR felbontású
felvételek
térbeli
részletességük
miatt
nem alkalmazhatóak.
Más
megközelítésben a feladat specializálásával, a vizsgálandó területek jellegének szűkítésével javítható lehet az eredmény.
- 61 -
8. Vörösiszap-elöntés (katasztrófa-felmérés) Már említettük, hogy a távérzékelés egyik fontos feladata a légi- vagy űrfelvételeken látható környezeti és ipari katasztrófák felmérése. A FÖMI-ben ár- és belvízfelmérés, aszályfelmérés, valamilyen kártevő (pl. gyapjaspille) kártételének vizsgálata rendszeres feladatok. A rendszeresen megismétlődő természeti katasztrófák mellett előfordulnak egyedi események is, melyeknek távérzékeléssel vizsgálható környezeti hatásuk van. Ilyen esemény történt 2010. október 4-én Ajka mellett, amikor a Magyar Alumínium Zrt. egyik zagytározójának (X. kazetta) gátja átszakadt, és a tárolt erősen lúgos kémhatású vörösiszap egy része elöntötte a környező területet. Az elöntés érintette három település belterületét, mezőgazdasági területeket, vízbázisokat, valamint a Torna patakon keresztül a Marcal és a Duna folyókat is. A FÖMI-ben végrehajtott katasztrófafelmérés többek között a terület méretét, a részben vagy egészben elöntött mezőgazdasági parcellák jellemzőit vizsgálta. E vizsgálatok keretében végeztem objektum alapú elemzéseket szuperfelbontású űrfelvételeken. Munkám elsősorban kutató jellegű, nem operatív felhasználásra készült (a felvételek késői időpontja, és hiányos fedésük miatt), de összehasonlítható terepi felmérésből, légifelvételezésből nyert adatokkal.
8. 1. A felhasznált felvételek Az időjárási viszonyok miatt felhasználható VHR felvétel csak napokkal a katasztrófa után készült.
Az első felvétel: 2010. október 9-én készült 8 sávos, 2m felbontású WorldView2 (WV2) felvételből előállított toa-reflektancia kép. A felvétel spektrális felbontása is nagyon jó, a látható tartomány mellett egy vörös-határ (a látható és közeli infravörös tartomány határa), két közeli infravörös, valamint a látható kék tartományhoz közeli, rövidebb hullámhossz-tartományban érzékelő sáv áll rendelkezésre. A sávok név szerint: 1. coastal, 2. blue (kék), 3. green (zöld), 4. yellow (sárga), 5. red (vörös), 6. rededge (vörös-határ), 7. near infrared 1 (közeli infravörös), near infrared 2, ez utóbbiakat
- 62 -
nir1 és nir2-vel rövidítem. A coastal sáv elsősorban nyílt vizek vizsgálatakor használható, ezt illetve a nir2 sávot a feldolgozás folyamán érdemben nem használtam. A cél az elöntés minél pontosabb lehatárolása volt, ezért a felvétel területi felbontása jobban kihasználható, mint a spektrális gazdagsága. A felvétel gyakorlatilag felhőtlen, ugyanakkor nem fedi a teljes elöntött területet. Egyes területeken kivehető a katasztrófa utáni első helyreállítási munkálatok hatása is.
A második felvétel: 2010. október 7-én készült RapidEye felvétel, melynek térbeli felbontás 5m, 5 spektrális sávban felvételez: 1. kék, 2. zöld, 3. vörös, 4. vörös-határ, 5. közeli infravörös. A felvétel felhős, a felhővel takart, illetve árnyékolt területeken a felvétel nem feldolgozható.
A feldolgozás részét képezte a két felvétel különbségéből adódó eltérések vizsgálata. A módszert a WV2 felvételen dolgoztam ki, majd azt átültettem a RapidEye felvételre is.
8. 2. A feldolgozás folyamata A végeredményként kiadott tematikus térkép egyszerű elöntéstérkép, azaz nincs az elöntött terület jellege szerint kategóriákra bontva. Az osztályozás megkönnyítése végett bevezettem ideiglenes kategóriákat az elöntés mértéke és az elöntött terület jellege (talaj, növényzet) alapján, de ez csak a felvételen látható viszonyok alapján történt, terepi felmérésből vagy mezőgazdasági adatbázisból származó megerősítés nélkül.
8. 3. Spektrális indexek Egy fontos spektrális index, az NDVI alkalmazásáról a fák lehatárolásánál már volt szó. Index az NDVI-hoz hasonló módon más sávokból is képezhető, gyakran használunk például talaj- és nedvesség-indexeket (NDSI, NDWI), bár ezekhez a most használt felvételtípusokon nem lévő közepes infravörös sáv szükséges. Ugyanakkor a WV2 felvétel spektrális gazdagsága további indexek alkalmazására ad lehetőséget. A lehetséges sávok kiválasztása többféle módon történhet, vizsgálhatjuk statisztikai
- 63 -
módszerekkel az egyes sávok kovarianciáját, ezek különbségét a felvételen előforduló különböző felszínborítási elemek esetén. Célszerű ezt az utat követni, ha a feldolgozás többször alkalmazandó. Jelen esetben egyszeri alkalmazásról van szó, a használandó indexeket statisztikai módszer helyett a spektrális tulajdonságok vizuális értékelése alapján választottam ki. Ez egy térinformatikai software, az ERDAS Imagine 9.1. segítségével történt. Első lépésben mintaterületeket választottam a felvételen, arra törekedve, hogy minden érdekes felszíni objektumból legyen minta. Ezen minták spektrális tulajdonságait vizsgálva a cél olyan sáv-párok megtalálása, melyek együttváltozása jól jellemzi az adott felszínborítást. A választás a következő indexekre esett: ndvi (a nir1 sávból), vörös - zöld és a vörös - vörös-határ sávokból képzett indexek. A látható vörös többszöri jelenléte a vizsgált esemény jellege miatt is várható volt. A feldolgozás első lépéseként a megfelelő sávokból a már említett módon létrehozzuk ezen spektrális indexeket.
8. 4. Szegmentálás A szegmensek létrehozásakor elsődleges cél a felszínborítási objektumok, illetve az elöntés határának szigorú követése a szegmenshatárokkal. Másodlagos célként szegmenseken belüli homogenitásra törekedtünk.
Már
többször
említettem,
hogy
az
alkalmazható
módszerek
és
a
paraméterezhetőség sokrétűsége miatt az optimális végeredményt kísérletezéssel, a paraméterek módosításával, többféle szegmentálás összekapcsolásával érhetjük el.
A több lépésben történő finomítással a várt eredmény fokozatos közelítése a cél. A felvétel mérete és a szegmentálás memóriaigénye miatt itt is alkalmazzuk a már említett „Tiling and Stitching” technikát, azaz a felvételt 2000x2000 pixeles darabokra osztva szegmentálunk. Itt is megadjuk a szegmentálás lépéseit:
1. lépés: „multiresolution segmentation” a vörös - zöld és a vörös-határ - vörös indexek alapján, (a vörös-zöld kétszeres súllyal) további paraméterek: scale = 3, shape = 0, compactness = 0,9.
- 64 -
Az első lépés még pixelszinten történik, a szegmentálás mellett az objektumok létrehozásáért is felel. Minden további lépés az objektumok szintjén történik.
26. ábra: a szegmensek az első lépés után
Az első lépés eredménye a kitűzött célokat jól közelíti, de lokális hibák miatt további lépésekre van szükség. A hibák olyan területeken jelentkeznek, ahol a szegmentálást meghatározó indexek szerint homogén a terület. Először felmerülhet a gondolat, hogy például az alábbi képen jól látható szegmentálási hiba elkerülhető lenne több sáv bevonásával. A kísérletezés tapasztalata, hogy a hasonló lokális hibákat javítandó több sáv szerinti szegmentálás általánosan rosszabb eredményt ad. Ezért egy második szegmentáló
lépést
alkalmazunk,
melyben
- 65 -
az
ilyen
területeket
szétvágjuk.
27. ábra: hibás szegmens
2. lépés: „contrast split segmentation” a felvétel zöld sávja alapján, a paraméterezéshez a software felkínált értékeit használjuk, kivéve a step size = 2 beállítást. Ez a lépés a szegmenseket feldarabolja. A hibákat megszűnteti, ugyanakkor számunkra érdektelen inhomogenitások felesleges felosztást eredményeznek, ezért még egy szegmentáló lépést végzünk.
28. ábra: a szegmensek a második lépés után
- 66 -
3. lépés: „multiresolution segmentation” a vörös sáv, a vörös-zöld és a vörös-határ - vörös indexek alapján, az első lépéssel megegyező paraméterezés mellett. A kapott eredmény az egész felvételen elég pontosan követi az elöntés határait, az elöntésen belüli változások követési pontossága is megfelel a célnak, további szegmentáló lépésekre nincs szükség.
29. ábra: a szegmentálás végeredménye
8. 5. Osztályozás Az osztályozás mintavételezéssel, maximum likelihood (ML) módszerrel történik. A végeredmény csak egy kategória, az elöntött terület, de az osztályozási folyamatban három célkategóriát adtam meg: nyílt iszapborítás, elöntött talaj és elöntött növényzet. Terepi felmérés vagy más megerősítés híján e kategóriák megfelelése a valóságnak nem igazolt, ugyanakkor a felvételen jól kivehető a három kategória eltérése. E három kategóriát megfelelő számú mintával írjuk le. Az osztályok nem diszjunktak, de elég szűkek ahhoz, hogy a téves osztályozások száma a lehető legkisebb legyen, egy kategória alkalmazása mellett a hibák száma jóval nagyobb lenne. A mintákra illesztett eloszlásokat kismértékben szükséges javítani, ez az osztályozás kis területen történő
- 67 -
tesztelésével, a függvény megfelelő módosításával elvégezhető. Az osztályozáshoz felhasznált jellemzők: vörös, vörös-határ, nir1, nir2 sávok és a három spektrális index átlaga, és a nir1, nir2 sávok valamint a, vörös-határ - vörös index szórása. A többi átlag és szórás nem jellemzi jól az egyes osztályokat, de téves találatok kiszűrésére e sávokban adhatunk fix küszöbértékeket. Az ilyen küszöb a ML módszerben 0 vagy 1 valószínűségnek felel meg.
30. ábra: az osztályozás eredménye (három kategória)
Eddig csupán spektrális jellemzőket alkalmaztunk a folyamatban, de a következő lépésben kihasználjuk objektum alapú elemzés egyes további lehetőségeit. Egyes területeken a nem elöntött, növényborítás nélküli talaj spektrális tulajdonságai nagymértékben hasonlítanak elöntött területekéhez. Ez téves találathoz vezet, ugyanakkor az ilyen szegmensek várhatóan elszigeteltek, nem kapcsolódnak helyesen osztályozott szegmensekhez. Azaz a geometriai lehetőségeket kihasználva, a valamely kategóriába sorolt objektummal nem határos találatokat kivesszük az eredményből.
- 68 -
8. 6. Pontosság Mind a szegmentálás, mind az osztályozás pontosságáról elmondható, hogy a gátszakadás helyétől távolodva romlik, ahogy a felszín jellegzetességei jobban befolyásolják az elöntést. Egy kis területen felhőárnyék van, ott nem történik osztályozás. Az elöntés fás területeket is érint, ahol a lombkorona teljesen eltakarja a talajt, az osztályozás ilyen területeken nem ad eredményt. A beépített területek és az infrastruktúra szintén nehezen kezelhetőek, a műutak például, vélhetően a katasztrófavédelmi és helyreállítási forgalom miatt – a gépjárművek futóművei elhordják a megszáradt iszapot – olyan helyeken is elöntöttnek tűnhetnek, amelyeket biztosan nem érintett az áradás.
Az ilyen hibákat geometriai tulajdonságok alapján lehetőség van javítani. A besorolt objektumokkal teljesen körülvett, de nem beosztályozott szegmenseket egy méretkorlátig besorolhatjuk, az úthálózat szegmensei kiszűrhetőek például az objektum vékonysága alapján.
8. 7. A RapidEye felvétel feldolgozása, összehasonlítás A feldolgozás a WV2 felvételhez hasonlóan, de egyszerűbb lépésekkel zajlott. A WV2 felvétel feldolgozásakor használt spektrális sávok a RapidEye felvételen is rendelkezésre állnak, ugyanakkor figyelembe kell venni az eltérő térbeli felbontásból származó különbségeket. A RapidEye felvételből nem áll rendelkezésre toa-reflektancia kép, ennek előállítása bonyolult, a felvétel készítésének paraméterei (pl. napállás szöge), valamint a szenzorra jellemző konstansok ismerete szükséges hozzá. Ettől jelen esetben eltekinthetünk, de több felvételen ismétlendő, vagy idősor-alapú elemzések kalibrálatlan felvételeken nem hajthatók végre.
8. 7. 1. A RapidEye felvétel szegmentálása
Egy lépésben, „multiresolution segmentation”, zöld sáv, vörös-határ - vörös, és vörös - zöld indexek alapján (ez utóbbi kétszeres súlyozással), további paraméterezése: scale parameter = 2, Shape = 0, Compactness = 0,9.
- 69 -
A szegmentálás eredménye általánosan megfelelő, de a felvétel gyengébb térbeli felbontása miatt a határvonalakon nem elég pontos. A határvonal pontossága további lépésekkel nem javítható, a határpixelek értékei ugyanis nagyobb terület (25 m2) sugárzási átlagából származik, ez az érték pedig nem kellően determinisztikus. Ezért további szegmentáló lépéseket nem hajtok végre.
31. ábra: a RapidEye felvétel szegmentálása
8. 7. 2. A RapidEye felvétel osztályozása
A szűkebb spektrális és térbeli lehetőségek miatt csak két alkategóriába osztályozunk. A módszer megegyezik a WV2 esetében leírtakkal, geometriai tulajdonságok figyelése nélkül.
- 70 -
8. 7. 3. Eredmények
A RapidEye osztályozása több téves találatot eredményez, ezek sötétebb tónusú talajok és egyes elöntött területek spektrális tulajdonságainak egyezéséből származnak.
32. ábra: a WorldView 2 felvétel osztályozása
33. ábra: a RapidEye felvétel osztályozása (a képi háttér a WorldView2 felvétel)
- 71 -
Ezek a téves találatok geometriai úton kiszűrhetőek, bár egyes helyeken ezek az objektumok kapcsolódnak helyesen osztályozott objektumokhoz, így a WV2 feldolgozása során használt kritérium ezen szegmensekre nem alkalmazható.
34. ábra: a RapidEye felvétel jellemző osztályozási hibái
A térbeli felbontásbeli különbség szintén megmutatkozik az eredményekben. A WV2
osztályozása
az
elöntés
határvonalát
pontosabban
követi.
A WV2 felvétel egy pixele 4 m2, míg a RapidEye felvételen ez 25 m2 területet fed le, azaz az egyes határpixelek spektrális értékei jóval nagyobb területről származnak. Elsősorban ebből következik a RapidEye osztályozás pontatlansága. A spektrális felbontásbeli különbség kevésbé látványos, a téves találatok számában jelentkezik.
- 72 -
35. ábra: a WorldView2 felvétel osztályozásának geometriai pontossága
36. ábra: a RapidEye felvétel osztályozásának gyengébb geometriai pontossága
Az eredményeket bemutató képeken a háttér a RapidEye felvétel osztályozáshoz is a WV2 valódi színes kompozitja.
- 73 -
9. Parlagfű kimutatás objektum alapon A FÖMI egyik jelentős feladata a parlagfű-fertőzöttség elleni közérdekű védekezés támogatása távérzékeléses módszerrel. Természetesen a városokban előforduló, elhanyagolt kertekben, közterületen jelen lévő parlagfű nem kimutatható légi- vagy űrfelvételeken, ugyanakkor a mezőgazdasági területeken, elsősorban kalászos tarlókon jelentkező fertőzöttség mérhető távérzékeléssel. Megjegyzendő, hogy az ilyen, mezőgazdasági területeken való előfordulás adja az erősen allergén növény összes hazai megjelenésének legnagyobb hányadát.
A távérzékeléses felmérés önmagában nem elegendő a védekezési folyamat lebonyolításához, de fontos támpont a terepi ellenőrzés elvégzéséhez.
A hagyományosan alkalmazott módszer HR felvételek idősor-elemzésével, terepi felméréses megerősítés mellett történő pixel-alapú feldolgozás, de a 2010-es évben egy szuperfelbontású felvételek feldolgozási lehetőségére irányuló kutatási folyamat részeként a VHR felvételek parlagfű-kimutatásra való alkalmasságát is vizsgáltuk. Ennek keretében objektum-alapú feldolgozást végeztem, melynek eredményeit összevetettük képpont-alapú eredményekkel. A vizsgálat kalászos tarlókra, illetve szójával ültetett területekre terjedt ki.
9. 1. Felhasznált felvételek 2010. szeptember 22-én Dél-Baranyáról (Villány környéke) készült WorldView2 felvételrészlet. A felvétel paraméterei az előző részben leírtakkal megegyezők.
2010. október 8-án végzett terepi felmérés eredményei, valamint a mezőgazdasági kategória maszkok a kalászos tarlók és a szójaültetvények térbeli leválogatására.
- 74 -
9. 2. A feldolgozás folyamata A parlagfű-kimutatás nem az objektumok egyenkénti, hanem az adott jellegű területtől (pl. kalászos tarló) várt tulajdonságoktól való eltérés, valamint növény-okozta texturális jellegzetességek megtalálását jelenti, ugyanis maga a növény még VHR felbontásban sem látszik a felvételen. Az elemzéshez használt tanuló és tesztterületek kijelöléséhez szükség volt a felvételezett területről, a felvételezés időpontjához közeli időpontban történő terepi felméréshez. A lehetséges célterületek kijelölése az idősoralapú elemzés eredményei alapján történt. A terepi felmérés hagyományosan öt kategóriát különít el, ezek valamelyikébe osztva a felmért területeket: 1.
parlagfűvel erősen fertőzött
2.
parlagfűvel és más gyomokkal együttesen fertőzött
3.
más gyomokkal fertőzött, kis mértékben parlagfüves
4.
gyomos, de nem parlagfüves
5.
betárcsázott
Ezt a kategorizálást jelen estben csak részben tudjuk alkalmazni, ugyanis a felmért terület kis méretéből adódóan az egyes kategóriákból nem érkezett kellőszámú eredmény, illetve a betárcsázások időpontját nem ismeretük, ezért csak három kategóriát különítettem el (1., 2-3. összevonva, 4.).
A két mezőgazdasági kategória fertőzöttségének a vizsgálata külön-külön történik. Az elemzés az egész területre szolgáltat eredményeket, de értelmes eredményt csak a kategórián belül várunk. Ezen területek leválasztását az ERDAS Imagine térinformatikai programmal végezzük.
9. 3. Szegmentálás Amint említettük, ezúttal a célobjektumok lehatárolása nem megoldható, ezért a szegmentálás célja a mezőgazdasági táblák egymástól való elválasztása mellett a lokális jellegzetességek, a textúrák követése. A szegmentálás egy lépésben történik: „multiresolution segmentation” a zöld, vörös, vörös-határ, nir1, nir2 sávok és az ndvi
- 75 -
alapján (ndvi a nir1 sávból számolva). A paraméterezése: scale = 30, Shape = 0.4, Compactness = 0.9.
37. ábra: a szegmentálás eredménye
9. 4. Osztályozás Az osztályozás ismét mintavételezéssel, maximum likelihood módszerrel történik. A
mintákat
a
terepi
felmérés
eredményéből
választottuk
mindkét
vizsgált
mezőgazdasági területtípusra. Ezek egy részét tesztterületként használjuk (tanuló és tesztterületek diszjunktak).
A
kalászos
tarlón
alkalmazott
megkülönböztetett
parlagfű-fertőzöttségi
kategóriák, az eredeti terepi fertőzöttségi kódoknak megfeleltetve: 1.
50% felett parlagfüves (1. kategória),
2.
parlagfűvel és más gyomokkal is fertőzött (2. és 3. kategória),
3.
más gyomokkal fertőzött, nem parlagfüves (4. kategória)
A szójaültetvényekről való hiányos terepi eredmények (összesen két tábla, 1-es fertőzöttségi kóddal) miatt ezen táblákban csak 50% felett parlagfüves területeket keresünk.
- 76 -
A szegmensek osztályba sorolásakor az egyes spektrális sávok, valamint az ndvi, illetve nir2 - vörös-határ indexek átlaga és szórása mellett texturális jellemzőket is figyelembe veszünk. A textúrát most a már említett Laplace-szűrő alkalmazásával mérjük a vörös sávon.
9. 5. Pontosság Az eljárás pontosságának mérése nehéz feladat. A tesztterületek alapján természetesen vizsgálható és javítható az osztályozás, de terepi megerősítésre nincs mód, továbbá nehézséget jelent, hogy a terepi felmérés egy mezőgazdasági táblát egy kóddal jelöl, a táblán belüli eltéréseket, parlagfű-csoportosulásokat nem jelöli, illetve a fertőzöttségi kód meghatározása sem matematikai úton történik. A célkategóriák spektrális tulajdonságai nagymértékű átfedést mutatnak, ami szintén korlátozza az elérhető pontosságot.
38. ábra: a parlagfüvesként osztályozott objektumok csak a kompozitban világosbarna terület (szója) eredményeit dolgozzuk fel
A módszer hatékonysága vizsgálható a pixel-alapú elemzés eredményével összehasonlítva. Ez a fertőzöttségi kategóriákat összevonva történt meg, azaz fertőzött -
- 77 -
nem fertőzött osztályokba sorolva. Az összehasonlítás mind a kalászos tarlókon, mind a szójaültetvényeken végzett elemzésekben 90% feletti egyezést állapított meg.
39. ábra: a pixelenkénti (a, c) és az objektumalapú (b, d) osztályozás eredménye a kalászos tarló (a, b) és szójaföldeken (c, d)
- 78 -
10. Összegzés Napjainkban a távérzékelés a felvételkészítő eszközök terén töretlen és lendületes fejlődést mutat. Mára a dolgozatban bemutatottaknál nagyságrendekkel jobb geometriai felbontású felvételek is elérhetőek. Ez a folyamat, és az ilyen felvételek specialitása kikényszeríti a feldolgozási módszerek változását is. Az objektum-alapú képelemzés és annak
kulcslépése,
a
szegmentálás
ugyanakkor
még
nem
kiforrott
ága
a
fotogrammetriának.
A szegmentáló algoritmusok elméleti kutatása és implementálása helyett a szakirodalomban egyre inkább átveszi a helyet a kész, de nagyon rugalmas algoritmusokat
adó
eCognition
programrendszer
alkalmazási
lehetőségeinek
bemutatása. Az objektum-alapú elemzés hatékony és eredményes alkalmazása érdekében
azonban
nem
feledkezhetünk
meg
a
szegmentáló
algoritmusok
megismeréséről és megértéséről sem. Az adott feladathoz legmegfelelőbb szegmentálás végrehajtásához elengedhetetlen az egyes lépések lehetőségeinek és korlátainak, előnyeinek és nehézségeinek mély ismerete.
A bemutatott
gyakorlati alkalmazások
célja a szegmensalapú
elemzés
lehetőségeinek vizsgálata, az OBIA beillesztése az Intézetben végzett képfeldolgozási módszerek közé. Az operatív alkalmazásig való eljutás azonban rögös útnak bizonyul. A feldolgozható adatok minőségének és mennyiségének kérdését talán nem hangsúlyoztam eléggé, de például a parlagfű-detektáló eljárás több felvétel és több terepi adat rendelkezésre állásával tovább finomítható és eredményesebbé tehető. Sajnos azonban az ilyen jellegű adatok esetében a nagyobb költségekre is tekintettel kell lennünk. Ugyanakkor az Intézet egyes újabb feladatai szükségessé teszik az objektumalapú elemzések felhasználását, mely alkalmazások hatékonyságához a bemutatott feladatok megoldása komoly segítség lehet mind az objektum-alapú elemzés, mind az eCognition rendszer alkalmazási lehetőségeinek tekintetében.
- 79 -
A. Függelék A. 1. Adatszerkezetek
Éllistás gráfreprezentáció Legyen a G = (V, E, ω) hármas egy irányítatlan gráf. V a csúcsok, E ∈ V × V az élek halmaza, ω ∈ E → ℝ súlyfüggvény. Minden v ∈ V csúcshoz egy listát rendelünk, melyben nyilvántartjuk az adott csúcshoz kapcsolódó éleket, és azok súlyát. Az ábrázolás hatékony adott csúcshoz tartozó élek feldolgozásához.
40. ábra: súlyozott, irányítatlan gráf és éllistás reprezentációja
Bináris kupac
A bináris kupac fa típusú adatszerkezet, melyben a kupac tulajdonság azt jelenti, hogy egy szülőcsúcs értéke mindig nagyobb a hozzá tartozó gyerekcsúcsok értékeinél. A tárolás majdnem teljes (a legalsó szint kivételével mindenhol teljesen kitöltött) bináris fában történik, a legalsó szinten balról jobbra haladva a feltöltéssel. A kupac tulajdonságot minden módosításkor fenn kell tartani. Hatékonyan kereshető, rendezhető adatszerkezet.
- 80 -
41. ábra: bináris kupac faként ábrázolva
A. 2. Négyfa alapú szegmentálás A négyfa (quadtree) adatszerkezet számos, részben a távérzékeléssel is rokon területről ismert. Fontos alkalmazása a térinformatikai adatbázisok geometriai típusú adatainak térbeli indexelése. Ugyanakkor a módszer bizonyos korlátok között alkalmas képszegmentálásra, elsősorban nagy erőforrás-igényű további szegmentáló lépések előkészítésére, segítésére használhatjuk, ezt a gyakorlati alkalmazások bemutatása során is szemléltetem. Alkalmas továbbá képek tömörítésére is.
A módszer rekurzív, az első lépésben az egész kép egy szegmens. Ezt négy egyenlő részre osztva négy szegmenst kapunk. Minden lépésben minden szegmenst hasonló módon négy részre vágunk, amíg az adott szegmens meg nem felel a homogenitási kritériumnak, vagy el nem érjük a leállási feltételt (pl. maximális szegmensszám, minimális szegmensméret). A geometriailag kötött vágások miatt előfordulhat, hogy a fa különböző élei mentén azonos tulajdonságú szomszédos szegmensek is keletkeznek. Ezeket egy következő szegmentáló eljárás kiküszöbölheti.
- 81 -
Irodalomjegyzék Bevezetés a távérzékelt felvételek elemzésébe: [1]
Csornai G., László I.: Távérzékelt felvételek elemzése. Előadások az ELTE Informatikai Kar Programtervező Matematikus és Programtervező Informatikus szakán, 2005-től, diasorozat.
[2]
Csornai G, Dalia O. (1991) Távérzékelés. Főiskolai jegyzet, Erdészeti és Faipari Egyetem Földmérési és Földrendezői Kar, Székesfehérvár, 1991.
[3]
Richard, J.A., Jia, X. (2006) Remote Sensing, Digital Image Analysis – An Introduction. Fourth Edition. Springer-Verlag, 2006.
[4]
Robert A. Schowengerdt: Remote Sensing, Third Edition: Models and Methods for Image Processing, Elsevier, 2007.
Felvételek szegmentálása, szegmensalapú feldolgozása, objektumalapú elemzés: [5]
R. Schoenmakers, “Integrated Methodology for Segmentation of Large Optical Satellite Images in Land Applications of Remote Sensing,” EUR 16292 EN, European Commission, Joint Research Centre, Sept. 1995, PhD dissertation of Katholieke Universiteit Nijmegen, http://www.cs.ru.nl/ths/dissertationsSchoenmakers-phd95.ps.gz .
[6]
Kettig, R. L., Landgrebe, D. A.: Classification of Multisprectral Image Data by Extraction and Classification of Homogeneous Object. In: IEEE Transaction on Geoscience Electronics, 14(1):19-26, 1976.
[7]
Pal, N.R., Pal, S.K. (1993) A Review on Image Segmentation Techniques. Pattern Recognition, Volume 26, Issue 9, September 1993, Pages 1277-1294.
[8]
Shi, J., Malik, J (2000) Normalized Cuts and Image Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, Volume 22, Issue 8, Aug 2000, pp: 888 – 905.
[9]
Hay, G. J., Castilla, G.: Object-based Image Analysis: Strengths, Weaknesses, Opportunities and Threaths (Swot). 1st International Conference on Object-based Image Analysis (OBIA 2006), 4-5, July, 2006, Salzburg, Austria.
[10] Haddad, S. (2007) Texture Measureas for Segmentation. Master’s Thesis, University of Cape Town, April 2007.
- 82 -
Szegmentálás, ELTE-FÖMI közös kutatás: [11] László, G. Nádor, I. Fekete, G. Csornai, A. Kocsis: A Segment-based Classification Method for Satellite Images. In: Proceedings of the 5th International Conference of Applied Informatics, Eger, 2001. (pp. 151-163) [12] László, T. Pröhle, I. Fekete, G. Csornai: A Method for Classifying Satellite Images Using Segments. Annales Univ. Sci. Budapest, Sectio Computatorica 23, 2004. (pp. 163-178) [13] László, B. Dezső, I. Fekete, T. Pröhle: A Fully Segment-based Method for the Classification of Satellite Images. Annales Univ. Sci. Budapest, Sectio Computatorica 30, 2009. (pp. 157-174) [14] Giachetta, R.: Gráf alapú módszerek műholdfelvételek tematikus osztályozásában. Tudományos Diákköri dolgozat, ELTE, Budapest, 2008. [15] Fekete I., Dezső B, László I., Ócsai K.: A szegmentálás szerepe az űrfelvételek tematikus osztályozásában. Az „Informatika a felsőoktatásban 2008” konferencia elektronikus kiadványa, DE Informatikai Kar, Debrecen, 2008.
Definiens eCognition: [16] Definiens eCognition Developer 8, Reference Book, Definiens AG, München, 2009. [17] Definiens eCognition Developer 8, User Guide, Definiens AG, München, 2009.
Saját munkák: [18] Gizella Nádor, Bernadett Csonka, Dávid Gera, Irén Hubik, Katalin Ócsai, Zsuzsanna Suba, György Surek, Grácia Linda Tóth, Cecília Török: RAGWEED IDENTIFICATION BY WORLDVIEW2 DATA. Submitted for The DigitalGlobe 8-Band Research Challenge, 2010. [19] Gizella Nádor, Bernadett Csonka, Dávid Gera, Irén Hubik, Katalin Ócsai, Zsuzsanna Suba, György Surek, Grácia Linda Tóth, Cecília Török: TOXIC SPILL IN HUNGARY ON 4TH OCTOBER, 2010. Submitted for The DigitalGlobe 8Band Research Challenge, 2010. [20] Gábor CSORNAI, István LÁSZLÓ, Gábor MIKUS, Gizella NÁDOR, Irén HUBIK, Katalin LIPTÁK, Mónika ANTAL, Katalin ÓCSAI, István FEKETE and Dávid GERA: The Possibilities of New Satellite Image Types in the Control of Area-based Subsidies and in Ragweed Monitoring System. 30th EARSeL Symposium "Remote Sensing for Science, Education, and Natural and Cultural Heritage", UNESCO, Paris, 31 May - 4 June 2010. -- Proceedings of EARSeL Symposium 2010, ISBN 978-3-00-033435-1,
- 83 -
[21] István László, Katalin Ócsai, Dávid Gera, Roberto Giachetta, István Fekete: Object-based Image Analysis of Pasture with Trees and Red Mud Spill. 31th EARSeL Symposium, Prague, Czech, 30 May – 2 June 2011. (Benyújtott előadás) [22] György Surek, Gizella Nádor, Zsuzsanna Suba, Irén Hubik, Katalin Ócsai, Dávid Gera, Cecilia Török, Grácia Linda Tóth: Comparative study of applications of satellite images with different spectral and spatial resolutions – three case studies (ragweed, toxic spill, waterlog). Three case study: ragweed, toxic spill and waterlog 31th EARSeL Symposium, Prague, Czech, 30 May – 2 June 2011. (Benyújtott előadás)
- 84 -