Cvičení 5-1 Bayesův teorém a klasifikace maximální věrohodnosti (Bayes’ Theorem and Maximum Likelihood Classification) Následujících šest cvičení rozšiřuje diskusi o klasifikačních postupech, které byly vysvětleny v úvodních cvičeních ze zpracování obrazu. Tato cvičení se zaměří na informace, které lze shromáždit v iterativním procesu klasifikace, který poskytuje množství vrstev informací za pomocí měkkých klasifikátorů. Analytik pak redukuje tyto informaci do jediného klasifikovaného obrazu. Pokud jste tak ještě neučinili, před pokračováním cvičení si přečtěte kapitolu Classification of Remotely Sensed Imagery (Klasifikace obrazu z DPZ), v příručce IDRISI Manual. Ve všech šesti cvičeních budeme pracovat se stejnými soubory dat, a výsledky z jednoho cvičení mohou být použity pro porovnání s výsledky jiného cvičení. Proto, pokud je to možné, uchovejte všechny výsledné obrazy z každého cvičení, dokud celá skupina cvičení nebude dokončena. Procedura maximální věrohodnosti je nepochybně nejpoužívanější postup pro klasifikaci v dálkovém průzkumu Země. Základem tohoto přístupu je Bayesův teorém, který vyjadřuje vztah mezi důkazy, předchozími znalostmi a věrohodností, že konkrétní hypotéza je pravdivá. Bohužel, překvapivě málo je využívána schopnost začlenit do postupu předchozí znalosti. V zájmu posouzení důkazů analytici obvykle nestanoví žádné předpoklady o relativní věrohodnosti, že budou nalezeny třídy krajinného pokryvu, a tak předpokládáme, že zastoupení každé třídy má stejnou šanci. V případě existence silných důkazů to obvykle způsobí malou škodu. Nicméně v souvislosti se slabými důkazy mohou předchozí znalosti velmi významně pomoci. IDRISI je zvláštní v tom, že nabízí mimořádně bohatou nabídku možností pro začlenění předchozích znalostí do procesu klasifikace. Zejména se nabízí zvláštní schopnost začlenit předchozí znalosti ve formě obrazů pravděpodobnosti tak, že je umožněno, aby se pravděpodobnost výskytu jakékoli třídy lišila místo od místa. Jak ukazuje toto cvičení, nabízí to významné zlepšení v postupu klasifikace. a) Zobrazte tři obrazové záznamy s názvy SPWEST1, SPWEST2 a SPWEST3, každý ve vlastním okně, zobrazený pomocí šedotónové palety. Jedná se o zelené, červené a blízké infračervené pásmo ze skeneru SPOT-HRV, zaznamenané multispektrálním čidlem (XS) v oblasti Westborough, Massachusetts. Z těchto pásem vytvořte barevnou kompozici v nepravých barvách pomocí modul COMPOSITE (z nabídky Display). Zadejte vstupní pásma ve výše uvedeném pořadí jako modré, zelené a červené. Zadejte vytvoření výsledného obrazu SPWESTFC. Vyberte lineární roztažení s body nasycení a vytvořte 24-bitovou kompozici, která zachovává původní hodnoty. Zadejte 1% na každém konci intervalu hodnot jako rozsah saturace. Pak se zobrazte výsledek. Westborough je malé venkovské město, které v posledních letech prošlo zásadním vývojem díky své strategické poloze v jedné z hlavních rozvojových oblastí high-tech ve Spojených státech. Je
to také oblast s významným pokryvem mokřadů – krajinný pokryv se týká specificky životního prostředí. b) Nástrojem Composer, přidejte vektorovou vrstvu s názvem SPTRAIN, zobrazenou pomocí palety s kvalitativními symboly (qualitative symbol file). V dialogovém okně Map Properties přidejte legendu této vrstvy výběrem karty legenda (Legend tab) a zobrazte první legendu. Jako vrstvu (layer) vyberte SPTRAIN. Možná budete muset zvětšit mapové okno (tažením za jeho okraj), aby se zobrazila celá legenda. Tato vrstva obsahuje sadu trénovacích ploch pro následující typy pokryvu: 1 Starší obytné (plochy) OLDRES 2 Novější obytné (plochy) NEWRES 3 Průmysl/obchod IND-COM 4 Silnice SILNICE 5 Voda WATER 6. Zemědělství/pastviny AG-PAS 7 Listnatý les DECIDUOUS 8. Mokřady WETLAND 9. Golfová hřiště / tráva-tráva GOLF 10. Jehličnatý les CONIFER 11. Mělká voda SHALLOW Poslední sloupec v tomto seznamu obsahuje množinu názvů příznaků (signatures), které použijeme v tomto cvičení a v následujících cvičeních z tohoto oddílu. c) Použitím MAKESIG (Image Processing/Signature Development) vytvořte množinu příznaků pro trénovací plochy ve vektorovém souboru SPTRAIN. Označte, že budou použita 3 pásma SPOT s názvy SPWEST1, SPWEST2 a SPWEST3. Vyberte tlačítko Enter Signature File Names a zadejte názvy příznaků ve výše uvedeném pořadí. d) MAKESIG automaticky vytvoří soubor s množinou příznaků (angl. signature group file) se stejným názvem jako má soubor s trénovacími plochami (angl. training site file). Soubory s množinou příznaků usnadňují používání dialogových polí klasifikátoru. Z nabídky File, otevřete Collection Editor. V nabídce Soubor editoru zvolte Open, z rozbalovacího seznamu typů souborů potom vyberte Signature Group File. Vyberte soubor s množinou příznaků SPTRAIN a stiskněte Otevřít. Ověřte, že soubor obsahuje požadované příznaky. Pak použijte volbu Save As pro uložení souboru s novým názvem SPOTSIGS. e) Spusťte MAXLIKE (Image Processing/Hard Classifiers). V této první klasifikaci, budeme předpokládat, že nemáme informace o předpokládané relativní četnosti výskytu různých tříd. Proto zvolte stejnou předpokládanou pravděpodobnost (equal prior probabilities) pro všechny klasifikované třídy. Poté stiskněte tlačítko Insert Signature Group tlačítko a zvolte SPOTSIGS. Tím se vyplní názvy všech 11 příznaků. Zvolte 0% jako podíl vyloučený ze zpracování, zadejte název výstupního souboru SPMAXLIKEEQUAL a zvolte si název (title) tematického rastru. Stiskněte tlačítko Next a zvolte použití všech pásem v klasifikaci. Stiskněte tlačítko OK.
f) Po dokončení klasifikace, zobrazte výslednou mapu pomocí palety s názvem SPMAXLIKE. Rozhodněte se také, zda zobrazíte legendu a název tematického rastru. Potom porovnejte výsledek s kompozicí v nepravých barvách s názvem SPWESTFC. 1. O kterých třídách si myslíte, že jsou klasifikátor nejlépe zpracované? Které z nich se vám zdají být nejhorší? Stát Massachusetts provádí pravidelné kontroly využití půdy pomocí leteckého snímkování. Obrazový záznam SPOT, který se zde používá, byl (podle data) naskenován v roce 1992. Využití území (land use) bylo před tím provedeno ještě v letech 1978 a 1985. Na základě těchto soupisů pro město Westborough, použijeme funkci CROSSTAB pro určení relativní frekvence, s jakou každá třída krajinného pokryvu změnil na kteroukoliv z ostatních tříd během období 1978-1985. Tyto relativní četnosti jsou známé jako přechodové pravděpodobnosti a jsou základním podkladem pro predikci budoucích přechodů podle modelu Markov Chain. Budeme-li předpokládat, že základní hybné síly a trajektorie změn z období 1978-1985 zůstávají stabilní až 1992, je možné odhadnout pravděpodobnost, s níž by se každá třída krajinného pokryvu v roce 1985 mohla změnit na jinou třídu v roce 1992. Pravděpodobnosti těchto změn pak byly aplikovány na třídy krajinného pokryvu z roku 1985 jako základ, čímž se získala sada pravděpodobnostních map vyjadřujících náš předpoklad výskytu každé z tříd krajinného pokryvu v roce 1992. Digitální obrazy těchto pravděpodobnostních map mají následující názvy: PRIOR-OLDRES PRIOR-NEWRES PRIOR-IND-COM PRIOR-ROADS PRIOR-WATER PRIOR-AG-PAS PRIOR-DECIDUOUS PRIOR-WETLAND PRIOR-GOLF-GRASS PRIOR-CONIFEROUS PRIOR-SHALLOW g) Pomocí standardní palety Idrisi zobrazte vybrané mapy předpokládané pravděpodobnosti. Povšimněte si, že tyto prostorové definice předpokládané pravděpodobnosti dosahují pouze na hranici města Westborough. Vně hranice města, byly předpokládané pravděpodobnost vyjádřeny jako neprostorové pravděpodobnosti přechodu (transition probability), ačkoli jako by se dalo tradičně uvést v používání Bayesovské procedury maximální věrohodnosti. Například, v obrazu PRIOR-NEWRES, oblast vně hranice města je předpokládaná pravděpodobnost 0,18. To pouze reprezentuje věrohodnost, s níž lze očekávat, že v roce 199285 bude nějaká oblast v kategorii nová rezidenční. Nicméně, prostorově specifické předpokládané pravděpodobnosti se pohybují kdekoli až po 0,70 a to v závislosti na pokryvu existujícím v roce 1985. h) Nyní spusťte MAXLIKE znovu. Opakujte stejné kroky, které byly provedeny dříve, ale tentokrát dejte najevo, že si přejete pro každý příznak zadat obraz předpokládané pravděpodobnosti. Vložte soubor s množinou příznaků SPOTSIGS. Klikněte na sloupec
Probability Definition mřížky pro první příznak. Objeví se tlačítko výběrového seznamu. Klikněte na něj, vyberte odpovídající obraz předpokládané pravděpodobnosti. Například první uvedený příznak by měl být OLDRES. Definice pravděpodobnosti pro tento řádek by měla být PRIOR-OLDRES. Klikněte postupně na každý řádek a vyberte obraz předpokládané pravděpodobnosti tohoto příznaku. Vyberte, že chcete klasifikovat všechny pixely a pojmenujte výsledný obraz SPMAXLIKE-PRIOR. Klepněte na tlačítko Next a potom na tlačítko OK. i) Zobrazte SPMAXLIKE-PRIOR pomocí palety SPMAXLIKE a uveďte, že si přejete mít legendu. Pak přidejte vektorovou vrstvu WESTBOUND vykreslenou jednotným symbolem ze souboru. Tato vrstva ukazuje hranice města. 2. Popište tyto třídy, v nichž se objevily nejzřetelnější rozdíly v důsledku uplatnění předpokládané pravděpodobnosti. j) Použijte funkci CROSSTAB (GIS Analysis/Database Query) k vytvoření obrazu (crossclassification image), ukazujícího rozdíly mezi SPMAXLIKE-EQUAL a SPMAXLIKE-PRIOR. Zadejte název tohoto obrazu EQUAL-PRIOR. Pak zobrazte rastr EQUAL-PRIOR (pomocí kvalitativní palety), název mapy a legendu. (Možná zjistíte, že je užitečné vytvořit paletu, v níž jsou barvy těchto tříd jsou stejné pro oba porovnávané obrazy, celé bílé nebo černé.86 Užitečné může být také zvýraznění legendy. Chcete-li zvýraznit určitou kategorii, podržte stisknuté levé tlačítko myši na příslušném barevném poli legendy.) Přidejte do své mapy vektorovou vrstvu WESTBOUND, abyste si usnadnili posouzení vlivu schématu předpokládané pravděpodobnosti. 3. Všimli jste si nějakých jiných významných rozdílů, které nebyly zřejmé na základě výše uvedené otázky č. 2? 4. Jak byste vyjádřili charakteristiku rozdílů v oblastech vně hranic města oproti rozdílům uvnitř města? Je zřejmé, že prostorové vymezení předpokládaných pravděpodobností nabízí velmi silnou podporu procesu klasifikace. Přestože velký zájem byl soustředěn na možnosti využití GIS jako vstupu do procesu klasifikace, pokrok byl poněkud pomalý, zejména z důvodu nemožnosti specifikovat prostorovým způsobem předpokládané pravděpodobnosti. Postup, který zde byl předložen, poskytuje velmi důležitý článek, a otevírá dveře k celé řadě GIS modelů, které by v tomto procesu mohly pomoci. 85. Tento údaj je pouze oblast obrazu členěná podle oblasti kategorie novější obytné v roce 1992. 86. Chcete-li tak učinit, otevřete nejprve složku dokumentace pro EQUAL-PRIOR s metadaty (z nabídky File). Klikněte na kartě Legend. Zapište si čísla kategorií, které reprezentují území beze změn - no change (např. 1|1, 2|2). Bude jich 11. Nyní otevřete Symbol Workshop. Otevřete soubor s paletou QUAL256 ze složky Symbols, která je ve složce programu Idrisi32. Zvolte File/Save As a uložte ji do své pracovní složky pod novým názvem, např. EQUALPRIOR. Klikněte na barevná pole pro každou z 11 kategorií pro území beze změn, pokaždé se změní barva, takže bude bílá nebo černá. Pokud v paletě existují jiné barvy, jimiž jsou bílá nebo černá, a nejsou na vašem seznamu, změňte jejich barvy na nějaké jiné. Uložte soubor a použijte Layer Properties, aby v obrazu došlo k jejich změně.
Odpovědi na otázky v textu 1. Při absenci dalších informací z terénu, je obtížné otázku zcela zodpovědět. Mohou být provedena některá pozorování. Klasifikátor funguje důsledně při stanovení kategorií listnatých a jehličnatých stromů. Jak se dalo očekávat pro tuto oblast, jehličnaté stromy jsou na okrajích hlubokých vodních ploch a mokřadů. Mokřady, ačkoli převažují v rozsáhlých oblastech, se nejeví jako mokřady. V těch místech dochází k záměně kategorií mokřady, silnice, průmysl/obchod a obytné. Pokud si přiblížíte velký mokřad ve středu obrazu, například, najdete oblasti průmysl/obchod okolo malé vodní plochy. Podobně v mokřadu existují izolované oblasti, které jsou klasifikovány jako starší obytné plochy. Při bližším zkoumání křižovatky v oblasti na pravé straně obrazu lze jasně vidět, že třídy starých a nových obytných ploch a mokřadů obklopují silnice, protože silnice se prodlužují dále od svých křižovatek. Toto je běžný problém v předměstských oblastech. Ve všech částech obrazu, jsou zaměňovány novější obytné oblasti s třídami průmysl/obchod a silnice, získanými klasifikací. Ačkoli mohou být přítomny všechny třídy, jejich vzájemné proporce se jeví jako nepravděpodobné. K záměně dochází rovněž u tříd golfové hřiště a zemědělské plochy. Abychom dokázali klasifikaci zhodnotit, potřebujeme více informací. 2. Dochází k většímu propojení starších obytných oblastí. Silnice začínají být zřetelnější. 3. Díky funkci CROSSTAB se dochází k vizualizaci mnoha malých změn v kategoriích. Zvýšil se výskyt jehličnanů. Sousedící třídy zemědělských ploch se změnily na třídu golfové hřiště. Množství pixelů dříve klasifikovaných jako silnice se změnilo na třídu průmysl/obchod (INDCOM). 4. Vzor uspořádání rozdílů vně hranic města je více fragmentovaný. Stejné rozdíly ukazují v oblasti uvnitř hranic města, které vzájemně více přiléhají (lépe spolu sousedí).