ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA MAPOVÁNÍ A KARTOGRAFIE
Klasifikace leteckých barevných snímků s využitím dat laserového skenování Classification of areal color photographs using laser scanning data
DIPLOMOVÁ PRÁCE Bc. Vojtěch Hron 2012
studijní obor: Geoinformatika studijní program: Geodézie a kartografie vedoucí práce: doc. Ing. Lena Halounová, CSc.
Prohlášení Prohlašuji, že jsem předloženou práci vypracoval samostatně a že jsem uvedl veškeré použité informační zdroje v souladu s Metodickým pokynem o etické přípravě vysokoškolských závěrečných prací.
V Praze dne
podpis
Poděkování Na tomto místě bych rád poděkoval všem lidem, kteří mi poskytli cenné rady, informace a podklady nezbytné ke zpracování této diplomové práce. Bez jejich pomoci a ochoty by tato práce
nemohla
být
nikdy
zpracována.
Na
prvním
místě
bych
chtěl
poděkovat
paní doc. Ing. Leně Halounové, CSc. za podnětné nápady, připomínky a odbornou pomoc při zpracovávání
této
práce.
Dále
pak
jmenovitě
panu
Ing. Karlu Brázdilovi, CSc.,
Mgr. Petru Hofmanovi a Ing. Zdeňku Švecovi ze Zeměměřického úřadu v Pardubicích za poskytnutí dat leteckého laserového skenování, přípravu leteckých infračervených snímků a poskytnutí metadat o Ortofotech ČR. Poděkovat bych chtěl také Českému úřadu zeměměřickému a katastrálnímu za uveřejňování velkého množství hodnotných informací prostřednictvím internetového Geoportálu.
Abstrakt Obsahem této práce je tvorba vlastní metody, která umožní automatickou klasifikaci vybraných tříd z leteckých barevných snímků s využitím dat laserového skenování. Hlavním cílem je nalezení a charakterizování klasifikační strategie metodou objektové analýzy obrazu za použití spektrálních, texturálních a kontextuálních příznaků. Text práce obsahuje popis vlastního řešení po dílčích krocích včetně názorných ukázek a příkladů výstupu. klíčová slova: dálkový průzkum Země, laserové skenování, objektová analýza obrazu, fuzzy klasifikace, spektrální vlastnosti, texturální vlastnosti, kontextuální vlastnosti
Abstract The goal of this thesis is to create own method, which allows automatic classification of specific classes from areal color photographs using laser scanning data. The main purpose is to discover and describe classification strategy through object-oriented image analysis using spectral, textural and contextual features. Text of this thesis contains step-by-step description of own solution including graphic illustrations and output examples. keywords: remote sensing, laser scanning, object-oriented image analysis, fuzzy classification, spectral features, textural features, contextual features
Obsah 1 Úvod..............................................................................................................................................7 1.1 Úvod......................................................................................................................................7 1.2 Cíl práce................................................................................................................................8 1.3 Charakteristika dat................................................................................................................9 1.3.1 Ortofoto České republiky..............................................................................................9 1.3.2 Data leteckého laserového skenování..........................................................................10 1.4 Předzpracování dat..............................................................................................................12 2 Metoda........................................................................................................................................16 2.1 Úvod....................................................................................................................................16 2.2 Klasifikace dat leteckého laserového skenování.................................................................17 2.2.1 Cíl klasifikace..............................................................................................................17 2.2.2 Tvorba pomocných rastrů 1.........................................................................................17 2.2.3 Segmentace obrazu......................................................................................................18 2.2.4 Inicializační klasifikace dat.........................................................................................19 2.2.5 Postklasifikační úpravy...............................................................................................20 2.2.6 Přesná extrakce budov.................................................................................................21 2.2.7 Použití morfologie.......................................................................................................23 2.2.8 Zhodnocení výsledků..................................................................................................24 2.2.9 Tvorba pomocných rastrů 2.........................................................................................25 2.3 Klasifikace obrazových dat.................................................................................................30 2.3.1 Cíl klasifikace..............................................................................................................30 2.3.2 Segmentace obrazu......................................................................................................31 2.3.3 Fuzzy klasifikace.........................................................................................................31 2.3.4 Použití morfologie.......................................................................................................34 2.3.5 Zhodnocení výsledků..................................................................................................36 3 Závěr...........................................................................................................................................39 4 Zdroje a použitá literatura...........................................................................................................41 5 Příloha.........................................................................................................................................43 5.1 Seznam tabulek...................................................................................................................44 5.2 Seznam obrázků..................................................................................................................45
1 Úvod
1 Úvod 1.1 Úvod Letecké snímky jsou nesmírně cenným zdrojem informací o zemském povrchu, který se využívá již více než sto let. Za tuto dlouhou dobu se staly běžnou součástí životů nejen expertů z oboru fotogrammetrie a dálkového průzkumu Země, ale i široké skupiny uživatelů z jiných oborů. Vděčí tomu především díky svému unikátnímu charakteru fotografie, která je pro člověka jednoduše vizuálně interpretovatelná, bez nutnosti čtení jakékoliv legendy. V podobě bezešvých ortofoto map jsou dnes součástí také většiny GIS a téměř všech internetových mapových prohlížečů, díky čemuž se těší obrovské oblibě i u běžných uživatelů. Nejsou to však jen obrazová data, která jsou u uživatelů velice oblíbená, ale také digitální prostorové modely reliéfu či celého povrchu, které vznikají na základě dat laserového skenování. Veliká obliba těchto druhů dat a vysoké požadavky na jejich přesnost a aktuálnost vedou k jejich častějšímu sběru. Se zvyšujícím se množstvím dat, které je nutno zpracovat za stále kratší období, se začínají více uplatňovat poloautomatické metody zpracování. Díky nástupu výkonné výpočetní techniky a moderních způsobů řešení se tyto metody během posledních deseti let výrazně zdokonalily. S rozvojem technologií automatického zpracování těchto druhů dat vzrůstá i potřeba automatické klasifikace rozličného zájmového obsahu. Donedávna byly informace obsažené v datech interpretovány, v převážné většině případů, zcela manuálně, např. pomocí vektorizace zájmových objektů a jejich následné klasifikace. Manuální zpracování však přináší celou řadu úskalí, ať již jde o značnou časovou náročnost nebo špatnou opakovatelnost celého procesu, kdy analýza identických dat může vést díky lidskému faktoru k rozdílným výsledkům a tudíž i odlišným závěrům. Tvorba univerzálně použitelných metod klasifikace, kterou se zabývá tato práce, je nesmírně složitým procesem vyžadujícím inteligentní porozumění obrazu. V tomto hledisku je lidské vnímání a chápání do značné míry stále nedostižitelné. Problematika je tak výzvou pro experty z celé řady oborů, ať již z dálkového průzkumu Země, fotogrammetrie či počítačového vidění.
7
1 Úvod
1.2 Cíl práce Hlavním cílem této práce je nalezení a charakterizování metody pro automatickou klasifikaci liniové vegetace a dalších vybraných tříd z leteckých barevných snímků s využitím dat laserového skenování. Klasifikační strategie bude vytvořena metodou objektové analýzy obrazu v prostředí softwaru Definiens Developer (v současnosti Trimble eCognition Developer) za použití spektrálních, texturálních a kontextuálních příznaků (vlastností). Součástí vytvářené metodiky bude rozbor jednotlivých kroků včetně posouzení vhodnosti použitých postupů pro danou aplikaci. Výsledkem této práce by měla být metoda umožňující hromadné zpracování dat bez nutnosti přizpůsobování jednotlivých procesů aktuálně zpracovávané scéně. Celá strategie bude vytvářena na datech Českého úřadu zeměměřického a katastrálního (dále jen ČÚZK), což představuje potenciální možnost nasazení metody při dávkové analýze rozsáhlých datových sad, které úřad spravuje.
8
1 Úvod
1.3 Charakteristika dat Pro potřeby vypracování této práce byly použity dva rozdílné typy dat. Jak již ze samotného názvu práce vyplývá, jedná se o barevné letecké snímky a data leteckého laserového skenování. Metoda bude vytvářena pro použití ve vysoce urbanizovaném území, a proto byla vybrána zájmová oblast, reprezentovaná jádrem města Česká Lípa, která poslouží pro vývoj a otestování klasifikační strategie. Následující část textu je věnována podrobnější charakteristice použitých dat.
1.3.1 Ortofoto České republiky Ortofoto České republiky (ČR) je pouze jednou z mnoha datových sad, které ČÚZK spravuje. Vzhledem k širokému interdisciplinárnímu uplatnění ortofoto snímků se však jedná o jeden ze stěžejních produktů úřadu, o čemž svědčí i zkrácení snímkovacích period území ČR (od roku 2012) ze tříletých na dvouleté. [1] Pro potřeby vypracování této práce byla použita ortofota z pásma „Střed“ z roku 2010. V tomto období se již snímkování provádělo digitální měřickou kamerou Microsoft UltraCamXp (se senzorovou jednotkou Sxp), která sbírá obrazová data v panchromatickém, viditelném a blízkém infračerveném pásmu. Díky vysokému rozlišení panchromatického pásma a následného pan-sharpeningu zbývajících barevných pásem, dosahují výsledné snímky velmi dobré obrazové kvality s jednotnou velikostí pixelu 25 cm po překreslení. [3] ČÚZK poskytuje ortofota nativně ve výdejním formátu JPEG, který však, vzhledem k použité ztrátové metodě komprese, obsahuje značné množství čtvercových artefaktů a není tak pro některé obrazové analýzy vůbec vhodný. Jedná se zejména o analýzy texturálních vlastností. Z tohoto důvodu byla data vyžádána v bezeztrátovém formátu TIFF (Tagged Image File Format) se standardní 24bitovou barevnou hloubkou pro každý pixel. Použití ortofot skýtá celou řadu obtíží, které plynou již ze samotné podstaty tohoto typu dat. a)
Ortofoto představuje fotografický obraz zemského povrchu, na kterém jsou odstraněny posuny obrazu způsobené výškovou nejednotností reliéfu. Z obrazu však nejsou odstraněny posuny způsobené vyvýšenými objekty nacházejícími se na zemském povrchu, jde především o budovy a vegetaci.
9
1 Úvod b) Ortofota jsou komponována do barevně vyrovnané bezešvé mozaiky a dělena v kladu mapových listů Státní mapy 1:5 000 (dále jen SM 5). Každé ortofoto je složeno hned z několika ortorektifikovaných snímků, přičemž mezi snímky z různých náletových řad vznikají nezanedbatelné rozdíly v čase pořízení. Tyto vzájemné časové odchylky představují komplikaci při analýze stínů, kdy je nutno pro každý mapový list uvažovat skladbu mozaiky a rozlišovat mezi částmi obrazu vzniklými z různých náletových řad. Z tohoto důvodu byly od ČÚZK vyžádány datové podklady definující průběh švů mozaiky a metadata pro letecké snímky, která umožňují určení přesného času pořízení jednotlivých snímků. Díky této informaci lze zpětně získat polohu Slunce na obloze v okamžik pořízení snímku a využít tento údaj při analýze stínů vržených od vyvýšených objektů. Přes výše zmíněné komplikace je použití bezešvých ortofot vcelku schůdným řešením. Okrajové části snímků, na kterých je nejvíce patrné „padání“ budov a vysoké vegetace ve směru od středu snímku, nezaujímají ve výsledné mozaice, díky velkému vzájemnému překrytu snímků, tolik plochy. Klasifikace obrazových dat je časově náročný proces a v případě klasifikace pouze překreslených leteckých snímků by docházelo ke značné duplikaci v důsledku velkého vzájemného překrytu snímků, což se jeví jako neekonomické řešení.
1.3.2 Data leteckého laserového skenování Data z leteckého laserového skenování (LLS) pochází rovněž od ČÚZK a byla pořízena v rámci projektu nového výškopisného mapování území ČR. Tento projekt je realizován v součinnosti s Ministerstvem obrany (MO) a Ministerstvem zemědělství a klade si za cíl výrazně zvýšit přesnost a podrobnost výškopisných podkladů pro území ČR a tím rozšířit jejich využitelnost. [2] Výškopisná data LLS slouží jako podklad pro vypracování nových produktů ČÚZK, mezi které patří mimo jiné i Digitální model povrchu České republiky 1. generace (DMP 1G). V úvodu zpracování této práce bylo předpokládáno, že jako zdroj dat LLS bude použit právě DMP 1G. Po bližším seznámení se s podobou tohoto digitálního modelu však bylo usouzeno, že k zamýšleným analýzám není tento zdroj zcela vhodný, vzhledem k nižší hustotě dat, jež je
10
1 Úvod výsledkem filtračního procesu. Z tohoto důvodu byla od ČÚZK vyžádána jakkoli nefiltrovaná mračna bodů reprezentující všechny nasnímané (dostatečně silné) odrazy laserového paprsku. Sběr dat v pásmu „Střed“ byl proveden mezi březnem až říjnem roku 2010, přičemž přesný čas pořízení dat pro zájmové území je uveden v následující tabulce. Tab. 1: Datum leteckého laserového skenování zájmového území Česká Lípa
29.4.2010
LLS bylo realizováno pomocí skeneru RIEGL LMS–Q680, který byl součástí systému LiteMapper 6800 od společnosti IGI mbH. Nedílnou součástí systému bylo také zařízení pro autonomní určování polohy skládající se z GPS (Global Positioning System) a IMU (Inertial Measurement Unit). Skenování se uskutečňovalo po blocích a pro sběr dat byl využit letoun MO Let L-410 FG. Základní parametry LLS jsou uvedeny níže v tabulce. [9] Tab. 2: Základní parametry leteckého laserového skenování (pro území s maximální nadmořskou výškou do 800 metrů) střední výška letu nad terénem
1.5 km
maximální vychýlení paprsku od svislé osy překryt skenování
30° 45-59 %
šířka
10 km
délka
20 nebo 30 km
počet podélných letových řad v bloku
12
počet příčných letových řad v bloku
2
min. požadovaná hustota sběru dat
1b/m2
velikost bloku
Měřená data byla georeferencována v programu RiPROCESS od společnosti RIEGL s využitím dat permanentních referenčních stanic CZEPOS, VESOG a POLOM a následně transformována do souřadnicového systému UTM (Universal Transversal Mercator) na elipsoidu WGS84 a výškového systému Bpv. Výsledná mračna bodů byla automaticky klasifikována v softwaru SCOP++ verze 5.4 od firmy INPHO GmbH do 5 tříd, reprezentujících terén, budovy, vegetaci, výškové překážky leteckého provozu a chybná měření. Následně byla manuálně opravena a zkontrolována třída reprezentující terén a zcela nově manuálně klasifikována třída reprezentující mosty. Klasifikovaná mračna bodů byla rozdělena do samostatných souborů podle jednotlivých tříd, přičemž formát zápisu do souborů odpovídá schématu x, y, h pro každý bod.[9]
11
1 Úvod Poskytnutá data LLS mají výše zmíněnou podobu s odhadovanou úspěšností automatického zatřídění kolem 90 %. Z důvodu neznalosti použitého klasifikačního postupu a nemožnosti jeho zrekonstruování (např. s odlišnými parametry) nebyla úvodní klasifikace uvažována a data byla před samotným zpracováním deklasifikována spojením do jednoho mračna. Tím byla zároveň omezena závislost vyvíjené metodiky na použití jiných softwarů.
1.4 Předzpracování dat Software Definiens Developer verze 7.0.8, který byl použit pro tvorbu metodiky, neumožňuje práci s daty LLS v podobě mračen bodů. Tato funkcionalita je implementována až v jeho novějších verzích. Z tohoto důvodu musela být data LLS převedena do rastrové podoby. Převod dat byl proveden v softwaru ArcGIS verze 10.0 od společnosti ESRI a proběhl podle níže uvedeného postupu. Součástí převodu byla také transformace dat ze souřadnicového systému UTM na elipsoidu WGS84 do souřadnicového systému S-JTSK, čímž došlo ke sjednocení obou zdrojových podkladů, protože ortofota poskytnutá ČÚZK byla v národním souřadnicovém systému. Postup převodu dat LLS do rastrové podoby: 1) Konverze dat z textového souboru typu XYZ do Feature Class typu shapefile. použitý nástroj: ASCII 3D to Feature Class umístění: 3D Analyst Tools - Conversion - From File 2) Data byla transformována ze souřadnicového systému WGS_1984_UTM_Zone_33N do S-JTSK_Krovak_East_North. použitý nástroj: Project umístění: Data Management Tools - Projections and Transformations – Feature 3) Mračno bodů bylo oříznuto dle kladu mapových listů SM 5. použitý nástroj: Clip umístění: Analysis Tools – Extract
12
1 Úvod 4) Z oříznutého mračna bodů byla vytvořena nepravidelná trojúhelníková síť, tzv. TIN (Triangulated Irregular Network), prostřednictvím algoritmu Deloného triangulace. použitý nástroj: Create TIN umístění: 3D Analyst Tools - TIN Management 5) Nepravidelná trojúhelníková síť byla převedena do rastru, přičemž osnova vytvářeného rastru byla při konverzi spjata s osnovou ortofota, a tudíž buňky obou rastrových podkladů navzájem koincidují. Velikost buněk rastru byla zvolena na 1 metr, což odpovídá průměrné hustotě dat v mračnu, která činí 1.3 b/m2 pro oblast České Lípy. Výsledné hodnoty v jednotlivých buňkách jsou typu FLOAT a jsou vypočteny na základě metody nejbližších sousedů, která při vizuální kontrole lépe reprezentuje průběh povrchu než metoda lineární interpolace. použitý nástroj: TIN to Raster umístění: 3D Analyst Tools - Conversion - From TIN 6) Vytvořený rastr byl exportován do formátu TIFF včetně informací o použitém souřadnicovém systému. Buňky rastru, pro které nebyla k dispozici žádná relevantní data, mají výslednou hodnotu 0. použitý nástroj: Export umístění: Layer features - Data – Export Raster Data Při pozdějším zpracování se ukázalo být klasifikování dat po celých mapových listech SM 5 (2.5 x 2 km) jako značně problematické z důvodu velké náročnosti na počítačové vybavení, zejména na velikost operační paměti. Bylo tedy přistoupeno k dělení mapového listu SM 5 na čtyři menší části a klasifikaci dat po jednotlivých kvadrantech. Následující a zároveň také poslední krok byl proto proveden pro všechny podklady (Ortofoto ČR, NIR mozaiky a rastrovou podobu dat LLS). 7) Každá scéna velikosti SM 5 byla rozdělena na 4 dlaždice (kvadranty). použitý nástroj: Split Raster umístění: Data Management Tools - Raster - Raster Processing
13
1 Úvod
obr. 1: Dělení mapového listu SM 5 a použité číslování kvadrantů
Pro potřeby pozdější klasifikace stínů bylo nutné určit polohu Slunce na obloze v časech pořízení jednotlivých snímků. Na Geoportálu ČÚZK jsou poskytována metadata o Ortofotech ČR, ze kterých lze zjistit dny, ve kterých byl proveden nálet konkrétních území. Pro přesné určení času pořízení snímků však musel být použit vektorový soubor definující průběh švů ortofoto mozaiky, s jehož pomocí byla zjištěna čísla konkrétních snímků, jež pokrývají zájmové území. Z dodatečně vyžádaných metadat leteckých snímků byl pak zjištěn přesný GPS čas jejich pořízení. GPS čas se liší od koordinovaného světového času, tzv. UTC (Coordinated Universal Time), pouze o několik vteřin. Koordinovaný světový čas totiž zohledňuje zpomalování rotace Země, kdežto GPS čas nikoliv. Od roku 1980, kdy začal být GPS čas používán, činí tento rozdíl 15 s. Zjištěný čas pořízení snímků musel být navíc opraven o + 2 hodiny, neboť ČR leží v pásmu UTC + 1 h (středoevropský čas) a v období snímkování zájmového území byl u nás, stejně jako ve většině států Evropy, platný letní čas (+ 1 h). Poloha Slunce na obloze je jednoznačně určena dvěma hodnotami, azimutem a elevací. Průměrné hodnoty byly vypočteny pomocí níže uvedených internetových kalkulátorů, jejichž výsledky se navzájem nelišily o více než 0.04 stupně. Pro kontrolu byly zjištěné hodnoty ještě ověřeny šetřením na skutečných snímcích.
14
1 Úvod Tab. 3: Internetové adresy kalkulátorů pro výpočet polohy Slunce http://www.esrl.noaa.gov/gmd/grad/solcalc/ http://www.largeformatphotography.info/sunmooncalc/ http://www.sunearthtools.com/dp/tools/pos_sun.php K hodnotě azimutu musela být také dodatečně připočtena velikost meridiánové konvergence C, jež byla přibližně určena podle řady C=0.008257⋅Y +2.373⋅
kde Y, X se dosazuje v km a výsledek je ve stupních. [4]
15
Y , X
2 Metoda
2 Metoda 2.1 Úvod Cílem této práce bylo vytvořit klasifikační metodu, která bude univerzálně použitelná pro jakákoliv typově identická data. Uskutečnění tohoto záměru se však ukázalo být postupem zpracování značně problematické. V průběhu klasifikace je totiž použito značné množství procesů, které vyžadují definování různých parametrů. Ne však všechny parametry jsou snadno měnitelné a nelze jejich volbu plně svázat např. s prostorovým rozlišením dat. Metoda je tak uzpůsobena pro použitá podkladová data a jejich prostorové rozlišení. Přizpůsobení pro data s jiným prostorovým rozlišením je samozřejmě možné. Tato úprava nepředstavuje velký zásah ze strany uživatele/zpracovatele. Je pouze nutno manuálně pozměnit hodnoty některých parametrů. Metoda byla vytvořena v softwaru Definiens Developer verze 7.0.8. Tento program je prvořadě určen pro analýzu obrazových dat. Jeho použití se liší od jiných programů ve způsobu práce s daty, kdy je v maximální možné míře kladen důraz na znovu využitelnost vypracovaných analýz a na jejich celkovou automatizaci. Program spadá svým pojetím do kategorie znalostních systémů. Pro uživatele představuje vyspělé vývojové prostředí pro tvorbu vlastních analýz, přičemž je v něm implementována celá škála sofistikovaných nástrojů. Analýza dat v tomto prostředí je uskutečňována prostřednictvím jednotlivých procesů (příkazů), které lze uspořádat do vyšších hierarchických celků a ovládat jejich následnost pomocí podmínek a řídících struktur. Práce v tomto softwaru má tak částečnou analogii k počítačovému programování, i zde má totiž uživatel možnost definování vlastních proměnných, tříd, tvorbu příkazů i celých algoritmů. Vytvořenou strategii lze samostatně uložit a opakovaně ji použít např. při dávkovém zpracování dat. Metodika vypracovaná v rámci této práce se skládá z mnoha set příkazů, jejichž podrobný výčet a popis by byl velmi komplikovaný a těžko pochopitelný, kvůli jisté míře abstrakce. Při zpracování bylo použito velmi mnoho pomocných tříd, kroků, ale i celých sad procesů, než bylo dosaženo požadovaných výsledků. V následujícím textu je proto klasifikační strategie popsána v obecnější rovině, která je jistě srozumitelnější, a v co největší možné míře doplněna ilustrativními obrázky. V případě použití specifických funkcionalit programu bude text doplněn o některé teoretické základy nezbytné pro správné pochopení postupu.
16
2 Metoda
2.2 Klasifikace dat leteckého laserového skenování 2.2.1 Cíl klasifikace Cílem klasifikace výškopisných dat je jejich rozdělení do 5 hlavních tříd, které reprezentují zem, budovy, mosty, vodní plochy a plochy s náhlou změnou výšky. Výsledky této klasifikace byly poté použity při klasifikaci obrazových dat. Základní princip klasifikační strategie dat LLS vychází z informací obsažených v komentovaných průvodcích k softwaru Definiens [Guided tour level 1 a Guided tour level 3], které jsou zaměřeny na zjednodušenou extrakci budov. Tyto materiály jsou volně k dispozici na internetových stránkách výrobce programu.
2.2.2 Tvorba pomocných rastrů 1 Výškopisná data LLS převedená do rastrové podoby reprezentují digitální model povrchu (dále již jen DMP). Data DMP lze rozdělit do dvou základních skupin. Jednu skupinu tvoří data s plynulými a pozvolnými změnami výšky, které v převážné většině případů popisují průběh reliéfu. Druhou skupinu tvoří data s náhlými a výraznými (skokovými) změnami výšky, které reprezentují veškeré vyvýšené objekty, ať již přírodního původu (vegetace, skalní zlomy atd.) či umělého (budovy, mosty atd.). Rozdělení dat do těchto dvou skupin je možno provést na základě analýzy sklonů. Analýza sklonů je specifická tím, že nevychází z absolutních hodnot výšek, nýbrž z jejich vzájemných rozdílů, díky čemuž je univerzálně použitelná a vhodná i pro data se složitým průběhem terénu. Výpočet sklonů byl proveden algoritmem Slope Zevenbergen, Thorne (ERDAS) [5], který je součástí skupiny filtračních algoritmů implementovaných v softwaru Definiens. Výstupem tohoto algoritmu je zcela nová rastrová vrstva, která popisuje intenzitu sklonů ve vstupních datech DMP. Aplikací jakýchkoli filtrů se vstupní rastr vždy nejdříve převzorkuje na velikost nejjemnějšího používaného podkladu. Data DMP (1 m/pix) byla tedy převzorkována na rozlišení obrazových dat (0.25 m/pix). Díky tomuto procesu vznikly ve vstupních datech DMP schodovité změny výšky, které vedly k umělým a chybným výpočtům sklonů. Data DMP proto musela být před výpočtem sklonů vyhlazena pomocí Gaussova konvolučního filtru s velikostí kernelu 7x7 pixelů. Velikost kernelu byla zvolena s ohledem na rozdíl v rozlišení mezi obrazovými daty a daty DMP, který je čtyřnásobný. Kernel menších rozměrů neposkytoval potřebný efekt a naopak větší kernel 17
2 Metoda již vedl k přílišnému vyhlazení a ztrátě některých informací.
obr. 2: Obrazová data (RGB)
.
obr. 3: Data DMP
obr. 4: Vyhlazená data DMP
obr. 5: Sklony vypočtené z vyhlazených dat DMP
2.2.3 Segmentace obrazu Vrstva (rastr) obsahující vypočtené hodnoty sklonů byla rozdělena do mnoha menších částí, tzv. objektů. Tento proces se označuje jako segmentace obrazu a objekty samotné lze chápat jako shluky pixelů s podobnými vlastnostmi. Pro tvorbu objektů byl použit algoritmus contrast split segmentation, který automaticky určuje nejlepší prahovou hodnotu pro rozdělení scény na dvě skupiny objektů. Výsledkem tohoto algoritmu není tedy pouze tvorba objektů, ale i jejich klasifikace podle kontrastu na světlé a tmavé. V případě použité vrstvy sklonů reprezentují tmavé objekty data s malými a velmi pozvolnými změnami výšky (obr. 7 – žlutá barva) a světlé objekty data s rychlou změnou výšky (obr. 7 – červená barva). Výsledná klasifikace byla upravena odstraněním objektů, resp. jejich přidružením k opačné třídě, s plochou menší než 1 m2. 18
2 Metoda Provedená segmentace obrazu je dobře patrná z následujících obrázků.
obr. 6: Objekty vytvořené kontrastní segmentací obrazu
obr. 7: Klasifikované objekty
2.2.4 Inicializační klasifikace dat Analyzovaná scéna byla následně rozdělena na dlaždice o velikosti 75 x 75 metrů. Každá dlaždice byla poté zcela samostatně klasifikována. K tomuto kroku bylo přistoupeno kvůli značné členitosti terénu s výraznými výškovými rozdíly. Hlavním cílem inicializační klasifikace bylo rozdělit objekty s mírným sklonem na ty, které představují zem a střechy budov. Všechny střechy budov, ploché či sedlové, byly totiž vždy alespoň z malé části reprezentovány objekty s mírným sklonem. To lze přisoudit menší hustotě sběru dat LLS, kdy laserový paprsek nedopadl vždy zcela přesně na hřeben střechy, a použitému vyhlazujícímu filtru. Klasifikace objektů v každé dlaždici byla provedena na základě rozdílných výšek, což odpovídá konceptu lidského vyhodnocení obrazu, kdy je každý objekt rozpoznáván v porovnání se svým nejbližším okolím. Objekty se strmým sklonem se této klasifikace vůbec neúčastnily a nebyly během ní ani nikterak měněny. Třída zem Z průměrné výšky všech objektů, nacházejících se na aktuálně klasifikované dlaždici, byl vypočten 5procentní kvantil, který představoval prahovou hodnotu pro zatřídění objektů. Objekty s mírným sklonem, jejichž minimální výška (dle DMP) byla menší než vypočtená prahová hodnota, byly klasifikovány jako objekty třídy zem. Pro potřeby následující klasifikace budov byly veškeré objekty třídy zem rozděleny na menší bloky o velikosti 5 x 5 metrů.
19
2 Metoda Třída budovy Klasifikace budov se zúčastnily všechny zbývající nezatříděné objekty s mírným sklonem. Pokud tyto objekty splňovaly následující podmínku, že minimální průměrný rozdíl mezi jejich výškou a výškou objektů třídy zem do vzdálenosti 20 metrů musí být větší než 2 metry, byly klasifikovány jako objekty příslušící do třídy budovy. Uvedená podmínka představuje zcela zásadní a univerzálně použitelné pravidlo (dále již jen Pravidlo), na základě kterého byly z dat DMP klasifikovány veškeré budovy. Naprostá většina budov je totiž vyvýšena vůči svému okolí o minimálně 2 metry. Objekty třídy zem do vzdálenosti 20 metrů pak představují dostatečně velký reprezentativní vzorek nejbližšího okolí, ve kterém je eliminován vliv případných lokálních extrémů. Třída zbývající objekty Při inicializační klasifikaci nemohly být do výše uvedených tříd jednoznačně zařazeny všechny objekty. Především objekty nacházející se na okrajích dlaždic nebyly, z důvodu nemožnosti vyhodnocení celého jejich okolí, klasifikovány a byly proto zařazeny do třídy neurčitých objektů.
2.2.5 Postklasifikační úpravy Postklasifikační úpravy byly provedeny z důvodu odstranění efektu úvodního dělení scény na dlaždice. Hlavním cílem v tomto kroku bylo spojit dohromady objekty identických tříd a klasifikovat neurčité objekty. Neurčité objekty a jejich okolí byly podrobně analyzovány a iteračním procesem postupně zatříděny mezi objekty zem či budovy na základě splnění popřípadě nesplnění Pravidla. Třída mosty Objekty třídy zem (bloky o maximální velikosti 5x5 metrů) nebyly během postklasifikačních úprav spojeny. Všechny objekty této třídy byly naopak podrobeny testu Pravidla, čímž se podařilo opravit některé chybné klasifikace a zároveň také nalézt bloky, které představují mosty. Mosty splňují Pravidlo pro klasifikaci budov, ale zároveň také mohou být díky plynulému přechodu na terén zařazeny i mezi třídu zem. Tato dvojznačnost je pro ně charakteristická a bylo jí proto využito. Uvedená dvojznačnost platí také např. pro budovy zasazené do svahu s rovnou střechou plynule navazující na terén, či pro náhlé terénní skoky (terasovité pozemky, skalnaté zlomy atd.). 20
2 Metoda Četnost výskytu takovýchto objektů není v jádrových územích českých měst příliš vysoká, a proto byla pro danou charakteristiku uvažována jako odpovídající pouze třída mosty. Vzhledem k omezením použitých metod nelze klasifikované mostní objekty v místech přechodu na terén přesně ukončit, což je viditelné na následujících obrázcích.
obr. 8: Most (obrazová data)
obr. 9: Most (DMP)
obr. 10: Klasifikovaný most
2.2.6 Přesná extrakce budov Výsledek inicializační klasifikace dat (obr. 11) nelze v případě třídy budov považovat za finální řešení. Inicializační klasifikace posloužila pro nalezení objektů, které s největší pravděpodobností náleží do třídy budov. Pro získaní optimálních tvarů zástavby se tyto objekty musejí rozrůst do svého okolí, které je reprezentováno třídou objektů s náhlou změnou výšky.
obr. 11: Výsledek inicializační klasifikace dat
obr. 12: Výsledek klasifikace objektů s podobným sklonem
Vysvětlivky k obrázkům obr. 11 a 12: zem, budovy, objekty s náhlou změnou výšky 21
2 Metoda Zpřesnění klasifikace budov bylo provedeno ve dvou separátních krocích. V prvním kroku byl proveden růst budov na základě podobných hodnot sklonu. Objekty s náhlou změnou výšky, které obklopují třídu budov, byly segmentovány do menších objektů. Následně byly vybrány pouze ty objekty, které bezprostředně sousedily s již klasifikovanými objekty třídy budovy a byly podrobeny sérii několika testů, jejichž cílem bylo identifikovat pouze ty, které skutečně reprezentují části střech. Po prvním kroku (obr. 12) došlo ke znatelnému zpřesnění klasifikace, která už mnohem lépe vystihovala skutečný tvar budov. Ve druhém kroku bylo provedeno přesegmentování objektů s náhlou změnou výšky do objektů o velikosti 1x1 m, které přesně odpovídaly rastrovému podkladu DMP. Následně byl realizován růst budov po těchto metrových objektech. Při růstu bylo pro každý přidružovaný objekt použito Pravidlo, které zajišťovalo růst pouze po dostatečně vyvýšených objektech. Rozrůstání na okolní vegetaci zabraňovala podmínka maximálního vzájemného výškového rozdílu mezi přidružovanými objekty. Vytvořený růstový algoritmus nebyl použit pouze pro zpřesnění klasifikace budov, ale také pro vylepšení klasifikace třídy mostů. Vzhledem k hrubosti použitého rastru DMP není vymezení hranic budov zcela přesné. Bylo však dosaženo poměrně dobrého kompromisu mezi výslednou kvalitou, náročností zpracování a stabilitou celého procesu.
obr. 13: Růstový algoritmus počáteční stav
obr. 14: Růstový algoritmus konečný stav
Vysvětlivky k obrázkům obr. 13 a 14: zem, budovy, objekty vyloučené z růstu, objekty s náhlou změnou výšky, počáteční hranice pro růst budov
22
2 Metoda
2.2.7 Použití morfologie Morfologie je metoda zpracování obrazu založená na binárních operacích otevření a uzavření objektu. Morfologické otevření je definováno jako oddělení všech částí objektu, které nepojmou použitou masku. Morfologické uzavření naopak vede k vyplnění všech přilehlých částí objektu, které neobsáhly použitou masku. Metody si lze zjednodušeně představit jako opískování objektu nebo jeho obalení. Obě vedou ke změně tvaru objektu a lze je použít odděleně či ve vzájemné kombinaci. Na výsledný tvar objektu má zcela zásadní vliv velikost a podoba použité masky. Oválná maska vede k celkovému zkompaktnění a vyhlazení objektu. Pro specifické účely však může být výhodnější použití masky jiného tvaru (obdélníkové, čtvercové atd.). Efekt obou operací je patrný na následujících obrázcích, které byly převzaty z příručky k programu Definiens Developer. [5]
obr. 15: Morfologické otevření obrazového objektu [5] .
obr. 16: Morfologické uzavření obrazového objektu [5] V rámci práce byly tyto operace použity k vyhlazení výsledků klasifikace budov a mostů. Aby nedošlo k přílišným změnám ve výsledné klasifikaci obou tříd, byla zvolena velmi malá maska (čtverec 2 x 2 m), která zajistila oddělení a zaplnění pouze velmi malých nerovností.
23
2 Metoda Metoda morfologického otevření byla s úspěchem použita také pro plošné vymezení prostoru bez měřených dat LLS. Takto vymezené větší části území reprezentují ve většině případů vodní plochy. Této skutečnosti bylo využito při klasifikaci vodních toků (viz. obr. 17, 18 a 19).
obr. 17: Vodní plochy (obrazová data)
obr. 18: Vodní plochy (data LLS)
obr. 19: Klasifikované vodní plochy
2.2.8 Zhodnocení výsledků Pro zhodnocení výsledků klasifikace dat LLS byla použita Státní mapa 1:5 000 (SM 5). Jedná se o státní mapové dílo největšího měřítka, které polohopisně vychází z katastrální mapy. Vzhledem k tomuto faktu je to velice vhodný podklad pro vyhodnocení úspěšnosti klasifikace budov. Pro zhodnocení ostatních nalezených tříd už však použitelný není. Před samotným vyhodnocením klasifikace budov, musela být SM 5 vizuálně zkontrolována a doplněna dle ortofota o chybějící stavby. U některých budov byl rozšířen jejich půdorys o drobné přístřešky a přístavky, které nejsou v katastrální mapě evidovány a nejsou tak obsaženy ani ve SM 5. Všechny tyto úpravy byly provedeny se záměrem získat velmi přesný referenční podklad, který obsahuje veškeré stavby nacházející se na zemském povrchu. Pouze podklad tohoto druhu lze totiž použít pro relevantní vyhodnocení klasifikace budov z dat LLS. Následující tabulka obsahuje výsledky klasifikace budov, jejich porovnání s referenčním podkladem a vyhodnocení úspěšnosti klasifikace.
24
2 Metoda Tab. 4: Výsledky klasifikace budov a jejich vyhodnocení Referenční podklad celkový počet budov
396
počet budov s výměrou ≥ 25 m2
368
zastavěná plocha budovami o výměře ≥ 25 m2 [ha]
25.637
Výsledky klasifikace budov celkový počet budov
488
počet budov s výměrou ≥ 25 m2
413
zastavěná plocha budovami o výměře ≥ 25 m2 [ha]
26.108
Vyhodnocení úspěšnosti klasifikace budov (o výměře ≥ 25 m2) počet správně identifikovaných budov úspěšnost klasifikace
348 (ze 413) 84.3 %
správně klasifikovaná zastavěná plocha [ha] úspěšnost klasifikace
23.600 (z 26.108) 90.4 %
Z předcházející tabulky lze zjistit, že vytvořená klasifikační metoda spíše nadhodnocuje. Je to způsobeno tím, že některé hustší typy porostů dostaly díky převodu dat LLS do rastrové podoby charakter vysoce kompaktních objektů, které algoritmus vyhodnotil jako stavby. Ze všech 368 staveb se podařilo identifikovat pouze 348. Vizuální kontrolou však bylo zjištěno, že všechny nenalezené stavby mají charakter přízemní budovy s rovnou střechou. Jednalo se o garáže, větší kůlny atp., které měly průměrnou plochu cca 50 m2. Všechny rodinné domy a větší stavby byly vždy nalezeny a klasifikovány, což lze označit za velmi dobrý výsledek.
2.2.9 Tvorba pomocných rastrů 2 Rekonstrukce stínů budov V prostředí softwaru Definiens byl vytvořen algoritmus, s jehož pomocí lze zrekonstruovat podobu stínů, které vrhají budovy. Implementovaný algoritmus pracuje výlučně s rastrem DMP a pro svoji činnost potřebuje určit pozici Slunce (elevaci a azimut) a definovat, které části scény reprezentují zem a které budovy. Tato tématická vrstva představuje výsledek předchozí klasifikace dat LLS. Tento algoritmus byl vytvořen se záměrem použít jej pro separaci stínů vržených budovami (či mosty) od stínů náležejících ostatním vyvýšeným objektům, mezi které patří především vysoká vegetace (stromy). Na základě analýzy takto separovaných stínů pak měla být vysoká 25
2 Metoda vegetace klasifikována. Následující text popisuje základní princip algoritmu.
obr. 20: Klasifikace budov
obr. 21: Řez A - náčrt situace
Mezi vstupní data patří, jak již bylo zmíněno, rastrová podoba DMP (obr. 3) a tématická vrstva obsahující klasifikaci budov (obr. 20). Algoritmus určuje rozsah stínu pro každou budovu ve scéně zcela samostatně. Každá budova a její nejbližší okolí jsou přitom analyzovány po pomyslných řezech vedených ve směru slunečního svitu. Tento způsob řešení byl zvolen z důvodu dosažení maximální přesnosti vymezení zastíněných ploch. Na obr. 21 je modelový náčrt situace v každém analyzovaném řezu.
obr. 22: Odvrácený okraj budovy (azurové pixely)
obr. 23: Řez B - analýza budovy
Algoritmus nejdříve provádí analýzu budovy. Prvním krokem je nalezení odvráceného okraje vůči pozici Slunce. Tento krok je prováděn vždy pro celou budovu najednou a jeho výsledek je zaznamenán na obr. 22. Každý jeden bod (pixel) na odvráceném okraji budovy představuje pomyslný střed realizovaného řezu. Vůči tomuto bodu je totiž definováno nejbližší analyzované okolí, které činí 50 metrů na obě strany v rovině slunečního svitu. Nalezený okraj budovy není zpravidla určující pro délku vrženého stínu. Výjimku představují 26
2 Metoda pouze budovy s plochou střechou. Většina zástavby má však střechu sedlového typu, a proto algoritmus sestaví řez budovou, tzn. nalezne body budovy ležící ve směru ke Slunci (obr. 24). Řez budovou je následně analyzován, přičemž podstatou analýzy je nalézt bod určující skutečnou délku vrženého stínu. Tento bod a princip jeho hledání se nalézá na obr. 23. Určující bod je nejvyšší bod v řezu, který splňuje podmínku, že svislý úhel β mezi ním, bodem na okraji budovy a vodorovnou rovinou je větší než elevace Slunce (výška Slunce nad obzorem). Z této podmínky vyplývá, že určujícím bodem nemusí být vždy absolutně nejvyšší bod v řezu, ačkoli na obr. 24 tomu tak zrovna je. Po nalezení určujícího bodu je sestaven řez okolím ve směru slunečního svitu. Mezi každým bodem (pixelem) tohoto řezu, určujícím bodem a vodorovnou rovinou je poté vypočtena hodnota svislého úhlu γ (obr. 26). Pokud je tento úhel větší než elevace Slunce, daný bod se nachází ve stínu budovy. V opačném případě již ve stínu budovy neleží. Vytvořený řez okolím je na obr. 25. Vytvořený algoritmus pracuje velmi exaktně a lze pomocí něj vymezit zastíněnou plochu i u velmi složitých budov (obr. 29). Po spojení výstupu tohoto algoritmu s obrazovou
obr. 24: Řez budovou (azurové pixely) a nalezený určující bod (červený pixel)
klasifikací dat lze získat velmi robustní a přesnou metodu klasifikace stínů budov (obr. 30). Přes velmi dobré výsledky, které tato metoda poskytuje, nebyla ve výsledné klasifikaci vegetace použita. V mnoha případech se totiž vysoká vegetace nachází, alespoň z malé části, ve stínu budovy. Přesné oddělení stínu budov pak může vést k odtrhnutí stínu náležejícího vegetaci a nemožnosti jí podle něj poté správně klasifikovat.
obr. 25: Řez okolím (azurové pixely) a nalezený stín (modré pixely)
obr. 26: Řez C - analýza okolí
27
2 Metoda
.
obr. 27: Budovy u Vodního hradu (Česká Lípa)
obr. 28: Klasifikované budovy (z dat DMP)
obr. 29: Rekonstruované stíny budov (raw data)
obr. 30: Klasifikované stíny budov (využití obrazových dat a rekonstr. stínů)
Vysvětlivky k obrázkům obr. 29: neanalyzovaná místa, osvětlená místa, rekonstruované stíny budov obr. 30: klasifikace budov (z dat DMP), klasifikované stíny budov
28
2 Metoda Zatřídění dat leteckého laserového skenování do výškových pater Nativní podoba dat leteckého laserového skenování, s výškou bodů v systému Bpv, není pro klasifikaci liniové vegetace příliš vhodná. Bylo proto přistoupeno k tvorbě pomocného rastru, který by obsahoval data LLS zatříděná do několika výškových pater vztažených k rovině terénu. Naprosto přesná znalost výšky jednotlivých bodů není pro klasifikaci vegetace nutná. Výsledek klasifikace DMP posloužil jako zdroj dat, pomocí kterého byly určeny body mračna reprezentující průběh terénu. Ostatní body mračna pak byly kategorizovány do jednotlivých výškových pater na základě rozdílu jejich výšky vůči bodům vyjadřujícím průběh terénu. Data LLS byla rozdělena do 5 tříd. Popis jednotlivých tříd je uveden v následující tabulce. Body s výškou větší než 58 metrů nebyly zatříděny, protože se s největší pravděpodobností již nejedná o body příslušící vegetaci (nejvyšší strom ČR měřil 58 metrů [6]). Výsledky kategorizace dat byly exportovány do tématické rastrové vrstvy, která je součástí podkladů na přiloženém datovém nosiči. Tab. 5:Zatřídění dat leteckého laserového skenování do výškových pater třídy / patra
výška bodů nad terénem
vegetační příslušnost
1.
od 0 do 3 metrů <0, 3>
trávy
2.
od 3 do 4 metrů (3, 4>
3.
od 4 do 5 metrů (4, 5>
nízké dřeviny (stromky, keře)
4.
od 5 do 15 metrů (5, 15>
střední strom
5.
od 15 do 58 metrů (15, 58>
velký strom
žádná data
území bez měřených dat a body s výškou větší než 58 metrů
29
2 Metoda
2.3 Klasifikace obrazových dat 2.3.1 Cíl klasifikace Hlavním cílem této práce bylo nalézt metodu pro klasifikaci liniové vegetace. Liniovou vegetaci představuje vysoká vegetace, která se nachází v úzkých pásech podél vodních toků, komunikací, cest atp. Pro klasifikování liniové vegetace je tedy nutno vypracovat metodu, která umožní dělení vegetace na nízkou a vysokou. Pro tuto metodu se jeví vhodné použití obrazových dat společně s daty LLS. Vzájemná použitelnost obou druhů dat pro tento účel je však značně problematická. Jedná se o stejnou komplikaci jako v případě použitelnosti obou druhů dat pro klasifikaci budov. Data laserového skenování jsou prostorově přesná, kdežto ortofoto je polohově přesné pouze v rovině terénu a u vyvýšených objektů dochází k posunu obrazu. Tento efekt je viditelný na následujícím obrázku, kde je zachycena skupina stromů společně s měřenými daty LLS (červené body reprezentují odrazy z korun stromů).
obr. 31: Posun obrazu vyvýšených objektů Laserová data mají navíc tu vlastnost, že měřené body zpravidla nevystihují vrcholky korun stromů. Ve většině případů je zachycen dostatečně silný odraz až z nižší části koruny. Na základě takovýchto dat lze dělit vegetaci dle její výšky pouze se značnou mírou nejistoty. Dostupná data leteckého laserového skenování (poskytnutá ČÚZK) jsou pro tyto účely vhodná ještě méně, protože byla pořízena na začátku vegetačního období a mají poměrně nízkou hustotu. 30
2 Metoda Z tohoto důvodu bylo upuštěno od použití laserových dat a přistoupeno k využití pouze obrazových podkladů. Zjištění výšky vegetace z obrazových dat je však úkol velice složitý, který vyžaduje vypracování metody, která vyhodnotí výšku vegetace pomocí délky vrženého stínu.
2.3.2 Segmentace obrazu Před klasifikací bylo nutné obraz segmentovat do objektů, které budou vhodně vystihovat vegetaci i zastíněné plochy. Pro tento účel bylo vyzkoušeno několik různých segmentačních algoritmů implementovaných v softwaru Definiens. Nejlepší výsledky poskytoval algoritmus Multiresolution segmentation. Tento algoritmus umožňuje volbu vrstev, na základě kterých bude segmentace obrazu provedena. Pomocí několika dalších parametrů lze také ovlivnit velikost a tvar vytvářených objektů. Pro segmentaci obrazu byl použit algoritmus Multiresolution segmentation s následujícím nastavením: –
váhy vrstev: červené pásmo: 0.67, zelené pásmo: 1.0, NIR: 1.0
–
parametry: scale: 20, shape: 0.3, compactness: 1.0
2.3.3 Fuzzy klasifikace Pro analýzu vytvořených obrazových objektů byl v prostředí softwaru Definiens vytvořen hierarchický klasifikační fuzzy model. Pro zájmové třídy byly nejdříve nalezeny charakteristické příznaky, které byly následně popsány pomocí členských funkcí. Členské funkce modelují pravděpodobnost zařazení objektu do konkrétní třídy. Jejich použití umožňuje kombinaci velice odlišných příznaků, jejichž vzájemné vztahy lze vyjádřit pomocí logických operátorů. [7] Vytvořený klasifikační fuzzy model je značně složitý a pro jeho pochopení je bezpodmínečně nutné znát použité funkcionality programu, a proto byl jeho podrobný popis raději zcela vynechán. Model je součástí vytvořené strategie a nachází se tak na přiloženém datovém nosiči. Při tvorbě klasifikační strategie byl kladen velký důraz na použití obecných a univerzálních objektových charakteristik, aby bylo možno výsledný klasifikační proces znovu využít i pro jiná data. Pro popis tříd bylo použito několik specifických typů příznaků, které jsou podrobněji popsány v následující části textu.
31
2 Metoda Normalizovaný diferenční vegetační index Normalizovaný diferenční vegetační index (NDVI - Normalized Difference Vegetation Index) udává poměr odrazivosti povrchů v červené a NIR části spektra. Jedná se o jednoduchý způsob (vzorec 1), pomocí něhož lze identifikovat vegetační pokryv. [8] NDVI = .
Mean NIR−Mean Red Mean NIR+Mean Red
[1]
Použití NDVI u ortofota však není zcela vhodné. Při spojování snímků do mozaiky dochází totiž k jejich barevnému vyrovnání, což vede ke změně výsledných hodnot v pixelech. NIR mozaika byla navíc připravena dodatečně a zcela odděleně od RGB dat. Její vyrovnání je proto odlišné. Tyto úpravy vedly ke změnám zachycených hodnot odrazivosti v jednotlivých kanálech, díky čemuž došlo u vegetace ke snížení hodnot NDVI a k nutnému posunu prahových hodnot pro její oddělení do mírně záporných čísel.
Barevný model Hue, Saturation, Intensity Barevný model Hue, Saturation, Intensity (barevný odstín, sytost, intenzita) zkr. HSI představuje alternativu k modelu RGB. Jeho použití při klasifikaci obrazových dat je velice vhodné, protože umožňuje oddělení barevné složky obrazu od hodnot sytosti a intenzity. Této skutečnosti bylo opakovaně využito v klasifikační strategii. Saturace reprezentuje sytost konkrétní barvy a udává poměr šedi v odstínu barvy. Intenzita charakterizuje světlost barvy v rozsahu od černé až po konkrétní odstín. Z barevného modelu RGB lze hodnotu saturace (vzorec 2) a intenzity (vz. 3) vypočíst dle následujících vztahů. [5, 8]
{
0 S = MAX −MIN MAX
I =MAX
.
MAX =0 MAX ≠ 0
[3]
R,G,B
...hodnoty vyjádřené v rozsahu od 0 do 1
MAX
...největší z R,G,B hodnot
MIN
...nejmenší z R,G,B hodnot
32
}
[2]
2 Metoda Texturální příznaky Použité texturální příznaky (Haralick features) jsou založeny na analýze matice stupňů šedi, tzv. GLCM (gray level co-occurrence matrix). Tato matice udává četnost střídání různých kombinací stupňů šedi v obrazovém objektu. Pro každý ze 4 směrů v rastrovém obraze (0°, 45°, 90° a 135°) lze získat odlišnou GLCM. Pro získání směrově invariantních texturálních příznaků lze využít všesměrovou matici, která je výsledkem součtu všech čtyř matic pro konkrétní směry. Každá GLCM je symetrická matice s identickým počtem řádků a sloupců, který odpovídá hloubce dat. V případě 8bitových dat se tedy jedná o matici s 256 sloupci a řádky. Čísla na hlavní diagonále reprezentují počty pixelových párů (sousedících pixelů) s identickými hodnotami. Čísla na paralelní diagonále udávají počty pixelových párů s rozdílem jednoho stupně šedi. Čím dále od hlavní diagonály, tím větší rozdíl stupňů šedi je mezi sousedícími pixely. Každá GLCM je normalizovaná (vzorec 4), čímž je eliminován vliv velikosti objektu, ze kterého je tato matice vypočtena. Výsledná matice stupňů šedi slouží jako zdroj dat pro výpočet celé řady texturálních vlastností. Pro potřeby této práce byly použity texturální příznaky charakterizující homogenitu a kontrast. Jedná se o příznaky, které využívají váhy pro jednotlivé prvky GLCM v závislosti na jejich vzdálenosti od hlavní diagonály. U příznaku homogenity (vzorec 5) platí, že čím je vzdálenost prvku od hlavní diagonály větší, tím exponenciálně klesá jeho význam. U kontrastního příznaku (vzorec 6) je tomu přesně naopak. [5] P i , j=
V i, j N −1
[4]
∑ Vi, j
i , j=0
. N −1
∑
i , j=0
.
N −1
∑
i , j=0
. i
...číslo řádku
j
...číslo sloupce
Pi, j 1+(i− j)2 P i , j (i− j)2
V i , j ...původní hodnota na pozici i,j P i , j ...normalizovaná hodnota na pozici i,j N
...počet řádků nebo sloupců 33
[5]
[6]
2 Metoda
2.3.4 Použití morfologie Pro klasifikaci zastíněných ploch určité délky bylo použito operace morfologického otevření se zcela specifickou maskou. Zásadní význam přitom měl její tvar, velikost i směrová orientace. Zvolený tvar masky odpovídal výrazně protáhlému obdélníku, který byl natočen do souhlasného směru s azimutem Slunce v době pořízení snímku. Délka masky byla vypočtena na základě elevace Slunce a hledané výšky vegetace. Pro klasifikaci vysoké vegetace byla stanovena její minimální výška na 5 metrů. Tato hodnota byla považována za dostatečnou pro oddělení většiny křovin od stromového porostu, což se ukázalo být jako pravdivé. Při vizuální kontrole výsledků klasifikace však bylo zjištěno, že došlo i k podstatné filtraci menších stromů. Byla proto provedena ještě dodatečná klasifikace vegetace s výškou 4-5 metrů. Maska použitá pro klasifikaci objektů s výškou větší než 5 metrů se nachází na obr. 32 (1 pix/0.25 m).
obr. 32: Použitá morfologická maska Na obrázku 34 je zobrazen výsledek klasifikace zastíněných ploch včetně efektu morfologického otevření specifikovanou maskou.
obr. 33: Vegetace a zastíněné plochy (obrazová data)
obr. 34: Zastíněné plochy po morfologickém otevření
Vysvětlivky k obrázkům obr. 34: vegetace, stíny po morfologickém otevření, separované části stínů 34
2 Metoda
obr. 35: Klasifikace vysoké vegetace přehled
obr. 36: Klasifikace vysoké vegetace detail
Vysvětlivky k obrázkům obr. 35 a 36: vegetace, stíny po morfologickém otevření, separované části stínů, analyzovaný stín obr. 36.2 a 36.3: hranice stínu přivrácená ke Slunci, hranice vysoké vegetace obr. 36.4: buffer (2 m) kolem hranice vysoké vegetace Na předchozích obrázcích (obr. 35 a 36) je vystižen princip klasifikace vysoké vegetace. Pro každou zastíněnou plochu po morfologickém otevření bylo provedeno hledání sousedících objektů ve směru ke Slunci, které by splňovaly spektrální charakteristiky pro vysokou vegetaci. Takto nalezené objekty byly následně segmentovány na jednotlivé pixely, díky čemuž mohla být přesně vymezena hranice mezi stínem a vysokou vegetací. Kolem této hranice byl potom realizován buffer o velikosti 2 metry (1.5 metru pro vegetaci s výškou 4-5 metrů), který vytvořil zástupný objekt pro klasifikovanou vegetaci. Hodnotu bufferu lze libovolně měnit a použitá velikost nemá hlubší význam. Jedná se pouze o prostředek usnadňující lokalizaci nalezené hranice v obraze, který byl zároveň použit pro vyhodnocení úspěšnosti. Při vytváření zástupných objektů v hustší vegetaci docházelo k jejich vzájemnému prolínání, a proto pro ně bylo použito univerzální označení vegetační shluk. Původně bylo zamýšleno provést, na základě těchto vegetačních shluků, klasifikaci všech přilehlých spektrálně podobných objektů. Od tohoto záměru však bylo upuštěno, protože nevedl k uspokojivým výsledkům a navíc při něm docházelo ke ztrátě lokalizační informace, kterou vytvořené zástupné objekty mají. 35
2 Metoda
obr. 37: Výsledek klasifikace vysoké vegetace
obr. 38: Výsledek vizuální kontroly klasifikace
Vysvětlivky k obrázkům obr. 37: klasifikovaná vegetace s výškou nad 5 m, klasifikovaná vegetace s výškou 4-5 m obr. 38, 39, 42, 45: správně klasifikovaná vegetace, chybně klasifikovaná vegetace
2.3.5 Zhodnocení výsledků Při zhodnocení výsledků nebylo bráno v úvahu dřívější výškové dělení vegetace (výška nad 5 m, výška 4-5 m). Nalezené shluky byly spojeny dohromady a následně vizuálně zkontrolovány. Kontrola se omezila pouze na klasifikovanou vegetaci nacházející se do vzdálenosti 50 metrů od hlavních komunikací (silnice I. a III. třídy) procházejících danou scénou. Tento způsob byl zvolen z důvodu omezení kontroly pouze na potenciální liniovou vegetaci. V případě nalezení nesprávně klasifikované vegetace došlo k zařazení daného shluku mezi chybné výsledky. V některých případech byla chybná klasifikace součástí většího shluku, který byl však klasifikován správně. V takovýchto případech došlo k manuálnímu oddělení chybné části a samostatnému vyhodnocení vzniklých podobjektů (obr. 37 a 38 vlevo dole). Výsledek vizuální kontroly je uveden v následující tabulce. Vzhledem k nejednotné velikosti vegetačních shluků nelze úspěšnost metody hodnotit na základě počtu správných klasifikací. Relevantní výsledky poskytuje vyhodnocení až na základě vymezené plochy.
36
2 Metoda Tab. 6: Výsledky vizuální kontroly klasifikace vysoké vegetace Počet vegetačních shluků z toho
604
počet správných klasifikací
519
počet chybných klasifikací
85
úspěšnost klasifikace
85.9 %
Plocha vegetačních shluků [m2]
21133.5
z toho
správně klasifikovaná plocha [m2]
19977.7
chybně klasifikovaná plocha [m2]
1155.8
úspěšnost klasifikace
94.5 %
Během vizuální kontroly byla zjišťována příčina vzniku chybných klasifikací vysoké vegetace. Bylo zjištěno, že podstatnou část chyb lze zařadit do 3 kategorií podle příčiny vzniku. Následující část textu je věnována rozboru nalezených příčin, včetně uvedení možného řešení.
obr. 39: Chyba I. - chybná klasifikace vysoké vegetace
obr. 40: Chyba I. - obrazová data
obr. 41: Chyba I. morfologické otevření stínů
Chybu I. kategorie lze charakterizovat jako nesprávné identifikování vysoké vegetace na okraji stínu komplikovanějšího tvaru. Tato chyba by měla jít eliminovat použitím jiné (rozměrově větší) masky při morfologickém otevření stínů. Další řešení by mohlo představovat vypracování samostatné metody, která by vyhodnocovala nalezenou společnou hranici mezi stínem a vysokou vegetací podle kritérií vzájemné velikosti a polohy.
37
2 Metoda
obr. 42: Chyba II. - chybná klasifikace vysoké vegetace
obr. 43: Chyba II. - obrazová data
obr. 44: Chyba II. morfologické otevření stínů
Chybu II. kategorie lze označit jako efekt nadhodnocení stínů. Použitá klasifikační strategie vede k částečnému nadhodnocení velikosti zastíněných ploch. V tomto případě došlo k zařazení odvrácené strany budovy do zastíněných ploch a k následné chybné klasifikaci na okraji budovy.
obr. 45: Chyba III. - chybná klasifikace vysoké vegetace
obr. 46: Chyba III. obrazová data
obr. 47: Chyba III. morfologické otevření stínů
Chyba III. kategorie se zdá být identická s chybou II. kategorie. V tomto případě však nedošlo k nadhodnocení stínů, ale jedná se o současný výskyt hned několika nepříznivých faktorů. Chyby II. a III. kategorie by šlo odstranit za použití vytvořené metody pro rekonstrukci stínů budov, která umožňuje oddělení stínů budov od ostatních zastíněných ploch. Využití této metody však nemusí vést pouze ke zlepšení výsledků. V určitých případech dochází k prolínání stínů budov a vegetace, která se nachází v jejich bezprostřední blízkosti (obr. 30). Striktní oddělení stínů budov by tak mohlo vést ke znemožnění správné klasifikace přiléhající vysoké vegetace.
38
3 Závěr
3 Závěr Během zpracování této práce bylo zjištěno, že kombinace různých zdrojů dat může být někdy velice komplikovaná a nemusí vždy vést k zisku předpokládaných informací. Každý typ dat má svá specifika, výhody i nevýhody a vlastní obsahový potenciál. Pro konkrétní analýzy představuje vhodný výběr zdrojových dat zcela zásadní rozhodnutí, kterému by měla být věnována dostatečná pozornost. Data leteckého laserového skenování lze velmi vhodně použít pro klasifikaci veškerých objektů, které lze popsat pomocí výškových charakteristik. Vhodnost jejich použití pro klasifikaci vegetace však ovlivňuje hned několik faktorů. Mezi nejvýznamnější faktory patří především samotná hustota sběru dat a období, ve kterém byla data pořízena. Vegetace se totiž v průběhu roku výrazně mění a tomu také odpovídá její podoba v datech laserového skenování. Data pořízená v předvegetačním období lze s úspěchem použít pro oddělení vegetace od zástavby. Data z vegetačního období pak mohou být zase využita pro výškovou klasifikaci zeleně. Ideální případ představuje situace, kdy je analyzováno území, pro které jsou k dispozici data z obou období. Laserová data získaná pro tuto práci byla pořízena na začátku vegetačního období a vzhledem k jejich poměrně malé hustotě je nelze pro spolehlivou klasifikaci vegetace příliš doporučit. Bylo totiž zjištěno, že některé stromy s řidší nebo menší korunou nemusí být v datech vůbec zaznamenány. To představuje zásadní nedostatek, kvůli kterému nebyly pro klasifikaci liniové vegetace vůbec použity. Uvedené nedostatky však nutně vyplývají z účelu, pro který byla tato data pořízena. Záměrem jejich pořízení totiž nebylo mapování vegetace, ale snaha zvýšit přesnost a podrobnost výškopisných podkladů pro území ČR. Během jejich zpracování však bylo prokázáno, že je lze s úspěchem použít pro klasifikaci zástavby. Vytvořená metoda klasifikace budov dosáhla 90.4% úspěšnosti, což lze, vzhledem ke složitosti analyzovaného jádrového území města, považovat za uspokojivý výsledek. Klasifikace liniové vegetace z obrazových dat je nesmírně složitý úkol, kterého nebylo vůbec lehké se zhostit. Vytvořená klasifikační metoda je založena na principu vyhodnocení délky stínů. Pokud vegetace nevrhá stín na vodorovnou plochu, dochází nutně ke zkreslení délky stínu, což může vést k nepřesnému zatřídění. V určitých případech (souvislá hustá vegetace, strom vrhající stín na stěnu budovy) však nemusí být vegetační stín vůbec nalezen. Identifikace vysoké 39
3 Závěr vegetace je potom pomocí této metody zcela znemožněna. Uvedené nedostatky ovšem vyplývají z principu vytvořené klasifikační metody a nelze je označit za chyby, ale za omezující podmínky. V případě splnění všech předpokladů tato metoda poskytuje vysokou úspěšnost 94.5 %, kterou by šlo podle naznačených způsobů ještě dále vylepšit. Na závěr celé práce bych chtěl poznamenat, že během vytváření jednotlivých klasifikačních metod jsem získal mnoho nových poznatků a osvojil si celou řadu dovedností, které jsem do té doby znal pouze v teoretické rovině. Celá problematika automatického klasifikování dat mě velice zaujala a chtěl bych se jí věnovat i v budoucnu.
40
4 Zdroje a použitá literatura
4 Zdroje a použitá literatura [1] Datové sady: Ortofoto České republiky. Geoportál ČÚZK [online]. © 2010 [cit. 2012-0511]. Dostupné z: http://geoportal.cuzk.cz/(S(y4osqujtmwpnl445sbnfbq3r))/Default.aspx? mode=TextMeta&text=ortofoto_info&side=ortofoto&menu=23 [2] Datové sady: Výškopis. Geoportál ČÚZK [online]. © 2010 [cit. 2012-05-11]. Dostupné z: http://geoportal.cuzk.cz/(S(vuov41urlrgcviq5jo5qei45))/Default.aspxmode=TextMeta &text=vyskopis&side=vyskopis&menu=30 [3] UltraCam Photogrammetric Digital Aerial Mapping Systems: UltraCamXp - Technical. UltraCam [online]. © 2012 [cit. 2012-05-11]. Dostupné z: http://www.microsoft.com/ ultracam/en-us/UltraCamXpTechnical.aspx [4] BUCHAR, Petr. Matematická kartografie. Vyd. 3., přeprac. V Praze: Nakladatelství ČVUT, 2007c1996, 197 s. ISBN 978-80-01-03765-2. [5] DEFINIENS. Developer 7: Reference Book [součást instalace softwaru]. Document Version 7.0.2.936. Germany: Definiens AG, © 2007 [cit. 2012-05-12]. [6] Zeměpisné rekordy České republiky. Kompas.estranky.cz [online]. 2012 [cit. 2012-0512].
Dostupné
z:
http://www.kompas.estranky.cz/clanky/clanky---cesko/zemepisne-
rekordy-ceske-republiky.html [7] BENZ, Ursula C., Peter HOFMANN, Gregor WILLHAUCK, Iris LINGENFELDER a Markus HEYNEN. Multi-resolution, object-oriented fuzzy analysis of remote sensing data for GIS-ready information. ISPRS Journal of Photogrammetry & Remote Sensing [online]. 2003, roč. 2004, č. 58, s. 20 [cit. 2012-05-12]. Dostupné z: http://www.colorado.edu/geography/leyk/geog_5113/readings/benz_etal_2004_JPRS.pdf [8] HALOUNOVÁ, Lena; PAVELKA, Karel. Dálkový průzkum Země. Vydání první. Praha : České vysoké učení technické v Praze, 2005. 192 s. ISBN 80-01-03124-1. [9] BĚLKA, Luboš, Petr DUŠÁNEK, Radek FIALA, Jakub GAMRÁT, Oldřich KAFKA, Josef PEICHL a Jiří ŠÍMA. Technická zpráva k digitálnímu modelu reliéfu 4. generace (DMR 4G). In: BRÁZDIL, Karel. [online]. Pardubice: Zeměměřický úřad, 31. října 2010, Aktualizace: 15.1.2012 [cit. 2012-05-14]. Dostupné z: http://geoportal.cuzk.cz/ Dokumenty/TECHNICKA_ZPRAVA_DMR_4G_15012012.pdf
41
4 Zdroje a použitá literatura [Guided tour level 1] ROGG, Caroline. Guided Tour1: Getting started - Example: Simple buidling extraction. eCognition: Community [online]. Version 3.0. 2010 [cit. 2012-0514].
Dostupné
z:
http://community.ecognition.com/home/copy_of_GuidedTour1_
eCognition8_GettingStarted_Example_SimpleBuildingExtraction.zip/view [Guided tour level 3] ROGG, Caroline. Guided Tour3: Advanced Building Extraction. eCognition: Community [online]. Version 3.0. 2010 [cit. 2012-05-14]. Dostupné z: http://community.ecognition.com/home/GuidedTour3_eCognition8_AdvancedRuleSet Writing_ExampleBuildingExtraction.zip/view
42
5 Příloha
5 Příloha
43
5.1 Seznam tabulek Tab. 1: Datum leteckého laserového skenování zájmového území...............................................11 Tab. 2: Základní parametry leteckého laserového skenování........................................................11 Tab. 3: Internetové adresy kalkulátorů pro výpočet polohy Slunce...............................................15 Tab. 4: Výsledky klasifikace budov a jejich vyhodnocení............................................................25 Tab. 5:Zatřídění dat leteckého laserového skenování do výškových pater....................................29 Tab. 6: Výsledky vizuální kontroly klasifikace vysoké vegetace..................................................37
44
5.2 Seznam obrázků obr. 1: Dělení mapového listu SM 5 a použité číslování kvadrantů..............................................14 obr. 2: Obrazová data (RGB).........................................................................................................18 obr. 3: Data DMP...........................................................................................................................18 obr. 4: Vyhlazená data DMP..........................................................................................................18 obr. 5: Sklony vypočtené z vyhlazených dat DMP........................................................................18 obr. 6: Objekty vytvořené kontrastní segmentací obrazu..............................................................19 obr. 7: Klasifikované objekty.........................................................................................................19 obr. 8: Most (obrazová data)..........................................................................................................21 obr. 9: Most (DMP)........................................................................................................................21 obr. 10: Klasifikovaný most...........................................................................................................21 obr. 11: Výsledek inicializační klasifikace dat...............................................................................21 obr. 12: Výsledek klasifikace objektů s podobným sklonem.........................................................21 obr. 13: Růstový algoritmus - počáteční stav.................................................................................22 obr. 14: Růstový algoritmus - konečný stav..................................................................................22 obr. 15: Morfologické otevření obrazového objektu [5]................................................................23 obr. 16: Morfologické uzavření obrazového objektu [5]...............................................................23 obr. 17: Vodní plochy (obrazová data)...........................................................................................24 obr. 18: Vodní plochy (data LLS)..................................................................................................24 obr. 19: Klasifikované vodní plochy..............................................................................................24 obr. 20: Klasifikace budov.............................................................................................................26 obr. 21: Řez A - náčrt situace.........................................................................................................26 obr. 22: Odvrácený okraj budovy (azurové pixely).......................................................................26 obr. 23: Řez B - analýza budovy....................................................................................................26 obr. 24: Řez budovou (azurové pixely) a nalezený určující bod (červený pixel)..........................27 obr. 25: Řez okolím (azurové pixely) a nalezený stín (modré pixely)...........................................27 obr. 26: Řez C - analýza okolí........................................................................................................27 obr. 27: Budovy u Vodního hradu (Česká Lípa)...........................................................................28 obr. 28: Klasifikované budovy (z dat DMP)..................................................................................28 obr. 29: Rekonstruované stíny budov (raw data)...........................................................................28 obr. 30: Klasifikované stíny budov (využití obrazových dat a rekonstr. stínů).............................28 obr. 31: Posun obrazu vyvýšených objektů...................................................................................30 obr. 32: Použitá morfologická maska............................................................................................34 45
obr. 33: Vegetace a zastíněné plochy (obrazová data)...................................................................34 obr. 34: Zastíněné plochy po morfologickém otevření..................................................................34 obr. 35: Klasifikace vysoké vegetace - přehled.............................................................................35 obr. 36: Klasifikace vysoké vegetace - detail................................................................................35 obr. 37: Výsledek klasifikace vysoké vegetace..............................................................................36 obr. 38: Výsledek vizuální kontroly klasifikace............................................................................36 obr. 39: Chyba I. - chybná klasifikace vysoké vegetace................................................................37 obr. 40: Chyba I. - obrazová data...................................................................................................37 obr. 41: Chyba I. - morfologické otevření stínů.............................................................................37 obr. 42: Chyba II. - chybná klasifikace vysoké vegetace...............................................................38 obr. 43: Chyba II. - obrazová data.................................................................................................38 obr. 44: Chyba II. - morfologické otevření stínů...........................................................................38 obr. 45: Chyba III. - chybná klasifikace vysoké vegetace.............................................................38 obr. 46: Chyba III. - obrazová data................................................................................................38 obr. 47: Chyba III. - morfologické otevření stínů..........................................................................38
46