Činnosti v rámci projektů Postup řešení 1. Stanovení cílů projektu 2. Budování datové databáze navržení databáze naplnění databáze – vstup údajů kontrola údajů a odstraňování chyb 3. Restrukturalizace nebo manipulace s údaji 4. Vykonání analýz a syntéz analýzy a syntézy geografické analýzy a syntézy modelů terénu analýzy a syntézy statistické analýzy a syntézy obrazů 5. Vytváření výstupů.
1. Stanovení cílů projektu
Databázové aplikace
důraz kladen na vytvoření databáze, využitelné širším okruhem uživatelů databáze je průběžně aktualizována, snadno prohledávatelná důležité: správně navržená databáze, všeobecně uznávaná lokalizace a tvorba univerzálně využitelných výstupů
Analytické aplikace
důraz kladen na analýzy bez potřeb vazeb na širší okolí, potřeby jiných uživatelů.
důležité:
výběr vhodného systému či způsob prezentace dat výběr souřadnicového systému
Součást řídícího a rozhodovacího systému
Plná integrace s využitím všech dovedností GISu. Důraz kladen na využití vhodných datových struktur, sdílení a vzájemné poskytování dat, využití nástrojů GIS pro podporu rozhodování.
Musíme odpovědět na následující otázky: 1. 2. 3. 4. 5. 6. 7. 8.
Jaký problém budeme řešit? Jak se řeší klasicky, bez použití GIS? Existují alternativní postupy, jak ho řešit pomocí GIS? Z jakých zdrojů a s jakými náklady můžeme získat vstupní údaje pro řešení? Jaké budou výsledné produkty řešení navrhovaným postupem – zprávy, mapy, tabulkové přehledy? Jak často se tyto postupy použijí (jednorázově, opakovaně) a s jakým časovým odstupem? Budou zpracovávané nebo potřebné údaje použitelné i pro jiné účely? Komu budou určeny výstupy – specialistům, laické veřejnosti?
2. Budování databáze
kritická etapa – vysoké nároky na čas a finance nutnost zvážit: dostupné zdroje údajů použitá zařízení pracovní postupy správné navržení struktury a parametrů databáze
2.1 Návrh struktury databáze:
stanovení požadovaných informačních úrovní, vrstev prostorových informací a objektů v nich určení požadovaných atributů pro objekty jednotlivých informačních vrstev definice schémat označení atributů definice souřadnicového systému
Při návrhu databáze se nutné si klást otázky typu: jak implementovat GIS do již používaných systémů a postupů, aby byl co nejlépe začleněn a byl smysluplně využíván jaká data budou mít pro provozovatele systému největší užitek jaká data mohou být a budou sdílena kdo bude zodpovědný za údržbu systému a dat Návrh je časově náročný a nevytváří žádné koncové aplikace, často je opomíjena jeho důležitost. Dobře navrhnutá databáze umožňuje: zvýšenou flexibilitu pořizování dat i analýz možnost používat jednotný návrh pro koncové aplikace minimalizovaná redundance dat možnost systém dále upravovat (hlavně v budoucnosti – rozšiřování funkčnosti systému)
Cíle správného návrhu: Zabezpečit splnění cílů aplikace GIS v organizaci a podpořit její funkčnost Databáze by měla obsáhnout všechny potřebné údaje (neredundantním způsobem) Struktura by měla umožnit užívání dat různým uživatelům Aplikace pro vstup a údržbu dat by měly být odděleny od těch, které je využívají Použití vhodných reprezentací, kódů a uspořádání dat V rámci naplnění databáze – vstup údajů je možné vyčlenit: vstup prostorových dat budování systému topologických vztahů vstup atributových údajů Důležitá je také etapa kontroly údajů a editace chyb v geometrické, topologické i atributové části údajů. Kontrola je nutná po celou dobu trvání projektu.
Základní kroky při návrhu databáze GIS: Modelování uživatelského pohledu
co vlastně je potřeba jaká data budou potřeba jak dlouho bude trvat implementace kolik bude stát
Definice objektů (entit) a jejich vztahů
jaké objekty budou popisovány jaké jsou mezi nimi vztahy co může konkrétní objekt obsahovat (jakých nabývá hodnot), normalizace (relační DB)
Identifikace reprezentace jednotlivých objektů (entit)
jaké geografické objekty budu používat pro reprezentaci reálných objektů z databáze (body, linie, polygony, text, rastry nebo vůbec jenom atributy v DB, …) jestli budou používány objekty pro prostorové analýzy (kvůli topologii)
Přizpůsobení dat konkrétnímu GISu zde je nutné prozkoumat, co který GIS SW poskytuje, jaká jsou jeho omezení (maximální počet bodů, liniových segmentů, ….), jak je možné zvolené objekty přizpůsobit konkrétní aplikaci (v tomto bodě by měl také probíhat výběr konkrétního SW)
Organizace dat do logických (geografických) celků jedná se o tématickou organizaci dat v závislosti na konkrétním GIS SW (mohu použít vrstvový přístup, mohu mít topologii i mezi soubory (mapové listy)…, konkrétní jména souborů, různé překódovací tabulky
Náklady na pořízení a údržbu dat tvoří až 80% všech finančních prostředků.
2.2 Data
Vstup prostorových dat Naplňování databáze je v drtivé většině případu jednoznačně nejnáročnějším a nejzdlouhavějším krokem v rámci GIS projektu. Obecně lze pro vstup použít různé zdroje údajů. V úvahu přicházejí zvláštně mapy, náčrty v souřadném systému, údaje z geodetických měření, statistické údaje a další. Při pořizování dat je ale důležité vybrat vhodný způsob a vhodná technická zařízení, která umožní získat data ve vhodné přesnosti a za přijatelnou cenu. V zásadě je možné zdroje dat rozdělit na: primární sekundární
Primární zdroje
Geodetické měření
zpracování obsahu klasických terénních zápisníků údajů pozemních geodetických měření. zadají se ručně přes klávesnici a převedou do vektorové podoby. Většina GIS systémů má tzv. COGO systém (souřadnicová geometrie) novější systémy umožňují zaznamenávat údaje o měření do digitální podoby rovnou a pak se přenesou do prostorové databáze opět pomocí COGO tento způsob je hlavně používán mapy velkých měřítek (katastrální mapy, technické mapy, plány, …) produkuje vektorová data
Fotogrammetrické zpracování leteckých či pozemních snímků
fotogrammetrie je věda zabývající se rekonstrukcí tvaru, velikost a polohy předmětů zobrazených na fotogrammetrických snímcích. měření se uskutečňuje na fotografii, ne na objektu fotogrammetrie je letecká a pozemní (jedno- a dvojsnímková, analogová či digitální) umožňuje převod objektu z centrální projekce do ortogonální produkuje rastrová data
DPZ – dálkový průzkum Země
data z leteckých a družicových nosičů, objekty mohou být identifikovány z velké vzdálenosti, jelikož vyzařují nebo odráží elektromagnetickou energii (zdroj je hlavně slunce). Spektrální charakteristika pak identifikuje jednotlivé objekty. využití v životní prostředí (sledování ozónové vrstvy, olejových skvrn, stavu napadení lesů škůdci a další), biologie, hydrologie, geologie, využití země a další. data jsou k dispozici v rastrové podobě. Systémy DPZ používají ke snímání dva druhy senzorů: pasivní – zaznamenává vyzářené nebo odražené elektromagnetické vlny (od slunce)
aktivní – používá svůj vlastní zdroj elektromagnetického vlnění, tudíž je možné ho používat jak ve dne, tak v noci. Výhodou aktivních senzorů je také schopnost monitorovat mnohem delší vlnové délky, než pasivní. Výhodou delších vln je schopnost lépe pronikat atmosférou, mraky a dokonce i mělkou vodou. Nevýhodou aktivních systémů je nutnost poskytovat energii senzoru.
Na snímcích DPZ jsou důležité následující parametry: spektrální rozlišení (popsáno počtem a šířkou spektrálních pásem, zaznamenávaných snímačem) příklad šedotónové obrazy mají jen jedno pásmo, barevné jsou lepší a mají 3 (R G B): Například Thematic Mapper (TM) zaznamenává 7 pásem prostorové rozlišení – nejmenší plocha, která je rozlišitelná. TM má 15x15 m v panchromatickém a 30x30 m v multispektrálním módu, SPOT má 2,5x2,5 m v panchromatickém a 10x10 m v multispektrálním módu, QuickBird 0,6x0,6 m v panchromatickém a 2,5x2,5 m v multispektrálním módu. radiometrické rozlišení – kolik různých hodnot (počet rozlišitelných úrovní – citlivost detektoru) mohu dostat v každém spektrálním pásmu (např. TM a SPOT mají 256, MSS má pouze 64) časové rozlišení – což je interval mezi dvěma úspěšnými přelety nad tím samým územím. (zde může hrát roli i počasí). Landsat-5 asi 16 dní, SPOT má asi 26dní (lze i po 2.5 dnech)
Rozlišení družicových dat
http://www.infoterra-global.com/resolutions.htm optické porovnáni kvality snímků jednotlivých družic přímo na jednotné oblasti, včetně s uvedením měřítka, pro jaké jsou data využívána
QuickBird -rozlišení 2,44 – 2,88 m
SPOT- rozlišení 5m (kombinace pásem zelené, červené a infračervené barvy) → dobře vynikají oblasti porostlé zdravou vegetací, které se jeví červenou barvou.
Identifikace ohnisek požáru pomocí DPZ
pravé barvy
nepravé barvy: červená: krátkovlnné infračervené, zelená: blízké infračervené, modré: zelená
Výhody DPZ: V porovnání s leteckými snímky poskytují komplexní obraz rozsáhlého území (tisíce km2) na jednom obrazovém záznamu Pravidelný sběr údajů Možnost rychlého zpracování (obvykle několik hodin po jejich naměření) Opakovatelnost aplikace stejných metod digitální interpretace – je možné snadno sledovat např. změny krajiny
Nevýhody DPZ: Obvykle pro měřítka 1:25 000 a menší (nyní zlepšení) Náročné na SW a HW i školený personál
GPS – globální polohový systém Je vystavěna síť 24 družic, které jsou rozmístěny na orbitální dráze ve výšce 22000 km tak, aby bylo z každého místa na zemi dostupných alespoň 6 satelitů. Každá družice zná svoji přesnou polohu na orbitu, tudíž pozemní přijímač je schopen po zaměření několika (3 pro zem. šířku a výšku, 4 i pro výšku nadmořskou) satelitů rekonstruovat jeho přesnou polohu (z polohy satelitů a vzdálenosti od nich).
Přesnost takového zaměření je 20-50 m, po korekci lze získat přesnost až na 2 m. Po naměření dat pomocí GPS se musí převést do GIS – jednoduché (soubor X,Y a Z souřadnic v textovém tvaru lze snadno importovat). GPS vrací geografické souřadnice nebo WGS 84, tudíž pro použití v ČR je nutné u získaných dat většinou převést data do jiného souřadného systému.
Výhody GPS: levný a rychlý sběr dat (až o 50%), dá se měřit kdykoliv (v noci) a za každého počasí, snadná konverze do GIS systémů, v poslední době jsou GPS systémy vysoce přesné (dosahují přesnosti až cm ) , také ale drahé
Nevýhody: vysoké budovy a stromy (v lese) blokují signály satelitů, relativně složitá konfigurace systému (pořízení, zaškolení klasickým měřičů, …), špatně se měří nedostupné objekty
Letecké laserové skenování technologie umožňující sběr digitálního modelu reliéfu a modelu terénu a to zvláště v zalesněných oblastech vhodný pro tvorbu 3D modelu města, analýzu vegetačního pokryvu, sledování nadzemních vedení vektorová data ve 3D
Sekundární zdroje již jednou zpracované primární zdroje jsou v nich obsaženy chyby získané již během prvního zpracování dat, tudíž nemohou být přesnější než zpracovávané primární zdroje
Manuálně přes klávesnici
prakticky nepřichází v úvahu, velice pracné (nutné zadávat souřadnice, …)
Manuální digitalizace
přímo nad obrazovkou – dnes velmi rozšířené digitalizace se provádí pomocí tablet-digitizér (je to zařízení na snímání souřadnic s různě velkou pracovní plochou (obvykle A3-A0) a různou rozlišovací schopností a přesností (maximální přesnost jsou řádově setiny milimetru)).
Princip digitalizace:
snímaný podklad se upevní na pracovní plochu a pomocí zaměřovacího kříže(kurzoru) je snímána poloha zaměřovaných bodů a z klávesnice nebo pomocí kurzoru se zadává identifikátor objektu.
Existují dvě základní metody digitalizace:
bodová (point) - kliká se na každém vrcholu, který je třeba zaznamenat – je to nejčastější způsob použití proudová (stream) - počítač automaticky zaznamenává sekvence bodů po časovém nebo vzdálenostním intervalu
Konkrétní postup digitalizace: 1. definování oblasti – definování minimálních a maximálních hodnot souřadnic
2. 3. 4.
registrace mapy - zadání nejméně 4 kontrolních (vlícovacích) bodů vlastní digitalizace mapy, editace chyb - nespojení čar, nedotahy a přetahy, vícenásobné zaznamenání - souvisí s topologickým čištěním.
Výhody ruční digitalizace: malé finanční nároky; digitizéry jsou relativně levné, pracovní síla je také levná flexibilita a adaptibilita na různé zdroje dat technika je snadno zvládnutelná v krátkém čase – lze se snadno naučit kvalita výstupů je víceméně vysoká digitizéry jsou velice spolehlivé a přesné snadné úpravy digitalizovaných dat Nevýhody: přesnost je limitována stabilitou vstupního média digitalizace je únavná a nudná, tudíž velice náchylná k operátorovým chybám
Scanování
převod dat z analogové do digitální (rastrové) formy Existují tři různé typy scannerů: Bubnové – nejpřesnější (přes 1000 DPI), ale nejdražší. Princip spočívá v rychlé rotaci bubnu, na kterém je připevněn snímaný dokument a paralelně pohybujícím se senzoru. Nevýhodou - dlouhá doba snímání, výhodou - vysoká přesnost a možnost vytvářet barevné separáty. Deskové – nejběžnější, ale mají malou snímatelnou plochu (asi tak do A2A3). Princip spočívá v položení dokumentu na skleněnou desku za kterou se pohybuje světlo a senzor. Jsou také velice přesné (běžně přes 600 DPI). Nevýhoda - maximální velikost snímaného dokumentu je pouze A3 Posuvné velkoformátové skenery - nejpoužívanější typ pro GIS. Jeho princip spočívá v posouvání dokumentu přes snímací kameru. V tomto případě se pohybuje pouze dokument, přesnost tedy závisí také na schopnosti posuvu dokumentu konstantní rychlostí. Nevýhodou - relativně menší přesnost snímaní (kolem 400 dpi)
Nejdůležitějšími hodnotícími ukazateli scannerů jsou: rozlišení (dpi), přesnost (obvykle v % … +-0,04%) barevnost či šedotónovost Vhodná rozlišení pro jednotlivé typy dat při digitalizaci pomocí scanneru:
Konkrétní postup při skenování: Výběr rozlišení – to je docela důležité rozhodnutí, jelikož platí, že dvakrát větší rozlišení vede ke čtyřnásobné velikosti výsledného souboru. Výběr přesnosti (zkreslení +-0,04%) a také přesnosti vstupních dokumentů (nikdy nelze dostat přesnější výstup než vstup, vždy je to naopak). V této části je také nutné uvažovat zkreslení vstupních dokumentů (papír se roztahuje a smršťuje – je lepší skenovat z nějakých bezesrážkových materiálů). Vyhodnocení nároků na rozlišení a přesnosti vede k výběru konkrétního scanneru. Příprava mapy ke skenování – očištění od mechanických nečistot, identifikace vlícovacích bodů, případně úpravy nečitelných částí.
Vlastní skenování.
Další postupy zpracování:
Registrace (transformace rastru) pomocí vlícovacích bodů. Volitelně úprava obrazu (jas, kontrast, prahování, ekvalizace histogramu). Volitelně čištění rastrového podkladu. Volitelně vektorizace.
Vstup atributových dat Manuální zadávání dat pomocí klávesnice (nejběžnější způsob) atributy se pak navazují na prostorovou část pomocí primárního klíče Nevýhody: problém kontroly správnosti zadaných údajů. Mohou se používat dvě základní metody kontroly: Single Key Data Entry – jeden operátor zadává atributová data a druhý operátor již zadaná data kontroluje (porovnává originál s vytištěnými výpisy, …). Tato metoda se používá při limitovaném čase a financích a je vhodná spíše pro menší projekty. Double Key Data Entry – atributová data jsou zadávána dvěma na sobě nezávislými operátory (každý zadává stejná data) a poté se obě varianty v počítači porovnají. Při nalezení rozdílných hodnot se zadaný atribut překontroluje a opraví. Tato metoda se používá spíše na větší projekty, u kterých velice záleží na správnosti zadaných údajů.
Scanování scanování textu s využitím OCR (Optical Character Recognition – nástroje na rozpoznávání písma) pro automatiovaný převod dat Nevýhody: nelze převést všechna data nutná pečlivá kontrola (podobně jako u manuálního zadání pomocí metody Single Key Data Entry). nutnost ručního navazování atributů na prostorovou část, podobně jako u ručního zadávání dat
Konverze dat z jiných digitálních zdrojů
načítání atributových údajů z jiných, již digitálních zdrojů a jejich následná konverze z jiných systémů/formátů.
důležité faktory:
Formát souboru - mám možnost ho použít/importovat, případně existuje konverzní program
Přenosové médium – na čem budu data přenášet ? (CDROM, disketa, DAT pásek) Tohle kritérium je důležité hlavně v případě přenosu dat velkých objemů (letecké snímky, …) Tématický obsah dat – jsou v datech obsaženy všechny prvky co potřebuji ? Měřítko a přesnost – jsou data v požadovaném měřítku a přesnosti ? Časový interval pořízení – kdy byla data pořízena a k jakému časovému intervalu se vztahují ? Souřadnicový systém – v jakém byla data pořizována? Mohu takový souřadný systém využít (případně mohu provést transformaci souřadného systému)?
Problematika kompatibility datový modelu. Cena
Metadata jsou to data o datech, tzn. informace, co popisovaná data obsahují. Tyto informace jsou zvláště důležité, pokud je zpracováváno několik druhů dat. Pomáhají pak lépe organizovat a udržovat přehled na daty. Problematika tvorby metadat je úzce spjata s tvorbou digitálních dat a jejich převody. V metadatech by měla být obsaženy následující informace: Co je obsahem dat (tématická složka). Rozlišení (prostorové (jaké území zabírají), popisné (popis možných hodnot atributů a jejich význam) a časové (jakou dobu zahrnují – kdy byly aktuální)). Formát dat (typ souboru, předávací médium). Datum pořízení dat (případně aktualizace). Kontakt na pořizovatele a správce.
2.3 Kontrola údajů a odstraňování chyb Možné chyby při zadávání: Nekompletnost dat – schází body, linie, polygony. Chybné umístění prostorových dat – chyby vycházející ze špatné kvality vstupních dat nebo z nedostatečné přesnosti při digitalizování.
Zkreslení prostorových dat – chyby z nepřesností vstupních dat (deformace podkladových dat, zkreslení již existující analogové kresby).
Špatná vazba mezi prostorovými daty a atributy. Atributy jsou chybné nebo nejsou kompletní – velice častá chyba zvláště pokud jsou atributy pořizovány z různých zdrojů v různých časech..
Identifikace chyb je velice obtížná. Kontrola dat: visuálně topologického čištění při vytváření topologie
Nejčastější chyby odhalené při vytváření topologie: Neidentické hranice - když jsou dvě hranice digitalizovány z různých zdrojů, ačkoli představují jednu a tu samou hranici. V takovém případě jsou linie, představující tutéž hranici, neidentické (nepřerývají se).
Nedotahy a přetahy uzly dvou sousedících prvků se nespojují Duplikátní linie (hlavně v CAD, ale i u některých GIS, které z toho vyrobí regulární polygon) reprezentující stejný objekt. Pokud se používá pro reprezentaci polygonů metoda hranic a centroidů, tak i
přiřazení více centroidů jednomu polygonu. Většina systémů obsahuje funkce, které umožní automaticky vyřešit některé z těchto uvedených chyb.
3. Restrukturalizace údajů Uchování dat Data se obvykle před uchováním rozdělují na mapové listy:
pravidelné
nepravidelné
bezešvé
(seamless)
Zpracování dat
Geometrické transformace Změna mapové projekce – programy obsahují velice často matematické modely mnoha souřadnicových systémů a zobrazení, takže je lze převádět z jednoho do druhého poměrně dobře (obvykle přes geografické souřadnice (šířka/výška), občas jsou implementované i převody mezi konkrétními souřadnými systémy. Implementace souřadného systému S-JTSK však není příliš častá.
Transformace souřadného systému mezi rovinnými pravoúhlými souřadnicemi – jsou založeny na poznání přesné polohy vybraných bodů. Lineární konformní transformace vhodná pro transformace mezi souřadnými systémy, které jsou navzájem posunuty, pootočeny a ve směrech obou souřadnicových os mají ve stejném poměru změněno měřítko.
Afinní transformace jednotlivé souřadnice nejsou na sobě závislé (výhodné když není změna měřítka ve všech směrech stejná). Používá se při registraci mapy při ruční digitalizaci.
Polynomické transformace (druhého a vyšších řádů) – založeny na znalosti identických bodů. Používají se pro deformace lokálního charakteru a komplikovanějšího průběhu deformace.
Specializované transformace Rubber sheeting (Používá lineární transformaci po částech) - transformace objektů v jednom rohu neovlivňuje objekty jinde. Metoda je využívána při procesu napasování zdeformovaných mapových listů na sebe.
Edge matching (napasování okrajů map) – zabezpečuje spojení do souvislé mapy a zároveň i propojení objektů pokračujících z jedné oblasti do druhé. Odstraní deformace na okrajích mapových listů.
Interaktivní editace prvků – obvykle standardní nástroje CAD jako kopírování, posuny, rotace, mazání, spojování a rozpojování segmentů. Lze použít jak pro vektorová, tak i pro rastrová data.
Weeding (snižování počtu vrcholů) – nástroj vycházející z generalizace a používaný digitalizaci a vektorizaci. Odstraňuje nadbytečný počet vrcholů z linie. Pouze pro vektorová data.
Densification (zhušťování) – umělé vkládání dalších bodů na linii. Pouze pro vektorová data.
Proložení bodů křivkou – použití po digitalizaci a vektorizaci vrstevnic. Proložení křivkou dodá vrstevnicím přirozený vzhled. Nezachovává však 100% tvar křivky. Pouze pro vektorová data.
Zpracování obrazu využívá se u rastrových dat (DPZ). Některé z funkcí:
filtrace (hledání hran, vyhlazování, ostření), úpravy histogramu (roztahování), prahování, změna jasu/kontrastu, odstraňování nečistot, mozaikování, klasifikace převzorkování (nejbližší soused, bilineární, bikubické)
Převody mezi reprezentacemi
Rasterizace překryv vektorové vrstvy na rastrovou mřížku a přiřazení hodnoty z vybraného atributu do této buňky nejdůležitější určit správnou velikost buňky výsledného rastru Metody převodu Metoda dominantního typu Metoda nejdůležitějšího typu Centroidová metoda
Metoda dominantního typu vychází z principu, že u buňky, do které zasahuje více objektů, se vyjádří podíl její plochy, zabíraný každým z objektů a hodnota objektu s největším podílem je pak buňce přiřazena (u bodů a linií se podíl plochy často nahrazuje počtem objektů, které buňka obsahuje).
Metoda nejdůležitějšího typu – buňce přiřadí se hodnota považovaná za nejdůležitější z hlediska aplikace.
Centroidová metoda – buňka má přiřazenou hodnotu definovanou polohou jejího středu při průmětu do vektorové reprezentace.
Vektorizace je poněkud složitější (je nutné rekonstruovat jednotlivé vektorové objekty z jejich spojité rastrové podoby) Metody převodu: Ruční – vše dělá operátor. Vhodný pro staré podklady nebo velice řídké podklady, kde operátor musí velice často rozhodovat, co k čemu patří. Poloautomatická - operátor zvolí počátek rastrové linie, systém se pokusí identifikovat rastrový objekt. Pokud narazí na nějakou překážku (mezera, křižovatka) či sporný bod, zastaví se a čeká na operátorovu odezvu. • snaží se přichytávat na střed rastru (používaný pro vektorizaci linií) • snaží se přichytávat na okraj rastru (používaný pro vektorizaci polygonů)
Automatická Algoritmy automatické vektorizace vycházejí z algoritmů zpracování digitalizovaného obrazu a uměle inteligence. Tuto metodu však většinou nelze použít pro převod běžných analogových podkladů, ale pouze pro již tištěné mapy z digitálních podkladů (podobně jako OCR). Princip: Body – zpracovávací program vyhledá střed buňky reprezentující bod a zjistí jeho souřadnice a zaznamená je spolu s identifikátorem bodu v rastru (obvykle barva, či nějaká skalární hodnota). Linie – automatická vektorizace linií funguje na principu hledání skeletonu (skeletizace) objektů, což je metoda velice často používaná pro ztenčování objektů. Po nalezení skeletu jsou pak pouze vyhledány na sebe napojené pixely (v rámci 4 nebo 8 okolí) a ty tvoří požadovanou linii.
Polygony – podobně jako u poloautomatické vektorizace jsou hledány hrany objektů a ty pak převáděny do linií. Poté se ze všech uzavřených liniových objektů vytvoří polygony.
Po vlastní vektorizaci často následuje proces, který odstraní nadbytečné informace získané při vlastním procesu vektorizace (nadbytečné body). Může to být odstranění nadbytečného počtu vrcholů nebo i jiná generalizační technika.
Interpolace slouží k získání informací i na jiných místech, než na kterých byla konkrétně měřená data lze využít u dat o nadmořské výšce, demografii, zásaditosti půdy, koncentraci škodlivin, která byla získána z nepravidelných intervalů v prostoru, avšak tvoří spojitá data. Metody: Metoda vážené inverzní vzdálenosti (IDW) – určuje hodnotu v dané buňce pomocí lineárně vážené kombinace množiny vstupních bodů, kde váha je funkce inverzní vzdálenosti (čím dále je konkrétní bod od zjišťované buňky, tím menší má na její hodnotu vliv) Metoda Trendu – používá polynomické regrese k proložení metody nejmenších čtverců celým povrchem. Na hodnotu buňky mají vliv i úplně vzdálené vstupní body.
Ukázka interpolace nad stejnými naměřenými hodnotami Metoda trendu
Metoda vážené inverzní vzdálenosti
Ostatní převody mezi reprezentacemi: TIN - Triangulated Irregular Network
používají se hlavně pro tvorbu digitálního modelu terénu reprezentuje povrch jako soubor trojúhelníků, které jsou definovány třemi body umístěnými kdekoliv v prostoru pro tyto trojúhelníky se uchovávají topologické vztahy
Vlastní proces vytvoření sítě se nazývá triangulace.
převody mezi trojúhelníkovou sítí a vektorovou či rastrovou datovou strukturu.
Vektor -> TIN – triangulace – využívá principy geometrické triangulace s určitými specifiky.
Vektor -> rastr – interpolace (speciální případ interpolace, který respektuje specifika DMT)
TIN -> rastr – speciální případ interpolace DMT
Tvorba topologicky čistých dat Pro tvorbu topologicky čistých dat se používají první dva topologické koncepty: konektivita – dvě linie se na sebe napojují v uzlech definice plochy – linie které uzavírají nějakou plochu definují polygon Jaké úlohy obnáší tvorba topologicky čistých dat ?
Eliminace duplikátních linií (stejných i podobných) Odstraňování nedotahů a přetahů Nalezení průsečíků dvou nebo více liniových prvků s následující segmentací. Odstranění mezer (souvisí s nedotahy). U reprezentací používajících pro reprezentaci polygonů metoda hranic a centroidů odstranění nadbytečných centroidů.
Princip odstranění přetahů
Princip odstranění nedotahů
Generalizace proces zjednodušování reprezentace detailů objektů s ohledem na měřítko anebo na účel map Proč vůbec je generalizace v GIS potřebná ? Ekonomické požadavky (kompromis přesnost/cena) Požadavky redukce objemu dat (čím více dat, tím je větší možnost výskytu chyb) Víceúčelovost požadavků pro údaje (z jedné digitální reprezentace dat je nutné vytvářet mapy s různými informacemi i v různých měřítkách) Požadavky zobrazování dat (vychází z kartografických doporučení některých limitů, při jejichž překročení se mapy stávají nečitelnými)
Generalizační metody Selekce (výběr prvků)
Eliminace (eliminace prvků)
Zjednodušení (zjednodušení prvků)
Agregace (kombinování malých prvků do větších celků)
Prostorová redukce (collapse) redukce dimenze prvku nebo jeho prostorového rozměru (řeky poly-linie)
Typifikace redukce hustoty prvků
Exaggerace (přehnání, zvýraznění) opak collapse – prostorové zvýraznění (zvětšení) prvku (důležitost)
Reklasifikace a spojení
Zjemnění (úprava vzhledu objektu ke zvýšení estetičnosti (vyhlazení linie …)
Generalizace je velmi složitá, nelze ji automatizovat GIS obsahují jen velice omezené nástroje pro generalizaci.
Obvyklé generalizační funkce GIS Redukce počtu vrcholů v liniovém prvku - zjednodušování Eliminace - eliminace všech objektů menších než x Výběr prvků (podle atributů, podle typu objektu) - selekce - spíše analytická úloha Posunutí prvku Reklasifikace a spojení - spíše analytická úloha Zjemnění linií
Výhody a nevýhody generalizace Výhody: zmenšení objemu dat dobrá rozlišitelnost prvků v malém měřítku Nevýhody: snižuje se polohová přesnost snížením polohové přesnosti se může snížit i atributová přesnost
4. Provedení analýz a syntéz Analytické možnosti GIS tvoří jádro systému GIS. Mezi otázky, na které nám GIS umožňuje patří: co se nachází na ? kde se nachází ? jaký je počet ? – statistické otázky co se změnilo od ? co je příčinou ? (kůrovec a lesy, rakovina a ovzduší, …) co když ? – modelování (co když se vybourá kamion s naftou a ta vyteče, co když bude pršet – povodeň)
Analytické možnosti GIS můžeme rozdělit do následujících skupin:
Měřící funkce Geografické dotazy a nástroje na prohledávání databáze Topologické překrytí Mapová algebra Vzdálenostní analýzy Analýzy sítí Analýzy modelu terénu Statistické analýzy Analýzy obrazů
Měřící funkce Systémy poskytují funkce na měření vzdáleností a ploch. Při měření je třeba dát pozor jen zobrazení: konformní (nezobrazují úhly) ekvivalentní – zachovává plošné obsahy ekvidistantní – nezkresluje čáry kompenzační – vše zkresluje, ale stejně
používání různých měřících jednotek (stopy, cm, …), případně automaticky prováděné převody mezi nimi. při projektech v malém měřítku má ne měření vliv také již zakřivení zemského povrchu, takže v poslední době umožňují GIS produkty započítat i křivost zeměkoule
Geografické dotazy a nástroje na prohledávání databáze Dotazování se vybírají údaje, které odpovídají specifickému kritériu nebo podmínce. Dotazovací operace má obvykle tři hlavní komponenty: Specifikace údajů, kterých se týká Formulace podmínek, kterým musí údaje vyhovovat Instrukci, co se má na vybraných údajích vykonat Obecná struktura dotazu: vyber z údajů typu T ty, které vyhovují podmínce P a vykonej na nich operaci O.
Dotazy můžeme v GIS dále rozdělit na: Atributové – dotaz typu: “které geografické objekty(lokality) mají definovanou vlastnost” Prostorové – dotaz typu: “co se nachází na tomto místě, co se nachází v této oblasti” Kombinované – dotaz typu: “které objekty splňují definovanou vlastnost a zároveň se nachází v nějaké oblasti“
Atributové dotazy identifikace jednotlivého objektu na základě jeho jména, označení či jiného atributu vyhledání všech objektů splňující intervalové a logické podmínky jednoho nebo více atributů. Pro vyhledávání intervalových podmínek je možné použít operátorů: <,>,=,<=,>=,<>. Intervalové podmínky jdou kombinovat pomocí logických operátorů (AND, OR, NOT) využívajících pravidel Booleovské logiky. Rozdíly vektorové a rastrové reprezentace: U vektorové reprezentace se zpracovávají údaje atributových tabulek připojených k jednotlivým vektorovým objektům. U rastrové se zpravidla zpracovávají údaje uložené v buňkách jednotlivých vrstev (není to ale podmínka, i u rastrových reprezentací je možné mít připojené atributové tabulky).
Prostorové dotazy identifikace geografického objektu na základě jeho souřadnic. A to buď ručně (zadáním souřadnic) nebo interaktivně (ukázáním na objekt myší), příklad dotaz na prvkem pomocí ikony „Identifikovat“.
prohledávání prostoru různých geometrických tvarů (obdélníky, kružnice, polygony, linie), příklad vyhledání okresů procházejících danou linií - řekou.
Rozdíly rastrové a vektorové reprezentace u vektorů se vyhledávají celé objekty u rastrů se identifikují konkrétní buňky
Kombinované dotazy umožňujíc práci i s více vrstvami (či množinami objektů), lze tvořit dotazy pomocí Booleovské logiky používají zčásti topologické překrývání vrstev Příklad: Vyhledejte sídla, která se nacházejí ve vzdálenosti 2 km od bažin v okrese Česká Lípa. Nejdříve musela být provedena analýza které, bažiny jsou zcela uvnitř v okrese Česká Lípa, a poté analýza, která města jsou vzdálena 2 km od nich.
Topologické překrytí dotazování dvou nebo více informačních vrstev se označuje jako topologické překrytí (overlay) těchto vrstev. Klasické řešení: překrytí dvou tématických map na průhledných fóliích. Řešení v GIS: pomocí základních algoritmů počítačové grafiky (test bodu v polygonu, hledání průsečíku dvou objektů, ořezávání). Výsledkem postupu je identifikace nových objektů, které mají kombinace vlastností objektů ze zdrojových informačních vrstev. pro kombinaci vstupních objektů se opět používají pravidla Booleovské logiky
UNION sjednocení
IDENTITY přiřazení na základě prostorového umístění
INTERSECT průnik
Při těchto operacích dochází k řešení vztahů bod, linie nebo polygon v polygonu (výjimkou je union, kdy mohu provádět pouze sjednocení polygon-polygon). Z procesu topologického překrytí vznikají nové objekty (vrstvy), kterým jsou přiřazeny také atributy. Tím se topologické překrytí liší od prostorových dotazů. Vstupní vrstva: body, linie, polygony, Druhá vrstva (ta co provádí union, intersect nebo identity) musí být polygonová Speciálním případem topologických operací jsou: CLIP a ERASE, UPDATE a SPLIT, které mají tu vlastnost, že atributy nejsou spojovány, ale přejímány ze vstupní vrstvy (jedna vrstva je vždy vstupní a druhá na ní provádí výše uvedené operace). Tyto funkce je možné zařadit i do kategorie restrukturalizace dat.
vyjme tu část vstupní vrstvy, která bude aktualizovaná druhou vrstvou a místo ní vloží prvky z druhé vrstvy ořízne vstupní vrstvu pomocí definovaných polygonů v druhé vrstvě. rozdělí vstupní vrstvu na části pomocí hranic definovaných polygony ve druhé vrstvě. opak CLIP odstraní části vstupní vrstvy pomocí polygonů definovaných v druhé vrstvě.
Mapová algebra U rastrových reprezentací se spíše než topologické překrytí používá nástroj zvaný mapová algebra. umožňuje kombinovat rastrové vrstvy pomocí různých matematických operací matematické operace se vykonávají buď na jedné nebo na dvou (i více) vrstvách a jejich výstupem je vždy nová vrstva
Mapová algebra používá objekty, činnosti a kvalifikátory činnosti. Objekty: slouží k uložení informací, nebo jsou to vstupní hodnoty. Jako objekty se používají rastry, tabulky, konstanty, … Činnosti: to jsou příkazy jazyka (operátory a funkce) – vykonávají operace na objektech Operátory - obvyklé matematické operátory (+-, relační <>, mod, div,)
Funkce – se dělí na: Lokální – na individuální buňce - nová hodnota z individuální buňky 1 nebo více vrstev Fokální – v definovaném okolí - nová hodnota z definovaného okolí buňky Zonální – na specifické oblasti - nová hodnota ze zóny definované v jiné vrstvě Globální – všechny buňky informační vrstvy (např. analýzy povrchů)
Kvalifikátory: řídí, jak a kde se vykonává činnost (pomocné konstrukce jazyka, podmínky, cykly, …)
Příklad lokální matematické operace Lokální funkce se obvykle dělí na matematické, trigonometrické, exponenciální, logaritmické, reklasifikační, selekční a statistické.
Fokální funkce Fokální funkce se dělí na statistické funkce a na analýzy proudění. provádějí se na okolí 3x3 sousedních buněk, možno definovat sousedské okolí podle uživatele (kružnice, čtverec, …). Statistické funkce: př. stanovení aritmetického průměru v okolí, sumy, odchylky, min, max, rozpětí, atd.. Analýzy proudění: př.výpočet směru proudění, rychlosti proudění, atd. Analýzy proudění jsou základem dalších, pokročilých analýz, jako jsou hydrologické analýzy, modelování eroze.
Zonální funkce rozdělení na statistické a geometrické. U statistických funkcí jde o statistické zpracování hodnot analyzované informační vrstvy, které patří do zóny definované v druhé informační vrstvě. Statistické funkce mohou být opět průměry, sumy, min, max, atd. Mezi geometrické funkce patří např. stanovení plochy, obvodu a dalších charakteristik každé zóny.
Vzdálenostní analýzy
Obalové zóny Proximy analysis Vážená vzdálenost (weighted distance)
spolupracuje s mapovou algebrou, velice složitý nástroj nejpoužívanějším nástrojem vzdálenostních analýz je tvorba obálky (bufferu), což spočívá ve vektorové reprezentaci ve vytvoření polygonů v určené vzdálenosti kolem bodů, linií a polygonů. vytvořené polygony jsou uloženy jako standardní vrstva s definovanou topologií, tudíž je možné je používat v analýzách topologického překrytí.
Obalové zóny
U rastrové reprezentace je tvorba bufferu opět jen otázka metriky. Všechny buňky, které jsou od daného objektu menší vzdálenost než definovaná budou označeny. Velice často se ale v rastrové datové struktuře analýza okolí dělá tak, že se spočítá vzdálenost každé buňky od požadovaného objektu a ta vzdálenost se uloží do nové vrstvy, kterou je samozřejmě možné dále reklasifikovat (např. buňky s hodnotou menší než 3km - hodnota 1, jinak hodnota NO_DATA). Tato analýza se často nazývá nalezeni vzdálenosti (Find Distance).
Proximy analysis: vytváří “individuální plochy” kolem každého ze vstupních bodů, které definují příslušnost dané lokality k nejbližším z objektů. Pro vlastní výpočet se používá metody Thiessenových polygonů nebo Voronoi diagramy, což jsou duální funkce k triangulaci. Území a nejbližší nádraží Funkci proximity analysis je možné provádět jak v rastrové, tak ve vektorové podobě
Vážená vzdálenost (weighted distance) vychází z analýzy okolí u rastrové reprezentace (každá buňka má přiřazenou vzdálenost od požadovaného objektu) neuvažují se vlivy okolí, vše je měřeno vzdušnou čarou za ideálních podmínek okolní faktory (cesta do kopce, směr větru) jsou zahrnuty vpomocí dalších dodatkových faktorů faktor terénního reliéfu faktor vertikální (stupňovitý). Bere v úvahu vliv gradientu. horizontální faktor (je založen na definování směrů převládajících vzdušných nebo vodních proudů)
Oblasti použití: modelování šíření ohně nalezení nejlepší lokality pro výstavbu v heterogenní oblasti, kde náklady na stavbu rostou tak jak jsou vzdáleny od cesty nalezení nejvhodnějšího koridoru pro stavbu dálnice. nalezení nejoptimálnější trasy pro překonání divočiny autem modelování povodňové vlny modelování vlivu zplodin na životní prostředí
Vstupní vrstvy: DMT, využití země a podloží. Z uvedených vrstev je vypočten povrch nákladů a z něj pak pomocí metody vážené vzdálenosti vlastní váženou vzdálenost od počátku silnice.
Povrch nákladů
Povrch vážené vzdálenosti
Z vážené vzdálenosti je pak pomocí analýzy nalezení nejlevnější cesty zjištěna nejlevnější koridor z počátku do určeného cíle .
Analýzy sítí hledání nejkratší vzdálenosti ve vektorové reprezentaci (linii) linie musí být topologicky provázané (musí být splněna konektivita a znalost směru linie) musí být stanovena pravidla, jak je možné se pohybovat mezi jednotlivými uzly (např. pokud obsahují informace o uliční síť, na některých křižovatkách není povoleno odbočení doleva, ulice mohou být jednosměrné, uzavřené). Pravidla jsou obvykle uložena v atributových tabulkách. Přiřazení dalších atributů pro výstupy z analýz - udání směru – přidání jmen ulic, významných bodů, názvy křižovatek, …
Vlastní analýzy: Hledání konektivy – hledání všech propojených prvků k danému uzlu či od daného uzlu. př. nalezení všech vedení a odběratelů postižených vyhořeným transformátorem
Modelování zatížení sítě – analýza transportu vody/splavenin ve vodních tocích, pohyb plynu v potrubích (na základě objemu, průřezu, sklonu, tlaku). př. Analýza, o kolik se sníží tlak v plynovém potrubí původním odběratelům připojením nového odběratele k potrubí. př. Navržení nouzového propojení přes jiný transformátor v případě poruchy. Nové propojení musí být dimenzováno podle odběratelů.
Hledání optimální trasy – jde o vyhledání optimální trasy mezi dvěma nebo více body (ve stanoveném pořadí nebo bez) na základě ceny cesty (vzdálenost, čas, …). Analýza umí produkovat i pokyny o cestě pro řidiče
Hledání optimální trasy rozvozu zboží
Hledání cesty do nejbližšího zařízení –vyhledání optimální trasy do nejbližšího zařízení. př. Jak se nejrychleji dostat k nehodě sanitkou a nalezení optimální cesty od nehody do nejbližšího zařízení (nemocnice).
Alokace zdrojů - vyhledání všech lokalit, které jsou od definovaného centra vzdáleny nějakou cenu cesty. př. vzdálenost do 30 minut (5 km) od vyhlášené restaurace.
Analýza podobná vytváření bufferů, ale bere v úvahy cenu cesty definovanou pomocí sítě (není to jen vzdálenost vzdušnou čarou). Výsledkem této analýzy jsou tzv. izochrony, což jsou čáry spojující body se stejným časem k dosažení výchozího bodu.
Analýzy povrchů (modelů terénu)
Sklonitost, směr sklonu - u gridového modelu je výstupem nová rastrová vrstva, u TIN jsou tato data k dispozici v podstatě implicitně Údaje analýzy sklonu a směru sklonu jsou poměrně důležité jako vstup pro další analýzy jako je vážená vzdálenost, analýzy eroze.
Morfologické analýzy - nalezení lokálních minim a maxim, konvexnosti a konkávnosti. Výstupem analýzy je bodová vrstva obsahující výše uvedené prvky.
Analýza osvětlení terénu -
Umožňuje počítat množství dopadajícího světla na danou lokalitu. Její použití je vhodné např. pro analýzy vyhledávání nejlepší lokality pro pěstování vína.
Tvorba vrstevnic (izočar) - jedná se o převod mezi reprezentacemi (DMT na vektorové linie).
Generování profilů - pomocí DMT je možné počítat profily liniových prvků
Analýza profilu DMT
Výsledný graf
Počítání objemů DMT- Cut and Fill analýza (změny objemu mezi dvěma DMT), analýzy reálné plochy povrchu, reálné délky na povrchu (reálná vzdálenost na DMT), kde výsledkem je reálná plocha/délka na DMT a ne planimetrická ze 2D.
Analýzy viditelnosti (line, point) - umí odpovědět na následující otázky: které oblasti je možné a nemožné vidět z rozhledny na určitém kopci jak často je vidět dané místo z dálnice (vyhledání nejvhodnější lokality pro reklamu) kolik je nutné postavit rozhleden a kde, aby bylo viditelné celé definované území studie nalezení vhodné lokality pro komunikační buňku (u mobilních telefonů)
Analýza viditelnosti
Speciální analýzy nad digitálním modelem terénu – jedná se o matematické modely využívající DMT jako jsou atmosférické a hydrologické analýzy.
Pohled na DMT z jakéhokoli místa v 3D prostoru, včetně vizualizace rastrových dat na něj položených (Image Drape). Tato analýza ale spíše patří do oblasti vizualizace GIS dat.
Analýzy 3D dat specializované analytické nástroje (např. Intergraph Voxel Analyst), které umí pracovat v opravdovém 3D prostoru. Jedná se obvykle o analogii rastrových analýz, ale ve 3D prostoru, což činní tyto prostředky velice náročné na výpočetní výkon. zobrazení geologických dat nebo šíření znečištěných látek v podzemních vodách
Statistické analýzy výsledky lze prezentovat i pomocí nejrůznějších ukazatelů a čísel Analýzy: klasické statistické metody (suma, medián, min, max, standardní odchylka, a další metody) grafy, kartodiagramy, kartogramy a histogramy regresní analýzy- snaží se nalézt souvislost mezi jednotlivými prostorovými jevy. Zjišťuje, mezi kterými jevy je největší závislost, což umožní provádět odhady míst, která jsou náchylná. přímé napojení na statistické programy (př. Statistica a MS Excel), kde je zpracovávaná data možné dále analyzovat
Analýzy obrazů Hlavní analýzy v DPZ Analýzy: Filtrace, konvoluce, roztažení histogramu – nástroje pro zvýraznění nejrůznějších charakteristik v obrazu. Mohou být úspěšně použity i ve statistických analýzách rastrů. Vyrovnání jasu/kontrastu mezi snímky, mozaikování a další – nástroje pro vyrovnání přechodů mezi jednotlivými snímky Metody klasifikace obrazů (základní prvek multispektrálních analýz obrazu, řízena či neřízená klasifikace) – jsou to statistické metody a metody umělé inteligence, které umožňují identifikovat na zpracovávaném snímku homogenní oblasti.
5. Vizualizace a tvorba výstupů Slouží k převodu dat z digitální formy (databáze GIS) zpět do analogové, člověku čitelné, formy (mapy, grafy, tabulky, zprávy). Nástroje pro automatizovanou tvorbu map: tvorba tématických map (tvorba výkresů) tvorba kartogramů (př. nezaměstnanost v ČR), diagramů (věkové složení v okresech ČR vyjádřené pomocí grafů) užívaní statistických metod pro zpracování hodnot atributových vlastností grafických objektů a jejich využití při grafické reprezentaci daného objektu automatické generování legendy automatické generování měřítka, směrové růžice, rámu, zeměpisné/kilometrové sítě prostředky pro automatizaci tvorby symbolů a popisu.
Vlastní vizualizace: interaktivní vizualizace (monitory) neinteraktivní vizualizace (plottery/tiskárny) Neinteraktivní vizualizace Tiskárny formát A4-A3 laserové (rozlišení 1200 dpi)/ inkoustové(rozlišení 2400 x 1200 dpi) barevné / černobílé
Plottery tisk výstupů na velké formáty (A2-A0, omezení jen šířkou, délka libovolná) typy plotterů: – pérové (výstup tvořen pomocí několika per o různých barvách, které jsou posouvány; určeny pro vektorové kresby; již se nepoužívají) – inkoustové (je zde tisková hlava, kde probíhá míchání barev; určeny pro vektor i rastr, pracuje na principu velkoformátové tiskárny)
Interaktivní vizualizace
Desktop Mapping produkty (např. ArcView, ArcGIS, Geomedia)– lze zobrazit pouze informace, které jsou potřebné, ostatní se nezobrazují
uložení do souboru s grafickým formátem (bmp, gif, jpg, tiff,..)
publikace GIS dat na internetu – stejný princi jako u WWW stránek, jen je nutné nainstalovat aplikační server, který vhodným způsobem komunikuje s Internetovským klientem
Pro práci s daty na internetu je vhodné zabezpečit:
odpovídající grafický výkon počítače rychlou síť jednoduchost uživatelského rozhraní