2 TARTALOM 2.
A valós világ modellezése ..............................................................................................................2-2 2.1 Fedvényekre bontás...............................................................................................................2-3 2.2 Szegmentálás..........................................................................................................................2-4 2.3 Vektoros modellek.................................................................................................................2-4 2.3.1 Spagetti modell ..............................................................................................................2-5 2.3.2 Topológiai modell..........................................................................................................2-6 2.4 Raszteres modellek................................................................................................................2-8 2.4.1 Négyesfa .......................................................................................................................2-10 2.5 Domborzatmodellek.............................................................................................................2-11 2.6 Ellenőrző kérdések .............................................................................................................. 2-13
Márkus Béla: A valós világ modellezése
2. A VALÓS VILÁG MODELLEZÉSE A következő részben Ön megismeri, hogyan épül fel a GIS adatbázisa. Megismeri majd a legfontosabb adatmodelleket és az ezekhez kapcsolódó elveket és fogalmakat. Ennek a témának a műszaki oldalát Ön már megismerte az adatgyűjtéssel kapcsolatos tantárgyakban. Itt a témát a térinformatikai rendszer szempontjából elemezzük. A valós világ túlságosan bonyolult közvetlen megértésünk számára. A térbeli adatbázis a térhez kapcsolódó adatoknak az együttese, amely a valóság modelljéül szolgál. Az adatgyűjtés során a GIS céljától függően a lényeges adatokat elkülönítjük a lényegtelenektől (generalizálás), felépítjük a valós világ célszerűen egyszerűsített modelljét. Amint az előzőekben említettük, a modellépítés döntően határozza meg a GIS megbízhatóságát, használhatóságát. Az egyszerű szöveges (nem térbeli) adatbázisokkal szemben a térinformatikai adatbázis nagy előnye, hogy az elemzések földrajzi helyhez köthetően is elvégezhetők. Vizsgálhatjuk a térbeli eloszlást és a térbeli kapcsolatokat. Sok térbeli objektum életében, a térbeli folyamat lezajlásában nagy szerepe van az időnek. Ha az adatbázisban idősorok állnak rendelkezésünkre, akkor ez újabb dimenziót jelent az elemzésben. Tehát, mivel a valós világ rendkívül összetett, ezért modellezésekor a földrajzi jelenségeket a modellezés célja szerint lényeges és lényegtelen egyedekre, idegen szóval entitásokra (entity) bontjuk (pl. földmérési alaptérképen a földrészletek, és az épületek szerepelnek, de nem szerepelnek a gyümölcsfák). Ezt hívják elméleti adatmodellnek. A lényegesnek tartott egyedekre ezután pontosan meg kell adnunk azokat az adatokat, amelyeket tárolnunk kell. A fenti példában a földrészlet helyrajzi száma, postai címe, területe, tulajdonosa stb. A kiválasztott egyedekre a tárolandó adatok alapján az adatbázisban logikai adatmodelleket építünk, az egyedeket objektumokban képezzük le. A fizikai adatmodell az adattároló rendszer meghatározó keretéül szolgál. A hetvenes évek végéig a raszteres adatmodellek voltak dominánsak. A nyolcvanas években megjelentek a hatékony vektoros rendszerek. A kilencvenes évekre a hibridmodellek (vektoros és raszteres) elterjedése volt a jellemző. Az adatmodellek általános értékelési szempontjai a következők: • teljesség, • rugalmasság, • hatékonyság, • egyszerűség. A földrajzi adatok három csoportját különböztetjük meg: 1. a földrajzi jelenség helyzetét adják meg (helyzeti, geometriai, grafikus adatok), 2. leírják annak lényeges tulajdonságait (szöveges, leíró, attribútum adatok, pl. az értéke, tulajdonosa, magassága) 3. megadják térbeli kapcsolatrendszerét (topológiai relációk).
2-2
Márkus Béla: A valós világ modellezése
2-1. ábra. London metróhálózata A térbeli kapcsolatok nagyon fontosak az adatkezelésben, adatelemzésben, de a mindennapi életben is. Az ábrán London metróhálózatát látjuk. A tájékozódásban itt a helyzeti adatokkal szemben előnyt élveznek a térbeli kapcsolatok. Mérési skálák A mérési skálák megállapítása nagy fontossággal bír az elemzések szempontjából. A mérési skáláknak az alábbi négy típusát különböztetjük meg: Nominális: mint pl., a helyrajzi szám vagy a talajtípus. Ezeknek a számoknak nincs jelentésük, csak a terület kategóriáját jelölik. A városok azonosítói vagy a telefonszámok példák a nominális skála mértékeire. Az egyetlen kapcsolat, ami a nominális skála értékei között van csupán az azonosítás. Ordinális: mint pl., egy verseny eredményei – a sorrend fontos. Lehet az adatokat (pl. idő adatok) rangsorolni, de nincsen más kapcsolat a számok között. Pl., sorrendbe állíthatjuk a városokat népességük szerint úgy, hogy az egyes szám jelenti a legnagyobb népességet. Arról a városról, ami kettes számot kapott, nem tudjuk meg mennyi a népessége, de azt tudjuk, hogy kevesebb, mint az előzőnek. Intervallum: mint pl., a hőmérséklet Celsiusban vagy Fahrenheitben mérve. Nincs igazi nulla, de az intervallumok egyenlők. A hőmérsékleti adatok, a többi intervallum adatokkal együtt, összeadhatók és kivonhatók (pl., kiszámíthatjuk a napi hőmérsékletváltozási tartományt a maximum és minimum értékekből), de nem mondhatjuk azt, hogy a 20 Celsius fok kétszer olyan meleg, mint a 10 Celsius fok. Arány: mint pl., a távolság. Itt van igazi nulla, negatívok is lehetségesek, az intervallumok a számok között egyenlők. Az arány skála adatai összeadhatók és kivonhatók és vannak arány tulajdonságok is. Így mondhatjuk, hogy 20/10 egyenlő 30/15.
2.1
Fedvényekre bontás
Az adatbázis gyakran tematikák szerinti rétegekből, fedvényekből (layer, coverage) épül fel. Például a topográfiai térképről adatbázisba tölthető tipikus fedvények a vízrajz, a közlekedési hálózat, a növényzettel való borítottság stb. Az alkalmazástól és az adattartalomtól függően a fedvények tovább bonthatók (a közlekedési hálózat utakra és vasutakra, az utak burkolt és talajutakra, a burkolt utak aszfalt, beton, ... ).
2-3
Márkus Béla: A valós világ modellezése
2-2. ábra. Az adatbázis rétegekből, fedvényekből épül fel. Forrás: PANEL-GI, 2000.
2.2
Szegmentálás
Nagyobb területek modellezésekor a rendszer memória- és tárkapacitásának véges volta miatt az adatbázist gyakran horizontálisan is tagolnunk, szegmentálnunk kell. Ez történhet szabályos négyszöghálós alapon, hasonlóan a térképek szelvényezéséhez. De a részekre bontás történhet szabálytalan vonalak mentén is, például közigazgatási egységenként. A horizontális tagolás megnehezítheti az adatmanipulációt a határvonalak közelében, ha erre a szoftver nincs felkészítve. A szegmensek csatlakozása legyen ellentmondásmentes (átlapolás- és szakadásmentesség, folytonosság biztosítása). Fejlettebb rendszerekkel megvalósítható a folytonos adatbázis.
2-3. ábra. Az adatbázis horizontálisan szegmensekre tagolható
2.3
Vektoros modellek
A vektoros adatmodellben az objektumokat pontokra, vonalakra és foltokra (poligonokra) bontjuk, majd az alakjelző pontok x,y(,z) koordinátáival, a koordináták sorozatával írjuk le. A pont egy kiskiterjedésű objektum (például egy forrás), a vonal egy hosszan elnyúló, keskeny objektum (például egy patak) megfelelője az adatbázisban, a folt egy hossz- és keresztirányban is nagykiterjedéssel bíró tereptárgy (például egy tó). Az objektumokhoz tartozó leíró adatok lehetnek számszerű, szöveges, multimédia elemek (például a vízminőség, a vízhozam, a földrajzi név stb).
2-4
Márkus Béla: A valós világ modellezése
Vektoros modellek esetén a feldolgozás számításigénye tekintélyes, ezért a válaszidő esetenként hosszú.
2-4. ábra. Pont, vonal és poligon
2.3.1 Spagetti modell A legegyszerűbb mód a helyzeti adatokat leíró vonalak megadására a vonalról-vonalra haladva vagy a folthatárvonalak körbejárásával foltról-foltra járva keletkező Y,X láncok tárolása. A leíró adatok ehhez kapcsoltan alfanumerikus, szöveges adatként jelentkeznek. Egy objektum az adatbázisban egy rekordnak felel meg, és helyzetileg definiálható y,x koordinátákkal, az y,x koordináták sorozatával (lánc). Az adatbázis a rekordok rendszer nélküli halmaza (hasonló egy tál spagettihez). A szomszédos foltok közös határvonalát kétszer kell digitalizálni, megadni. A spagetti modell főképpen a számítógépes tervezésben, számítógépes térképészetben terjedt el. A GIS megjelenítési funkcióit viszonylag hatékonyan támogatja, de elemzésre használni rendkívül körülményes. Elem Pont Vonal Folt
Száma 42 46 5 3 31 32
Helyzete y42,x42 y21,x21,y22,x22,y23,x23,y24,x24,y25,x25 (lánc) y26,x26,y23,x23 (lánc) y13,x13,y17,x17 (lánc) y13,x13,y12,x12,y11,x11,y18,x17,y17,x17,y13,x13 (zárt lánc) y17,x17,y13,x13,y14,x14,y15,x15,y16,x16,y17,x13 (zárt lánc)
2-5. ábra. A spagetti modell adatszerkezete Tehát a rendszer egyszerűsége ellenére fenntartásokkal javasolt, mert alkalmazása sok hátránnyal jár: • a szomszédos foltok határvonalát kétszer kell digitalizálni, • nehéz az adatbázis javítása, módosítása, • nincs szomszédsági információ, • a foltokba ágyazott foltok (szigetek) kezelése nehézkes, • nehéz ellenőrizni a határvonalakat.
2-5
Márkus Béla: A valós világ modellezése
2.3.2 Topológiai modell Napjainkban ez a leggyakrabban alkalmazott modell. A szakirodalomban a topológiai kapcsolatok használatának képessége gyakran szerepel, mint választóvonal a az egyszerűbb számítógépes grafikai, térképező, tervező rendszerek és a GIS között. A topológia kapcsolatok (összefüggés, szomszédság, közelség) megadása történhet az adatbevitel során, vagy automatikusan. A kapcsolatok tárolása természetesen együtt jár az adatmennyiség növekedésével. A topológiai leírás megadásának lépései: • a láncok vonalhálózatba kapcsolása, • a záródások ellenőrzése, • foltok (poligonok) képzése, a foltok területének számítása, • az attributum adatok illesztése.
Topológiai adatmodellt alkalmazva a számítógép automatikusan képes felfedezni az adatbázis logikai hibáit (hiányzó vonalak, nem csatlakozó vonalak, nem záródó foltok).
2-6
Márkus Béla: A valós világ modellezése
Csomópontok koordináta állománya Pontszám 11 12 … 26 42
y
x
Vonalak állománya Vonalszám 1 2 3 4 5 6
Pontok y13,x13,y12,x12,y11,x11,y18,x18,y17,x17 y13,x13,y14,x14,y15,x15,y16,x16,y17,x17 y17,x17,y13,x13 y21,x21,y22,x22,y23,x23 y26,x26,y23,x23 y23,x23,y24,x24,y25,x25
Összefüggések leírása Vonalszám 4 5 6
Honnan 21 26 23
Hová 23 23 25
Hossz
Utcanév
Házszám jobboldalon
Házszám baloldalon
Területleírás Foltszám 31 32
Vonalszám 1,3 2,3
Terület
Kerület
Tulajdonos
Földhasználat..
Szomszédság Vonalszám 1 2 3
Balfolt 33 32 31
Jobbfolt 31 33 32
2-6. ábra. Topológiai adatszerkezetek (Az összefüggés és területleírás táblákhoz leíró adatokat fűztünk: utcanév, házszám illetve tulajdonos, földhasználat. Ezek tetszés szerint bővíthetők: burkolat típusa, érték, adó stb. A hossz, terület, kerület oszlopokat a rendszer automatikusan tölti ki.)
2-7
Márkus Béla: A valós világ modellezése
2-7. ábra. Hipertérkép A hagyományos térbeli adatok tárolási lehetősége mellett a számítógép újabb lehetőségekkel szolgál. A multimédiás eszközökkel a modellezett világról gazdagabb adatbázist adhatunk a felhasználóknak (pl. videofelvételekkel). A hipertérkép "térkép-a-térképben". A térkép objektumaira mutatva egyszerűen és gyorsan nyerhetünk újszerű információkat.
2.4
Raszteres modellek
A raszteres forma alkalmazásakor a síkot egy rácshálóval rácselemekre, képpontokra (pixelekre) bontjuk. Ez a művelet leggyakrabban egy analóg - digitális konverzió (pl. szkennelés) vagy egy vektor - raszter transzformáció. A raszteres átalakítás során minden cella egy értéket kaphat. Ezt a problémát valamilyen megállapodással lehet megoldani (pl. a dominancia elve alapján: a cellát nagyobbrészt kitöltő jelenség kapja az egész cella kódját). A raszteres tárolás egyik legnehezebb kérdése az optimális cellaméret megválasztása. Túl nagy méretű cellák esetén egyes objektumok „eltűnnek”, a túl kis cellaméret adattárolási problémákat okozhat. A raszteres modell létrehozása során ki kell töltenünk a teret, azaz annak minden pontját hozzá kell rendelni egy cellához.
2-8
Márkus Béla: A valós világ modellezése
vektoros
raszteres
2-8. ábra. Pontok, vonalak és poligonok raszteres ábrázolása Az eredmény egy N sorból és M oszlopból álló képmátrix. A képmátrix a hozzá tartozó értékekkel egy tematikus adatszintet, más szóval fedvényt alkot (angolul layer). Több fedvényt logikailag csoportosítva jutunk az adatbázishoz: talajtípus, földhasználat, felszínborítottság, domborzat stb. A raszteres modellek tárigénye általában nagy. Bár - amint látni fogjuk - jól tömöríthetők. A raszteres modell választását több dolog indokolhatja: • viszonylag egyszerű, számítógéppel jól kezelhető adatszerkezet jön létre, • a fedvények közötti műveletek végrehajtása a vektoros adatszerkezethez képest egyszerűbb, • a raszteres adatelőállításnak vannak automatizált formái (pl. a letapogatás vagyis szkennelés), • viszonylag könnyű áttérni raszteres modellről vektorosra, • kódolási eljárásokkal viszonylag jól tömöríthetők a raszteres adatok, • egyes esetekben az adatnyerés már eleve raszteres formában történik (pl. távérzékelő műholdak, légifényképezés). A következőkben néhány tipikus fájlformátumot mutatunk be: Sorok szerinti elrendezés: 1 1 1 3 3
1 1 1 3 3
1 1 1 1 3
2 1 1 1 1
2 2 1 1 1
2-9
Márkus Béla: A valós világ modellezése
Minden elem új sorban kezdődik: 1 1 1 2 2 1 stb. Folyamatosan beírt adatok: 111221111211111331113331 A cellákba írt értékek lehetnek valós vagy egész számok, logikai típusúak, alfanumerikusak. Az egész számok gyakran kódokat takarnak, pl. 0 = osztályozatlan 1 = finom homokos agyag 2 = durva szemcsés homok 3 = kavics A valós számok általában domborzatmodellek magassági cellaértékeként fordulnak elő. A raszteres adatbázist felfoghatjuk úgy, mint fedvények sorozatát. Egy fedvényen belül egy ponthoz csak egy adat kapcsolódhat, ami akár száz fedvényt is jelenthet. A következőkben összefoglaljuk a raszteres fedvényeket meghatározó legfontosabb tulajdonságokat: • Felbontás: általánosságban a felbontás nem más, mint az ábrázolt terület legkisebb elemének kiterjedése. A raszter modellekben ez a legkisebb elem a cella vagy pixel, alakja a leggyakrabban négyzet, de egyes rendszerek használnak háromszögeket vagy hatszögeket is. • Tájolás: ez azt a szöget jelenti, amelyet az északi irány (a koordinátarendszer x tengelye) a raszter oszlopai által meghatározott iránnyal bezár. • Helyzet: felmerülhet az igény, hogy a cellákat valamilyen (országos) koordináta rendszerben ábrázoljuk. Ilyenkor az eddig használt relatív cellaazonosítóról (sor, oszlop) át kell térnünk egy másik koordináta rendszerre. Ehhez a tájoláson kívül ismernünk kell egy cella helyét az országos koordináta rendszerben.
2.4.1 Négyesfa Az említett nagy tárigényt a különböző adattömörítési megoldások jelentősen csökkenthetik. A raszteres modellek közül a legtömörebb tárolást a négyesfa (angolul quad-tree) módszer biztosítja azáltal, hogy a modellben a rácsméret rugalmasan változik. Ott, ahol az objektumok finom részleteket alkotnak, a rácsméret felére, negyedére, nyolcadára csökken. A négyesfa reprezentáció elve a következő ábrán látható. Osszuk a "kép" területét az oldalak felezésével először négy negyedre. Azt a rácselemet nem kell tovább bontani amelyre nem esik az ábrázolandó objektumnak egy részlete sem, vagy amelyet teljes egészében lefed az objektum. A vegyes tartalmú rácselemeket a szükséges részletek eléréséig tovább negyedeljük. A fa leveleinek jelentése: a kitöltött négyzet arra utal, hogy a rácselemet teljesen lefedi az objektum; üres négyzetet ott találunk ahol a rácselemen nem található az adott objektum, a nullkörök vegyes tartalmat jelölnek.
2-10
Márkus Béla: A valós világ modellezése
2-9. ábra. Négyesfa
2.5
Domborzatmodellek A terepfelszín illetve más természetes illetve mesterséges felületek modellezéséhez az előbb említett modellekkel ellentétben a magassági koordinátát is kezelnünk kell. Egyéb felületek (pl. talajvíz felszíne) számítógépes modelljeit digitális felszínmodelleknek nevezzük. A terepfelszín modellezése speciális megoldásokat kíván. Ezt a napjainkban már részleteiben kidolgozott technológiát a számítógépes tervezésben, térképészetben megkülönböztető névvel digitális domborzatmodellezésnek hívjuk.
A digitális domborzatmodell (DDM) a terepfelszín célszerűen egyszerűsített mása, amely fizikailag számítógéppel olvasható adathordozón tárolt terepi adatok rendezett halmazaként valósul meg. A DDM a modellezés folyamatában - digitális modellező rendszer segítségével információkat szolgáltat a modellezett terep egészének vagy kiválasztott részletének lényeges sajátosságairól. Az adatgyűjtés során a terepfelszín - a modellezés céljából következően - lényeges tárgyairól, tulajdonságairól diszkrét információkat szerzünk. Ezek az információk a terep valamely kiválasztott pontjára (támpont, adott pont, mért pont) vonatkoznak. A támpontok pontok közé iktatott (interpolált, levezetett, keresett) pont magasságának számításakor a modellező rendszer ezeket a pontokat használja kiinduló adatként, a felületillesztés ezekre támaszkodik. A DDM feladatok közül igen gyakori az eredeti modell transzformációja, új modell levezetése. Ilyen esetekben az eredeti modell támpontjait elsődleges pontoknak az új modell támpontjait másodlagos pontoknak nevezzük. A modellek általában támpontok strukturált halmazaként épülnek fel. A modellező rendszer programjai ezen támpontok alkalmas készletére támaszkodva állítanak elő új információkat a modellezett terepről.
2-11
Márkus Béla: A valós világ modellezése
A támpontok eloszlása szerint megkülönböztetünk: 1. szabályos modelleket, ahol a támpontok szabályos rácsháló metszéspontjaiban helyezkednek el, 2. strukturális modelleket, amelyek felépítésekor figyelembe veszik a domborzat jellegzetességeit és 3. véletlenszerű modelleket, ahol a nem szabályosan elhelyezkedő támpontok valamilyen ok miatt nem esnek a terepfelszín jellemző pontjaira (pl. tó vagy folyó medrének felmérésekor).
2-10. ábra. Szabályos, strukturális és véletlenszerű DDM Elsődleges modellként általában strukturális modelleket vagy nagy pontsűrűségű szabályos modelleket alkalmaznak. A másodlagos (levezetett) modellek - az egyszerű, gyors kezelhetőség miatt - rendszerint szabályosak. A szabálytalan ponteloszlású modelleket a gyors visszakeresés, hatékonyabb feldolgozás érdekében megfelelően szervezik (például növekvő koordinátarendbe rendezik). Elterjedt módszer a támpontok rendezésére a háromszöghálós un. TIN hálózatba rendezés (Triangulated Irregular Network). A TIN egy olyan DDM adatstruktúra, melyet egymáshoz kapcsolódó háromszögek alkotnak. A háromszögháló generálása sokféle módszerrel történhet. Ezek közül a legelterjedtebb a Delaunay háromszögelés. Itt az automatikus hálózatgenerálás törekszik a lehető legzömökebb háromszöghálózatot kialakítani. A magasságszámítás a későbbiekben ezekre a háromszögekre alapozva történik. Az így kialakult hálózat topológiájának tárolásával a keresési és feldolgozási idő lerövidül.
2-12
Márkus Béla: A valós világ modellezése
2-11. ábra. TIN hálózat Az előző részben Ön megismerte a valós világ modellezésének folyamatát. Felvázoltuk azt, hogyan épül fel a GIS adatbázisa. Megismerte a legfontosabb adatmodelleket és az ezekhez kapcsolódó elveket és fogalmakat. A következőkben arról lesz szó, hogy milyen tipikus GIS alkalmazások vannak a gyakorlatban.
2.6
Ellenőrző kérdések 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
Mi a térbeli adatbázis előnye a szöveges adatbázisokkal szemben? Határozza meg a fedvény fogalmát! Mit jelent a szegmentálás? Milyen mérési skálákat ismer? Mi a vektoros adatmodell lényege? Melyek a spagetti modell jellemzői? Melyek a topológiai modell jellemzői? Mi a raszteres adatmodell lényege? Hogyan tárolhatók a raszteres fedvények? Adja meg a raszteres fedvényeket meghatározó legfontosabb tulajdonságokat! Mi a négyesfa modell lényege? Határozza meg a DDM fogalmát! Csoportosítsa a támpontok eloszlása szerint a domborzatmodelleket! Mi a TIN hálózat?
2-13