Kartering van de verstruweling in de Amsterdamse Waterleidingduinen met behulp van Definiens Developer Bachelorscriptie voor de opleiding Aardwetenschappen
Frank Diependaal Amsterdam, Juli 2008 Faculteit FNWI Universiteit van Amsterdam
Begeleiders: Universiteit van Amsterdam Guido van Reenen Fred van der Vegte Cees de Vries
Waternet Mark van Til
Samenvatting Om de successie van de vegetatie in de Amsterdamse Waterleidingduinen te kunnen monitoren, is het belangrijk om luchtfoto’s om te kunnen zetten in een vegetatiekaart. Een van de (nieuwste) computerprogramma’s waarmee dit kan gebeuren is Definiens Developer. Dit onderzoek behelst enerzijds een kartering van de vegetatie voor de beheerder van de Amsterdamse Waterleidingduinen, en anderzijds een inschatting van de mogelijkheden voor het gebruik van Definiens Developer binnen De Universiteit van Amsterdam. De luchtfoto’s van 2001 en 2006 zijn in dit onderzoek met behulp van Definiens Developer ingedeeld in gebiedjes met vergelijkbare spectrale eigenschappen, de segmenten. Een aantal van deze segmenten zijn vervolgens toegewezen aan zeven vegetatie-structuurtypen: water, zand, gras, laagstruweel, hoogstruweel, loofbos en naaldbos. Op basis van een analyse van de spectrale eigenschappen van de segmenten in deze klassen zijn ook alle andere segmenten in een van de klassen ingedeeld. Dit is gebeurd volgens de nearest neighbor methode. Door middel van een accuracy assessment is het percentage goedgeclassificeerde segmenten bepaald. Van de classificaties met de grootste accuracy is voor elke klasse het oppervlak bepaald als percentage van het totale gebied.
Figuur 1, in de grazige vegetatie is de toekomstige verstruweling al zichtbaar
De verschillen binnen twee classificaties van hetzelfde jaar blijken van dezelfde ordegrootte als de verschillen tussen 2001 en 2006. Hierdoor zijn de oppervlaktes die zijn bepaald van elke vegetatiestructuurklasse niet betrouwbaar genoeg om conclusies te trekken over successie tussen 2001 en 2006. Op het oog geeft een vergelijking van de luchtfoto’s van 2001 en 2006 wel aanleiding om een
2
successie in de vegetatie te veronderstellen. Er is wel een kaart gemaakt van de vegetatie van een deel van de Amsterdamse Waterleidingduinen in 2006. De eigenschappen die verschillende vegetatiestructuurklassen het beste van elkaar kunnen onderscheiden, zijn vast te stellen door middel van een “Feature Space Optimization”. In dit onderzoek is deze methode slechts beginnend verkend, waardoor de waarde hiervan nog niet goed beoordeeld kan worden. Een belangrijk deel van dit verslag vormen de aanbevelingen voor vervolgonderzoek waardoor de vele mogelijkheden die Definiens Developer biedt in de toekomst beter ingezet kunnen worden bij vegetatiekartering aan de hand van luchtfoto’s. Vooral verbetering van de methode op het gebied van automatisering bij het kiezen van samples en verbetering van de segmentatiefase zijn punten waardoor snel de (accuracy) resultaten van de kartering kunnen worden verbeterd.
Figuur 2, De grazende reeën zijn niet voldoende om de successie te stoppen
3
Inhoudsopgave Samenvatting………………………………………………………
2
Voorwoord……………………………………………………….
5
Inleiding - achtergrond van het onderzoek…………………………. - probleemstelling………………………………………… - opzet van het onderzoek…………………………………
6 7 8
Methode - bestanden………………………………………………… - software………………………………………………….. - Werkwijze……………………………………………….. - Parameters………………………………………………...
9 10 10 14
Resultaten - Inleiding…………………………………………………… 17 - TTAmasks…………………………………………………. 17 - Accuracy resultaten………………………………………… 17 - Veranderingen in het oppervlak per vegetatiestructuur……. 19 - Veranderingen in het aantal segmenten per vegetatie-structuurtype 23 - Beschrijving van de gemaakte kaarten…………………… 24 - Kartering van een terreindeel dat binnenkort in begrazing wordt genomen 27 Conclusie……………………………………………………………
28
Discussie - Discussie……………………………………………………. - verdere aanbevelingen………………………………………
31 32
Literatuur - Boeken……………………………………………………… - Internet………………………………………………………
34 34
Inhoudsopgave bijlagen……………………………………………… - Excel bestand o Classificaties o TTAmasks o Oppervlaktes o Afbeeldingen classificatie 201 t/m 210 - ArcGis bestand o Vegetatiekaart van 2006
v.a. 35
4
Voorwoord Dit thesisonderzoek vormt het laatste onderdeel van de bacheloropleiding aardwetenschappen aan de Universiteit van Amsterdam. Dit onderzoek komt voort uit de samenwerking tussen de Universiteit van Amsterdam en Waternet. Voor zowel de Universiteit van Amsterdam als Waternet is het onderwerp vrij nieuw, en gedurende het onderzoek is gebleken ook in de literatuur over dit onderwerp nog vrij weinig bekend is. Mede vanwege de complexheid is het onderzoek behoorlijk ingeperkt om het uitvoerbaar te kunnen maken als bacheloronderzoek in de daarvoor bestemde tijd. Dit heeft tot gevolg gehad dat het onderzoek vooral verkennend van karakter is en dat de resultaten slechts in beperkte mate praktisch toepasbaar zijn. Ondanks dat kijk ik terug op een geslaagd bacheloronderzoek, en ik hoop dat de lezer dit onderzoek met net zoveel interesse zal lezen als ik het onderzoek heb uit mogen voeren. Voor alle hulp bij het onderzoek wil ik mijn begeleiders Guido van Reenen, Cees de Vries en Fred van der Vegte bedanken en ook masterstudent Guusje Hoek , die mij als Definiens-specialist met name in het begin veel heeft geholpen.
5
Inleiding Achtergrond van het onderzoek De Amsterdamse Waterleidingduinen (AWD) beslaan een gebied langs de kust direct ten zuiden van Zandvoort ter grootte van 3800 hectare (figuur 3). Behalve in gebruik voor de waterwinning voor de gemeente Amsterdam herbergt dit gebied een naar Nederlandse maatstaven rijke flora en fauna. Waternet beheert dit gebied in opdracht van de gemeente Amsterdam, en in die hoedanigheid ook verantwoordelijk voor het milieubeleid waarbij het behoud en uitbreiding van de hoge biodiversiteit centraal staat. Een van de bedreigingen voor de biodiversiteit is de uitbreiding van de Amerikaanse vogelkers (Prunus serotina) die vooral ten koste gaat van de open, lage vegetaties.
Figuur 3, ligging van de AWD ten opzichte van Amsterdam
Om het gevoerde natuurbeheer te kunnen beoordelen en om het beleid voor de toekomst te kunnen bepalen, zijn goede vegetatiekaarten van groot belang. Met kaarten van verschillende jaren kan de ontwikkeling van het gebied worden beoordeeld. Deze benodigde kaarten zijn niet zondermeer beschikbaar en vergelijkbaar. Een goede (geautomatiseerde) methode om met behulp van luchtfoto’s vegetatiekaarten te maken zou een grote bijdrage kunnen leveren aan de beoordeling –
6
en dus verbetering- van het natuurbeheer. Een van de computerprogramma’s die gebruikt kunnen worden is Definiens Developer. Door veelbelovende resultaten in eerdere studies is er voor dit onderzoek gekozen om van dit programma gebruik te maken.
Figuur 4, Ligging van het onderzoeksgebied in de AWD
Probleemstelling Dit onderzoek is in overleg met Waternet vooral gericht op het ontwikkelen van een methode voor de kartering. Daarnaast is een kartering van een klein deel van de AWD gewenst in verband met voorgenomen beheersmaatregelen. De hoofdvraag van het onderzoek is: -
Op welke wijze kan de verstruweling van het Middenveld in de Amsterdamse Waterleidingduinen het beste worden gemonitord met behulp van luchtopnamen en het programma Definiens Developer?
Om deze hoofdvraag gestructureerd te kunnen beantwoorden zijn de volgende deelvragen opgesteld: -
Welke gegevens zijn er benodigd voor de kartering van de verstruweling in de AWD?
7
-
Op welke wijze zijn met behulp van Definiens Developer de verschillende vegetatiepatronen in de AWD te onderscheiden?
-
Wat zijn de verschillen in de emissiespectra van verschillende soorten vegetatie in de AWD?
-
Hoe is de verstruweling te kwantificeren in de AWD tussen 2001 en 2006?
-
Hoe ziet het vegetatiepatroon er uit in het Middenveld en het Renbaanveld in de AWD in de zomer van 2006?
Opzet van het onderzoek Voor het uitvoeren van dit onderzoek is kennis van ArcGIS en Definiens Developer nodig. Met name dit tweede programma is nog weinig gebruikt, waardoor het leren werken hiermee een belangrijke fase is in dit onderzoek. Door de combinatie van de beperkte tijd en de enorme mogelijkheden die Definiens Developer biedt is het niet mogelijk om dit programma geheel te leren gebruiken. Dit onderzoek is er daarom vooral op gericht om de mogelijkheden van het programma in de toekomst in te schatten en optimaal te kunnen benutten. In het hoofdstuk “methode” zal een duidelijke beschrijving worden gegeven van wat er is uitgevoerd om tot resultaat te komen. De belangrijkste resultaten worden daarna besproken. In de conclusie wordt geprobeerd een antwoord op de onderzoeksvragen te geven. Ondanks dat het onderzoek een zeer methodische vraagstelling kent is de discussie na de conclusie als apart hoofdstuk opgenomen. Hierin zijn ook de aanbevelingen voor vervolgonderzoek opgenomen. Als laatste volgen nog de literatuurlijst en de bijlagen waarin ook de uitvoer van de computerberekeningen is opgenomen.
8
Methode Bestanden Omdat het doel van het onderzoek niet alleen het in kaart brengen is van het onderzochte gebied, maar ook het zoeken naar een methode om in het algemeen de vegetatie te kunnen karteren, ligt de nadruk op een zoveel mogelijk gestandaardiseerde en reproduceerbare classificatiemethode. Voor de uitvoering van dit onderzoek werd verwacht dat de programma’s Definiens Developer en ArcGIS gebruikt zouden moeten worden. Daarom is in het begin van het onderzoek veel tijd geïnvesteerd in het leren werken met deze programma’s. Tijdens het onderzoek is, toen dit nodig bleek, ook nog gewerkt met ERDAS. De gegevens die voor dit onderzoek beschikbaar zijn, bestaan onder meer uit luchtopnamen van de Amsterdamse Waterleidingduinen uit 2001 en 2006. Om de grootste zichtbaarheid van de struweelvegetatie te verkrijgen zijn er foto’s van de zomer gebruikt. In dit jaargetijde zijn de struiken het duidelijkst te onderscheiden van bomen en grazige vegetatie. De geografische positie per foto van de hoekpunten van deze opnamen waren met de foto’s meegeleverd, alleen het coördinatenstelsel moest hieraan nog worden toegevoegd. De foto’s zijn allemaal gerefereerd op coördinaten van het Rijksdriehoekstelsel (Amersfoort). Naast deze twee opnames is er een vegetatiekaart beschikbaar van de AWD uit 1995 en een bedrijfskaart uit 1998 waarop ook verschillende vegetatieklassen worden onderscheiden. De foto’s waarop deze kaarten gebaseerd zijn, waren niet beschikbaar voor dit onderzoek. Alle bestanden en kaarten die gebruikt zijn voor dit onderzoek zijn beschikbaar gesteld door Waternet. Software Voor het analyseren van de luchtfoto’s is gebruik gemaakt van diverse programma’s. In de eerste plaats zijn aan de bestanden de juiste coördinatenstelsels toegevoegd met een ArcGIS pakket, waarbij gebruik is gemaakt van ArcMap en ArcCatalog. Er bestaan verschillende programma’s die kunnen helpen bij het analyseren van luchtfoto’s. Deze programma’s zijn in te delen in programma’s die “pixel-based” werken en programma’s die de analyse “object-based” uitvoeren. De eerste soort beoordeelt voor elke pixel apart de eigenschappen en deelt iedere pixel op basis
9
daarvan in een aangegeven klasse in. “Object-based” programma’s zijn gericht op de analyse van een pixel in relatie tot de omliggende pixels. Hierdoor kan bijvoorbeeld een verschijnsel op de foto als schaduw worden meegenomen bij de classificatie. Vanwege de betere verwachtingen en beschikbaarheid van het “object-based” programma Definiens Developer (de opvolger van het programma eCognition) is dit programma gebruikt in plaats van de programma’s ERDAS en DICRANUM. Werkwijze Voorbereiding Voor het leren werken met ArcGIS en Definiens Developer zijn diverse modules beschikbaar bij de GIS-studio van de Universiteit van Amsterdam. Het volgen van deze modules was de eerste stap in het onderzoek, en de kennis die hiermee is opgedaan vormt de basis van het verdere onderzoek. Naast de modules is er algemene informatie ingewonnen over de Amsterdamse Waterleidingduinen en in het bijzonder over het natuurbeleid van Waternet, de beheersmaatregelen die genomen zijn in het verleden en hoe het beheer georganiseerd is. De eerste kennismaking met het onderzoeksgebied bestaat uit een veldbezoek met Mark van Til van Waternet en Cees de Vries van de Universiteit van Amsterdam. Hierbij wordt duidelijk welke problematiek er in het algemeen in de Amsterdamse Waterleidingduinen speelt rondom successie. Voordat vervolgens zelfstandig het onderzoeksgebied in gegaan kan worden, zijn met behulp van ArcGis de luchtfoto’s bewerkt voor gebruik in het veld en in kleur (schaal 1:4500) uitgeprint. Van een klein deel van het gebied is ook nog een foto op extra grote schaal (1:1000) uitgeprint, om in het veld de waarde hiervan in te kunnen schatten. Het veld in… Met een afdruk van de luchtfoto’s is het veld in gegaan om het te karteren gebied in werkelijkheid te kunnen zien. Hierbij is een indeling gemaakt van de foto in de volgende vegetatieklassen: gras, loofbos, naaldbos, hoogstruweel en laagstruweel. Ook zijn de klassen zand en water onderscheiden. Het belangrijkste was om de vraag te beantwoorden of het mogelijk is om zonder computer en alleen op basis van de foto het gebied te kunnen classificeren. Over het algemeen is gebleken dat uit de luchtfoto’s duidelijk is af te leiden welke vegetatiestructuur er in het veld daadwerkelijk aanwezig is. Dit is een belangrijke conclusie omdat we daardoor in staat zijn om ook foto’s die jaren geleden gevlogen zijn tenminste met de hand te classificeren. Opgemerkt moet nog worden dat er in het veld rekening is gehouden 10
met het feit dat de meest recente foto uit de zomer van 2006 komt en dus niet meer letterlijk te vergelijken is met de werkelijkheid zoals die half mei 2008 in het veld is aangetroffen. Het belangrijkste probleem van de successie wordt in dit gebied van de duinen gevormd door de uitbreiding van Amerikaanse vogelkers. Dit is een zeer snel groeiende struik die zowel de plaats inneemt van bestaand duingrasland als van bestaand laagstruweel. Over het algemeen bestaat laagstruweel uit duindoorn, wat meestal niet hoger wordt dan 1 à 2 meter. Omdat de Amerikaanse vogelkers al binnen enkele jaren hier bovenuit groeit, zijn de gebieden waar deze groeit meestal geclassificeerd als hoogstruweel. Gebieden die in het veld als loofbos geclassificeerd zijn, bestaan bijvoorbeeld uit berk, eik of els. Amerikaanse vogelkers kan zo groot worden dat er in hoogte geen verschil meer is met loofbomen. De foto’s in de computer… Voordat de foto’s die zijn aangeleverd door Waternet gebruikt kunnen worden in Definiens Developer, zijn deze met behulp van het programma ERDAS aan elkaar geplakt zodat het onderzoeksgebied is samengebracht in één bestand. Vervolgens is er een uitsnede gemaakt met ERDAS, zodat alleen het onderzoeksgebied door Definiens Developer geanalyseerd hoeft te worden, wat rekentijd scheelt. In Definiens Developer is de afbeelding vervolgens gesegmenteerd (figuur 5). Dit betekent dat het programma de eigenschappen van elke pixel gaat vergelijken met de omliggende pixels of segmenten. Op basis van een aantal parameters bepaalt het programma of deze pixels zodanig overeen komen dat ze samen in een segment worden geplaatst. De gebruikte parameters voor deze segmentatie zijn aanvankelijk bepaald op basis van literatuur over eerder onderzoek en op basis van het testen van kleine veranderingen hierin. Vervolgens zijn hieruit de instellingen gekozen waaruit de beste classificatie volgde. Een belangrijke beperking voor de segmentatie is de tijd die het de computer kost. Een segmentatie duurt soms meer dan een uur, en hoe langer het duurt, des de groter de bestanden zijn die dit oplevert. Het gevolg is dat ook de classificatie daardoor weer meer tijd kost. De classificatie… De volgende stap is om de segmenten van de kaart te laten classificeren. Hierin worden twee manieren onderscheiden: “supervised” en “unsupervised classification”. Bij “supervised classification” worden eerst de klassen waarin de foto moet worden ingedeeld vastgesteld. Vervolgens worden er van elke klasse een aantal 11
voorbeeldsegmenten (trainingssamples) aangewezen. Hierna deelt het programma alle segmenten in aan de hand van de eigenschappen (features) per klasse die zijn afgeleid uit de eigenschappen van de voorbeeldsegmenten. Bij “unsupervised classification” deelt het programma de pixels bij elkaar in die vergelijkbare eigenschappen hebben. In feite heeft dit grote overeenkomsten met de “segmentation”. Door de toenemende mogelijkheden (snelheden) van computerhardware worden de resultaten van “unsupervised classification” steeds beter. Dit is ook goed bruikbaar als er weinig kennis is over het gebied. Bovendien is er relatief weinig GIS kennis voor nodig. Op basis van de beschreven verschillen in de methodes voor classificatie, is er gekozen om te werken met “supervised classification”. Dit betekent dat er in Definiens Developer per klasse een aantal segmenten wordt ingedeeld. Deze voorbeeldgebieden (trainingssamples) kunnen samen worden opgeslagen als TTA (Test and Training) mask. Vervolgens worden de eigenschappen geselecteerd waarop het programma de voorbeeldgebieden moet vergelijken met de nog te classificeren gebieden. Dit zijn bijvoorbeeld spectrale waardes zoals gemiddelde en standaarddeviatie. Hier volgt later meer over. De classificatie gebeurt uiteindelijk volgens de nearest neighbor methode.
Figuur 5, Een deel van de luchtfoto van 2001, ingedeeld in segmenten
Beoordeling van de classificatie Nadat de indeling is gemaakt, kan deze worden beoordeeld. Hiervoor worden er opnieuw handmatig bij elke klasse een aantal segmenten ingedeeld. Door deze
12
indeling te vergelijken met de resultaten van de “supervised classification” met behulp van een accuracy assessment kan de nauwkeurigheid beoordeeld worden van het resultaat van de “supervised classification”. In eerste instantie bestond de indeling uit de klassen water, zand, gras, struweel, naaldbos en loofbos. Omdat hiermee de ontwikkeling in struweel minder nauwkeurig bij te houden is en omdat de accuracy zeer hoog was, is het aantal klassen uitgebreid door struweel onder te verdelen in hoog- en laagstruweel. Bij het aanwijzen van segmenten voor deze klassen wordt meteen duidelijk dat het uit de foto’s moeilijk is om het verschil tussen hoog- en laagstruweel te zien. De veldwaarnemingen zijn hierbij zeer belangrijk, met name voor de twijfelgevallen. Dit zijn bijvoorbeeld gebieden waarin het niet duidelijk is welk soort vegetatietype er op te foto te zien is of segmenten die eigenlijk meerdere vegetatietypen bevatten. Accuracy Assessment Een standaard functie in Definiens Developer is het laten uitvoeren van een accuracy assessment. Er wordt hiervoor een mask gemaakt dat de testsamples bevat. Van deze segmenten wordt net als bij een trainingsmask aangegeven in welke klasse ze horen te vallen. Door vergelijking van de klasse volgens de testmask en de classificatie wordt duidelijk welk percentage van de testmasks correct is geclassificeerd. Het laden van de masks in Definiens Developer kost de computer erg veel tijd, waardoor het ook veel tijd kost om een grote hoeveelheid classificaties uit te voeren zoals die in bijlage 1 te vinden is. Behalve de accuracy geeft een accuracy assessment ook nog de KIA (Kappa index of agreement). Deze waarde is een schatting van de betrouwbaarheid van de accuracy. Een hoge KIA (de KIA loopt van 0 tot 1) en een hoge accuracy geeft dus de beste classificatie weer. Bij veel samples in de testmask zal de KIA toenemen. Er is ook geprobeerd om de samples in de testmask goed te verdelen over de verschillende klassen. Meestal zijn bij een foto meerdere masks gemaakt, om de invloed van de samplekeuze in te kunnen schatten. Het aantal segmenten dat als zand geclassificeerd kan worden, is slechts klein. Het gevolg is dat de zandsamples voor ieder mask ongeveer hetzelfde zijn. Hierdoor zullen de masks nooit helemaal verschillend zijn van elkaar. De oppervlakte per klasse Om van de geclassificeerde foto een kaart te maken waarvan de oppervlaktes te berekenen –en dus te vergelijken- zouden zijn, is de classificatie met de hoogste “accuracy” uiteindelijk geëxporteerd als raster file uit Definiens Developer. In 13
ArcCatalog is er opnieuw een georeferentie toegevoegd en in ArcMap is het rastertype geconverteerd naar features. Door een gebied te kiezen dat begrensd wordt door infiltratiegeulen is het gemakkelijk om ArcMap te gebruiken om daarna oppervlakte per vegetatiestructuur te bepalen. Bij het vergelijken van de oppervlaktes per vegetatiestructuur lijken de verschillen al erg groot, en uiteindelijk blijkt ook het totaal van de oppervlakte in 2001 en in 2006 niet overeen te komen. Omdat er nogal wat bewerkingen zijn uitgevoerd om tot een kaart in ArcMap te komen, is het moeilijk om de plek aan te wijzen waar het fout is gegaan. Om hier niet al te veel tijd mee te verliezen is besloten niet meer met ArcMap de oppervlaktes uit te rekenen maar met Definiens Developer. De oppervlaktes van 2001 en 2006 per vegetatiestructuur kunnen vervolgens vergeleken worden om inzicht te krijgen in de verstruweling van het gebied. Een nadeel van het werken met Definiens Developer in plaats van ArcMap is dat de gemaakte kaarten minder eenvoudig bewerkt kunnen worden. Parameters Door afhankelijk van de uitslag van een accuracy assessment steeds de waarde van de parameters te veranderen, kan de accuracy van de indeling steeds hoger worden. Er is geprobeerd een zo systematisch mogelijk systeem te hanteren waarbij vrijwel alle parameters meerdere keren zijn veranderd. In de segmentatie is alleen de “scale parameter” veranderd. Van “shape” en “compactness” is ondervonden dat deze zoals eerder onderzoek ook heeft aangetoond standaard zeer goed bruikbare waardes hebben. Tijdens het onderzoek is gebleken dat de grootte van de pixels van de opnamen van 2001 en 2006 niet overeenkwamen. Hierna is de celgrootte gelijkgesteld aan de grootste van de twee (2006) met een waarde van 50x50cm per cel (pixel). Een luchtopname bestaat uit een bestand van spectrale eigenschappen per pixel. Deze spectrale eigenschappen bestaan uit de waarde van elke pixel voor een specifieke golflengte. Behalve de zichtbare golflengtes die horen bij rood, groen, en blauw licht, wordt ook de golflengte van nabij-infrarood (NIR) geregistreerd. Omdat de variatie in energie in NIR in de vegetatie zo groot is, wordt deze vaak gebruikt om vegetatie te onderscheiden. Omdat de waardes van een luchtopname altijd maar in drie kleuren weergegeven kunnen worden op een foto (de kleuren op het scherm zijn ook opgebouwd uit rood, groen en blauw) bevat het gebruikte bestand van de luchtopname
14
maar drie “banden”: een voor het groene licht, een voor het rode licht en een voor het NIR. Zoals gezegd dient er bij de classificatie aangegeven te worden aan de hand van welke eigenschappen van de voorbeeldsegmenten er geclassificeerd moet worden. Hier is een enorme hoeveelheid keuzes mogelijk, welke het belangrijkste verschil vormen voor de accuracy van de verschillende indelingen. Voor dit onderzoek was het onmogelijk om heel veel verschillende eigenschappen te gebruiken. Er is daarom gebruik gemaakt van wat hierover al bekend was uit eerdere onderzoeken. Uit de geraadpleegde literatuur is gebleken dat de gemiddelde waarde van elke laag een goede parameter is. Daarnaast is de NDVI gebruikt. NDVI staat voor “Normalized Difference Vegetation Index” en geeft een waarde voor de fotosynthetische eigenschap van een gebied waarmee dus iets gezegd kan worden over de vegetatie. De NDVI kijkt niet naar nieuwe eigenschappen maar naar de verhouding van de waarde van het gemiddelde in laag 1 en 2 (NIR en rood) van de luchtopname met de formule
NDVI=
meanlayer1 - meanlayer2 meanlayer1 + meanlayer2 .
Voor verbetering van de automatische classificatie van luchtfoto’s is het zoeken naar onderscheidende parameters zeer belangrijk. Dit kunnen, zoals eerder genoemd, bijvoorbeeld spectrale waardes zijn zoals gemiddelde van een bepaalde band of de standaard deviatie. Dit onderzoek is helaas te klein om daar een methode voor te ontwikkelen. Definiens Developer biedt hier een aantal hulpmiddelen bij, die in dit onderzoek slechts oppervlakkig verkend zijn. Een van de hulpmiddelen die Definiens Developer biedt is de “Feature Space Optimization”. Deze methode is niet voldoende onderzocht om hier conclusies uit te trekken, maar ziet er in dit stadium veelbelovend uit. Zoals met meer mogelijkheden die de computer kan bieden, zou bij verder onderzoek wel goed bekeken moeten worden wat de software precies doet om het antwoord op de juiste manier te kunnen interpreteren. Een belangrijke component die de waarde van de accuracy sterk beïnvloed is de voorbeeld- en toetssegmenten die gekozen worden om de accuracy te bepalen. Met de hand worden er aan elke klasse een aantal samples toegewezen. Dit is helaas geen exacte wetenschap, en daarom is er met vele verschillende TTA masks gewerkt. Over het algemeen wordt aangenomen dat de fouten hierdoor redelijk binnen aanvaardbare
15
grenzen blijven maar hier wordt in de discussie nog op terug gekomen. Overeenkomsten tussen de masks zijn niet uit te sluiten In het begin is soms onterecht gebruik gemaakt van dezelfde segmenten in trainingsen test masks. Omdat hiermee de accuracy onterecht hoger wordt (segmenten die als trainingsobject zijn gebruikt zullen immers sowieso goed worden geclassificeerd), is dit later vermeden. Door de opzet van Definiens Developer is het echter mogelijk dat er toch een enkele keer een segment zowel in de trainings- als in de testmask zit. Automatiseren van de werkwijze Vooraf was het de vraag of een kartering van het gebied volgens een geautomatiseerde methode mogelijk zou zijn waardoor de classificatie objectiever zou worden. Dit is echter in het stadium waarin het onderzoek nu nog zit niet van belang. Het classificeren met Definiens Developer vraagt nu soms nog teveel handelingen om dit te kunnen automatiseren. Bovendien zijn er in deze handelingen ook nog teveel dingen die fout kunnen gaan waardoor de classificatie minder betrouwbaar wordt. Nummering van de resultaten De resultaten zijn allemaal in de bijlage te vinden. Van elke classificatie is de accuracy en de KIA vastgelegd. Van de laatste tien classificaties zijn bovendien ook de afbeeldingen met excel opgeslagen. Voor de nummering van de classificaties van 2001 is begonnen bij 1, de nummering van de classificaties van 2006 beginnen bij 101. In de tweede fase van het onderzoek zijn de classificaties begonnen bij nummer 201. De bijbehorende afbeeldingen zijn te vinden met hetzelfde nummer.
16
Resultaten
Inleiding Gedurende het onderzoek zijn vele resultaten verkregen. De meeste van deze resultaten zijn gebruikt om de verschillende parameters te kunnen beoordelen en te veranderen om zo de methode te verbeteren. In de bijlage zijn alle resultaten terug te vinden. Van de classificaties zijn niet in alle gevallen de kaarten gedocumenteerd omdat de classificatie in het begin vooral gericht was op het verhogen van de accuracy. De methodes met de hoogste waardes voor de accuracy zijn vervolgens herhaald. Hier zijn wel kaarten van. Omdat de geclassificeerde foto’s niet allemaal zijn uitgevoerd als gis-bestand zijn deze “kaarten” alleen een afbeelding, dus zonder geografische informatie. Van het jaar 2006 is de beste classificatie wel naar een ArcGIS bestand omgezet. TTAmasks In de bijlage is een overzicht te vinden van alle TTAmasks die gebruikt zijn. Hierbij is aangegeven voor welke toepassing ze ontworpen zijn. De accuracy kan zowel op basis van een mask als op basis van een aantal voorbeelden uitgerekend worden. Als alle voorbeelden gewist worden en de mask vervolgens wordt omgezet in voorbeelden (create samples from mask) dan geeft dit een andere accuracy, terwijl de samples en de mask identiek zijn. Hier is geen verklaring voor gevonden. De accuracy is altijd groter als de classificatie met behulp van de mask wordt beoordeeld. Bij het bepalen welke mask de hoogste accuracy heeft is alleen naar de mask gekeken. Accuracy resultaten De accuracy resultaten voor alle classificaties die gedaan zijn, zijn te vinden in de bijlage. Er is gevarieerd met verschillende parameters. De segmentation parameter is gevarieerd van 10 tot 200. Als de grootte van de segmenten al niet voldeed aan de eisen is er ook geen verdere classificatie uitgevoerd. Als de segmentatie teveel tijd kostte is deze niet afgemaakt. Bij de resultaten zijn daarom alleen de accuracy waardes te vinden van parameterwaarde 80, 100 en 120. Omdat de accuracy bij waarde 100 het grootste was is, is bij de gemaakte kaarten een segmentatieparameter van 100 gebruikt. Toch wordt bij het bekijken van de segmenten soms duidelijk dat dit een bron van fouten kan zijn. Een groot aantal segmenten bestaat uit meerdere soorten vegetatie, bijvoorbeeld een lage struik in een verder vergraste vegetatie
17
(figuur 6). Een uitgebreid onderzoek naar de optimalisatie van de segmentatiemethode zou nodig zijn om dit soort fouten uit te kunnen sluiten. Omdat voor het trainen en testen altijd een mask is gebruikt dat is gemaakt bij een bepaalde segmentatie is het veranderen van de overlap (dit wordt gevraagd bij het laden van een mask) zonder resultaten.
Figuur 6, een segment dat meerdere structuurstypes bevat
Omdat in het begin niet duidelijk was dat de pixelgrootte tussen de twee jaartallen verschilde, was deze bij de eerste resultaten niet gelijk. Tijdens het onderzoek is de celgrootte alsnog gelijk gesteld met Definiens Developer (File > Modify Project), en alleen deze celgrootte van 50x50cm is gebruikt om de afbeeldingen te maken. Bovenstaande parameters hebben voornamelijk betrekking op de segmentatie. Als de segmenten eenmaal gedefinieerd zijn dan hebben de features de grootste invloed op de classificatie. Zoals te zien is, is een aantal features elke keer toegepast. Dit zijn Brightness, Mean (van alle drie de banden) en Max Diff. In de bijlage is bij elk resultaat aangegeven welke features er bij de classificatie gebruikt zijn.
Van de accuracy in 2001 is de waarde voor de nauwkeurigheid bij classificatienummer 7 het grootste, met 0.861. Dit is een herhaling van classificatie 6 (accuracy 0.846) met precies dezelfde omstandigheden, waardoor dus eigenlijk verwacht mag worden dat de accuracy ook hetzelfde zou zijn. Waarom dit niet zo is, is niet duidelijk. Bij classificatie 7 is bij de indeling naast de standaardfeatures gebruik gemaakt van de NDVI. Bij classificatie 4 is dit niet het geval, maar toch zijn
18
de resultaten hetzelfde, zelfs voor de KIA. Het gebruik van NDVI verhoogt hier de nauwkeurigheid dus niet. Van de foto uit 2006 is de nauwkeurigheid bij classificatienummer 104 het hoogste met 0.764 Hierbij zijn alleen de standaardfeatures gebruikt. De verschillen in accuracy tussen een herhaling met dezelfde randvoorwaardes lijken groter dan de verschillen tussen het wel of niet gebruiken van de NDVI. De beste eigenschappen (features) waarop een vegetatiestructuur te onderscheiden is, is per gebied, per segmentatie en per mask weer anders. Het is daarom niet mogelijk om eigenschappen aan te wijzen die ook altijd buiten het onderzoeksgebied te gebruiken zijn. Bovenstaande classificaties zijn in de eerste fase van het onderzoek uitgevoerd. In de tweede fase is opnieuw een classificatie uitgevoerd, waarbij de nadruk niet meer lag op het verbeteren van de werkwijze maar juist op de resultaten. In deze fase speelt ook het uitrekenen van de oppervlakte per vegetatiestructuur een belangrijke rol, omdat hiermee antwoord kan worden gegeven op de onderzoeksvragen -
Hoe is de verstruweling te kwantificeren in de AWD tussen 2001 en 2006
-
Hoe ziet het vegetatiepatroon er uit in het Middenveld en het Renbaanveld in de AWD in de zomer van 2006
Bij het beantwoorden van deze vragen is dus gebruik gemaakt van een methode waarvan bekend was dat deze nog verbeterd kon worden.
Veranderingen in het oppervlak per vegetatie-structuurtype In het gebied dat is onderzocht is volgens de beheerder de successie van de vegetatie een groot probleem. Dit is ook de reden dat er gewerkt wordt aan nieuwe beheersmaatregelen. Voorbeelden van successie zijn de overgang van zandbedekking naar duingrasland (figuur 7) , van duingrasland naar struweel en van struweel naar bos. Bij het analyseren van de ontwikkeling van bijvoorbeeld struweel moet echter wel in de gaten worden gehouden dat de totale hoeveelheid struweel niet hoeft te veranderen. Er kan eenzelfde hoeveelheid struweel verdwijnen door een overgang
19
Figuur 7, Een voorbeeld van successie; gras neemt de plaats in van zand
naar bos als er bijkomt door de ontwikkeling van duingrasland naar struweel. Een echte toename zou daardoor vooral te zien zijn in het begin en het eind van de successiereeks: bij kaal zand en bij (loof)bos. Door de kleine hoeveelheid zand vormt ook de hoeveelheid duingrasland een redelijke indicatie. Er kan immers maar weinig zand overgaan in duingrasland, dus als de hoeveelheid duingrasland is afgenomen zou dit een toename van de hoeveelheid (laag)struweel tot gevolg kunnen hebben. De eerste fase waarin struweel nog niet is onderverdeeld in hoog- en laagstruweel gaf wel een hoge accuracy, maar weinig informatie over de successie. De oppervlakte per klasse van deze indeling is daarom niet bepaald. Omdat het in Definiens alleen mogelijk is om met vierkante beelden te werken, is de uitsnede van het onderzoeksgebied in ERDAS gemaakt. Alles wat buiten de polygoon valt, is afgebeeld als zwart. Bij de classificatie met Definiens Developer wordt dit gebied meestal ingedeeld als “Unclassified”. Een enkele keer is echter het verschil tussen water en helemaal zwart kennelijk niet duidelijk en is het gebied dat buiten de polygoon valt als water geclassificeerd. Dit is geen probleem omdat de hoeveelheid water niet belangrijk is voor dit onderzoek. Voor de percentages per vegetatiestructuurtype (tabel 1 en 2) is het vierkant waarin het polygoon van het onderzoeksgebied ligt als 100% genomen. Daardoor zijn de percentages per vegetatieklasse van verschillende classificaties vergelijkbaar, ook als het gebied buiten de polygoon als water wordt geclassificeerd. Bij het gebruiken van ERDAS om een polygoon van het onderzoeksgebied uit te knippen, treedt er een verandering van de kleuren op. Deze verandering zit niet in beide foto’s, waardoor het moeilijker is de foto’s met elkaar te vergelijken. Omdat de
20
classificatie op basis van trainingssamples wordt uitgevoerd, wordt verwacht dat dit geen invloed heeft op de classificatie. Van 2001 en 2006 zijn meerdere classificaties uitgevoerd waarvan de accuracy berekend is. Bij deze classificaties zijn de features en de TTAmasks veranderd (zie bijlage 1). Van de classificaties met de hoogste accuray in combinatie met de hoogste KIA benaderen de berekende oppervlaktes het beste de werkelijke situatie. In 2001 is dit classificatie 203, met een accuracy van 0.771 (berekend met mask). Van 2006 is dit classificatie 204 met een accuracy van 0.857. De resultaten hiervan zijn ook opgenomen in onderstaande tabel. Vegetatietype
Percentage in 2001
Percentage in 2006
(water)
36.81%
3.84%
(zand)
1.24%
0.78%
(gras)
15.01%
12.05%
laagstruweel
21.19%
18.70%
hoogstruweel
9.89%
16.58%
10.09%
9.14%
5.76%
6.48%
loofbos naaldbos unclassified Totaal
32.44% 100.00%
100.00%
Tabel 1, percentage oppervlakte per vegetatieklasse van classificatie 203 en 204
Hierin is te zien dat het percentage zand en gras in verhouding het meeste is afgenomen. De percentages laagstruweel en loofbos zijn ook afgenomen, maar in mindere mate. Een zeer aanzienlijke toename, van 9,89% naar 16,58%, is te vinden in het hoogstruweel. De hoeveelheid naaldbos is slechts licht toegenomen. De afname van de hoeveelheid loofbos van 10,09% naar 9,14% kan niet verklaard worden door natuurlijke processen in het gebied en er heeft ook geen menselijk ingrijpen plaatsgevonden. De afname is kleiner dan één procent en zou ook een gevolg kunnen zijn van de classificatiemethode. Om de invloed in te kunnen schatten die het gevolg is van de gebruikte classificatie methode, is er van elk jaar nog een classificatie uitgevoerd met andere test- en trainingsmasks. Dit zijn classificatie 205 en 206, waarvan de accuracy respectievelijk op 0.772 en 0.851 liggen. De resultaten hiervan zijn opgenomen in onderstaande tabel.
21
Vegetatietype
Percentage in 2001
Percentage in 2006
(water)
36.21%
3.89%
(zand)
1.52%
1.31%
(gras)
12.46%
11.12%
laagstruweel
17.49%
21.00%
hoogstruweel
12.62%
14.32%
loofbos
16.14%
12.16%
naaldbos
3.56%
3.75%
unclassified
0.00%
32.44%
100.00%
100.00%
Totaal
Tabel 2, percentage oppervlakte per vegetatieklasse bij classificatie 205 en 206
Hierin is ook te zien dat het percentage zand en gras afneemt, hoewel het minder is dan bij de vergelijking in tabel 1. Het percentage laagstruweel neemt juist toe, en de toename in het percentage hoogstruweel is veel minder. Het percentage loofbos neemt hier nog meer af dan in tabel 1. Naaldbos laat een lichte stijging zien. Behalve een vergelijking van twee verschillende jaren, kunnen we nu ook twee dezelfde jaren vergelijken. De verschillen hiertussen zijn zeker het gevolg van verschillen in de classificatiemethode omdat ze op basis van dezelfde foto gemaakt zijn. In 2001 is het percentage water ongeveer gelijk gebleven. De hoeveelheid zand is bij 205 relatief groter dan bij 203, maar met het kleine oppervlak zand gebeurt dat al bij een kleine absolute toename. Het verschil in percentage gras is ruim 2,5 procent, wat erg hoog is ten opzichte van de verandering van 2001 naar 2006. Laagstruweel laat een verschil van 3,2% zien, wat zelfs meer is dan de afname van 2001 naar 2006. Bij hoogstruweel is de verandering binnen 2001 minder extreem, maar zowel loof- als naaldbos laat een verandering binnen 2001 zien die groter is dan de veranderingen van 2001 naar 2006. Met name loofbos valt op doordat de eerste classificatie (tabel 1) een percentage van 10.09 laat zien en de tweede classificatie van dezelfde foto (tabel 2) een percentage van 16,14. De accuracy van beide classificaties (204 en 206) van 2006 zijn hoger, dus er mag verwacht worden dat hier de verschillen binnen hetzelfde jaar kleiner zijn. Zand blijkt echter met 0,78% en 1,31% juist verder uit elkaar te liggen dan in 2001. Het verschil bij gras is minder dan 1%, wat niet zoveel is op de totale (ongeveer) 12%.
22
Hoogstruweel, loofbos en naaldbos laten weer grote verschillen zien. Van de laatste drie springt naaldbos er duidelijk uit met een verschil van 2,73% tussen 204 en 206. Vanwege het kleine aantal classificaties, zijn deze cijfers nog niet het bewijs voor enorme structurele verschillen als gevolg van de gebruikte masks. Als er nog meer classificaties van hetzelfde jaar bekend zijn, dan zou er echter wellicht geconcludeerd kunnen worden dat de standaarddeviatie tussen verschillende classificaties van hetzelfde jaar groter is dan de verschillen die hier tussen de jaren 2001 en 2006 te vinden zijn. Dat het toch, als je de luchtfoto bekijkt, lijkt dat de vegetatie in het onderzoeksgebied aan successie onderhevig is, geeft aan dat de classificatiemethode zoals die hier gebruikt is nog niet van voldoende kwaliteit is. Hier wordt in de discussie nog op terug gekomen. Veranderingen in het aantal segmenten per vegetatie-structuurtype Naast de hoeveelheid vierkante meters is ook het aantal segmenten per vegetatietype hier opgenomen. De foto’s die hiervoor gebruikt zijn hadden dezelfde eigenschappen (onder andere pixelgrootte) maar het is niet bekend of er bewerkingen aan gedaan zijn die van invloed kunnen zijn op de segmentatie. Doordat de segmentatieparameters hetzelfde zijn gebleven representeert het totale aantal segmenten de grilligheid van de vegetatie voor zover die in de luchtfoto’s wordt gerepresenteerd. De foto van 2001 is in 3245 segmenten opgedeeld, terwijl de foto van 2006 in 2075 segmenten is opgedeeld. Deze afname met ruim 36% is een indicatie voor het feit dat de vegetatie in 2006 homogener van karakter is geworden. Vegetatietype
2001
2006
Water
3.45%
5.59%
Zand
4.28%
6.84%
Gras
13.50%
14.02%
Laag struweel
18.34%
26.12%
Hoog struweel
25.27%
17.16%
Loofbos
28.69%
20.24%
Naaldbos
6.47%
8.82%
Unclassified
0.00%
1.20%
100.00%
100.00%
Totaal
Tabel 3, percentage segmenten per vegetatieklasse bij classificatie 205 en 206
23
In tabel 3 staat het percentage segmenten per vegetatiestructuur-klasse weergegeven voor classificatie 205 en 206. De belangrijkste verschillen zijn de toename in segmenten bij laagstruweel en de afname bij hoogstruweel en loofbos. De verandering bij laagstruweel en loofbos komt ook terug in tabel 1 en 2 als verandering in oppervlak. De afname van het aantal segmenten hoogstruweel in combinatie met een toename in het oppervlak kan aangeven dat de gebieden hoogstruweel aaneen gegroeid zijn. Van classificatie 203 en 204 zijn de aantallen segmenten per klasse niet bekend. Beschrijving van de gemaakte kaarten Van de complete lijst resultaten, welke in bijlage 1 te vinden is, bestaat van elk resultaat ook een afbeelding (bijlage 4) waarin op de luchtfoto de klassen zijn aangegeven. In het begin van het onderzoek zijn deze afbeeldingen niet opgeslagen omdat in dat stadium alleen het verbeteren van de methode van belang was en dat is op basis van de accuracy gebeurd. In de tweede fase van het onderzoek, waarbij nogmaals een aantal classificaties is uitgevoerd, zijn de afbeeldingen wel gebruikt om de classificatie te beoordelen. De twee resultaten van classificatie 203 en 204 (respectievelijk 2001 en 2006) zijn hieronder weergegeven. In de bijlage is de afbeelding groter weergegeven, de cijfers van de oppervlaktes zijn in tabel 1 weergegeven. Tabel 4 is een legenda voor de figuren van de classificatie.
Figuur 8, afbeelding van classificatie 203 (links) en 204 (rechts)
24
Vegetatiestructuur-type
Kleur
Zand
Geel
Gras
Lichtgroen
Laagstruweel
Roze
Hoogstruweel
Paars
Loofbos
Donkergroen
Naaldbos
Bruin
Water
Blauw
Unclassified
Zwart
Tabel 4, legenda van de classificatie-afbeeldinen (figuur 1 en 2)
Op de afbeelding van 2001 is rechtsboven (noordoost) weinig verschil met 2006. Rondom het meertje zijn de grootste verschillen tussen de twee jaren. In 2001 is het grootste deel geclassificeerd als loofbos, terwijl dit in 2006 als hoogstruweel is geclassificeerd. Het laagstruweel ten oosten van het meertje in 2006 bestond in 2001 volgens deze classificatie uit hoogstruweel en bos. Vanaf het midden van de foto naar beneden toe is een sterk wisselende vegetatiestructuur, met in 2001 laagstruweel en duingrasland. In 2006 is met name de hoeveelheid duingrasland afgenomen en de hoeveelheid hoogstruweel toegenomen. Het “Eendenvlak” en “Pietjes Zwarteveld”(rechtsonder), dat in 2001 bestaat uit loof- en naaldbomen, afgewisseld met soms hoogstruweel en gras, is in 2006 veel homogener geclassificeerd met voornamelijk grote vlakken loof- en naaldbomen. Het oppervlak dat buiten het onderzoeksgebied valt is in 2001 als water geclassificeerd en in 2006 als “unclassified”. Met de classificatie in het veld vergeleken, lijkt het noorden in 2001 op basis van de luchtfoto te boomrijk geclassificeerd te zijn. Het zuiden laat juist in 2006 wel erg veel naaldbomen zien. Het gevolg is dat de totale oppervlakte loofbomen iets afneemt, terwijl de hoeveelheid in het zuiden juist is toegenomen. Als in 2001 in het noorden de vegetatie (onterecht) als loofbomen is geclassificeerd, en dit in 2006 als hoogstruweel is geclassificeerd dan lijkt het volgens de cijfers onterecht alsof de hoeveelheid struweel is toegenomen. Een kaart van alleen het hoogstruweel in 2001 en 2006 is te vinden in bijlage 5. Hierop lijkt het hoogstruweel heel erg te zijn
25
uitgebreid, maar een deel van het hoogstruweel in 2006 was in 2001 gewoon als loofbos geclassificeerd. Omdat een tweede vergelijking tussen 2001 en 2006 de ontwikkeling duidelijk zou kunnen maken, is deze hieronder opgenomen (afbeelding 2). Het zijn de resultaten die het gevolg zijn van classificatie 205 en 206. De cijfers van de oppervlaktes zijn dus in tabel 2 te vinden. Helaas zijn de afbeeldingen van 205 en 206 niet helemaal vergelijkbaar. Bij 205 (jaar 2001) staat een klein deel in het westen niet op de kaart, en van 206 (jaar 2006) wijken de kleuren enigszins af van de andere classificaties.
Figuur 9, afbeelding van classificatie 205 (links) en 206 (rechts)
Als eerste valt weer op dat de vegetatie in 2006 veel homogener verspreid is dan in 2001. Het laagstruweel in het noorden in 2006 bestond in 2001 volgens de classificatie nog uit hoog- en laagstruweel. De bomen rondom het meertje in 2001 zijn in 2006 weer als hoogstruweel geclassificeerd. In de zuidelijke helft zit het verschil vooral in de rand van het bosgebied “Pietjes Zwarteveld”. Een aanzienlijk deel van de segmenten die in 2006 als hoogstruweel zijn geclassificeerd, zijn in 2001 als loofbos geclassificeerd. In 2006 is daar ook een groot deel als naaldbos geclassificeerd dat in 2001 nog als hoogstruweel of loofbos werd aangemerkt. In 2001 zijn zelfs twee vlakken water als bos geclassificeerd, dit is op de figuur in de bijlage beter te zien.
Bij het analyseren van deze classificaties valt op dat de veranderingen in 2006 ten opzichte van 2001 niet allemaal het gevolg kunnen zijn van natuurlijke processen, en 26
in veel gevallen is er al helemaal geen sprake van successie. Omdat er in het gebied door de beheerder nauwelijks is ingegrepen en ook op de ruwe luchtfoto’s geen sprake lijkt te zijn van een teruggang in vegetatie, is de verandering toe te schrijven aan de methode waarmee geclassificeerd wordt. Daarom zou naar aanleiding van deze resultaten een aanpassing van de methode een volgende stap moeten zijn. Vanwege de beperkte omvang van dit onderzoek is dit niet gebeurd. In de conclusie wordt daarom ingegaan op de resultaten tot zover, welke de basis kunnen vormen voor verder onderzoek. Kartering van een terreindeel dat binnenkort in begrazing wordt genomen In bijlage 6 is een kaart van het onderzoeksgebied te vinden, welke ook digitaal als ArcGIS bestand is toegevoegd. Deze kaart komt voor het grootste deel overeen met de afbeelding van classificatie 204. De belangrijkste afwijking van de classificatie in het veld betreft de hoeveelheid naaldbos. In het veld is hier minder van aangetroffen dan deze classificatie laat zien. Verder is het gebied dat als laagstruweel is geclassificeerd in werkelijkheid meer een afwisseling van laagstruweel en vergrast duingrasland zoals in figuur 3 te zien was.
Figuur 10, De vegetatiekaart van het onderzoeksgebied over de luchtfoto heen
27
Conclusie
Gedurende het onderzoek zijn er veel veranderingen in de methode uitgeprobeerd om de mogelijkheden van de software te kunnen beoordelen. Dit was een van de belangrijkste acties om de onderzoeksvragen te kunnen beantwoorden. Terugkijkend naar de deelvragen van dit onderzoek, kunnen de volgende deelconclusies worden getrokken.
Voor de kartering van de verstruweling in de AWD vormen de luchtfoto’s de belangrijkste basis. Naast de fotobestanden zelf, is inzicht in de productie van de bestanden zeer waardevol om de foto’s op de juiste manier te kunnen bewerken en te analyseren. In het bijzonder kennis van de manier waarop de spectrale eigenschappen van een gebied worden opgeslagen in een fotobestand en welke bewerkingen hieraan vooraf gaan is belangrijk omdat deze spectrale eigenschappen gebruikt worden bij het indelen van de vegetatie in klassen. Naast de luchtfoto’s zijn veldwaarnemingen van belang om de informatie op de foto te kunnen interpreteren en is de kennis van het beheer in een gebied belangrijk om natuurlijke- en antropogene processen te kunnen onderscheiden. Beter inzicht in de andere gebruikte software had in dit onderzoek veel tijd kunnen sparen, bijvoorbeeld bij het “uitknippen” van het onderzoeksgebied uit de luchtfoto. Met behulp van Definiens Developer kunnen gebieden die qua spectrale eigenschappen op elkaar lijken bij elkaar worden ingedeeld in segmenten waarna deze in klassen kunnen worden ingedeeld. De eigenschappen op basis waarvan de segmenten worden ingedeeld kunnen per klasse worden uitgekozen. Indien dit bestaat, zou literatuur over een vergelijkbaar onderwerp al richting kunnen geven aan de indelingscriteria omdat de lijst met mogelijke kenmerken waarop een gebied te onderscheiden is erg groot is. Bovendien kunnen sommige eigenschappen elkaar versterken dus zouden ook combinaties van eigenschappen bekeken moeten worden. Het is ook mogelijk om door Definiens Developer de beste features en combinaties uit te laten zoeken. Het programma gaat met de “Feature Space Optimazation” zelf opzoek naar de eigenschappen die de klassen het beste onderscheiden, maar hiermee worden niet de features gevonden die op alle foto’s de beste accuracy geven. Met deze functie is dit onderzoek geen ervaring op gedaan.
28
In tegenstelling tot wat in het begin van het onderzoek werd aangenomen, is kennis van de spectrale eigenschappen van elke klasse niet direct van belang voor de classificatie. Vanwege de rekensnelheid is ervoor gekozen om deze eigenschappen buiten beeld te houden, wat er voor gezorgd heeft dat er geen kennis is opgedaan over de eigenschappen van elke klasse. Om in de toekomst de classificaties van meerdere jaren beter vergelijkbaar te kunnen maken, kan het classificeren op basis van (de waarde van) eigenschappen in de toekomst wellicht een belangrijke methode zijn. Hiervoor moeten verschillende luchtopnames de werkelijkheid wel allemaal hetzelfde weergeven. Met behulp van de spectrale eigenschappen van een vegetatieklasse kan het ook makkelijker zijn om representatieve samples uit te kiezen waarmee de classificatie gedaan kan worden.
Figuur 11, Duindoorn gaat achteraan over in Amerikaanse vogelkers
Met behulp van Definiens Developer zijn de luchtfoto’s van 2001 en 2006 geclassificeerd. Uit de verschillen hiertussen (met name tussen de struweeloppervlaktes) kan de verstruweling in de AWD worden gekwantificeerd. Een voorwaarde hiervoor is wel dat de classificatie klopt, en een nadeel is dat de getallen in dit onderzoek alleen maar over het gehele gebied gingen en niet over delen van het gebied voorhanden zijn. Een grafische weergave in de vorm van een kaart maakt een snelle interpretatie van de vegetatieontwikkeling mogelijk.
Uit de deelconclusies volgt ook de hoofdconclusie, welke gezien kan worden als antwoord op de in inleiding gestelde hoofdvraag: “Op welke wijze kan de
29
verstruweling van het Middenveld in de Amsterdamse Waterleidingduinen het beste worden gemonitord met behulp van luchtopnamen en het programma Definiens Developer.” Het belangrijkste antwoord dat hierop te geven is, is dat dit onderzoek te weinig tijd geeft om hier volledig antwoord op te geven. De snelste methode om de verstruweling te monitoren is een handmatige kartering aan de hand van luchtfoto’s van het gebied. Definiens Developer kan hierbij gebruikt worden voor de segmentatie, en daarna kunnen de segmenten handmatig in klassen worden ingedeeld. Een meer algemene conclusie is dat het programma Definiens Developer vele mogelijkheden biedt voor kartering. Door deze grote hoeveelheid mogelijkheden is er meer onderzoek nodig om een goede methode vast te stellen maar er lijken tegelijkertijd goede mogelijkheden te zijn om dit programma in de toekomst wel te kunnen gebruiken voor een (geautomatiseerde) kartering, ook van grotere gebieden. De bevindingen in dit onderzoek kunnen daarbij helpen de mogelijkheden en beperkingen van het programma Definiens Developer verder te onderzoeken en in te schatten.
30
Discussie Bij een onderzoek naar een onderwerp waar vooraf nog maar weinig in de literatuur over te vinden is, is het moeilijk om het onderzoek direct doelmatig op te zetten. Dit heeft tot gevolg dat de efficiëntie van het onderzoek, met name in het begin, niet altijd het gewenste niveau heeft gehad. Er is veel tijd besteed aan het leren werken met het programma Definiens Developer, maar meer nog aan het leren gebruiken van de juiste functies en parameters hierin. Inhoudelijk is het ook nog niet gelukt om het programma naar alle tevredenheid in te zetten voor het classificeren van de vegetatie. Het zou na het handmatig indelen van de segmenten in een klasse mogelijk moeten zijn om de analyse die het programma maakt over de features uit te lezen. Deze waardes zou je dan vervolgens kunnen gebruiken om de classificatie te beoordelen. Bovendien zou je dan de foto van 2001 en 2006 op basis van dezelfde waardes (van de eigenschappen) kunnen classificeren. Het is hiervoor wel noodzakelijk dat eigenschappen die in werkelijkheid gelijk zijn ook op verschillende foto’s een gelijke waarde hebben. Dit lijkt in praktijk niet het geval te zijn. Zowel foto’s van verschillende jaren als naast elkaar liggende foto’s van hetzelfde jaar laten met elkaar vergeleken verschillen zien waar de werkelijkheid vrijwel zeker hetzelfde is. Als nu het geclassificeerde gebied niet op één foto staat zou de indeling anders kunnen zijn dan wanneer dit wel op één foto staat. In het veld is tijdens dit onderzoek vastgesteld dat het mogelijk is om op basis van de luchtfoto’s met de hand de vegetatie in klassen in te delen. Dit gehele onderzoek gaat er van uit dat deze indeling helemaal goed is. Hier kunnen echter ook interpretatiefouten in zitten. Zeker nadat de onderverdeling van struweel in hoog- en laagstruweel is gemaakt, is de kans op interpretatiefouten groter.
Er is al een enkel experiment uitgevoerd waarbij meerdere malen een classificatie is gedaan met dezelfde voorbeeldsegmenten. Ook de accuracy is vervolgens meerdere malen bepaald, elke keer met hetzelfde test-mask. Door het vergelijken van meerdere accuracy waardes wordt duidelijk dat de accuracy zelf ook niet altijd betrouwbaar is. De KIA is ook een maat om aan te geven hoe betrouwbaar de accuracy waarde is. Per classificatie zijn steeds twee accuracy assessments uitgevoerd. De error matrix van het accuracy assessment is steeds berekend op basis van de TTAmask én op basis
31
van samples (die gemaakt zijn van hetzelfde TTAmask met de functie “create samples from TTAmask”). Hoe het komt dat de error matrix die het accuracy assessment geeft verschillend is, is niet duidelijk.
De accuracy is nu afhankelijk van twee TTAmasks. Eerst is er een classificatie opgezet met een mask, en vervolgens wordt deze beoordeeld met een ander mask. Er is geprobeerd om segmenten niet in beide masks in te delen, maar dit kan soms toch per ongeluk gebeurd zijn. Na het indelen wordt de accuracy bepaald. Dit heeft tot gevolg dat de gekozen mask twee keer van invloed is op de totale betrouwbaarheid van de accuracy. Deze methode is hierdoor erg afhankelijk van de keuze die wordt gemaakt door de persoon die de mask maakt. Door willekeurig (dus geautomatiseerd) een vast aantal punten per klasse aan te wijzen zou de methode minder afhankelijk worden van menselijke keuzes. Bovendien zit er altijd een aantal “twijfelgevallen” bij de segmenten. Dit zijn segmenten die eigenlijk uit meerdere vegetatiestructuren bestaan waarvan er niet een type aangewezen kan worden als dominant. Als dit segment meerdere malen met de hand zou moeten worden ingedeeld zou het mogelijk zijn dat er steeds een andere keuze wordt gemaakt. Ook wanneer de classificatie dus geheel met de hand zou gebeuren zou de accuracy niet op 100% liggen.
Verdere aanbevelingen In dit onderzoek is veel tijd besteed aan problemen die het gevolg waren van het feit dat er nog maar weinig onderzoek is gedaan (of gepubliceerd) aan kartering met behulp van Definiens Developer. Na dit onderzoek kunnen uit de problemen en oplossingen die zijn ondervonden aanbevelingen worden gedaan voor vervolg(deel)onderzoek, waardoor volgende onderzoeken sneller of beter resultaat kunnen krijgen. -
De luchtfoto’s van hetzelfde jaar en van verschillende jaren waren nu niet altijd vergelijkbaar. Als er luchtfoto’s gebruikt zouden worden die wel vergelijkbaar zijn, kan uitgesloten worden dat dit een bron van fouten is. Het is wel belangrijk dat de bewerkingen die gedaan zijn om de foto’s vergelijkbaar te maken, geen invloed hebben op de eigenschappen van de foto’s.
32
-
Vanwege de grootte van de bestanden die gebruikt worden, is de rekentijd voor de computer vaak erg lang. Een snellere computer, of een computercluster, zal de rekentijd kunnen verkleinen. Bovendien zou het daardoor mogelijk zijn om te werken met kleinere segmenten, waardoor de classificatie nauwkeuriger zou kunnen worden. Het kiezen voor een hogere segmentatieparameter om een acceptabele rekentijd te verkrijgen, is in dit onderzoek gedeeltelijk ten koste gegaan van de precisie van de segmentatie.
-
Het is gebleken dat de oppervlakte per klasse sterk afhangt van de nauwkeurigheid van de classificatie. Het zou goed zijn om onderscheid te kunnen maken in oppervlaktevariatie als gevolg van de nauwkeurigheid van de classificatie en als gevolg van veranderingen in de luchtfoto’s (en dus werkelijkheid). Wellicht is er een relatief eenvoudige statistische toets te vinden die het mogelijk maakt classificaties met elkaar te vergelijken waardoor kan worden vastgesteld of de werkelijkheid significant is veranderd.
-
De segmentatie moet nog verbeterd worden, zodat er slechts één vegetatietype in elk segment zit.
-
De werking van “Feature space optimazation” zou verder onderzocht kunnen worden, zodat deze gebruikt kan worden voor het vinden van de juiste features. Het is wel belangrijk om ook de werking te begrijpen als deze functie gebruikt gaat worden zodat de resultaten correct geïnterpreteerd worden.
-
Bij onderzoek naar onderscheidende features van een vegetatiestructuur is het vooral waardevol als deze features algemeen gelden en niet alleen voor het onderzochte gebied. Dan kunnen de uitkomsten van zo een onderzoek ook gebruikt worden om luchtopnames van verschillende tijdstippen en plaatsen te vergelijken.
-
Het uitzoeken en aanwijzen van trainings en testsamples gebeurt nu met de hand. Als het mogelijk is om een manier te ontwikkelen/gebruiken om de segmenten die in een mask worden gebruikt willekeurig te kiezen, kan de betrouwbaarheid van de accuracy toenemen.
33
Literatuur Boeken
Gemeentewaterleidingen Amsterdam, 2001, Struinen in de toekomst (beheersvisie voor de Amsterdamse Waterleidingduinen 2001-2010), Geelen, L. (red.), Stadsdrukkerij Amsterdam
Haaf, M.ten, Classificeren van duinvegetatie m.b.v. Ecognition, Universiteit Utrecht
Koeman, S., 2005 Classificatie van digitale infrarood luchtfoto’s van door PWN beheerde duingebieden met de extensie DICRANUM, Universiteit Utrecht
Nol, L., 2003 Classificatie van open zand tussen Bergen en Egmond d.m.v. luchtfoto’s uit verschillende jaren, Universiteit van Amsterdam,
Internet Widayati, A., Verbist, B., Meijerink, A., Application of combined pixel-bases and spatial-based approaches for improved mixed vegetation classification using ikonos, http://www.itc.nl/library/Papers/MEIJERINK.application.ACRS.2002.pdf University of South Carolina, Remote sensing core curriculum http://www.cas.sc.edu/geog/rslab/rscc/mod8/exercises/CROSSCLASS.HTM
34
Inhoudsopgave bijlagen Bijlage 1 Uitgevoerde classificaties
b-1
Bijlage 2 Gebruikte masks
b-2
Bijlage 3 Vegetatieoppervlaktes
b-3
Bijlage 4 Afbeelding classificaties 201 t/m 210
b-4
Bijlage 5 Afbeelding hoogstruweel 2001-2006
b-11
Bijlage 6 Vegetatiekaart 2006
b-12
35