From 3973685e1deaf49e3a3a2736378f175dba70d7c9 Mon Sep 17 00:00:00 2001 From: hansvancalster Date: Wed, 18 Sep 2024 10:55:11 +0200 Subject: [PATCH] restructure --- .../{02_methoden.Rmd => 02_review.Rmd} | 58 +---------------- source/validatie/03_methoden.Rmd | 62 +++++++++++++++++++ .../{03_resultaten.Rmd => 04_resultaten.Rmd} | 0 .../{04_discussie.Rmd => 05_discussie.Rmd} | 0 4 files changed, 63 insertions(+), 57 deletions(-) rename source/validatie/{02_methoden.Rmd => 02_review.Rmd} (88%) create mode 100644 source/validatie/03_methoden.Rmd rename source/validatie/{03_resultaten.Rmd => 04_resultaten.Rmd} (100%) rename source/validatie/{04_discussie.Rmd => 05_discussie.Rmd} (100%) diff --git a/source/validatie/02_methoden.Rmd b/source/validatie/02_review.Rmd similarity index 88% rename from source/validatie/02_methoden.Rmd rename to source/validatie/02_review.Rmd index 90531af..2d02e05 100644 --- a/source/validatie/02_methoden.Rmd +++ b/source/validatie/02_review.Rmd @@ -2,7 +2,7 @@ bibliography: [references.yaml, references.bib] --- -# Materiaal en methoden +# Achtergrond ## Typologie van landgebruik @@ -164,10 +164,6 @@ De 14 klassen van niveau I zijn: 14. Coastal water bodies and inter-tidal areas -### Huidige aanpak - -TODO - ## Validatie ecosysteemkaarten Vlaanderen NARA 2020 ### Aanpak @@ -399,55 +395,3 @@ validatie landgebruiksveranderingen nara 2020 https://docs.google.com/document/d/1pOCGKCxiS4v1tsW6IqMUpdruOVhmwf8heuL98msDLs4/edit#heading=h.yylq3n3tvbtn --> ``` -## Steekproefontwerp - -- ecosysteemkaart - - bereken mode klasse in blok - - dit geeft stratificatie per klasse - - eventueel strata samenvoegen - - binnen elk stratum ruimtelijk gebalanceerde steekproef van $n$ clusters (= blok van pixels = primary sampling unit of PSU) - - binnen elk blok (PSU) wordt elk van $M$ secundary sampling units (SSU) bekeken (= pixels) - -In @cochran1977 vinden we de formule om te bepalen wat het effect van de grootte van een cluster is bij cluster sampling voor het schatten van een proportie: - -```{=tex} -\begin{align*} -\text{total sum of squares} &= \text{within sum of squares} + \text{between sum of squares}\\ -NMP(1-P) &= M\sum_{i=1}^n{(p_i - P)^2} + Mp_i(1-p_i) -\end{align*} -``` -Deze relatie kan gebruikt worden om de verschillende variantiecomponenten in functie van de clustergrootte $M$ te berekenen. -Hiermee kan dan gekeken worden of er een optimale clustergrootte is in termen van enkel variantie (kosten zijn hier nog buiten beschouwing). - -## Response design - -### Definitie ecosystemen - -### Keuze steekproefeenheid - -- Primaire steekproefeenheid (PSU): vierkante polygoon (blok) met afmeting $\sqrt{n_2}*\sqrt{n_2}$ pixels (bijvoorbeeld 9 x 9 pixels) -- Secundaire steekproefeenheid (SSU): pixel 10 m x 10 m - -maar in de praktijk gaan we als volgt te werk: - -- blok van $\sqrt{n_2}*\sqrt{n_2} = n_2$ pixels -- volledige blok wordt gedigitaliseerd (opgedeeld in polygonen en aan elke polygoon wordt een primair label toegekend en een alternatief label) -- deze polygoonkaart van het blok wordt verrasterd en deze verrastering levert ons de referentiewaarde voor elke pixel binnen een blok - -### Gebruikte referentiedata - -Wat de **resolutie van de orthofoto's** betreft, de middenschalige foto's van 2023 hebben een resolutie van 15 cm. -In het jaar 2000 was dat nog 1 m. -Het zou dus wel kunnen dat voor de periode 2013 tot 2022 er was evolutie zit op die resolutie, en dat foto's voor het valideren van een ecosysteemkaart van 2013, minder nauwkeurig zijn dan die voor 2022. - -## Analyse - -Omwille van het complexere steekproefontwerp (afweging precisie en kostenefficiƫntie) zullen de standaard formules opgegeven in @olofsson2014 enkel gelden op niveau van de PSU's. -Met dit steekproefontwerp hebben we achteraf nog de flexibiliteit om accuraatheid en oppervlakteschattingen voor verschillende scenario's te berekenen. -Stel bijvoorbeeld dat we als PSU een blok nemen van 9 x 9 pixels: - -- bepalen van label op niveau van PSU voor referentiedata en kaart en vervolgens verwerken volgens formules in @olofsson2014 - - hoe het label bepaald wordt, moeten we vastleggen in regels (bv volgens een meerderheidsregel of een binaire classificatie) -- bepalen van label op deel van de PSU, bv de centrale 3 x 3 blok van pixels en vervolgens identiek verwerken -- alle informatie gebruiken (van alle pixels) en dus validatie op pixelniveau; in dat geval wellicht formules uit de model-assisted survey sampling literatuur en/of schatters voor cluster sampling nodig om de analyse te doen. - - ook hier kan nog een regel nodig zijn voor toekenning van labels in de referentiedata in geval een polygoon een pixel doorsnijdt diff --git a/source/validatie/03_methoden.Rmd b/source/validatie/03_methoden.Rmd new file mode 100644 index 0000000..71a5910 --- /dev/null +++ b/source/validatie/03_methoden.Rmd @@ -0,0 +1,62 @@ +--- +bibliography: [references.yaml, references.bib] +--- + +# Materiaal en methoden + +## Typologie van landgebruik + +TODO + +## Steekproefontwerp + +- ecosysteemkaart + - bereken mode klasse in blok + - dit geeft stratificatie per klasse + - eventueel strata samenvoegen + - binnen elk stratum ruimtelijk gebalanceerde steekproef van $n$ clusters (= blok van pixels = primary sampling unit of PSU) + - binnen elk blok (PSU) wordt elk van $M$ secundary sampling units (SSU) bekeken (= pixels) + +In @cochran1977 vinden we de formule om te bepalen wat het effect van de grootte van een cluster is bij cluster sampling voor het schatten van een proportie: + +```{=tex} +\begin{align*} +\text{total sum of squares} &= \text{within sum of squares} + \text{between sum of squares}\\ +NMP(1-P) &= M\sum_{i=1}^n{(p_i - P)^2} + Mp_i(1-p_i) +\end{align*} +``` +Deze relatie kan gebruikt worden om de verschillende variantiecomponenten in functie van de clustergrootte $M$ te berekenen. +Hiermee kan dan gekeken worden of er een optimale clustergrootte is in termen van enkel variantie (kosten zijn hier nog buiten beschouwing). + +## Response design + +### Definitie ecosystemen + +### Keuze steekproefeenheid + +- Primaire steekproefeenheid (PSU): vierkante polygoon (blok) met afmeting $\sqrt{n_2}*\sqrt{n_2}$ pixels (bijvoorbeeld 9 x 9 pixels) +- Secundaire steekproefeenheid (SSU): pixel 10 m x 10 m + +maar in de praktijk gaan we als volgt te werk: + +- blok van $\sqrt{n_2}*\sqrt{n_2} = n_2$ pixels +- volledige blok wordt gedigitaliseerd (opgedeeld in polygonen en aan elke polygoon wordt een primair label toegekend en een alternatief label) +- deze polygoonkaart van het blok wordt verrasterd en deze verrastering levert ons de referentiewaarde voor elke pixel binnen een blok + +### Gebruikte referentiedata + +Wat de **resolutie van de orthofoto's** betreft, de middenschalige foto's van 2023 hebben een resolutie van 15 cm. +In het jaar 2000 was dat nog 1 m. +Het zou dus wel kunnen dat voor de periode 2013 tot 2022 er was evolutie zit op die resolutie, en dat foto's voor het valideren van een ecosysteemkaart van 2013, minder nauwkeurig zijn dan die voor 2022. + +## Analyse + +Omwille van het complexere steekproefontwerp (afweging precisie en kostenefficiƫntie) zullen de standaard formules opgegeven in @olofsson2014 enkel gelden op niveau van de PSU's. +Met dit steekproefontwerp hebben we achteraf nog de flexibiliteit om accuraatheid en oppervlakteschattingen voor verschillende scenario's te berekenen. +Stel bijvoorbeeld dat we als PSU een blok nemen van 9 x 9 pixels: + +- bepalen van label op niveau van PSU voor referentiedata en kaart en vervolgens verwerken volgens formules in @olofsson2014 + - hoe het label bepaald wordt, moeten we vastleggen in regels (bv volgens een meerderheidsregel of een binaire classificatie) +- bepalen van label op deel van de PSU, bv de centrale 3 x 3 blok van pixels en vervolgens identiek verwerken +- alle informatie gebruiken (van alle pixels) en dus validatie op pixelniveau; in dat geval wellicht formules uit de model-assisted survey sampling literatuur en/of schatters voor cluster sampling nodig om de analyse te doen. + - ook hier kan nog een regel nodig zijn voor toekenning van labels in de referentiedata in geval een polygoon een pixel doorsnijdt diff --git a/source/validatie/03_resultaten.Rmd b/source/validatie/04_resultaten.Rmd similarity index 100% rename from source/validatie/03_resultaten.Rmd rename to source/validatie/04_resultaten.Rmd diff --git a/source/validatie/04_discussie.Rmd b/source/validatie/05_discussie.Rmd similarity index 100% rename from source/validatie/04_discussie.Rmd rename to source/validatie/05_discussie.Rmd