Erfdienstbaarhedenproject Arjen Santema en Gert Meijerink
Platform voor ICT professionals
Erfdienstbaarheden
•Mag ik hier langs? •Moet ik mijn buren toelaten op dit pad?
Wat zijn erfdienstbaarheden
•
"Een erfdienstbaarheid is een last, waarmede een onroerende zaak het dienende erf ten behoeve van een andere onroerende zaak het heersend erf is bezwaard“, bijvoorbeeld ‘recht van overpad’.
•
Het project ‘actualiseren en ontsluiten van erfdienstbaarheden’ heeft tot doel de erfdienstbaarheden op te nemen in de kadastrale registratie.
•
Daarvoor worden 15.000.000 akten vanaf 1950 doorgelezen op het voorkomen van erfdienstbaarheden.
Wat doen we
Met tekstherkenning zoeken naar Alle akten vanaf erfdienstbaarheden Controleren van de gevonden 1950 dititaliseren erfdienstbaarheden Kijken op welk perceel de erfdienstbaarheid nu rust
Digitaliseren akten
Gescande akten opslaan
Microfilms zoeken
Scannen met een ‘reader-scanner’
Wat doen we
Met tekstherkenning zoeken naar Alle akten vanaf erfdienstbaarheden Controleren van de gevonden 1950 dititaliseren erfdienstbaarheden Kijken op welk perceel de erfdienstbaarheid nu rust
Productiestraat Xtherkenning
Productiestraat Xtherkenning Unknown scans scans scans
Bevat erfdienstbaarheden
Tiff image XML bestand
Bevat geen erfdienstbaarheden
OCR Nuance
Tekstherkenning
ABBYY
Textkernel
Iris
Autonomy
Resultaten eerste PoC 3634 akten Wel erfdienstbaarheden
1132 (31%)
13
4
Autonomy
Textkernel 832 1300
1719 2502 (69%) Geen erfdienstbaarheden Textkernel
Autonomy
Overeenstemming
complementair
Aantal gevonden akten
35,8%
47,3%
22.9%
60,2%
Valse negatieven
0,3%
0,8%
<0,3%
03%-0,8%
Kwaliteitspercentage
99,7%
99,2%
>99,7%
99,2%-99,7%
Wat doen we
Met tekstherkenning zoeken naar Alle akten vanaf erfdienstbaarheden Controleren van de gevonden 1950 dititaliseren erfdienstbaarheden Kijken op welk perceel de erfdienstbaarheid nu rust
Lezen akten
Wat doen we
Met tekstherkenning zoeken naar Alle akten vanaf erfdienstbaarheden Controleren van de gevonden 1950 dititaliseren erfdienstbaarheden Kijken op welk perceel de erfdienstbaarheid nu rust
Filiëren
? erfdienstbaarheid
Georefereren
Context
Via tussenstap georefereren
67 85
LWR01C 7779
67 84
6779 83
82
67
67 74
63
62
74 67 80
Hulpkaart geprojecteerd op kadastrale kaart
Rust op dit pad een erfdienstbaarheid?
Dat kunnen we straks opzoeken
1 Zoek perceel
2 Vind teksten
3 Vind locatie
Techniek Xtherkenning Gert Meijerink
Platform voor ICT professionals
• Activiteiten uitgevoerd voor de PoC – Inrichting van de Textkernel en Autonomy applicaties – Opbouwen van een spotlijst met termen en frases – Tunen van de systemen naar een kwaliteitspercentage van 99,5% – Werken aan de “false negatieven” om kwaliteit te verbeteren.
Aanpak Proof of Concept
Activiteiten
Issues: • Missende stukken tekst (bv. verkeerd belichte pagina’s) • Problemen met spatiering • Lage karakteraccuraatheid • Handschrift • Image kwaliteit optimalisatie
Aanpak Proof of Concept
OCR optimalisatie
• State-of-the-art OCR toolkits gebruikt en afzonderlijk de speelruimte bepaald. • Opmerkelijk: bij goede imagekwaliteit resultaat engines vergelijkbaar, echter bij slechte imagekwaliteit grote verschillen…
Aanpak Proof of Concept
OCR optimalisatie
Aanpak Proof of Concept
OCR voorbeelden
UNISYS
eerste versie:
. --. Reden, de erste-okteber . . . :.. . , . :.ter Barre Albert Grge,yah Nievelt,,notaris ter standplaats Rotterdam: } de heer . .
Kadaster XTherkenning - Proof of Concept
Aanpak Proof of Concept
OCR voorbeelden
na optimalisatie van parameters:
. . .. :.,::._ . Reden, de'.0erste-okteber . .,negentienhonderd,zes. en_zeventig_verschenen voor mij, Mees-,- : ' ^ - - - ' :,.. , , : ter lOrre Albert,Grge:van,.Nievelt,', notaris ter standgaats Rotterdam:---------------------------------------------------. . de,heer Neter paVinSpho1, tO end :kanprhedie, wpnde te " ." - - ...... , Rotterdam, ten,dege.handelende alsschriftelijk gevol..... , machtigde van mevrouw Evertje Etolle,:,directtice,,wonende teApeldoorn, PONC4AStliari de heer:Hendrik Ufkes,A,41 het geven -der volniaehthandelende in haar hoedanigheid: van enig directrice van e.te Apeldoorn geVestigde beslo*': ten vennootschap met.beperkteaansprakpiijkheid Maatschappij voorrBouwontwikkeling,en,noOwbegeleiding. Ufkes. B..V en:, 1 ,als zodanig die:heslotei) vennootschap ten. deze rechtsgel' , dig vertegenwoordigend ' :
Aanpak Proof of Concept
OCR voorbeelden
Andere engine output:
. . ~ ' .! %G�%@ '. . ' .; ,.... :": He [len ,de . dQ~' e(~:ste~l~ kto,~ber, , ~--_':'--:-';;--:"~;"-';;':"-%G�%@'--'::'';':''_~'- , nl~:";"'Cl tir;ll~hon~ en) zas cm" ':1cvcntic, V~~' ;;i:~I:t?J'jC!l . :V001' ,:Jij ,-":~~.- - " '. -:' .,. . . _. ' . I ~. ; ,. ..%G�%@ . I . . ": . , , _.. . . . .
Aanpak Proof of Concept
OCR voorbeelden
• Brute-force matching van frases voor OCR robuustheid • Definieren van features op – Positieve instanties – Negatieve instanties – OCR kwaliteit en compleetheid • Tuning beslissings-tresholds • OCR kwaliteit (compleetheid) is van grote invloed
Aanpak Proof of Concept
Trainen intelligente conceptherkenning
Aanpak Proof of Concept
Trainen intelligente herkenning
Functioneel overzicht Database
Aanleveren Images
No manual proces
Optimal OCR result
Manual proces
Data Entry With help from application
Processing platform (hosting)