OP EN IN HET WEB
Hoe de toegankelijkheid van juridische informatie kan worden verbeterd Marc van Opijnen Kennis- en Exploitatiecentrum Officiële Overheidspublicaties
14 mei 2014 KNVI-JI, Den Haag
[email protected]
CV 1990
Doctoraal Nederlands/internationaal recht RuG
1995-2000
Raad voor Rechtsbijstand Arnhem
2000-2010
Bureau Internetsystemen en –Toepassingen Rechterlijke Organisatie (Bistro)
2011-2013
Spir-it
2013-
Kennis- en Exploitatiecentrum Officiële Overheidspublicaties (KOOP)
2007-2014
Doctoraat UvA
2004-
EU-Raadswerkgroep e-law/e-justice.
3
Onderwerpen • Publicatie van rechterlijke uitspraken: juridisch kader en stand van zaken • Open, linked & big data • Identificatie: ECLI & ELI • Links: jurisprudentie, regelgeving & literatuur • Rekenen met het recht.
Juridisch kader • • • •
Openbaarheid van de uitspraak Verstrekking Toegankelijkheid Anonimisering.
De stand van zaken in Nederland • De geschiedenis van Rechtspraak.nl • Porta Iuris • Het beleid van de rechtspraak – In jaardocumenten – In vergelijking met tijdschriften – In vergelijking met zaaksafhandelingsgegevens
• Voldoet Nederland aan juridisch kader? • Ja, maar: – Uitspraken van het EHRM – Onherroepelijkheid van uitspraken is niet in beeld – Toegankelijkheid, in het bijzonder hanteerbaarheid kan beter.
Artikel 5 EU-Hergebruikrichtlijn
Open & linked data
Beschikbaar op het web onder open licentie Gestructureerde, machineleesbare data Non-proprietary formaten Voorzien van URIs om data te identificeren Gelinkt aan andere data. Standaarden nodig
U S A G E
User interfaces
Statistics and other advanced stuff
Special collections
Linked open data P R O D U C T I O N
Adding links > 5 star
Adding URIs > 4 star
Conversion > 3 star
5 star data
1/2 star data
Identificatie: ECLI • Eenduidige, unieke en persistente identificatie van rechterlijke uitspraken is noodzakelijk – Vindplaats – Triplet: instantienaam, zaaknummer, datum – Landelijk JurisprudentieNummer (LJN)
• European Case Law Identifier (ECLI): – ECLI:[land]:[gerecht]:[jaar]:[nummer] – Nationale implementatie – Europees portaal.
European Case Law Identifier
12
13
14
15
Introductie ECLI
• Hof van Justitie EU • Europees Hof voor de Rechten van de Mens
• Europees Patent Bureau • Europese Commissie & lidstaten: ECLI search interface. Gereed 2014-Q3.
27-3-2014
Data: open, linked & big
23
European Legislation Identifier
24
U S A G E
User interfaces
Statistics and other advanced stuff
Special collections
Linked open data P R O D U C T I O N
Adding links > 5 star
Adding URIs > 4 star
Conversion > 3 star
5 star data
1/2 star data
Linked data: contextualiteit • Juridische teksten bestaan uit woorden en verwijzingen • Die verwijzingen vormen een (semantisch) web van gerelateerde informatiecomponenten (linked data) • Maar op basis van die relaties is niet te zoeken – Geef mij alle uitspraken over artikel 5 van Verordening (EEG) nr. 1408/71 – Geef mij alle jurisprudentie en literatuur waarin deze uitspraak van de Hoge Raad wordt aangehaald.
Linked Data Overheid Jurisprudentie
Maken van links
Adviezen Commentaren Decentrale regelgeving Wetten
Zoek / gebruik links
Beleidsregels
Kamerstukken
Handboeken
Attenderen Voorlichting
Linkjes maken? • Probleem: (nog) geen standaard citeermethode. Voor uitspraken bijvoorbeeld: – – – – –
Tijdschrift-vindplaatsen ‘Tripletten’ LJN of ECLI Door elkaar, foutief gespeld, etcetera Technisch niet geëxpliciteerd (platte tekst)
• Oplossing: voed de auteurs op • Oplossing: menskracht • Oplossing: ‘link-extractors’.
Link-extractor voor jurisprudentie • Detecteren mogelijke onderdelen van citatie (m.b.v. reguliere expressies) – – – – –
LJN (ECLI) Datum Zaaknummer Vindplaatsen Gerechtsnamen
• Normaliseren • Canonicaliseren.
32
Link-extractor voor wetgeving
U S A G E
User interfaces
Statistics and other advanced stuff
Special collections
Linked open data P R O D U C T I O N
Adding links > 5 star
Adding URIs > 4 star
Conversion > 3 star
5 star data
1/2 star data
Cool apps for your tablet
U S A G E
User interfaces
Statistics and other advanced stuff
Special collections
Linked open data P R O D U C T I O N
Adding links > 5 star
Adding URIs > 4 star
Conversion > 3 star
5 star data
1/2 star data
Selectie en relevantie • Wat is een ‘representatieve selectie’? • Door ‘explosie’ van gepubliceerde uitspraken wordt ‘selectie’ van ‘input-probleem’ steeds meer ‘output-probleem’ • Relevantieprobleem uit de ‘information retrieval’.
Wat is ‘relevantie’? • Systeemrelevantie of algoritmische relevantie – Wat vindt de (tekstuele) zoekmachine passend?
• Onderwerpsrelevantie – Op basis van taxonomie
• Cognitieve relevantie of toepasbaarheid – Aansluitend op persoonlijke informatiebehoefte
• Situationele relevantie – Helpt het bij oplossen probleem?
• Domeinrelevantie – Belang dat domeinexperts aan informatie hechten.
Domeinrelevantie • 300.000 uitspraken op Rechtspraak.nl • Vele meer in interne databanken • Wat is belangrijk? Bagatelzaken vs. de canon van het recht • ‘Juridisch belang’ als zoek-/filtercriterium.
Meten juridisch belang • Beoordelingscommissie? – Arbeidsintensief – Continue actualisering – Onenigheid
• De hele crowd? – ‘Beoordelen’ is wat anders dan ‘liken’
• Model for Automated Rating of Case Law (MARC). Maakt o.m. gebruik van de impliciete oordelen van de juridische crowd, te vinden in linked data.
Regressie-analyse Predictors Geslacht
Regressor Aandoening X
Leeftijd
Eerdere ziektes
Bereken de kans op aandoening X, gegeven de waarde van de predictors
Omgevingsfactoren Algemene gesteldheid
Generalized lineair/nonlineair model.
Publicatieperiode
Transitieperiode
Citatieperiode
Karakter
Uitspraak ziet levenslicht
Studie en commentaar
Voortdurende roem of geleidelijke vergetelheid
Duur
Eén week
Drie maanden
Oneindig
Regressor
Publicatie m.u.v. Rechtspraak.nl
Gewogen gemiddelde van:
Citatie in rechtspraak en eenmalige literatuur in komende drie jaar
Predictors
• • •
• • Uitgaande jurisprudentiecitaties Uitgaande wetsverwijzingen
Lengte
•
Publicatie op Rechtspraak.nl
•
•
afhankelijk van dag in transitieperiode.
•
Publicatie (gewogen)
•
Annotatie (idem)
•
Citatie in continue literatuur (logaritmisch)
•
Citatie in eenmalige literatuur (idem + gew. voortschr. gem.)
•
Citatie in rechtspraak (idem)
•
Leeftijd
•
Gerechtstype
•
Rechtsgebied
Enkel- / meerv. kamer
•
•
MARC-publicatieperiode MARC-citatieperiode
Nieuwsbericht op website Gerechtstype
Rechtsgebied
Eenvoud • Waarden gaan van -0,4894170847 to 32,663963198 • Groeperen in vijf klassen: MARC-1 tot MARC-5 • Bepalen van de grenzen tussen de klassen hangt af van de inhoud van de database en is subjectief.
Vergelijking MARC-PP en MARC-CP Citatieperiod 1 2 3 4 5 Totaal
Publicatieperiode 1 2 3 71,1 3,9 0,0 0,0 0,0 75,0
0,1 11,1 4,8 0,5 0,0 16,5
0,0 0,9 4,8 0,7 0,1 6,5
4
5
Totaal
0,0 0,0 1,2 0,4 0,1 1,7
0,0 0,0 0,0 0,2 0,1 0,3
71,2 15,8 10,9 1,7 0,3 100,0
87,5% in zelfde klasse; 11,9% wijkt één klasse af; 0,6% twee klassen.
Hoe verder? • Een moeizame verhouding tussen de bètavakken en het recht • Aansluiting op nieuwe ontwikkelingen rond semantisch web, maar de juridische invalshoek is essentieel • Inspiratie voor meer onderzoek en nieuwe toepassingen.
Dank voor de aandacht