PASO- databeheerder 1.
Voorstelling van het team
Hoofpromotor: Naam: Functie: Instelling: Onderzoekseenheid: Contactadres:
Co-promotoren: Naam: Functie: Instelling: Onderzoekseenheid: Contactadres:
Naam: Functie: Instelling: Contactadres:
2.
Monique Ramioul Hoofd sector Arbeid en Organisatie Hoger Instituut voor de Arbeid, Katholieke Universiteit Leuven Sector Arbeid en Organisatie Naamsestraat 63 B-3000 Leuven Telefoonnummer: +32-16-32 43 63 Faxnummer: +32-16-32 43 54 E-mail:
[email protected]
prof. dr. Luc Sels Associate Professor in Human Resource Management Departement Toegepaste Economische Wetenschappen, Katholieke Universiteit Leuven Organization Studies Naamsestraat 69 B-3000 Leuven Telefoonnummer: +32-16-32 68 72 Faxnummer: +32-16-32 67 32 E-mail:
[email protected] prof. dr. Geert Van Hootegem associate professor Departement Sociologie, Katholieke Universiteit Leuven E. Van Evenstraat 2b B-3000 Leuven Telefoonnummer: +32-16-32 31 29 Faxnummer: +32-16-32 33 65 E-mail: geert.vanhootegem@ soc.kuleuven.ac.be
Probleemstelling
Reeds op basis van de eerste bevragingsgolf genereert de PASO enquête een zeer omvangrijk databestand. Dit bestand neemt vanzelfsprekend meer dan proportioneel toe in omvang en in complexiteit met elke volgende golf omdat het om een panelenquête gaat. Eén van de doelstellingen van het PASO onderzoek is overbevraging vermijden. Het is van belang het databestand zo ruim mogelijk ter beschikking te stellen van overheid en wetenschap om het analysepotentieel ervan maximaal te valoriseren en zo een doelmatige aanwending van de projectgelden te verzekeren. In het basiscontract van het
2
PASO-onderzoek is deze doelstelling weliswaar expliciet vermeld, er zijn echter geen voorzieningen getroffen om deze doelstelling ook daadwerkelijk waar te maken. Inmiddels zijn er tijdens de eerste golf, verschillende scenario’s uitgewerkt én ten dele in praktijk gebracht om dit vorm te geven: het gebruik van modules (was wel al voorzien in de basisopdracht), daarnaast zijn er ook vragen voor additionele analyseopdrachten, met of zonder rapportering voor het PASO team, en vragen van derden om zelf op het bestand te werken (zie www.paso.be “werken met de paso-data”). In bijlage 1 wordt het Pasoprotocol bijgevoegd dat een overzicht geeft van deze samenwerkingsverbanden. Omdat de enquête microgegevens bevat over vestigingen zijn bijzondere voorzorgen noodzakelijk om zowel de anonimiteit van de respondenten als de correctheid en objectiviteit van de wetenschappelijke analysemethoden bij gebruik door derden te verzekeren. Het KUL –promotorenteam moet daarom alle technische, organisatorische en juridische schikkingen treffen om maximale toegankelijkheid van de data voor overheid en wetenschap te combineren met een noodzakelijke en adequate ‘ zorg’ voor het bestand en de respondenten. Voorstellen van richtlijnen daarvoor zijn uitgewerkt in het PASO protocol (zie bijlage) en worden opgevolgd door een ad hoc werkgroep, samengesteld uit PASO en de Vlaamse adminisitratie (EAW en APS). Naast bestandsovereenkomsten en protocollen die deze samenwerkingsvormen ondersteunen (zoals vertrouwelijkheidsafspraken edm), is het echter ook noodzakelijk een ‘fysische’ omgeving te organiseren waar een correct en bruikbaar databestand met documentatie, ter beschikking staat van overheid en wetenschap. Binnen de reguliere PASO-onderzoeksfinanciering is momenteel voorzien in één wetenschappelijk medewerker voor het hele project. Deze basisfinanciering laat geenszins toe deze bijkomende taken ifv de toegankelijkheid op te nemen. Met ander woorden, voor de doelstelling ‘overbevraging vermijden’, geconcretiseerd in verschillende samenwerkingsverbanden, waaronder het degelijk ter beschikking stellen van de data voor niet-commerciële derden, zijn noch impliciete noch expliciete voorzieningen getroffen in de basisfinanciering van het project. De concretisering van deze opdracht is niet opgenomen in het basiscontract (behoudens het opnemen van door externen gemaakte modules) en de draagwijdte ervan kon niet vooraf worden ingeschat. Op dit moment zijn er bovendien nergens een kader of infrastuctuur, kortom mensen of middelen, ter beschikking die het PASO team daarin kunnen ondersteunen. Op de korte termijn is daarop ook geen perspectief. Bovendien is het, reeds van bij de eerste golf, noodzakelijk de omstandigheden te creëren en de basisvoorwaarden te verzekeren voor een optimale toegankelijkheid van het bestand. De voorgestelde ‘basisinvestering’ in de uitbouw van een degelijk databeheer is vanuit die optiek zinvol, zelfs al wordt deze opdracht later op een andere manier bestendigd. De (door de korte termijn alsnog beperkte) ervaringen van de eerste golf bevestigen deze noodzaak. Ten eerste zijn in de vragenlijst van de eerste golf twee modules opgenomen over specifieke thema’s. Het ter beschikking stellen van de data voor deze modules met al wat daarbij komt kijken en in het bijzonder het begeleiden van de externe onderzoeksgroepen in het gebruik ervan, waren extra taken voor de PASO-onderzoeker die niet zijn geëxpliciteerd in de initiële opdracht en die uitdrukkelijk ook niet worden gefinancierd door de externe onderzoeksteams in kwestie. Ten tweede wordt de onderzoeker op basis van de eerste golf gecontacteerd door derden die eveneens met de data willen werken, met name onderzoekers, bursalen en studenten van andere universiteiten (3 maal tot nog toe) en het Steunpunt WAV (ifv het komende jaarboek). Het spreekt vanzelf dat dit telkens de nodige tijdsinvestering vergt. Ten derde is er uitzicht op een ad hoc samenwerking met sommige provinciale Kamers voor Koophandel voor de tweede golf. Terwijl in de eerste golf een extra provinciale rapportering was voorzien voor de vijf Vlaamse Kamers op basis van een additioneel onderzoekscontract, lijkt de piste voor de toekomst hier eerder te liggen in het op vraag leveren van specifieke, op maat gesneden analyses. Hoewel het op dit moment moeilijk is een correcte schatting te maken van de omvang en frequentie van al deze vragen door derden, geven deze drie verschillende samenwerkingsverbanden (modules, steunpunt, Kamers) alvast wél het uitzicht op het feit dat de databank wel degelijk aangesproken zal worden. Voor een deel van deze vragen zal een dagprijs kunnen worden aangerekend volgens de geldende modaliteiten aan de KUL (bvb. eventuele toekomstige opdrachten voor de Kamers). Het is echter duidelijk dat een ‘basisinvestering’ zich opdringt om de toegankelijkheid van de bestanden in al de aspecten zoals hier worden beschreven, mogelijk te maken. Het voorstel van taakstelling en het financieel plan, die hieronder worden uitgewerkt, gaan daarom ook uit van bijkomende ad hoc opdrachten om deze opdracht in tweede instantie te ondersteunen en vooral te continueren. Die opdrachten kunnen op zich die basisinvestering echter onmogelijk volledig vervangen.
2
3
Om een en ander ook nu reeds te organiseren is het nuttig te vermelden dat het onderzoeksteam ten behoeve van de hele problematiek van dataprotectie het Nederlandse WSA heeft geconsulteerd, dat in Nederland de rol van ‘databemiddelaar’ op zich neemt. Dit bezoek was bijzonder inspirerend voor wat betreft, onder meer, het uitbouwen van bestandsdocumentering en –archivering, het toepassen van systemen van dataprotectie, de organisatie van controle op het gebruik van data door derden, etc. De voornaamste conclusies van dit werkbezoek zijn opgenomen in het protocol, dat in bijlage is toegevoegd. In de taakstelling van de functie van databeheerder zoals die hieronder wordt uitgewerkt, moet worden voortgebouwd op de ervaringen van het WSA inzake het scheppen van een kader voor het werken op bedrijfsdata, waarvoor de bescherming van de privacy bijzondere voorzorgen vereist. Zo wordt, ter illustratie, voor de Nederlandse dataverstrekkers het werken met vertrouwensprotocols voor bedrijfsmicodata absoluut als onvoldoende beschouwd. Technische omstandigheden, de voorafgaande controles van contracten, maar ook nalezen van analyses en publicaties vormen integraal deel uit van deze voorzorgen. Deze laatste maatregelen blijken in de praktijk overigens perfect haalbaar te zijn wanneer ze gebeuren door de onderzoeksteams-dataproducenten, die de bestanden immers tot in de details kennen. Een nauwere samenwerking met WSA, maar ook met CBS (ontwikkelde beveiligingssoftware ARGUS), OSA, die in Nederland al jaren ervaring heeft met Panelbevragingen (vraag- en aanbodzijde) en met het Duitse IAB in Nürnberg, die ervaring hebben met technieken als postrandomisation voor de Duitse organisatiepanelenquête, zijn wenselijk en worden daarom ook voorzien in de taakstelling van de hier voorgestelde databeheerder. In vergelijking met Nederland, heeft het Vlaamse academische arbeidsmarktonderzoeksveld nog een weg af te leggen. In die zin kunnen de PASO-ervaringen ongetwijfeld een nuttige meerwaarde leveren voor het hele ‘arbeidsmarktgeoriënteerde’ onderzoekslandschap, indien het PASO-team de kans krijgt deze ervaringen voldoende te verdiepen en te valoriseren via deze additionele onderzoeksopdracht. De positieve feedback inzake het PASO- protocol, en wat daarmee samenhangt zoals de samenwerkingscontracten, geeft alleszins aan dat hieraan wel degelijk behoefte is. Daarnaast is het vanzelfsprekend belangrijk samen te werken met APS en de VIONA-administratie, de ontwikkelingen die daar op dit terrein gebeuren actief op te volgen en de in het kader van PASO opgedane expertise inzake privacybescherming en methoden van bestandsbeveiliging maximaal ter beschikking te stellen van de Vlaamse overheid. De basis hiervoor is al gelegd in de ad hoc PASO-ministuurgroep, die tot nog toe de uitwerking van het samenwerkingsprotocol, model samenwerkingscontract en vertrouwelijkheidsverklaring goedkeurde. Om al deze redenen wordt voorgesteld om een ¾ wetenschappelijk onderzoeker toe te voegen aan het PASO-project om de hieronder beschreven taken uit te voeren. Deze onderzoeker wordt door het bestaande PASO promotorenteam begeleid, wat een kostenbesparing impliceert.
4. Taakstelling van de databeheerder 1.
2.
3.
de kwaliteit en actualisering van het databestand verzekeren voor gebruik door derden. Dit houdt ook in het voldoende documenteren van het bestand in al zijn aspecten (steekproef, weging, itemnonrespons, variabelen, etc…). De eisen ten aanzien van deze documentering liggen duidelijk hoger dan voor de reguliere documentering voor intern gebruik door het onderzoekersteam die nodig is voor de analyse en voor een volgende golf. Zo is het noodzakelijk meer omstandige achtergrondinformatie of ‘meta-informatie’ toe te voegen over, in het bijzonder, gebruikte concepten, geconstrueerde variabelen, schalen, clustering van sectoren, edm. De ervaringen met het ter beschikking stellen van het bestand voor de externe onderzoeksteams, die in de eerste golf een module hebben geleverd, bevestigt nu al zeer duidelijk deze noodzaak. Door het feit dat slechts ongeveer 25% van de enquête constant blijft voor de verschillende bevragingsgolven (de andere vragenblokken betreffen tweejaarlijkse thema’s en cross-sectionele modules) impliceert dit ook voor elke golf een substantieel bijkomend werk. marktonderzoek naar verschillende methoden van bestandsbeveiliging bij relevante bevragingen panelenquêtes in Duitsland en Nederland (CBS, OSA, IAB…) en die evalueren op hun waarde voor PASO als vestigingsbestand. De meest aangewezen beveiligingsmethoden uitwerken en toepassen.
3
4
alle andere maatregelen treffen voor het on site werken in een beveiligde omgeving. Dit impliceert het installeren van een stand-alone pc, uitgerust met de nodige programmatuur, die enkel wordt gebruikt voor PASOanayses. 5. het onderzoeken en behandelen van aanvragen voor specifieke deelbestanden door derden – overheid en wetenschappers. 6. het klaarmaken en overmaken van deze deelbestanden. begeleiden van derden in het gebruik van de data, zowel on site als via andere wegen (email etc.) 7. de nodige screenings doen van de analyses en publicaties van derden op het respecteren van de anonimiteit van de respondenten 8. de nodige screenings doen van de analyses en publicaties van derden op het correct gebruik van analysemethoden gegeven de specificiteit van de bestanden feedback hierover organiseren naar deze derden 9. een goed monitoringssysteem uitwerken om het gebruik van het bestand door derden te registreren, te evalueren en daarover te rapporteren. 10. voorzien in een permanente ervaringsuitswisseling met APS en de VIONA administratie inzake deze problematiek. 11. De ervaringen terzake opgedaan met PASO rapporteren om ze ter beschikking te stellen van beide administraties. 12. De koppeling van de PASO-databankthema's met andere bestaande databanken onderzoeken (databank SD Worx, Cevero, sectorfondsen sociale secretariaten). 4.
Geacht wordt dat hiervoor een 3/4 FTE noodzakelijk is (negen onderzoeksmaanden)
BIJLAGE 1
PROTOCOL PASO - SAMENWERKINGSVERBANDEN.
1.
Vormen van samenwerking en types gebruikers
1.1 Vooraf Deze nota schetst de uitgangspunten voor samenwerkingsvormen met derden in verband met de PASO-enquête en hun operationalisering. Er moet vooraf worden benadrukt dat een strikte regeling over het gebruik van de onderzoeksgegevens in functie van privacygaranties en wetenschappelijke verantwoordelijkheid ten aanzien van de respondenten, wordt gecombineerd met het ontwikkelen van instrumenten die een ruime verspreiding van de onderzoeksresultaten toelaten. In het bijzonder de benchmarks moeten in dit verband worden genoemd: deze laten toe dat een ruime doelgroep eenvoudig en, tot op zekere hoogte, op maat toegang krijgt tot een groot aantal descriptieve resultaten in verband met de kernthema’s van het PASO-onderzoek. Dit is ook van belang voor een beheersing van vragen ten aanzien van de PASO-equipe naar resultaten in verband met deze thema’s
4
5
1.2 Vier soorten van samenwerking Eén van de centrale opdrachten en missie van PASO is het vermijden van overbevraging. Om dit te bereiken zijn verschillende samenwerkingspistes denkbaar. De eerste piste is de samenwerking op niveau van de vragenlijst: externe onderzoeksgroepen ontwikkelen ad hoc modules. Zo wordt voorkomen dat teveel enquêtes worden opgezet rond analoge thema’s. Omdat deze vorm van samenwerking rechtstreeks ingrijpt op het concept van de bevraging (m.n. de vragenlijst) zijn hiervoor specifieke technische en inhoudelijke richtlijnen ontwikkeld in het zgn. draaiboek. Op de samenwerking met derden voor de toelevering van ad hoc modules wordt door de VIONA Stuurgroep toegezien en deze samenwerking wordt door de PASO Visiegroep opgevolgd. Voorbeelden uit het eerste PASO-werkjaar zijn: de FBA- en de VIONA-kraptemodule. De tweede piste is samenwerking op niveau van de steekproeftrekking. In dit geval financieren derden bijkomende steekproefeenheden, complementair aan de PASO steekproef, al dan niet selectief ten aanzien van bepaalde segmenten uit de populatie (sectoren, microbedrijven…). De brede thematische dekking van PASO kan zo voorkomen dat nieuwe enquêtes moeten worden opgezet. Dit maakt het ook mogelijk dat beide partijen kunnen beschikken over een grotere steekproef. Deze piste heeft in de praktijk pas zin als ze samengaat met ofwel de toevoeging van een ad hoc module en/of indien er ook afspraken zijn omtrent de verwerking en analyse van de gegevens. De derde piste betreft samenwerking op niveau van de data waarbij PASO analyse en rapportering uitvoert in opdracht van derden. Dit laat toe de PASO data beter te valoriseren. Dit komt niet alleen de valorisatie van het project op zich ten goede (onder vorm van meer publicaties), maar kan ook de toekomstige respons van het panel gunstig beïnvloeden. De tweede en derde formule zijn additionele onderzoeksopdrachten voor de PASO-equipe waarvoor een contract wordt opgesteld. Voorbeelden uit het eerste PASO-werkjaar zijn: contract APS, contracten Kamers van Koophandel. De VIONA-stuurgroep verleent haar goedkeuring hierover, de PASO-ministuurgroep volgt ze op. De vierde piste is die waarbij bepaalde, welomschreven groepen gebruikers zelf data analyseren en hierover zelf rapporteren. In dat geval moeten die data ter beschikking worden gesteld en moeten de voorwaarden en modaliteiten daarvoor worden vastgelegd. De KUL is hier als eigenaar eindverantwoordelijke (zie infra). Aan de PASO-ministuurgroep wordt over het gebruik van de data door derden, en de daaruit voortvloeiende publicaties, gerapporteerd (zie infra).
1.3 Verschillende types van gebruikers Onderstaand schema vat de verschillende samenwerkingsformules samen naargelang van het type van gebruiker, en specifieert de procedures die daarvoor worden uitgewerkt.
5
6
VORMEN VAN SAMENWERKING
Supervisie
Ad hoc modules
VIONA Stuurgroep/V isiegroep
Supplementaire Steekproef
PASO analyseert
PASO analyseert, en rapporteert
VIONA-stuurgroep / PASO-ministuurgroep
Draaiboek
Databeheerder PASOministuurgroep
Rapportering VIONA-modules VIONA-expertrapporten VIONA-projecten
gebruiker analyseert PASOdata en rapporteert
Contract en protocol
Gedragscode en wetensch. toezicht
(vb. Krapte)
Wetenschappelijke gebruikers
Draaiboek
Contract en protocol
Gedragscode en wetensch. toezicht
Administratie, VOI
Draaiboek
Contract en protocol (vb. APS module)
Gedragscode en wetensch. toezicht
(vb. FBAmodule) Niet-commerciële derden
Draaiboek
Contract en protocol (vb. Kamers)
Alle samenwerkingsformules richten zich in principe tot samenwerking van de PASO-equipe met wetenschappers en beleidsverantwoordelijken van de overheid. Eventuele samenwerkingsverbanden met andere gebruikers dan in het schema opgesomd, worden ad hoc onderzocht door de VIONA-stuurgroep. Commerciële exploitatie van de data is nooit mogelijk (zie infra).
2.
Wetenschappelijk en deontologische uitgangspunten
2.1 Verantwoordelijkheid ten aanzien van de respondenten De PASO-equipe heeft ten aanzien van de respondenten een deontologische, professionele en wetenschappelijke verantwoordelijkheid. Een goede omschrijving van die verantwoordelijkheid kan worden gevonden in de Europese en Belgische regelingen inzake het statistisch geheim. In een Europese verordening 1 worden een aantal algemene regels beschreven, die zowel de kwaliteitsbewaking van de gegevens als de privacy van de respondenten garanderen. Drie principes uit deze regelgeving zijn hier relevant en kunnen, vertaald naar een wetenschappelijk onderzoek zoals PASO, als volgt worden omschreven: 1.
1
onpartijdigheid: een objectieve, wetenschappelijke en onbevoordoordeelde wijze om de data te verwerken en ze ter beschikking te stellen voor gebruikers voor wetenschappelijke of beleidsmatige doeleinden
EG Verordening nr. 322/97 van de Raad van 17/2/1997, Publicatieblad E.G. nr. L052 van 22/02/1997, p.47
6
7
2.
betrouwbaarheid: het gebruik van wetenschappelijke criteria voor de keuze van methoden om op de data te werken; het verstrekken van informatie over waarnemingsgebied, methodologie van dataverzameling en dataverwerking, gehanteerde procedures…
3.
statistische geheimhouding: gegevens die verband houden met afzonderlijke statistische eenheden worden beschermd tegen iedere schending van het individuele recht op geheimhouding. Statistische eenheden mogen nooit direct of indirect kunnen worden geïdentificeerd, informatie over individuele statistische gegevens mag nooit worden onthuld of openbaar gemaakt.
De eigenaar- eindverantwoordelijke voor de gegevens, de KUL, is ook rechtstreeks verantwoordelijk voor regelingen ten aanzien van derden die voor dit project willen samenwerken, zodat deze principes worden gerespecteerd. Met andere woorden regelingen voor een adequate beveiliging en een correct gebruik van de data moeten worden uitgewerkt door de KUL. Deze principes brengen ook met zich mee dat de data nooit voor een ander doel dan waarvoor ze zijn verzameld, mogen worden gebruikt. Commerciële exploitatie is zo volledig uitgesloten. Voorts is het van belang dat de verzameling van de gegevens wel berust op de individuele waarnemingen, maar niet is gebeurd voor het verwerven van kennis over een individuele statistische eenheid (in dit geval een bedrijf). De informatieverzameling is wel opgezet met de bedoeling samenvattende en representatieve gegevens te hebben over groepen van bedrijven, zoals omschreven in het onderzoeksopzet.
2.2 Eigendomsrechten De KUL is als hoofdpromotor eigenaar en beheerder van de PASO-gegevens. Aangezien die verantwoordelijkheid ten aanzien van de respondenten zoals hierboven beschreven, essentieel en ondeelbaar is, kunnen die eigendomsrechten op de databank niet geheel of gedeeltelijk worden overgedragen. Omdat het bestand als een ondeelbaar geheel moet worden beschouwd (en alle data volledig binnen de PASO-bevraging worden verzameld) impliceert dit dat ook de gegevens bekomen door de toevoeging van ad hoc modules onder dit eigendomsrecht vallen. Bovendien hebben ze geïsoleerd noch waarde noch relevantie. 2 Dit alles impliceert in de praktijk dat de KUL alle juridische, administratieve, technische en organisatorische maatregelen moet treffen die noodzakelijk zijn om de statistische geheimhouding, betrouwbaarheid en onpartijdigheid te bewaken. De gebruikers moeten worden geïnformeerd over de regels die moeten worden nageleefd met het oog op de bescherming van de privacy. In wat volgt worden deze algemene principes vertaald naar de mogelijke samenwerkingsverbanden zoals boven opgesomd.
3.
Basisprincipes voor samenwerking: correct omgaan met de data
Elke gebruiker moet zich vooraf akkoord verklaren met een aantal afspraken en uitgangspunten: 1.
VIONA is en blijft de hoofdopdrachtgever van de PASO-enquêtes
2
Het spreekt echter vanzelf dat modaliteiten inzake ‘eerste gebruiksrecht’ op deze ‘derden-gegevens’ kunnen worden afgesproken: zie infra
7
8
2. • • • •
Zowel bij analyse als bij rapportering moeten steeds de volgende uitgangspunten worden gegarandeerd en gerespecteerd: De privacy van de respondenten. Dit impliceert bijvoorbeeld dat correct moet worden omgegaan met toevallig geïdentificeerde respondenten Het correct gebruik van de data De wetenschappelijke geldigheid van analyses De correcte interpretatie van de data en de analyses
3.
Gebruikers zijn uitdrukkelijk gebonden door de eigendomsrechten van de data, die hen ter beschikking worden gesteld voor analyse.
4.
Bij elk gebruik van PASO-gegevens wordt een bronvermelding voorzien die verwijst naar het feit dat de gegevens werden verzameld in het kader van de PASO-enquête die werd uitgevoerd in opdracht van VIONA, Vlaamse Regering.
5.
Publicaties op basis van analyses met de PASO-databank vermelden uitdrukkelijk dat de bespreking van de gegevens en de publicaties enkel de visie van de auteurs vertolken en niet de visie van de PASO-equipe, de VIONA-stuurgroep of de Vlaamse Regering;
6.
Exclusiviteitsrechten m.b.t. de PASO-gegevens kunnen nooit aan derden worden verleend;
7.
Aan derden kan een in de tijd beperkt eerste gebruiksrecht voor publicaties toegekend worden;
8.
De data of onderzoeksresultaten mogen nooit voor een ander doel worden gebruikt dan vooraf afgesproken in een contract of protocol. Ze mogen nooit aan derden worden doorgegeven.
9.
Om de resultaten van een volgende PASO-golf niet in het gedrang te brengen, geldt in principe een publicatieverbod op basis van PASO-gegevens in de twee maanden voorafgaand aan het opstarten van een (nieuwe) PASObevragingsronde. Van dit principe kan worden afgeweken in samenspraak met de PASO-ministuurgroep.
10. De toegeleverde data moeten drie jaar na het aanvragen door de gebruiker worden vernietigd. 11. De eindrapporten van derden worden ook opgeleverd aan de voltallige PASO-ministuurgroep.
4.
Samenwerking met derden voor additionele vragen, een additionele steekproef en additionele analyses, eventueel inclusief rapportering
Voor deze samenwerkingsvormen wordt vooraf een onderzoekscontract en protocol afgesloten met de gebruiker. Hierin wordt het volgende nageleefd: 1.
Indien samenwerking impliceert dat bijkomende vragen worden gesteld (als module of als afzonderlijke vragen) moeten de inhoudelijke en technische richtlijnen worden gerespecteerd die in de specifieke nota “Draaiboek voor modules” zijn uitgewerkt.
2.
Bij de samenwerking tussen PASO en derden moet het basisconcept van PASO worden bewaakt. Dit impliceert dat derden geen wijzigingen kunnen aanbrengen aan: de standaardvragenlijst, het steekproefkader, de bevragingswijze,
• • •
8
9
•
de opbouw van de databank en bijhorende kwaliteitsbewaking
3. •
De volgende procedure wordt voorgesteld: Via een schriftelijke procedure spreken de leden van de VIONA stuurgroep zich uit over het ontwerp van samenwerking en formuleren desgewenst hun opmerkingen of bezwaren. Op basis van de schriftelijke respons beslissen de voorzitter van de visiegroep en de VIONA coördinator om de VIONA stuurgroep (al of niet in beperkte samenstelling) bijeen te roepen voor bijkomend overleg en het nemen van een beslissing. De voltallige visiegroep en de VIONA stuurgroep worden geïnformeerd over de protocollen en samenwerkingsverbanden.
•
5.
Gebruik van de data door derden
Het gebruik van de data voor derden vergt specifieke regelingen. Deze vorm van samenwerking is niet mogelijk voor andere gebruikers dan de wetenschappelijke gemeenschap of de administratie, VOI. Het gaat hier dus enkel om het onder wetenschappelijke begeleiding ter beschikking stellen van de data ten behoeve van de onderzoeksgemeenschap of de administratie. Voor principes inzake het gebruik van de data door derden zijn de ervaringen van het Nederlandse WSA uitermate relevant gebleken 3. Men moet ervan uitgaan dat toevallige identificatie nooit uit te sluiten is, en in verband met bedrijfsdata stelt het WSA zelfs bedrijfsidentificatie nooit volledig waterdicht vermeden kan worden. Om de principes van statistische geheimhouding en samenwerking, zoals beschreven onder paragrafen 2 en 3, te bewaken moeten daarom een aantal organisatorische, juridische en technische maatregelen worden getroffen. Deze zijn complementair. Een concreet en urgent probleem dat zich op dit moment terzake stelt is evenwel dat er geen omkadering is voorzien voor het opvolgen van dit gebruik door derden. Zowel de organisatorische als de technische maatregelen vergen dit nochtans.
5.1 Outputcontrole Een eerste principe richt zich op outputcontrole, controle van het gebruik, ipv op databeveiliging. Dit impliceert dat elk onderzoeksvoorstel en –contract wordt opgevraagd bij degene die aanvraagt om met de data te kunnen werken. Opvragen van de onderzoeksvoorstellen werkt ook preventief en is tegelijk een handig monitoringsinstrument voor de valorisatie van het project. Verder worden alle publicaties ter controle en goedkeuring voorgelegd. Die kwaliteitscontrole kan gaan over de statistische maten die men toepast, de opmaak van tabellen, maar ook over interpretatie (bvb. conclusies die niet mogen getrokken worden omdat er bias is, omdat er intermediaire variabelen spelen die niet gecontroleerd zijn, omdat de causaliteit niet correct is edm). Hiervoor kunnen en moeten efficiënte procedures worden opgezet. Ten derde wordt de gedragscode zoals uitgewerkt onder 3. vooraf meegedeeld en goedgekeurd.
3
Zie werkbezoek 2 juli 2002 met delegatie van Steunpunt WAV, APS, VIONA en PASO
9
10
5.2 On-site of remote werken op de data Een tweede systeem is on-site: de onderzoeker werkt op een stand alone computer die bij de producent wordt ter beschikking gesteld. Dit moet in een waterdichte technische omgeving 4. Een praktischer systeem dan dit kan ook ‘remote access’ zijn: de onderzoeker vraagt data aan, vb. via email, en de bestanden worden voor hem/haar klaargemaakt en toegeleverd.
5.3 Technische beveiliging Er is ook software die identificeerbaarheid zichtbaar kan maken. Bijvoorbeeld het programma ARGUS voor microdata en voor tabellen, dat is ontwikkeld door o.m. het Nederlandse CBS. Daarbij worden ad random driedimensionele tabellen gedraaid die vervolgens kunnen worden gecontroleerd. Volgens aggregatie zijn er drie mogelijke uitkomsten: ‘heel herkenbaar’; ‘redelijk herkenbaar’ of ‘minimaal herkenbaar’. Een ander systeem is postrandomisation: de data worden daarbij opnieuw aangemaakt met dezelfde basiskenmerken. Bij dit systeem veranderen de gemiddelden niet, wel de variantie en de significantie, maar voor het oefenen op een bestand (bijvoorbeeld in functie van de voorbereiding van een ‘remote access’ aanvraag) is dat minder erg.
6.
Opvolgingsstructuur
Er wordt een PASO-ministuurgroep geïnstalleerd die de opvolging van de samenwerkingsverbanden op zich neemt. Deze stuurgroep wordt samengesteld met de KUL- databeheerder, de Administratie Werkgelegenheid (gelijktijdig vertegenwoordiger van VIONA) en de Administratie Planning en Statistiek. De taken van deze PASO- ministuurgroep zijn: 1.
Bewaken van concept en kwaliteit PASO-enquête (beperkt houden van standaardvragenlijst / verenigbare modules)
2.
Opvolging van co-financieringcontracten met derden die analyses en/of rapporten wensen op basis van de gegevens uit de PASO-databank
3.
Uitwerken van gedragscode en protocol
4.
Bepalen van procedures en mogelijkheden inzake publicaties op basis van PASO-gegevens;
5.
Overzicht houden op gebruik van de data, de publicaties en rapporteringen m.b.t. PASO-gegevens.
7.
Financieringsmodaliteiten
Tot slot is het van belang een financieringsmodel te hebben voor de verschillende vormen van samenwerking, zoals:
4
geen printerpoort, geen discette-schrijver of zelfs CD-writer, zeker geen netwerkverbinding. Omdat ook dit niet altijd volstaat is het ook essentieel dat de databewaker de logfiles (vb. van spss) opvraagt
10
11
•
Bijkomende vragen en modules : worden aangeleverd door de onderzoeksgroep in kwestie
•
Supplementaire steekproef: aan geldende eenheidsprijs enquête.
•
PASO analyseert: aan geldende dagprijs/uurprijs onderzoeker
•
PASO analyseert, interpreteert, rapporteert: kostprijsberekening conform gewone onderzoeksopdrachten.
•
Gebruik databank onder toezicht beheerder: geldende dagprijs/uurprijs gebruik databank all-in. Monique Ramioul, november 2002
11