Gastcolumn

Afbeelding Jacquelijn Ringersma

Onderzoeksdata: van ‘waarom’ naar ‘hoe’

Toen ik 3.5 jaar geleden als Hoofd van het Digitaal Productiecentrum bij Wageningen UR Library kwam stond het onderwerp ‘onderzoeksdata’ bij de Nederlandse universiteiten nog in de kinderschoenen. Ik kwam van een Max Planck Instituut, waar de kinderschoenen al waren verruild voor stevige stappers: daar wordt ‘The Language Archive’ gebruikt door onderzoekers die hun data volgens standaarden archiveren. Het wetenschappelijk thema van dat archief, bedreigde talen, vraagt dan ook om archiveren. Bedreigde talen  zijn talen die nog door een handjevol mensen worden gesproken, en die het archiveren waard zijn, omdat in die talen informatie schuil gaat over bijvoorbeeld medicinale planten en culturele waarden. Iedereen snapt dat deze data het bewaren waard zijn en archiveren is daarom onderdeel van het onderzoeksproces.

De boodschap waarom het zinvol is om onderzoeksdata te beheren en archiveren, was 3 jaar geleden in Wageningen niet zo gemakkelijk over te brengen. Eerste ontmoetingen met onderzoekers over het onderwerp bleken vrij academisch. Ze gingen over de vraag waarom het zinvol zou zijn onderzoeksdata te archiveren. Inmiddels, 3 jaar verder, is de vraag rondom onderzoekdata veranderd in hoe dienstverlening ‘Research Data Management’ er uit moet zien. Het programma van de komende Surf Masterclass met veel bijdragen van de UKB werkgroep Data, in Maastricht ( 3 en 4 April) is een mooi voorbeeld van de veranderde discussie.

Ik neem u even mee terug naar een tweetal kwesties, die destijds het gesprek beheersten.

1: Van wie is de data?

Onderzoekers ervaren eigendom over de data die ze verzamelen. Dit eigendom brengt met zich mee dat onderzoekers zichzelf het uniek recht geven om te publiceren over de data, en bang zijn dat anderen hun data verkeerd gebruiken. Echter, juist door data te archiveren, en daar als onderzoeker je naam aan te koppelen, worden de data meer ‘eigendom’. Net als een publicatie worden gearchiveerde data onlosmakelijk verbonden met de onderzoeker. Anderen die er wellicht iets anders en onverwachts mee doen dan wat de onderzoeker zelf in gedachten had, zijn door het gebruik maken van gearchiveerde data wetenschappelijk ethisch verplicht naar de dataset te refereren en zo plukt de ‘creator’ extra vruchten van zijn data.

2: Data archiveren kost teveel (tijd, geld)

Onderzoekers binnen de universiteit werken onder tijdsdruk en loopbaanontwikkeling hangt (op dit moment nog) niet af van het aantal gearchiveerde datasets. Om onderzoeksdata zinvol te archiveren, moeten deze worden gedocumenteerd (metadata, variabelen, methodes). En, jazeker, dat kost tijd. Maar kost het extra tijd? Voor het schrijven van een publicatie wordt veelal een ‘materials & methods’ sectie geschreven, die voor een groot deel de metadata verschaft voor het archiveren van de data. Ook het bijhouden wat verschillende variabelen betekenen behoort tot de normale wetenschappelijke praktijk. Je kunt als onderzoeker maar beter vanaf het begin vastleggen wat je met a, b en c bedoelt voordat je de weg in je eigen variabelen kwijt raakt. Met andere woorden: de handeling van het archiveren zelf kost wel wat tijd, maar het metadateren gebeurt grotendeels tijdens het normale wetenschappelijke proces, en levert zelfs een bijdrage aan ‘door de data het bos blijven zien’. Pure tijdswinst.  

Inmiddels is iedereen wel overtuigd dat we ‘iets’ moeten met onderzoeksdata. De affaires Stapel, Smeesters en Dhonukshe etc.  hebben een wending aan de discussie gegeven. Het beheren en archiveren van onderzoeksdata moet bijdragen aan het verbeteren van transparantie, verifieerbaarheid en dupliceerbaarheid van het wetenschappelijk onderzoek. Ook belangrijke subsidieverleners bepalen de koers. De EU zal in het kader van Horizon2020 vragen om een Research Data Management Plan (RDMP) en het archiveren van data; NWO is bezig een beleid te ontwikkelen. De discussie over onderzoeksdata is veranderd van ‘waarom’ naar ‘hoe’.

Ik neem u nu mee naar de belangrijkste twee kwesties van dit moment:

1: Welk beleid zal leiden tot het gewenste beheer van data?

De Nederlandse Universiteiten zijn allemaal bezig met het definiëren van beleid. Wageningen UR bepaalde in juli 2013 dat iedere PhD-student en alle leerstoelgroepen m.i.v. 1 april 2014 een Research Data Management Plan moeten hebben, maar stelt het archiveren van data niet verplicht. Wageningen UR meent dat onderzoekers door het nadenken over het beheren van data ook gaan archiveren, en dat van ‘boven af’ opleggen van archiveren niet tot het gewenste resultaat zal leiden. De Radboud Universiteit schrijft sinds November 2013 het archiveren van data door PhD, MSc en BSc studenten wel voor. Wat de andere universiteiten gaan doen is nog afwachten.

2: Hoe organiseren we de dienstverlening (pro-aktief)?

De meeste universiteiten hebben hun Bibliotheek (UB) aangewezen als uitvoerend dienstverlener. Dat is een logische keuze; immers het beheren en archiveren van onderzoeksdata ligt dicht tegen de taak die de UB’s al uitvoeren, namelijk het beheren van publicaties. Ook in Wageningen is de UB, samen met de Wageningse onderzoeksscholen, door de Raad van Bestuur aangewezen om de onderzoekers te ondersteunen bij het maken van een RDMP. Daarnaast levert de Wageningen UR Library ondersteuning bij archiveren van data op de infrastructuur van Research Data Netherlands.

Hoe we de dienstverlening tijdens het onderzoek moeten inrichten weten we als UB’s nog niet precies, en er ligt hier een grote uitdaging. Samenwerking tussen de UB’s, de Universitaire IT afdelingen en de onderzoeksscholen is voor het opzetten van de juiste en gewenste dienstverlening essentieel. Tijdens de komende masterclass, georganiseerd door de UKB werkgroep data en de SURF-SIG, zal informatie over het ‘hoe’ worden gedeeld, dit levert een kans om van elkaar te leren en elkaars successen her te gebruiken. De masterclass zit, helaas voor u, al vol. Maar de presentaties en rapportages worden beschikbaar gemaakt op de SURF-Space Research Data. Volgend jaar ongetwijfeld weer een masterclass.

Jacquelijn Ringersma is hoofd van het Digitaal Productiecentrum van de Wageningen UR Library en heeft 10 jaar ervaring met (het archiveren van) onderzoeksdata. Ze is lid van de werkgroep Data van de UKB.


REACTIES

  • Afbeelding Maike Koningstein
     
     
     
     
     
    40

    Beste Jacquelijn,

    fijn eindelijk te lezen dat er al ervaren mensen zijn op dit terrein! :) Ik ben pas aangesteld op het Julius Centrum om voor een van de professoren eens orde in de oude chaos te scheppen. Een hele klus voor een groentje als mezelf, ik hoop veel te kunnen leren van dit forum.

PLAATS REACTIE