False positive, false negative
  • Home
  • False positive, false negative

Column

 

False positive, false negative

31-8-2009 - Wim Westera

Komt het ooit nog goed met het onderwijsonderzoek? Dat heeft door de jaren heen nooit veel potten kunnen breken; niet alleen in Nederland, maar wereldwijd. Docenten laten de uitkomsten veelal hoofdschuddend aan zich voorbijgaan, want van verrassend nieuwe inzichten is zelden sprake. Zij weten zich gesteund door gereputeerde instanties als het Center for Educational Research and Innovation (CERI) van de OECD dat het onderwijsonderzoek ooit onomwonden kwalificeerde als “irrelevant”, “navelstarend”, “slecht van kwaliteit” en “matig bruikbaar” is. Vernietigender kan het niet. Vrij vertaald: onderzoekers houden zich op de verkeerde manier met de verkeerde dingen bezig. Onderzoek heeft nauwelijks betekenis voor de onderwijspraktijk. Dat is niet alleen slecht voor het onderzoek, maar ook voor het onderwijs, dat zich bij gebrek aan beter slechts kan verlaten op praktische of subjectieve overwegingen.

In 2006 werd het Nederlandse onderwijsland opgeschrikt door het rapport “Naar meer evidence-based onderwijs” van de Onderwijsraad. De effectiviteit van onderwijsmethoden moet nadrukkelijker worden bewezen met behulp van wetenschappelijk onderzoek, vond de Raad. Zij houdt een stevig pleidooi voor een betere positie van het onderwijsonderzoek. Daar kon natuurlijk niemand tegen zijn, maar het voelde toch een beetje als het belonen van wanprestatie. De bevindingen van het CERI zijn weliswaar onverbloemd in het rapport opgenomen, maar van een bestraffende toon jegens onderzoekers is geen sprake. Onderzoek moet dus meer aandacht krijgen, en dat krijgt het ook. Wie in de recente tender “Onderwijsbewijs” de kleine lettertjes doorneemt, kan constateren dat het vooral moet gaan om onderzoek, …onderzoek en …onderzoek, zodat ondubbelzinnig kan worden aangetoond wat werkt, waarom het werkt en hoe.

U voelt het misschien al aankomen: met dit onvoorwaardelijk eerbetoon aan onderwijsonderzoekers is natuurlijk van alles mis. Ik zal dat op drie punten toelichten:

1)      De wetenschappelijke methode
De Onderwijsraad spreekt een duidelijke voorkeur uit voor gerandomiseerde gecontroleerde (veld)experimenten, dat wil zeggen een a-selecte opsplitsing in twee groepen onder verschillende condities, waarna de statistiek mag vaststellen of waargenomen verbanden significant zijn. Dat is problematisch, omdat in veel meetsituaties het aantal variabelen erg groot is en vele daarvan buiten de controle van de onderzoekers vallen. Men kan effecten meten, men kan zelfs correlaties vaststellen, maar door het grote aantal ongecontroleerde en oncontroleerbare variabelen zijn er nauwelijks oorzakelijke verbanden te leggen. Shaver (1983) zegt hierover: “Statistische significantie is geen zinvol criterium om te bepalen of onderwijsmethoden werken.” Met andere woorden, effectmetingen onder zogenaamd gecontroleerde omstandigheden kunnen vaak helemaal niet worden toegeschreven aan de interventies.

2)      Bevestigend onderzoek
Een ander groot probleem van onderwijsonderzoek is het bevestigende karakter ervan: men probeert eigenlijk common sense wetenschappelijk te bewijzen. Nu wil ik niet beweren dat bevestigend onderzoek helemaal achterwege moet blijven (want evengoed zou common sense op dwalingen, vooroordelen of bijgeloof kunnen berusten), maar over het algemeen schieten we er niet veel mee op. Daar bestaan legio voorbeelden van. Om niet meteen de hele VOR-familie over me heen te krijgen geef ik een voorbeeld uit het buitenland. Loken en consorten (2004) bijvoorbeeld voerden een omvangrijke en kostbare studie uit naar het online studiegedrag van 100.000 studenten die zich voorbereidden op het toelatingsexamen voor een van de Amerikaanse colleges. Wat bleek? Studenten roeren maandenlang hun spullen niet aan en beginnen pas een paar dagen voor het examen te werken. Dat wisten we natuurlijk allemaal al, al blijft het de vraag of we het nu zeker weten.

3)      Positief nieuws
Wil je als onderzoeker serieus worden genomen, dan moet je je onderzoek publiceren in wetenschappelijke tijdschriften. Maar dat kan eigenlijk alleen als je positieve resultaten hebt te melden, lees: significante resultaten. Daarom is het handig om veilige, algemene hypothesen te formuleren, waarvan je bij voorbaat al weet dat die zullen worden bevestigd, bijvoorbeeld: “Studenten beginnen pas een paar dagen voor het examen te werken”. Door de positieve selectiedwang van wetenschappelijke tijdschriften ontstaat er bovendien een vertekend beeld van alle statistische onderzoeksgegevens. Een groot deel wordt immers nooit gepubliceerd, ongeacht hoeveel geld en inspanningen er mee gemoeid waren. In diverse vakgebieden zijn nu tijdschriften verschenen waarin niet-significante en andere negatieve resultaten een positieve plaats kunnen krijgen, zoals het Journal of Spurious Correlations, het Journal of Negative Results in Biomedicine, het Journal of Negative Observations in Genetic Oncology met het briljante acroniem “NOGO”, het Journal of Negative Results - Ecology & Evolutionary Biology en het Journal of Interesting Negative Results in Natural Language Processing and Machine Learning. Misschien ook iets voor ons: het Journal for Negative Outcomes of Neat and Sensible, but Ever-Rejected or Neglected Studies in Education. Of blijft alles dan toch zoals het was?

 

En nu maar afwachten welke wetenschappelijke bewijzen de projecten van het Onderwijsbewijs gaan opleveren.

 

Loken, E., Radlinski, F., Crespi, V.H., Millet, J. & Cushing, L. (2004). Online Study Behavior of 100,000 Students Preparing for the Sat, Act, and Gre. Journal of Educational Computing Research, 30-3, 255-262. 

Shaver, J.P. (1983). The Verification of Independent Variables in Teaching. Educational Researcher, 10, 3-9.

Reageer

 



   
 
 
 
 
   
Voer de tekens in die u op de afbeelding ziet

 

Reacties

 

False positive, false negative
Tja, ook SURF blijkt te worstelen met de gebrekkige wetenschappelijkheid van haar projecten. In de call voor Studiekeuzegesprekken wordt aanvankelijk hevig getamboerd op het belang van grondig onderzoek om de effecten onomstotelijk te kunnen vaststellen, maar vervolgens staat er doodleuk "...Van de projecten wordt niet verwacht dat zij het karakter van wetenschappelijk onderzoek hebben...". Dat betekent dus dat je zonder schroom wichelroedelopers, astrologen en gebedsgenezers kunt inzetten om je gelijk aan te tonen. Lijkt me geweldig.  Wim
9-9-2009 14:37 Wim Westera

False positive, false negative
Hallo Wim, Perfect idee, dat Journal for negative outcomes! Als echte onderwijsonderzoeker heb ik ook altijd al dat gevoel gehad dat verwachtingen eigenlijk altijd bevestigd worden en daar wordt ik van nature dan ook altijd al argwanend van. Eigenlijk vertrouw ik alleen verrassende en onverwachte resultaten echt.. Zoals ik aangaf in mijn eerdere column, is het probleem denk ik ook vooral dat we nog niet goed genoeg het (diepe) leren kunnen meten, zodat er geen goed corrigerend mechanisme is voor alle claims die maar kunnen worden gemaakt. In de sociale wetenschappen kun je immers iedere claim bewijzen en, komend vanuit de natuurwetenschappen, zou ik daarom veel meer falsificerend onderzoek willen doen: alleen als het je, hoe hard je ook probeert, echt niet lukt om een bepaalde bewering te weerleggen, zou die misschien wel eens waar kunnen zijn.
3-9-2009 12:56 Jakko van der Pol

Column archief

 

De Apple-familie (column)
31-8-2010

Laat de lerarenopleiding 5 of 6 jaar duren! (column)
25-6-2010

Als de governance maar goed zit... (column)
7-6-2010

Geef design-denken de ruimte! (column)
17-5-2010

In de wolken met nieuwe ICT-dienstverlening (column)
13-4-2010

Toga (column)
25-3-2010

Crisis? Naar buiten! (column)
9-3-2010

De toets moet gevierd worden (column)
21-2-2010

Avatar, of het web van verbondenheid (column)
21-1-2010

Lieve vrienden (column)
4-1-2010

Zijn ze nou helemaal gek geworden? (column)
10-12-2009

Exploratievaardigheden (column)
27-11-2009

Nederland, koploper in Open CourseWare? (column)
2-11-2009

Interview met Mr. No (column)
14-10-2009

Plantenveredeling en Open Access (column)
10-9-2009

False positive, false negative (column)
31-8-2009

Alles 2.0 (column)
25-6-2009

Portfolio: van controle naar verbeelding (column)
12-6-2009

De modegevoeligheid van onderwijsland (column)
28-5-2009

Downgrading (column)
11-5-2009

Meeting of minds? (column)
29-4-2009

Bent u ook Linked In Social Networks? (column)
16-4-2009

Progressieve stijging van aantal afhakende studenten in het 1e jaar  (column)
2-4-2009

Substitutie, transitie, transformatie (column)
19-3-2009

Serious game over? (column)
12-2-2009

Net Generation bestaat niet (column)
22-1-2009

Over Open Access (column)
8-12-2008

A Simple Desultory Philippic… : Stop the BS [1] (column)
25-11-2008

Verboden kleuren en onderzoek naar ICT in het onderwijs (column)
5-11-2008

Crisis (column)
28-10-2008

Dagen op de snelweg: de student als toerist (column)
30-9-2008

De herfst, de herfst (column)
18-9-2008

Het scorend vermogen van de nieuwe elite (column)
19-8-2008

Hoe ICT de jeugd verpest – en wat daaraan te doen (column)
10-7-2008

Duur is niet altijd goed (column)
28-6-2008

Scherptediepte (column)
25-6-2008

Creative Commons: afgeleide werken en commercieel gebruik als kansen (column)
25-6-2008

Kind van de rekening (column)
16-5-2008

Je wordt gewoon standaard voor de gek gehouden (column)
13-5-2008

Drie vliegen in één klap? (column)
22-4-2008

Mijn film, the movie (column)
22-4-2008

Het not-invented-here syndroom bestaat niet (column)
22-4-2008

Web2.0 en de nieuwe cultuur (column)
17-3-2008

‘Bad practices’: e-learning allianties ontleed (column)
12-3-2008

Erik Saaman: Soa - services of architectuur (column)
14-12-2007

Meer columns of