‘Compensatoir toetsen komt kwaliteit hoger onderwijs wél ten goede’

Opinie | door Dominique Sluijsmans & Elisa van Bekkum-Swager & Laurie Delnoij & Janke Cohen-Schotanus & Klaas Visser
19 maart 2024 | In reactie op een betoog van Niels Smits en Michael S. Merry betogen vijf onderzoekers dat compensatoir toetsen de kwaliteit van het hoger onderwijs wel ten goede komt. Voorwaarde is een geïntegreerd curriculum met toetsing die niet alleen tot valide beslissingen leidt, maar ook de juiste houding bij studenten stimuleert, schrijven Dominique Sluijsmans, Elisa van Bekkum-Swager, Laurie Delnoij, Janke Cohen-Schotanus en Klaas Visser.
Compensatoir toetsen
Beeld: Ben Mullins

Onlangs publiceerde ScienceGuide het artikel Compensatoir toetsen komt kwaliteit hoger onderwijs niet ten goede, geschreven door de onderzoekers Niels Smits en Michael S. Merry. Zij zijn geen voorstanders van compensatoir toetsen, waarbij studenten minder goede toetsresultaten kunnen compenseren met goede toetsresultaten. In hun bijdrage ontkrachten zij verschillende argumenten ten faveure van compensatoir toetsen.

Hun perspectief is echter eenzijdig en vooral toetstechnisch ingestoken, en behoeft daarom nuancering. Ook gezien de vele vormen die compensatoir toetsen kan hebben (alles met alles compenseren, alleen binnen vakken compenseren, of binnen een samengesteld pakket etc.), is het onlogisch om tegen compensatoir toetsen in het algemeen te zijn. Daarnaast wordt het empirische onderzoek dat voorhanden is te makkelijk verworpen door Smits en Merry.

In onder andere de boeken Studiesucces door onderwijskwaliteit (2019) en Werken aan kwaliteit hoger onderwijs, dat in april 2024 verschijnt, wordt compensatoir toetsen wél aangemoedigd vanuit het gegeven dat we garant moeten blijven staan voor een diploma van kwaliteit. 

Wat zijn volgens Smits en Merry de problemen met compensatoir toetsen?

Smits en Merry zijn in hun bijdrage vooral sceptisch over het nominaal = normaal (N=N) programma dat wordt gehanteerd aan bijvoorbeeld de Erasmus Universiteit. N=N houdt in dat een student in het eerste jaar alle toetsen aflegt. Als deze toetsen zijn afgelegd (binnen een bepaalde termijn) en er gemiddeld een cijfer 6 wordt behaald, is de student geslaagd voor het eerste studiejaar. De kritiek richt zich onder meer op het feit dat studenten in deze aanpak bepaalde vakken strategisch ‘laten zitten’ en compenseren met vakken waar ze goed in zijn. Zo kan het gebeuren dat iemand met een cijfer 5 voor statistiek dan toch de propedeuse haalt. 

Wijzend op zulke regelingen stellen Smits en Merry dat compensatoir toetsen en de daarop gebaseerde certificerende beslissingen tot cruciale kennishiaten kunnen, de rechtvaardigheid en eerlijkheid van beslissingen in het geding is, en er een verkeerde visie op betrouwbaarheid wordt gehanteerd. Daarbij waarschuwen ze voor ‘maatschappelijk gevaarlijke situaties’ en ‘falende experts’. 

In deze repliek duiden we waarom compensatoir toetsen wél kan bijdragen aan onderwijskwaliteit. Met onderwijskwaliteit bedoelen we dan dat hardwerkende studenten in staat moeten zijn om in de daarvoor gestelde studieduur de beoogde eindkwalificaties te behalen dankzij een goed ingericht onderwijs- en toetsprogramma.

Een disclaimer vooraf: ook wij beseffen dat een niet doordachte implementatie van compensatoir toetsen kan leiden tot de problemen die door Smits en Merry worden benoemd. Dat geldt echter voor elke ondoordachte interventie in het onderwijs.

Het ontbreken van een curriculair perspectief vanuit kennis over leren

Smits en Merry geven in hun afkeer van compensatoir toetsen niet of nauwelijks blijk van curriculumbewustzijn en kennis over leren en opleiden. Ze lijken slechts een methodologisch toetsperspectief vanuit het idee van een ‘vakken- curriculum’ te hanteren. In zo’n curriculum bestaan opleidingsprogramma’s uit losstaande onderdelen die allemaal moeten worden afgerond met een voldoende. 

Een dergelijke opvatting past bij curricula uit de vorige eeuw, toen de programma’s voornamelijk bestonden uit een optelsom van kennisvakken en docenten zelf bepaalden wat studenten moesten leren. Wij hebben grote bedenkingen bij opleidingen die bestaan uit losse, apart getoetste onderdelen. Dat kan makkelijk leiden tot een toetsprogramma waarin studenten vooral “zweten, weten en vergeten”.

Een curriculum is geen verzameling losse vakken, maar (in de woorden van prof. dr. Jan van den Akker) een ontwerp voor leren: het moet studenten begeleiden naar een kwalificatie van duurzame waarde én hen plezier geven in leren. Wie zo’n ontwerp maakt, moet rekening houden met veel inhoudelijke en randvoorwaardelijke factoren zoals programmadoelen, tijd, geld, faciliteiten, leermiddelen, docentrollen en toetsvormen. Een goed curriculum draait niet alleen om de inhoud, maar ook om het onderwijzen (de didactiek) en toetsen van die inhoud (Wiliam, 2023). Een goede zogenoemde ‘constructieve afstemming’ daarvan vergt een visie op leren, onderwijzen en toetsing. 

Naar een coherent opgebouwd curriculum vanuit een visie op leren en onderwijzen

Bied studenten vooral een curriculumdienend toetsprogramma aan dat niet alleen tot valide beslissingen leidt, maar vooral ook het gewenste studeergedrag versterkt, adviseren wij. Wij weten al decennia dat pas sprake is van leren (langetermijnbeheersing) na veel intensieve oefening en herhaling. We kunnen daarom geen zekere uitspraken doen over daadwerkelijk leren na een momentprestatie zoals een toets (Soderstrom & Bjork, 2015). 

Leren en onthouden is gebaat bij een functionele spreiding van dat leren – en dus bij een curriculum- en lesopbouw waarin het geleerde wordt herhaald, toegepast en terugkomt. Vooral regelmatige (zelf)toetsing zal bijdragen aan het beter beklijven van de stof (Roediger & Karpicke, 2006). 

Bij inschrijving ga je akkoord met onze privacy-voorwaarden. Deze voorwaarden zijn hier te lezen.

De wekelijkse nieuwsbrief is nog korte tijd gratis te ontvangen. De voorwaarden vindt u hier.

Wat is dus de waarde is van een reeks momentprestaties als niet is achterhaald of de getoetste inhoud na een aantal weken of maanden nog steeds wordt beheerst? En weet een student die net een voldoende haalde over een jaar echt zoveel meer dan de student die twee vragen onder de zak/slaaggrens (cesuur) scoorde? In een curriculumdienend toetsprogramma dat rekening houdt met deze inzichten over leren, kan worden toegestaan dat een keer een onvoldoende wordt gecompenseerd.

Een curriculum dat toewerkt naar het opbouwen van een kennisbasis en integratie van kennis en vaardigheden, helpt de student ook om de essentie van de opleiding te ervaren. Een docent die een goede vertaling naar een onderwijs- en toetsprogramma wil maken, heeft een volle didactische en toetsdeskundige gereedschapskist nodig (zie bijvoorbeeld het boek Wijze lessen van Surma et al., 2019).

Tot welke nuanceringen en aanbevelingen voor compensatoir toetsen leidt dit?

We schetsten in het voorgaande dat studenten en docenten gebaat zijn bij een onderwijs- en toetsprogramma dat bijdraagt aan het succesvol en met plezier behalen van de curriculumdoelen – maar wel binnen de gestelde studieduur. Op basis van het voorgaande stellen wij dat compensatoir toetsen dient te worden ingericht vanuit een curriculumperspectief en vanuit de kennis over leren en opleiden. We geven de volgende nuanceringen en aanbevelingen mee voor het vormgeven van compensatoire toetsing.

Compensatie in de propedeuse

Dat studenten met onvoldoendes op een enkel vak hun propedeuse kunnen halen, heeft ook de functie eerstejaarsstudenten zo veel mogelijk als groep bijeen te houden. De hele jaargroep (uitzonderingen daargelaten) rondt de propedeuse in een jaar af en start met dezelfde bagage het tweede studiejaar. Men maakt in feite een programma dat een snelle scheiding aanbrengt tussen studenten die kennelijk ongeschikt zijn en studenten die geschikt zijn. 

Aan de regeling zitten dan wel voorwaarden. Zo wordt het aantal toegestane onvoldoendes en herkansingen beperkt. Na de propedeuse zal de student verder studeren en een vervolgvak op het gebied van bijvoorbeeld de statistiek krijgen, en/of de statistiek moeten toepassen in onderzoek. Ook de student die geslaagd is met een vijf voor dit propedeusevak, zal dus nog steeds moeten aantonen te voldoen aan de eindterm op dat gebied. 

Als een vak niet meer terugkomt in de latere studiejaren, is het de vraag waarom dit vak geen onderdeel is van een leerlijn. Want, zoals we al eerder stelden: hoeveel onthoudt de student van een eerstejaars vak dat later in de studie niet terugkomt?

Wanneer compensatoir toetsen?

Er is heel veel onderzoek gedaan naar N=N, o.a. door Baars (2013; 2015). Steeds is nagegaan of de studenten die veel hadden gecompenseerd, later zwakkere studenten werden of tekortkwamen. Dat is soms het geval, met name als men veel en/of zware onvoldoendes mocht compenseren, maar soms niet. Een specifiek voorbeeld biedt het onderzoek van Ivo Arnold (2017), die onderzocht hoe studenten die in jaar 1 hadden gecompenseerd, presteerden bij het vervolgvak in jaar 2 ten opzichte van studenten die niet hadden gecompenseerd. Hij vond geen verschil, behalve bij de studenten die pas hadden kunnen compenseren na het afleggen van herkansingen. 

Juist zulk onderzoek maakt het beleid sterk: nagaan wat de effecten zijn, en op basis daarvan het beleid bijstellen. Ons advies is dan ook: alleen compenseren bij eerste kansen, en niet de kans bieden om losse deeltoetsen te herkansen als een vak uit deeltoetsen bestaat die samen tot een (compensatoir) eindresultaat leiden. Bij een onvoldoende eindresultaat vervallen dan alle deelresultaten en moet de student het hele vak overdoen. 

Wat compenseren?

Aan een compensatoir toetsbeleid kun je op veel manieren invulling geven. Smits en Merry richten zich vooral – en zijn daarmee ook erg eenzijdig – op een “alles met alles”-scenario. Hun kritiek op compensatoir toetsen geldt dan echter evenzeer bij conjunctief toetsen. Ook daar kan immers een student die steeds net op de zak/slaaggrens scoort naar hun betoog met serieuze kennishiaten (en dus ‘gevaar voor medemens’) een diploma met dezelfde waarde krijgen als een student die steeds op het maximum haalbare scoort. 

Compensatoir toetsen kan echter ook compensatie binnen vakinhoud betreffen. Kerdijk en collega’s (2013) onderzochten zo’n situatie binnen cumulatief toetsen, waarbij ze hoogscoorders en laagscoorders op de eerste deeltoets vergeleken met hun scores op latere deeltoetsen. Cumulatief toetsen bleek de scores van initiële laagscoorders te verbeteren en geen negatieve invloed te hebben op hoogscoorders. 

Bij vervolgonderzoek (Kerdijk et al., 2015) bleek dat studenten in een cumulatief toetsprogramma anderhalf keer zo veel tijd aan zelfstudie besteden dan studenten die alleen een toets kregen aan het eind van een blok. Studenten geven aan dat cumulatief toetsen helpt om uitstelgedrag te voorkomen en dieper te leren.

We pleiten daarom ook voor grote(re) onderwijsonderdelen, waarbij bij elkaar passende onderdelen samenwerken in een grotere cursus van bijvoorbeeld 12 of 15 studiepunten. Juist bij elkaar passende onderdelen kunnen veel baat hebben bij compensatoir toetsen. Dat kan bijvoorbeeld door het afnemen van tussentoetsen die zowel de docent als de student inzicht geven in de ontwikkeling van het leerproces, of met een systeem van deeltoetsen waarbij een oordeel over slagen of zakken plaatsvindt op basis van veel verzamelde informatie. Het ultieme doel daarin is om onderwijs en toetsing veel meer te integreren in plaats van een systeem te hanteren waarbij de student eerst onderwijs volgt en pas daarna gaat ‘leren voor de toets’.

Zet de validiteit voorop

In hun bijdrage hameren Smits en Merry op het belang van betrouwbaarheid. Vanuit een curriculair perspectief is het optimaliseren van de betrouwbaarheid van individuele toetsen niet het meest belangrijke. Omdat je nooit een volledig betrouwbare toets ontwikkelt, is het eerlijker naar studenten toe om hen (mits er (meerdere) voldoendes tegenover staan) te laten compenseren (Cohen-Schotanus et al., 2019). De aanname daarbij is dat de student die vrijwel alle vakken van de propedeuse heeft behaald op een enkele misser na, heeft laten zien in staat te zijn om de beoogde eindtermen van de opleiding te halen. 

Smits en Merry benoemen bij het betrouwbaarheidsargument ook dat meetfouten inderdaad verkleind kunnen worden door verschillende metingen te combineren tot één score, maar wijzen er terecht op dat je dan wel hetzelfde moet meten. Hiervan zou bij compensatoir toetsen geen sprake zijn, zeggen zij. Wij betwijfelen dat. In een hedendaags, geïntegreerd curriculum relateren alle toetsen aan de eindtermen van de opleiding. Het gebruiken van meerdere metingen om een beslissing te nemen heeft dan een ander belangrijk voordeel: het verhoogt de validiteit. Aangezien beoogde eindkwalificaties vaak breed geformuleerd zijn, zullen verschillende vormen van bewijsmateriaal, verzameld op meerdere momenten, nodig zijn om een valide beslissingen te nemen over deze eindkwalifictaies (Cohen-Schotanus, 2019). 

Tot slot

We hebben betoogd dat toetsing dient te leiden tot valide beslissingen over de essentiële beoogde curriculumdoelen, maar studenten niet onnodig vroegtijdig mag laten uitvallen of demotiveren. Al in 1966 schreef Adriaan de Groot het opruiende maar ook noodzakelijke boek ‘Vijven en Zessen’, waarin hij de feilbaarheid van toetsen en beoordelaars haarscherp beschreef. We zullen altijd beoordelingsfouten maken, zeker op de grens van onvoldoende en voldoende: met een andere vragenset zouden er immers andere studenten slagen en zakken. Toetsen zijn nooit volledig betrouwbaar en ook nooit even gemakkelijk of moeilijk. Daarom moet er worden gecorrigeerd voor de moeilijkheidsgraad en moet er niet zo heilig worden gedaan over de behaalde 6 of 5,5.  

Studenten mogen niet onnodig de dupe worden van een toetsprogramma dat geen aansluiting kent met een samenhangend curriculum of geen kansen biedt tot leren. Wel mag worden verwacht dat studenten hard studeren; het zweet moet op de juiste rug blijven staan. We hebben compensatoir toetsen daarom bekeken door een curriculaire bril: Wat willen we dat studenten gaan leren en waarom? 

Zolang toetsing niet als een integraal curriculumvraagstuk wordt benaderd vanuit een onderbouwde visie op leren, didactiek en onderwijs- en toetsontwerp, zal compensatoir toetsen bekritiseerd blijven worden vanuit een individuele, vak- en toetsgerichte opvatting. Met compensatoir toetsen zonder onderbouwde visie gaan we studenten en de onderwijskwaliteit van het hoger onderwijs uiteindelijk niet verder brengen. Daarentegen komt het gebruik van compensatoir toetsen in geintegreerde curricula de kwaliteit van onderwijs juist wél ten goede.

Referenties

  • Arnold, I. (2017). Resitting or compensating a failed examination: does it affect subsequent results? Assessment & Evaluation in Higher Education, 42(7), 1103-1117.
  • Baars, G. J. A., Godor, B., Hermus, P., & Wolff, R. (2013). Uitgebreide pilot Nominaal=Normaal aan de Erasmus Universiteit Rotterdam. Rotterdam: Risbo.
  • Baars, G. J. A., Wensveen, P. van, & Hermus, P. (2015). Doorwerking regeling ‘Nominaal = Normaal’ aan de Erasmus Universiteit Rotterdam op de samenstelling van de instroom en doorstroom/uitval van (subgroepen) studenten in het eerste studiejaar en op de studievoortgang na twee jaar studeren, zowel van de hele groep als van de verschillende compensatiegroepen. Rotterdam: Risbo.
  • Cohen-Schotanus, J., Visser, K., Jansen, E., & Bax, A. (2019). Studiesucces door onderwijskwaliteit. Den Haag: Boom Lemma Uitgevers.
  • De Groot, A.D. (1966) Vijven en zessen. Groningen: Wolters Noordhoff.
  • Kerdijk, W., Cohen-Schotanus, J., Mulder B. F., Munthinge F. L. H., Tio R. A. (2015). Cumulative versus end-of-course assessment: effects on self-study time and test performance. Medical Education, 49(7), 709-716.
  • Kerdijk, W., Tio, R. A., Mulder, F., & Cohen-Schotanus, J. (2013). Cumulative assessment: strategic choices to influence students’ study effort. BMC Medical Education, 13, 172-176.
  • Roediger, H. L. III, & Karpicke, J. D. (2006). Test-enhanced learning: Taking memory tests improves long-term retention. Psychological Science, 17(3), 249–255.
  • Soderstrom, N. C., & Bjork, R. A. (2015). Learning versus performance: an integrative review. Perspectives on Psychological Science, 10(2) 176-199.
  • Surma, T., Vanhoyweghen, K., Sluijsmans, D. M. A., Camp, G., Muijs, D., & Kirschner, P. (2019). Wijze lessen: Twaalf didactische bouwstenen voor effectieve didactiek. Ten Brink Uitgevers.
  • Wiliam, D. (2013). Principled curriculum design. [Redesigning Schooling 3]. SSAT Limited.
  • Wiliam, D. (2023). Curriculum, pedagogy, and assessment; in that order. In N. Csogor & B. Watkin: Sixth Form Matters. A collection of essays & case studies (pp.14-16). Sic Form College Associations.

Over de auteurs:

  • Dominique Sluijsmans is lector Integrale Curriculumontwikkeling bij de Hogeschool Rotterdam. 
  • Elisa van Bekkum-Swager is senior adviseur onderwijskwaliteit bij Hogeschool Rotterdam.
  • Laurie Delnoij is Universitair Docent Educational Research and Development bij de Universiteit Maastricht. 
  • Janke Cohen-Schotanus is emeritus-hoogleraar Onderzoek van onderwijs in de Medische wetenschappen. 
  • Klaas Visser is voormalig Onderwijsdirecteur bij de Universiteit van Amsterdam.

«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK