Een stortvloed van klachten is de afgelopen maanden geuit tegen tests. Een deel van de kritiek heeft betrekking op de PARCC-examens, Ohio’s nieuwe examens Engels en wiskunde voor de groepen 3 tot en met 8 en de middelbare school. Het gemopper over testen is geen gloednieuw fenomeen. In 2004 mopperden de inwoners van Ohio al over de OGT’s! In het licht van de laatste versie van het testverzet, moeten we onthouden waarom gestandaardiseerde testen essentieel zijn. De belangrijkste redenen, zoals ik ze zie, zijn objectiviteit, vergelijkbaarheid en controleerbaarheid.
Reden 1: Objectiviteit
In de kern zijn gestandaardiseerde examens ontworpen om objectieve metingen te zijn. Ze beoordelen leerlingen op basis van een vergelijkbare reeks vragen, worden onder vrijwel identieke testomstandigheden afgenomen, en worden beoordeeld door een machine of een blinde beoordelaar. Ze zijn bedoeld om een nauwkeurige, ongefilterde maatstaf te zijn voor wat een student weet.
Nu hebben sommigen betoogd dat de cijfers van leraren voldoende zijn. Maar de realiteit is dat de beoordelingspraktijken van leraren van school tot school, en zelfs binnen scholen, sterk uiteen kunnen lopen. Zo kan de ene wiskundeleraar buitengewoon mild zijn, terwijl de andere keihard kan zijn: een tien halen betekent iets heel anders. De beoordeling door leraren kan ook op andere manieren subjectief zijn, zoals vriendjespolitiek ten opzichte van bepaalde leerlingen, en kan gebaseerd zijn op factoren die geen invloed hebben op de prestaties, zoals het gedrag in de klas, deelname of aanwezigheid.
Maar wanneer leerlingen een gestandaardiseerd examen afleggen, ontstaat een veel duidelijker beeld van academisch meesterschap. Dus hoewel gestandaardiseerde examens niet bedoeld zijn als vervanging (en dat ook niet zouden moeten zijn) van het cijferboek van de leraar, bieden ze wel een objectieve, “summatieve” beoordeling van de prestaties van leerlingen. Gestandaardiseerde prestatiebeoordelingen kunnen worden gebruikt voor vergelijkings- en verantwoordingsdoeleinden, die beide achtereenvolgens worden besproken.
Reden 2: Vergelijkbaarheid
De objectiviteit zelf van gestandaardiseerde examens zorgt voor vergelijkbaarheid van de prestaties van leerlingen, een wenselijke eigenschap voor zowel ouders als praktijkmensen. De meeste ouders willen bijvoorbeeld weten of hun kind voldoet aan de benchmarks van de staat, of hoe het zich verhoudt tot zijn leeftijdsgenoten in de staat. Standaard staatsexamens geven ouders deze belangrijke informatie. Intussen hebben ouders die naar een andere school gaan, het volste recht om de resultaten van de standaardtests van een reeks scholen, waaronder charters, districtsscholen en STEM-scholen, te inspecteren en te vergelijken voordat ze een school voor hun kind kiezen.
Schoolleiding gebruikt de resultaten van de standaardtests ook om de prestaties van haar leerlingen over de grenzen van scholen en districten heen te vergelijken. De directeur van East Elementary kan bijvoorbeeld de prestaties van haar leerlingen vergelijken met die van de leerlingen van West Elementary, het gemiddelde van de wijk, het gemiddelde van de provincie en het gemiddelde van de hele staat. Hoe doen haar leerlingen het? Dat kan alleen een gestandaardiseerde landelijke toets uitwijzen.
Er zijn interessante voorstellen gedaan om scholen hun eigen beoordeling te laten kiezen – een ‘pick-your-own-assessment’-beleid. Dit is een onjuist idee dat moet worden verworpen. Het zou het beginsel van de vergelijkbaarheid van landelijke tests ondermijnen.
Voor alle duidelijkheid: gestandaardiseerde examens zijn niet allemaal hetzelfde. Neem een voor de hand liggend voorbeeld: Ohio’s oude staatsexamens en de PARCC-examens zijn beide gestandaardiseerde examens, maar ze zijn zo verschillend als dag en nacht. Ondertussen zou een “kies je eigen” toetsbeleid een doos van Pandora openen met verwarring over hoe de resultaten moeten worden geïnterpreteerd. Stel dat Columbus City Schools NWEA selecteert als zijn testverkoper en een score van 80% behaalt. Stel nu dat Worthington City Schools (in de voorsteden van Columbus) PARCC kiest en een score van 50 procent haalt. Moeten we daaruit afleiden dat de leerlingen in Columbus een hoger niveau halen dan in Worthington? Of is de test gewoon anders? Alleen op basis van deze testgegevens zouden we geen idee hebben.
Het beoordelingsbeleid van de staat moet niet neerkomen op een Kies Je Eigen Avontuur voor districten en scholen. In plaats daarvan moeten de wetgevers van Ohio doorgaan met het implementeren van één samenhangend systeem van gestandaardiseerde examens dat vergelijkbare resultaten oplevert.
Reden 3: Verantwoording
Of je het leuk vindt of niet, gestandaardiseerde examengegevens blijven de beste manier om scholen verantwoordelijk te houden voor hun academische prestaties. Het is een grote verdienste van Ohio dat het een geavanceerd systeem voor schoolverantwoording heeft ingevoerd. Het systeem omvat robuuste maatstaven die vaak worden aangeduid als “groei van de leerlingen” of “toegevoegde waarde”-maatstaven, naast de conventionele resultaten op het gebied van vaardigheid en toelating tot de universiteit. Al deze resultaten zijn gebaseerd op gestandaardiseerde testresultaten.
De informatie uit deze verantwoordingsmaatregelen stelt beleidsmakers in staat te bepalen welke scholen interventie nodig hebben, tot sluiting aan toe. De wet op automatische sluiting van charterscholen maakt bijvoorbeeld gebruik van de resultaten van staatsexamens – zowel de toegevoegde waarde op schoolniveau als de bekwaamheid – om te bepalen welke scholen moeten sluiten. Bovendien kunnen districten onder staatstoezicht komen te staan via de Academic Distress Commission als zij slecht presteren op basis van testresultaten. Een ander gebruik van gestandaardiseerde testgegevens komt er op het gebied van deregulering. Een prioritair wetsvoorstel dat in de Senaat in behandeling is (SB 3) zou “goed presterende” districten bepaalde versoepelingen en vrijstellingen van overheidsmandaten geven. Hoe worden deze goed presterende districten geïdentificeerd? Antwoord: Door middel van overheidsmaatregelen, gebaseerd op gestandaardiseerde testscores.
Behalve de resultaten van gestandaardiseerde toetsen bestaat er voor beleidsmakers geen objectieve methode om vast te stellen welke scholen slecht presteren en interventie nodig hebben en welke scholen goed presteren en beloond moeten worden. Denk eens aan het alternatief: Wie wil dat beleidsmakers ingrijpen in een school op basis van hun “onderbuikgevoel” of een school belonen op basis van anekdotes? Standaard staatsexamens zijn essentieel voor het handhaven van een eerlijk en objectief verantwoordingssysteem.
In een utopische wereld zou men standaard tests kunnen weg wensen. Alle scholen zouden geweldig zijn, en elke leerling zou zijn potentieel waarmaken. Maar we leven in de realiteit. Er zijn goede scholen en rotte scholen; er zijn leerlingen met hoge prestaties en leerlingen die het heel moeilijk hebben. We hebben harde, objectieve informatie nodig over de prestaties van scholen en leerlingen, en het beste beschikbare bewijs komt van gestandaardiseerde tests. Beleidsmakers moeten oppassen dat ze de integriteit van de gestandaardiseerde tests van de staat niet ondermijnen.