27.09.2019
Hvad viser de nationale tests?
Af seniorforsker Rasmus Landersø

De nationale tests har været centrum for en stærk debat gennem længere tid. En del af debatten har handlet om hvornår og hvor meget man skal teste børn. En anden del af debatten har handlet om, hvorvidt testresultaterne er retvisende. Dette indlæg handler om den sidste del.

Et kort svar er, at testene – også i den nuværende form – giver en meget stærk indikator for, hvordan børn vil klare sig i fremtiden. I august måned i år viste vi eksempelvis i en undersøgelse, der bygger på testresultater for over 100.000 børn, at halvdelen af de børn, der klarer sig dårligst i 2. klasse, også klarer sig dårligst i 8. klasse. Når der er så stor sammenhæng mellem testresultater over så lang tid, er der ikke belæg for at påstå, at testresultaterne er upræcise.

Men selvfølgelig er det at foretrække, at test er så præcise som muligt. Testene skal nemlig både indgå i læreres vurdering af de enkelte elevers niveau, og hvordan eleverne har udviklet sig, men også til at følge tre nationale mål:

1) Mindst 80% af eleverne skal være gode til at læse og regne i de nationale tests, 2) andelen af de allerdygtigste elever i dansk og matematik skal stige år for år, og 3) andelen af elever med dårlige resultater i de nationale test for læsning og matematik skal reduceres år for år.

Det er dog tvivlsomt, om der findes et skudsikkert værktøj, der kan opfylde disse krav og præcist følge både de enkelte elevers færdigheder år efter år. For hvad vil det sige ”at være god”, og hvordan måler man ”andelen af de allerdygtigste elever” eller ”elever med dårlige resultater”? Hvordan sammenholder man et barns testresultat som 8-årig med testresultatet som 10-årig, når 10-årige jo kan meget mere end 8-årige?

Antagelser

Faktisk vil alle, der anvender testresultater, bygge konklusionerne på antagelser, om hvad vi kan måle, og hvordan vi gør det. Det gælder forældre og lærere, der vurderer børn ud fra, om de fik 10 eller 2 til eksamen, eller sammenholder en årskarakter fra 8. klasse med en årskarakter fra 9. klasse, eller udregner et karaktergennemsnit, eller… Alle gør det. Og hvad der er realistisk at antage, og hvad der ikke er, afhænger ofte af øjnene, der ser.

Hvad gør vi, hvis de spørgsmål vi stiller, ikke kan besvares uden stærke antagelser? Skal vi så justere vores spørgsmål, eller skal vi gå på kompromis med, hvor sikre testene er? Vil vi hellere kunne vurdere få ting med sikkerhed, eller vil vi hellere vurdere mange ting med større usikkerhed?

Et problem med tests

Tests kan have den fordel, at alle får en stemme – selv det stille barn der ikke siger noget i timerne. Men dette betyder ikke, at testresultater entydigt besvarer alle spørgsmål. Eksempelvis vil resultatet af en test, hvor et barn skal sidde stille i en time, også afhænge af forhold som koncentrationsevne og ikke kun selve indholdet af spørgsmålene. Dette er en præmis for alle tests.

Men måske endnu mere grundlæggende: Findes der en naturlig måleenhed for de færdigheder, som tests skal måle? Afstande kan fx måles i meter. 2 meter er dobbelt så langt som 1 meter. Det er alle enige om. Men kan man sige det samme om færdigheder? At et barns sproglige færdigheder er 1, mens et andet barns er 2? Og betyder det, at det andet barn har dobbelt så gode sproglige færdigheder?

Mange læsere vil nok undres over, hvor pudsigt et sådan udsagn lyder – og grunden er, at der ikke findes nogen naturlig skala for færdigheder. For hvorfor lige vælge tallene 1 og 2, og ikke 4 og 5 eller 12 og 59?

Kan man sige noget præcist?

Men hvad kan man så sige med testresultater? Hvis man tror på, at hvis et barn svarer rigtigt på færre spørgsmål end et andet, så må det første barn have de laveste færdigheder, så kan tests bruges til at sige, hvem ligger i toppen, og hvem ligger i bunden.

Men hvis det ene barn nu svarer rigtigt på spørgsmål, som det andet svarer forkert på og omvendt, hvordan kan man så sige, hvem der er bedst? Det afhænger af, om vi vil tillægge spørgsmålene forskellig vægt, fordi nogle er sværere end andre. Men hvordan bestemmer vi, hvad der er sværest – og kan vi sige, at et spørgsmål fx er dobbelt så svært som et andet? Det er valg, vi træffer hver gang, vi ser på testresultater.

Viser de nationale tests noget?

I vores undersøgelse fra august, sammenholdes børnenes placering i forhold til hinanden på hvert klassetrin fra 2. til 8. klasse. Hvem ligger i toppen, og hvem ligger i bunden? Her finder vi meget stærke sammenhænge i placeringen fra år til år.

Her hjælper data os altså. Alle de akademiske bekymringer til trods, står det derfor klart, at de nationale tests er et stærkt og brugbart værktøj til at vurdere børn og deres muligheder. Hvis testene var meget usikre – som at slå plat og krone – ville der ingen sammenhæng være mellem testscorer på forskellige klassetrin, afgangskarakterer eller senere uddannelse. Men det er der. Ud fra testene kan vi f.eks. se, at omkring 70% af placeringen i de nationale tests i 8. klasse forklares af placeringen to år tidligere i 6. klasse. Når dette er tilfældet for tusinder og atter tusinder af børn, må testene siges at give både lærere og forældre en stærk indikation af børnenes styrker og udfordringer.

Men virker testene?

For at kunne besvare om testene har bidraget positivt til skolers og børn udvikling, er det nødvendigt at sammenholde skoler og børn, som tager del i testene med nogle, der ikke gør. Altså at have en kontrolgruppe. Men da alle skal tage testene, er dette ikke umiddelbart muligt.

Den eneste store undersøgelse, der forsøger at besvare, hvorvidt ”testene virker”, ender med svaret: Ja. Det første år efter de nationale tests indførsel, var der et teknisk problem, der gjorde at nogle børn tilfældigvis ikke fik taget testen. Altså er der her en kontrolgruppe til de resterende børn, der tog testen i det samme år. Når børnene følges videre igennem skoletiden, finder forskere fra Aarhus Universitet, at de børn der tog testen i det første år, i gennemsnit klarer sig bedre efterfølgende.

Det vi bekymrer os om

Vi kan med de nationale tests også se at kun 3 ud af 4 af de elever, der lå blandt de nederste 20% i 4. klasse, har påbegyndt en ungdomsuddannelse som 19-årig, mens det blandt de bedste 20% i 4. klasse, er 19 ud af 20. Når Folkeskoleloven starter beskrivelsen af skolens formål med:

”Folkeskolen skal i samarbejde med forældrene give eleverne kundskaber og færdigheder, der: forbereder dem til videre uddannelse og giver dem lyst til at lære mere”

er det måske i virkeligheden det, som tests bør vurderes ud fra. Kan de hjælpe med at sige hvilke elever, der er i farezonen i forhold til at opfylde de helt basale formål med skoletiden? Hvis vi allerede i starten af skoletiden kan sige, hvem der er udsatte, eller hvilke klasser der har brug for ekstra støtte, skal vi så lade være?

Kritikken har samtidig affødt en skepsis overfor al brug af testene. Der er udfordringer med testene, og et helt andet spørgsmål, som vi slet ikke har diskuteret her, er, hvor meget og hvornår man skal teste børn. Men når vi diskuterer, om testene er retvisende eller ej, er debatten i høj grad relateret til de udfordringer, der er med testenes formål. Som jeg beskrev ovenfor, vil dette altid kunne være genstand for kritik. Selv hvis testene revideres og tilpasses.

Testresultaterne som de foreligger i dag er troværdige – hvis de anvendes med måde. Også i de mange, mange forskningsresultater, der benytter de nationale tests.  Man kan også overveje, hvad alternativet bliver. Er det, at vi ikke finder de børn, klasser og skoler, der har brug for ekstra hjælp.

ROCKWOOL Fondens kommentarer er forfatternes eget indlæg og er derfor ikke underlagt peer review.