Flervalgsoppgaver til hverdags og test

Hva er fordelene med flervalgsoppgaver, og hva er det overordnete grunnlaget for denne typen prøver, såkalt testteori?

Publisert mandag 30. mars 2009

Rolf V. Olsen
ILS ved UiO

I de internasjonale og nasjonale prøvene som norske skoleelever deltar på, brukes det i stor grad flervalgsoppgaver. Det eksisterer mange forestillinger og myter om hvor fæle slike oppgaver er. I forbindelse med relanseringen av de nasjonale prøvene sist høst, fikk vi høre i media at dette var en amerikanisering av norsk skole. Aftenposten meldte i tillegg, med anonyme pedagoger fra 70-tallet som sannhetsvitner, at slike prøver er fordummende og skadelige. Dette indikerer at det finnes frykt om hva flervalgsoppgaver er, og at ulike aktører i norsk skole har relativt begrenset kunnskap om denne typen prøver. Det har jo ikke vært tradisjon for å teste elevers kompetanse i Norge. Vi har riktignok eksamener, men disse er basert på et helt annet grunnlag enn de nasjonale og internasjonale prøvene.

I føringene for utvikling av Osloprøvene i naturfag, som ble gjennomført på 5. og 8. trinn høsten 2007, ble det bestemt at prøvene skulle ha en ganske stor andel flervalgsoppgaver. Jeg vil derfor her kort oppsummere noen av fordelene med flervalgsoppgaver, men først gir jeg en rask innføring i det overordnete grunnlaget for denne typen prøver, såkalt testteori.

Et testteoretisk grunnlag

Å lage en prøve etter testteoretiske prinsipper medfører å følge en systematisk og omfattende prosedyre. Jeg ser her kun på den fasen som består i å skaffe seg informasjon om hvordan de ulike oppgavene fungerer. De to sentrale begrepene i testteori er reliabilitet og validitet. I denne framstillingen vil jeg bevisst unngå å bruke disse ordene, og heller se på de testteoretiske kriteriene i et mer hverdagslig språk. Hva vil det så egentlig si at en oppgave fungerer? Hva skiller en god oppgave fra en dårlig? Svarene på slike spørsmål blir noe uvant når vi ser det fra et testteoretisk perspektiv.

Oppgaver skal teste den kompetansen som prøven setter seg fore å teste, og de må være skrevet i et godt språk som er tilpasset elevgruppen. Men testteorien gir langt flere kriterier som oppgavene må oppfylle. Med et testteoretisk perspektiv blir oppgavene i all hovedsak vurdert etter hvor godt de passer inn i prøven som helhet. I testteorien spør man altså først og fremst om prøven er god slik at en kan skille mellom de sterke og svake elevene. At oppgavene er gode for å teste kunnskaper i spesifikke naturfaglige emner, blir et underordnet (men viktig) kriterium. Det finnes
flere vanlige krav som man stiller til oppgavene i prøven:

1. Det totale utvalget av oppgaver må dekke det området som skal prøves på en god måte. For å få til dette må man ha et relativt stort antall oppgaver for å dekke det faglige området i dybde og bredde.

2. Det er gunstig at relativt mange oppgaver har middels vanskegrad. Men man trenger også noen svært lette og svært vanskelige oppgaver for å kunne skille godt mellom elever på ulike nivå.

3. I en god test bør alle oppgavene være relativt enige med hverandre om hvor flinke elevene er. Det vil si at alle oppgavene bør skille mellom elevene slik at de som svarer riktig på en enkelt oppgave, i gjennomsnitt er flinkere på hele prøven enn de som ikke svarer riktig på oppgaven. Grunnen til dette er at man i faglige prøver forsøker å måle en bestemt dyktighet. Hver enkelt oppgave bidrar til denne målingen og hvis oppgavene ikke er enige om hvem som er dyktigst, måler oppgavene opplagt ikke den samme dyktigheten.

Hvorfor flervalgsoppgaver i slike prøver?

Den viktigste begrunnelsen for å benytte flervalgsoppgaver i en prøve som skal etterleve testteoriens krav, er at man kan få elevene til å svare på flere oppgaver. Her vil jeg bruke de kjente naturfaglige begrepene systematisk og tilfeldig målefeil som analogi. For det første gir en prøve med mange oppgaver større muligheter for å dekke alt det som prøven skal måle. Dette reduserer sjansen for systematiske målefeil. Sagt annerledes: Med mange oppgaver, er det mindre relevant for eleven å unnskylde seg med at han eller hun var uheldig med oppgavene. For det andre er det slik at flere målepunkter (dvs. flere oppgaver) gjør at innslaget av tilfeldige målefeil blir mindre.

Andre eksempler på fordeler med flervalgsoppgaver listes opp nedenfor uten at jeg kan gå i dybden på hver enkelt her. Alle disse momentene er forenlige med et testteoretisk perspektiv hvor man forsøker å se på en prøve som en måling:

Ofte kan det være uklart hva en oppgave egentlig spør om.Ved å liste opp mulige alternativer blir det lettere å skjønne hva det blir spurt om.
Flere elever gir svar på flervalgsoppgaver. Et problem med åpne oppgaver er at svært svake elever ikke svarer på oppgavene.
Det er ingen feilkilder ved retting av flervalgsoppgaver fordi rettingen er gitt på forhånd. Men 10 av 10 eksperter må være enige om at det finnes ett enkelt riktig svar blant alternativene.
De dårlige eller gale svarene kan også gi verdifull informasjon, særlig dersom de er knyttet til en teori om hvorfor elevene valgte akkurat den typen feil som svaret representerer.
I flervalgsoppgaver kan ikke skrivedyktige elever maskere sin uvitenhet ved å skrive en veldig rund formulering. Dette er typisk i svar hvor elevene egentlig går rundt grøten og skriver en subtil gjentakelse av spørsmålet og/eller informasjon som er gitt i forbindelse med oppgaven. For åpne oppgaver
er dette et problem som er vanskelig å gjennomskue.
Flervalgsoppgaver kan resirkuleres ved å endre noen av alternativene. Både det riktige og de gale svarene kan formuleres på nytt, og man har da i prinsippet en ny oppgave.
Flervalgsoppgaver gir mindre rettebyrde for lærerne. Men det tar mer tid å lage oppgaven. I tillegg til et riktig svar, trenger man også 2-4 gale svar.
I en læringsplattform får elevene umiddelbar tilbakemelding på flervalgsoppgaver.
Mange elever liker slike oppgaver godt. Det kan nok skyldes at de slipper å formulere et svar, men også at inkludering av flervalgsoppgaver gir en større variasjon i oppgaveformater.
Det er fullt mulig å lage flervalgsoppgaver som utfordrer elever på et høyt kognitivt nivå.

Med bakgrunn i slike argumenter har man både i de internasjonale prøvene som TIMSS og PISA, i de nasjonale prøvene og i de ulike Osloprøvene valgt å ha et relativt stort innslag av flervalgsoppgaver. I Osloprøvene i naturfag 2007, med varighet
en klokketime, utgjorde disse hele 40 oppgaver på 5. trinn og 51 oppgaver på 8. trinn. Om lag 70 % av prøvene var flervalgsoppgaver i en eller annen variant.

To eksempler på oppgaver fra Osloprøven for 5.trinn

To oppgaver fra utprøvingen til Osloprøven i 2007 (se figur 1) illustrerer det grunnleggende testteoretiske prinsippet om at det ikke bare er oppgavene i seg selv som kan vurderes som gode. Oppgavene må også fungere sammen med resten av prøven slik at prøven gir et godt totalt mål på elevens dyktighet i faget. I figuren har vi uthevet det som regnes som riktig svar.

Figur 1: Eksempel på oppgaver som ble pilotert for Osloprøver i naturfag i 2007 Figur 1: Eksempel på oppgaver som ble pilotert for Osloprøver i naturfag i 2007

Tabell 1 gir noen opplysninger om de to samme oppgavene. De to oppgavene ble prøvd ut i hvert sitt hefte, så det er ikke de samme elevene som har svart på begge oppgavene.

Tabell 1: Opplysninger om 2 oppgaver fra utprøvingen av Osloprøver Tabell 1: Opplysninger om 2 oppgaver fra utprøvingen av Osloprøver

Tabellen viser at 60-70 % av elevene svarer riktig på oppgavene. I Osloprøvene var det et mål å ha mange oppgaver med en slik vanskegrad. Videre viser tabellen lærernes vurdering av hvor gode de mente oppgavene var for å prøve elevene i et bestemt kompetansemål, Elevene skal kunne samtale om livssyklusen til noen plante- og dyrearter. Lærerne gjorde dette på en firedelt skala hvor 1 er Svært godt og 4 er Dårlig. Med andre ord mente langt de fleste lærerne at begge oppgavene passet rimelig godt til dette kompetansemålet.

Det som er mest interessant i forhold til vårt tema er de siste fire kolonnene. Disse viser hvorvidt de elevene som valgte riktig svar for disse oppgavene, også var de dyktigste elevene på hele prøven. Med andre ord viser disse verdiene hvor enige oppgavene er om hvem som er de dyktige elevene. Her ser vi at for begge
oppgavene er det de elevene som har valgt det riktige svaret (B) i eksempeloppgave 1 og C i eksempeloppgave 2) som også er de dyktigste. Oppgavene er derfor i noen grad enige med hverandre. Men i Eksempeloppgave 1 er det et av de gale svarene (alternativ D) som tiltrekker seg elever som er nesten like dyktige som elevene som valgte riktig svar (B), og det var relativt mange elever som også valgte dette bestemte gale svaret. Eksempeloppgave 1 ble derfor forkastet etter utprøvingen fordi oppgaven ikke skiller godt nok mellom elever.

Det er ikke mulig å vise alle egenskapene til Osloprøven i naturfag gjennom noen få eksempler. Det jeg har ønsket å få fram er at denne prøven har til hovedhensikt å gi lærerne kvalitetssikret og pålitelig informasjon om det totale faglige nivået for sine elever. I tillegg kan hver enkelt oppgave gi interessant informasjon om elevenes kunnskap i helt spesifikke naturfaglige emner.

Tema

Vurdering

Levert av

ILS ved UiO

Forfatter

Rolf V. Olsen