„rozrywające” w testach na przykładzie zadań

Transkrypt

„rozrywające” w testach na przykładzie zadań
Ewa Stożek, Henryk Dąbrowski
OKE Łódź
Zadania „rozrywające” w testach
na przykładzie zadań maturalnych z matematyki
Na podstawie analizy danych empirycznych z egzaminu maturalnego z matematyki 2005 i 2006 roku wyodrębniono zadania na tyle silnie różnicujące, iż można mówić o tym, że „rozrywają” populację zdających na dwie grupy. Podjęto próbę
opisu cech charakterystycznych tych zadań oraz określenia ich parametrów.
Na zróżnicowanie wyników na egzaminie maturalnym ma wpływ wiele
czynników, które powodują, że rozkłady są spłaszczone i/albo wielomodalne. Takimi
czynnikami są
np. typ szkoły lub deklarowany poziom zdawania przedmiotu
(uczniowie słabsi deklarują zdawanie tylko poziomu podstawowego, a lepsi kontynuują zdawanie na poziomie rozszerzonym). „Rozrywanie” rozkładu wyników poprzez te czynniki przedstawiają wykresy na rys. 1. Wszystkie prezentowane rozkłady
wyników odpowiadają danym zdających w szkołach na terenie objętym działaniem
Okręgowej Komisji Egzaminacyjnej w Łodzi.
Jednak przyczyną „rozrywania” mogą być także pojedyncze zadania, które
będziemy nazywać zadaniami rozrywającymi1. Aby to pokazać, ograniczymy rozważania do Arkusza II i absolwentów liceów ogólnokształcących (około 6 tysięcy zdających) , wytrącając w ten sposób wpływ innych (być może nie wszystkich) czynników różnicujących populację.
Zadania poziomu rozszerzonego z matematyki w 2005 roku były dla absolwentów liceów ogólnokształcących zadaniami trudnymi (łatwość 0,35). Daje się wyodrębnić dwa podrozkłady z wierzchołkami (modami) 10 i 20 punktów odpowiednio.
Dalsza analiza zadań pokazuje, że drugą modę generują wyniki uczniów, którzy poprawnie rozwiązali zadanie 14. (por rys.2) Zadanie 14. okazuje się dla tej populacji
zadaniem rozrywającym: ci, którzy poprawnie je rozwiązali (około 44% zdających)
uzyskali wyższe wyniki z całego testu niż grupa osób, która otrzymała za to zadanie
0 punktów (33%).
1
por. E.Stożek Zadania „rozrywające” w testach, w materiałach XII Konferencji Diagnostyki Edukacyjnej, Lublin 9-11.X.2006
Rozkład wyników Arkusz I - matematyka 2006
Rozkład wyników AI - matematyka 2006
5%
4%
4%
liczebność
liczebność
3%
2%
3%
2%
1%
1%
0%
0
0%
0
2
4
6
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
LO
Rozkład wyników Arkusz II - matematyka 2006
LP,LU,T
Rozkład wyników Arkusz I - matematyka 2006
4%
6%
5%
3%
liczebność
liczebność
4%
2%
3%
2%
1%
1%
0%
0
0%
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
poziom podstawowy
poziom rozszerzony
Rys. 1 Przykłady wielomodalnych rozkładów wyników na egzaminie maturalnym z matematyki wraz z przykładami czynników rozrywających
Przypomnijmy to zadanie:
Zadanie 14. (5 pkt) – poziom rozszerzony
1 + 4 + 7 + ... + (3n − 2)
n →∞ 5 + 7 + 9 + ... + ( 2n + 3)
Oblicz: lim
Aby rozwiązać to zadanie, należało zauważyć, że licznik i mianownik ułamka, to
sumy ciągu arytmetycznego. Jeśli zdający poprawnie rozpoznawali ciąg arytmetyczny, to z reguły doprowadzali zadanie do końca. Jednak dla zaskakująco dużej części
populacji zadanie okazało się niezrozumiałe. Łatwość tego zadania 0,58 wskazuje na
jego umiarkowaną trudność dla całej populacji. Jego wartość różnicującą można potraktować jako element pożądany w teście maturalnym.
Zadania poziomu rozszerzonego w Arkuszu II egzaminu maturalnego w 2006 roku
dla absolwentów liceów ogólnokształcących były trudne (łatwość 0,42). W porównaniu z testem 2005 roku wzrosło zróżnicowanie wyników (odchylenie standardowe
wynosiło dla tej populacji 10,32 punktu w 2005 roku i 12,7 punktu w 2006 roku).
Tym razem jednym z zadań rozrywających okazało się najłatwiejsze zadanie w teście
(por. rys.3). Wyniki za cały Arkusz II tych zdających, którzy rozwiązali zadanie 20.
koncentrują się wokół mody 30 punktów.
Zadanie 20. (4 pkt) – poziom rozszerzony
Dane są funkcje f ( x) = 3
x 2 −5 x
1
i g ( x) =  
9
−2 x 2 − 3 x + 2
.
Oblicz, dla których argumentów x wartości funkcji f są większe
od wartości funkcji g .
Zadanie sprawdza umiejętność rozwiązywania nierówności wykładniczej. Punkty
były przyznawane za wykonanie kolejnych prostych czynności: zapisanie nierówności, wykorzystanie monotoniczności funkcji wykładniczej i rozwiązanie nierówności
kwadratowej. Ponad 15% zdających nie otrzymała żadnego punktu za to zadanie,
14% uzyskało od 1do 2 punktów, a całkowicie poprawnie rozwiązało to zadanie
prawie 53% uczniów. Podobnie jak poprzednio wydaje się, że tego typu różnicowanie populacji jest wartościowe jako cecha testu, który jest jednocześnie egzaminem
wstępnym na wyższą uczelnię.
Rozkład wyników AII - matematyka 2005 - absolwenci LO
4%
liczebność
3%
2%
1%
0%
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
Rozkład wyników AII - matematyka 2005 - absolwenci LO
bez zadania 14
5%
liczebność
4%
3%
2%
1%
0%
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
Rozkład wyników Arkusz AII - matematyka 2005 - abslowenci LO
12%
liczebność
10%
8%
6%
4%
2%
liczba punktów
nie rozwiązali zadania 14
poprawnie rozwiązali zadanie 14
Rys.2 Zadanie 14. – zadanie rozrywające Arkusza II – matematyka 2005.
50
48
46
44
42
40
38
36
34
32
30
28
26
24
22
20
18
16
14
12
8
10
6
4
2
0
0%
Rozkład wyników AII - matematyka 2006 - absolwenci LO
4%
liczebność
3%
2%
1%
0%
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
Rozkład wyników Arkusz II - matematyka 2006 - absolwenci LO
bez zadania 20
4%
liczebność
3%
2%
1%
0%
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
liczba punktów
Rozkład wyników Arkusz II - matematyka 2006 - absolwenci LO
10%
liczebność
8%
6%
4%
2%
liczba punktów
uzyskali za zadanie 20 od 0 do 2 pkt
poprawnie rozwiązali zadanie 20
Rys.3 Zadanie 20. – zadanie rozrywające Arkusza II – matematyka 2006.
50
48
46
44
42
40
38
36
34
32
30
28
26
24
22
20
18
16
14
12
8
10
6
4
2
0
0%
Zestawmy łatwość i moc różnicującą omawianych zadań:
łatwość
moc różnicująca
zadanie 14 (2005)
0,58 (umiarkowanie trudne)
0,68 (dobrze różnicuje)
zadanie 20 (2006)
0,72 (łatwe)
0,65 (dobrze różnicuje)
Czy można na tej podstawie wnioskować, że wszystkie zadania łatwe i dobrze różnicujące będą zadaniami „rozrywającymi”?
Takie wnioskowanie nie jest uprawnione. W rozpatrywanych przykładach ze sprawdzianu2 zadaniami rozrywającymi okazały się zadania, które były trudne i dobrze
różnicowały. Może więc chodzi o to, żeby to były po prostu zadania dobrze różnicujące? Ale większość zadań Arkusza II to zadania dobrze różnicujące. Parametry łatwości i mocy różnicującej są zbyt ogólne i mówią za mało o zadaniu. Zadanie „rozrywające” można rozpoznać po jego krzywej charakterystycznej3.
Spróbujmy zatem wyrysować krzywe charakterystyczne dla zadań 14 i 20.
Zrobimy to w nieco uproszczony sposób: obliczymy łatwości omawianych
zadań dla grup osób, których wyniki znalazły się w kolejnych staninach. Kolejny
stanin możemy traktować jako określony poziom umiejętności ucznia, a łatwość zadania, jako prawdopodobieństwo udzielenia poprawnej odpowiedzi. Krzywą charakterystyczną uzyskamy jako krzywą regresji nieliniowej (logistycznej) z trzema parametrami (w tym celu wykorzystamy dostępną w programie SPSS opcję regresji nieliniowej). Krzywą charakterystyczną zadania opisuje trójparametryczna funkcja logistyczna postaci: p (θ ) = c +
1− c
1+ e
−1, 702*a (θ − b )
, gdzie θ oznacza poziom pewnej cechy
latentnej (np. poziomu osiągnięć, poziomu zdolności), p – prawdopodobieństwo
udzielenia poprawnej odpowiedzi na zadanie, natomiast a, b, c są parametrami. Parametr a jest związany z mocą różnicującą zadania, a parametr b – z łatwością zadania. Parametr c w zadaniach wielokrotnego wyboru jest nazywany parametrem zgadywania i jest związany z podatnością zadania na zgadywanie.
2
por. E.Stożek Zadania „rozrywające” w testach, w materiałach XII Konferencji Diagnostyki Edukacyjnej, Lublin 9-11.X.2006
3
Hulin CH.L., Parsons C.K., Wprowadzenie do teorii odpowiedzi na pozycje testu,[w:] J.Brzeziński
(red.) Trafność i rzetelność testów psychologicznych. Wybór tekstów. GWP, Gdańsk 2005, s.213-271
Zadanie 14 (2005)
1,0
1
0,8
a = 1,21
b = -0,31
c= 0
łatwość
0,8
0,6
0,6
0,4
0,4
0,2
0,2
0
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
-1
-0,5
0
0,5
1
1,5
2
0,0
1
2
3
4
5
6
7
8
9
num er stanina
Zadanie 20 (2006)
1,0
1
0,8
a = 1,37
b = -0,60
c= 0
łatwość
0,8
0,6
0,6
0,4
0,4
0,2
0,2
0
-2
-1,5
0,0
1
2
3
4
5
6
7
8
9
numer stanina
Rys.5 Krzywe charakterystyczne dla zadań 14. i 20.
Zadanie 14. i 20. mają podobne parametry krzywych charakterystycznych. Krzywe
charakterystyczne tych zadań wyraźnie wskazują na ich „rozrywający” charakter:
duża (większą od 1) wartość parametru a i jednocześnie parametr b bliski 0. Wartość
parametru b (punkt przegięcia) wskazuje podział populacji na dwie grupy
o podobnych liczebnościach, a wartość parametru a (kąt nachylenia stycznej do wykresu w punkcie przegięcia) wskazuje na duże różnice w umiejętnościach tych grup.
Charakterystyka zadania poprzez analizowanie parametrów krzywej charakterystycznej daje więcej informacji o zadaniu niż analiza współczynników łatwości
i mocy różnicującej. Wydaje się zasadnym, aby na etapie standaryzacji testu analizować krzywe charakterystyczne zadań.

Podobne dokumenty