Zadania „rozrywające” w testach na przykładzie sprawdzianu ze
Transkrypt
Zadania „rozrywające” w testach na przykładzie sprawdzianu ze
Ewa Stożek, Zadania „rozrywające” w testach Ewa Stożek Okręgowa Komisja Egzaminacyjna w Łodzi Zadania „rozrywające” w testach Na podstawie analizy danych empirycznych ze sprawdzianu 2004 i 2006 roku wyodrębniono zadania „odpowiedzialne” za dwumodalność rozkładu wyników tych testów. Takie zadania nazwano zadaniami „rozrywającymi”. Podjęto próbę opisu cech charakterystycznych tych zadań oraz określenia ich parametrów. 1. Co to jest zadanie „rozrywające”? Rozkłady wyników z egzaminów zewnętrznych przeprowadzanych w Polsce po każdym etapie kształcenia rzadko kiedy są rozkładami normalnymi. Co więcej, często są to rozkłady z wieloma dominantami (rozkłady wielomodalne). Taki kształt rozkładu sugeruje duże zróżnicowanie populacji zdających. O ile na egzaminie maturalnym na poziomie rozszerzonym jest to zrozumiałe, to na sprawdzianie, który z założenia miał być testem sprawdzającym, a nie różnicującym, taki charakter wyników może budzić niepokój. Zróżnicowanie wyników wewnątrz populacji może być następstwem wpływu różnych czynników, o różnej sile oddziaływania, np.: 1. zróżnicowanie populacji ze względu na lokalizację szkoły (miasto-wieś), 2. zróżnicowanie populacji ze względu na rodzaj szkoły (publiczna-niepubliczna), 3. zróżnicowanie populacji ze względu na typ szkoły ponadgimnazjalnej (LO, LP na egzaminie maturalnym), 4. zróżnicowanie wynikające z cech zadań występujących w teście. Ostatni z wymienionych czynników: pojedyncze zadanie w teście, odpowiedzi na które tak silnie różnicują populację, że prowadzi to do rozkładu wyników o dwóch modach, będziemy nazywać zadaniem „rozrywającym”. 149 wydawnictwo_kor_ok.indd 149 19-09-2006 19:51:30 A. Nowe pola diagnostyki edukacyjnej Na rysunku 1. przedstawiono przykłady dwumodalnych rozkładów wyników sprawdzianu 2004, sprawdzianu 2006, egzaminu gimnazjalnym części humanistycznej 2003 oraz wielomodalnego rozkładu wyników egzaminu maturalnego (matematyka, Arkusz II) 2005. Rozkład wyników - sprawdzian 2006 6% 5% 5% 4% 4% 40 38 36 34 32 30 28 26 24 22 20 18 liczba punktów liczba punktów Rozkład wyników - Arkusz II - matematyka 2005 R0zkład wyników GH 2003 6% 4% 5% procent uczniów 5% 3% 2% 1% 4% 3% 2% 1% 0% liczba punktów 50 48 46 44 42 40 38 36 34 32 30 28 26 24 22 20 18 16 14 12 8 10 6 4 2 50 48 46 44 42 40 38 36 34 32 30 28 26 24 22 20 18 16 14 12 8 10 6 4 2 0 0% 0 procent uczniów 16 14 12 8 0 40 38 36 34 32 30 28 26 24 22 20 18 16 14 12 8 10 0% 6 0% 4 1% 2 1% 6 2% 10 2% 3% 4 3% 2 procent uczniów 6% 0 procent uczniów Rozkład wyników - sprawdzian 2004 liczba punktów Rys. 1. Przykłady wielomodalnych rozkładów wyników na różnych egzaminach zewnętrznych w latach 2003-2006. Dane OKE Łódź. Czy rzeczywiście jedno zadanie może powodować powstawanie drugiej mody w rozkładzie wyników? Na sprawdzianie w 2004 i w 2006 roku takimi zadaniami okazały się zadania matematyczne – zadanie 24. oraz zadanie 21. odpowiednio. 150 wydawnictwo_kor_ok.indd 150 19-09-2006 19:51:30 Ewa Stożek, Zadania „rozrywające” w testach Rysunki poniżej pokazują, jak zadanie matematyczne podzieliło populację uczniów: lewy rozkład to wyniki uczniów, którzy uzyskali zero punktów za to zadanie, a prawy rozkład – wyniki uczniów, którzy wiedzieli, jak rozwiązać zadanie (uzyskali punkty za metodę, być może stracili punkty za błędy rachunkowe). Duża odległość między wierzchołkami (modami) tych rozkładów oraz podobne liczebności podgrup są przyczyną powstawania dwumodalnego rozkładu wyników. Rozkład wyników - sprawdzian 2006 4% % uczniów 3% 2% 1% 36 38 40 38 40 34 36 32 30 28 26 24 22 20 18 16 14 12 8 10 6 4 2 0 0% liczba punktów wiedzieli jak rozwiązać zad.21 uzyskali zera za zad.21 Rozkład wyników - sprawdzian 2004 4% % uczniów 3% 2% 34 32 30 28 26 24 22 20 18 16 14 12 8 6 4 2 0 0% 10 1% liczba punktów uzyskali zera za zadanie 24 wiedzieli jak rozwiązać zadanie 24 Rys.2. Zadanie matematyczne podzieliło populację zdających na sprawdzianie 2004 i 2006. 151 wydawnictwo_kor_ok.indd 151 19-09-2006 19:51:31 A. Nowe pola diagnostyki edukacyjnej Rozkład wyników - sprawdzian 2006 bez zadania 21 7% 6% % uczniów 5% 4% 3% 2% 30 32 34 36 38 40 32 34 36 38 40 28 30 26 24 22 20 18 16 14 12 8 6 4 2 0 0% 10 1% liczba punktów Rozkład wyników - sprawdzian 2004 bez zadania 24 8% 7% % uczniów 6% 5% 4% 3% 2% 28 26 24 22 20 18 16 14 12 8 6 4 2 0 0% 10 1% liczba punktów Rys.3. Rozkłady wyników na sprawdzianie 2006 i 2004 bez zadań matematycznych. Zwróćmy uwagę na fakt, że rozkłady wyników sprawdzianu bez tych zadań są rozkładami z jedną modą (rys.3), zatem uzasadnione jest twierdzenie, że za dwumodalność rozkładów wyników są odpowiedzialne właśnie te zadania. Porównajmy podstawowe parametry tych zadań: 1 1 Opis zadań ze względu na łatwość i moc róznicującą za: D.Sołtys ,, M.K.Szmigel , Doskonalenie kompetencji nauczycieli w zakresie diagnozy edukacyjnej, Zamiast korepetycji, Kraków 1997, s.64. 152 wydawnictwo_kor_ok.indd 152 19-09-2006 19:51:32 Ewa Stożek, Zadania „rozrywające” w testach łatwość moc różnicująca zadanie 21. (2006) 0,42 (trudne) 0,81 (dobrze różnicuje) zadanie 24. (2004) 0,31 (trudne) 0,72 (dobrze różnicuje) Czy można na tej podstawie wnioskować, że wszystkie zadania trudne i dobrze różnicujące będą zadaniami „rozrywającymi”? 2. Krzywe charakterystyczne zadania W teorii odpowiedzi na pozycje testu (item response theory, IRT) do opisu cech zadania stosuje się trójparametryczne krzywe charakterystyczne2. Krzywą charakterystyczną zadania opisuje trójparametryczna funkcja logistyczna postaci: p (θ ) = c + 1− c 1+ e −1, 702*a (θ −b ) , gdzie (oznacza poziom pewnej cechy latentnej (np. poziomu osiągnięć, poziomu zdolności), p – prawdopodobieństwo udzielenia poprawnej odpowiedzi na zadanie, natomiast a, b, c są parametrami. Parametr a jest związany z mocą różnicującą zadania, a parametr b – z łatwością zadania. Parametr c w zadaniach wielokrotnego wyboru jest nazywany parametrem zgadywania i jest związany z podatnością zadania na zgadywanie. Geometryczna interpretacja tych parametrów jest następująca: im większe a, tym większy kąt nachylenia stycznej do krzywej logistycznej w punkcie przegięcia b, a y = c jest asymptotą poziomą wykresu funkcji p (θ ) . Zadanie z krzywą charakterystyczną A jest zadaniem trudnym, które nie różnicuje słabych uczniów, różnicuje natomiast najlepszych. Zadanie z krzywą charakterystyczną B jest zadaniem łatwym, które nie różnicuje najlepszych uczniów. Zadania z krzywymi charakterystycznymi C i D są zadaniami dzielącymi populację na dwie grupy, wewnątrz których nie różnicują. Im bardziej stroma będzie krzywa charakterystyczna i im bliżej punkt przegięcia będzie środkowej wartości cechy θ, tym wyraźniejszy będzie podział – zadanie będzie zadaniem „rozrywającym”. 2 Hulin CH.L., Parsons C.K., Wprowadzenie do teorii odpowiedzi na pozycje testu,[w:] J.Brzeziński (red.) Trafność i rzetelność testów psychologicznych. Wybór tekstów. GWP, Gdańsk 2005, s.213-271. 153 wydawnictwo_kor_ok.indd 153 19-09-2006 19:51:33 A. Nowe pola diagnostyki edukacyjnej 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 -2 -1,5 -1 -0,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 B A 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 -2 C -1,5 -1 -0,5 0 0,5 1 1,5 2 0 0,5 1 1,5 2 D Rys.4. Przykłady krzywych charakterystycznych dla różnych zadań 3. Parametry zadań „rozrywających” Spróbujmy wyrysować krzywe charakterystyczne dla zadań nr 21 i 24 ze sprawdzianu 2006 i 2004 odpowiednio. Zrobimy to w nieco uproszczony sposób: obliczymy łatwości omawianych zadań dla grup osób, których wyniki znalazły się w kolejnych staninach. Kolejny stanin możemy traktować jako określony poziom umiejętności ucznia, a łatwość zadania, jako prawdopodobieństwo udzielenia poprawnej odpowiedzi. Krzywą charakterystyczną uzyskamy jako krzywą regresji nieliniowej (logistycznej) z trzema parametrami (w tym celu wykorzystamy dostępną w programie SPSS opcję regresji nieliniowej). Krzywe charakterystyczne tych zadań wyraźnie wskazują na ich „rozrywający” charakter, w szczególności krzywa zadania 21. Na podstawie analizy danych empirycznych ze sprawdzianu (również z lat 2002-2005) można próbować wnioskować, że zadanie będzie zadaniem „rozrywającym”, jeśli parametr a ≥ 1,5 i jednocześnie b ∈ (−0,6;0,6) . Bardziej szczegółowe analizy większej ilości materiału empirycznego (szczególnie testów maturalnych) mogą przynieść wiele nowych informacji o charakterze zadań „rozrywających”. Charakterystyka zadania poprzez analizowanie parametrów krzywej charakterystycznej daje więcej informacji o zadaniu niż analiza współczynników łatwości i mocy różnicującej. 154 wydawnictwo_kor_ok.indd 154 19-09-2006 19:51:33 Ewa Stożek, Zadania „rozrywające” w testach Zadanie 24 Sprawdzian 2004 1,0 p = 0,31 r = 0,72 1 0,8 a=1,5 b=0,59 c=0,01 łatwość 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 -2 0,0 1 2 3 4 5 6 7 8 -1,5 -1 -0,5 0 0,5 1 1,5 2 1 1,5 2 9 numer stanina Zadanie 21 Sprawdzian 2006 1,0 p = 0,42 r = 0,81 łatwość 0,8 1 a=1,5 b=0,15 c=0,02 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0,0 1 2 3 4 5 6 7 8 9 -2 -1,5 -1 -0,5 0 0,5 numer stanina Rys.5. Krzywe charakterystyczne dla zadań 21. i 24. Pytania na zakończenie: 1. Czy zadania „rozrywające” są zadaniami pożądanymi w teście, szczególnie w teście o charakterze sprawdzającym? 2. Jak odróżnić zadania, które są zadaniami „rozrywającymi” na skutek swojej wadliwej konstrukcji lub nieodpowiedniego schematu punktowania od zadań w sposób zamierzony różnicujących populację? 3. Czy na etapie konstrukcji i standaryzacji testu należałoby analizować krzywe charakterystyczne zadań? Jak duża wobec tego powinna być próba standaryzacyjna? 155 wydawnictwo_kor_ok.indd 155 19-09-2006 19:51:34