Zestaw 5. - Uniwersytet Ekonomiczny w Katowicach
Transkrypt
Zestaw 5. - Uniwersytet Ekonomiczny w Katowicach
Uniwersytet Ekonomiczny w Katowicach Wydział Zarządzania, Kierunek: Analityka gospodarcza Zestaw 5. z wielowymiarowej analizy statystycznej1 Analiza wariancji Do rozwiązania zadań 4. – 7. w tym zestawie wykorzystaj zbiór danych znajdujący się na stronie internetowej: http://web2.ae.katowice.pl/trzesiok/j dane kibice.sav Zadanie 1. Studenci zostali losowo podzieleni na 3 grupy, w których pisali test ze statystyki (wcześniej zapowiedziany). Zanim zaczęli pisać, prowadzący zajęcia przedstawił różnego rodzaju komunikat motywujący. W pierwszej grupie powiedział, że jest to niezbyt ważny test a studenci mają napisać luźno tyle ile potrafią. W drugiej grupie zdecydował się na motywację pozytywną. Ogłosił, że jest to ważny sprawdzian i mają postarać się napisać jak najlepiej. W trzeciej grupie przedstawił motywację negatywną, że jest to krytyczny sprawdzian, który jest warunkiem zaliczenia całego roku. Wykorzystując dane przedstawione w poniższej tabeli odpowiedz na pytanie, czy w tym przypadku spełnione są założenia do wykonania analizy wariancji testem Fishera-Snedecora. Zadanie 2. Zinterpretuj wynik testu Browna-Forsythe’a (będącego „mocnym odpowiednikiem” testu Fishera-Snedecora w analizie wariancji) przedstawionego w poniższej tabeli. Czy przedstawiony przed testem komunikat motywacyjny miał wpływ na wyniki testu? Odpowiedź uzasadnij. Zadanie 3. Wykorzystując wartości testów post-hoc przedstawionych w tabeli (porównań wielokrotnych) wskaż, które grupy studentów różnią się istotnie (odpowiedź uzasadnij). 1 Zestaw dostępny na stronie: http://web2.ae.katowice.pl/trzesiok/j zestaw5 was.pdf 1 Zadanie 4. Dane w zbiorze „kibice” dotyczą wylosowanej próby pseudokibiców trzech klubów piłkarskich: Legii, Cracovii oraz Widzewa. Badano jak kształtuje się stopień zaangażowania w „kibicowanie”, który był mierzony liczbą ran ciętych odniesionych przy okazji rozgrywek piłkarskich. Pozyskano również informacje, czy dana osoba jest notowana przez policję. Wykorzystując dwuczynnikowa analizę wariancji zbadać, czy zaangażowanie pseudokibica, tj. liczba ran ciętych odniesionych przy okazji rozgrywek piłkarskich, różni się w grupach wyznaczonych przez zmienne klub i notowany. W tym celu: a) sprawdź i skomentuj spełnienie założeń dwuczynnikowej analizy wariancji, b) przeprowadź analizę wariancji i odpowiedz na pytanie, który z czynników (klub, notowany) ma istotny wpływ na zmienną zależną (liczbę ran ciętych odniesionych przy okazji rozgrywek piłkarskich), c) odpowiedz na pytanie, czy interakcje mają istotny wpływ na zmienną zależną, d) wykorzystując test post-hoc Bonferroniego określ w których klubach piłkarskich średnie liczby odniesionych ran ciętych różnią się istotnie (bez względu na to, czy byli notowani). Zadanie 5. Wykorzystując wartości testów post-hoc przedstawionych w tabeli „Porównania parami” wskaż, które grupy kibiców różnią się istotnie. Zapisz odpowiednie uzasadnienie i interpretację. 2 Zadanie 6. W poniższej tabeli przedstawiono wyniki testowania w grupach wyznaczonych przez zmienną klub hipotezy, czy zmienna notowany wpływa istotnie na zmienną zależną. Wykorzystując te dane odpowiedz na pytanie, w którym z klubów piłkarskich fakt, czy kibic był notowany przez policję, czy nie, ma istotny wpływu na liczbę odniesioną ran ciętych. Odpowiedź uzasadnij. Zadanie 7. Wykorzystując dane przedstawione w poniższej tabeli odpowiedz na pytanie, który z czynników ma większy wpływ na liczbę odniesioną ran ciętych wśród kibiców. c 2017 Joanna Trzęsiok Copyright Odpowiedzi Zadanie 1. • Zamienna zależna (wynik z testu) mierzona jest na skali ilorazowej (metrycznej). • Czynnik (komunikat motywujący) jest zmienną nominalną (niemetryczną). • Spełnione jest założenie o normalności rozkładu zmiennej Y w grupach. 1) Wsw (57) = 0, 977; p = 0, 34 > 0, 05; 2) Wsw (68) = 0, 974; p = 0, 16; 3) Wsw (55) = 0, 966; p = 0, 12. Zatem w żadnej z badanych grup nie ma podstaw do odrzucenia hipotezy o normalności rozkładu zmiennej zależnej. • Natomiast nie spełnione jest założenie o jednorodności wariancji. F (2, 177) = 9, 52; p < 0, 001 < 0, 05 ⇒ zatem hipotezę o równości wariancji w grupach należy odrzucić Zadanie 2. BF (2, 144) = 43, 86; p < 0, 001 < 0, 05, co oznacza, że H0 należy odrzucić, a więc komunikat motywacyjny miał wpływ na wynik testu w poszczególnych grupach studentów. 3 Zadanie 3. Oznaczenia: A – grupa w której zapowiedziano, że test jest niezbyt ważny, B – grupa, której powiedziano, że test jest ważny i mają pisać jak najlepiej, C – grupa, której powiedziano, że test jest warunkiem zaliczenia roku. Mamy mA − mB = −7, 69; p < 0, 001 ⇒ różnica istotna, mA − mC = −8, 36; p < 0, 001 ⇒ różnica istotna, mB − mC = −0, 67; p = 0, 905 ⇒ różnica nieistotna. Zatem istotne różnice w wynikach testu obserwujemy, pomiędzy studentami (z grupy A), którym powiedziano, że to niezbyt ważny test, a studentami (z grup B i C), którym zapowiedziano, że test jest ważny. Nie ma istotnych różnic w wynikach pomiędzy studentami z grupy B motywowanymi pozytywnie, że mają pisać jak najlepiej potrafią, a tymi z grupy C, których „straszono”, że test jest warunkiem zaliczenia roku. Zadanie 4. Ad a) Spełnione są wszystkie założenia analizy czynnikowej: – zmienna zależna jest mierzona na skali ilorazowej, zaś czynniki klub i notowany są zmiennymi nominalnymi, – spełnione jest założenie o normalności rozkładu w grupach, – spełnione jest założenie o jednorodności wariancji (F (5, 76) = 1, 4; p = 0, 235 > 0, 05) Ad b) Zarówno przynależność do klubu, jak i fakt, czy kibic był notowany na policji mają istotny wpływ na liczbę odniesionych ran ciętych: F (2, 76) = 9, 93; p < 0, 001 < 0, 05 ⇒ zmienna klub ma istotny wpływ na liczbę ran, F (1, 76) = 26, 39; p < 0, 001 < 0, 05 ⇒ zmienna notowany ma istotny wpływ na liczbę ran. Ad c) F (1, 76) = 1, 36; p = 0, 264 > 0, 05 ⇒ interakcje czynników nie mają istotnego wpływu na liczbę ran. Ad d) Istotne różnice w liczbie odniesionych ran ciętych obserwujemy tylko pomiędzy kibicami Cracovii a Widzewa: mL − mC = −1, 83; p = 0, 125 ⇒ różnica nieistotna, mL − mW = 1, 52; p = 0, 3 ⇒ różnica nieistotna, mC − mW = 3, 35; p = 0, 001 ⇒ różnica istotna. Zadanie 5. Wśród osób, które nie były notowane na policji, pod względem odniesionych ran ciętych istotnie różnią się kibice Widzewa od kibiców Legii i Cracovii. Nie ma istotnych różnic w liczbie ran ciętych pomiędzy kibicami Legii a Cracovii wśród nienotowanych: NIE mL − mC = −1, 26; p = 0, 785 ⇒ różnica nieistotna, mL − mW = 2, 97; p = 0, 037 ⇒ różnica istotna, mC − mW = 4, 23; p = 0, 001 ⇒ różnica istotna. Wśród osób, które były notowane na policji, pod względem odniesionych ran ciętych istotnie różnią się tylko kibice Widzewa od kibiców Cracovii. Nie ma istotnych różnic w liczbie ran ciętych pomiędzy kibicami Legii a Cracovii oraz pomiędzy kibicami Legii a Widzewa (wśród notowanych): TAK mL − mC = −2, 37; p = 0, 09 ⇒ różnica nieistotna, mL − mW = 0, 36; p = 1, 0 ⇒ różnica nieistotna, mC − mW = 2, 73; p = 0, 039 ⇒ różnica istotna. Zadanie 6. Wśród kibiców Cracovii oraz Widzewa fakt, że ktoś był notowany na policji miał istotny wpływ na liczbę odniesionych ran ciętych: Legia Cracovia W idzew F (1, 76) = 3, 38; p = 0, 07 ⇒ wśród kibiców Legii cz. notowany nie miał istotnego wpływu na liczbę ran, F (1, 76) = 8, 65; p = 0, 004 ⇒ wśród kibiców Cracovii cz. notowany miał istotny wpływ na liczbę ran, F (1, 76) = 16, 78; p < 0, 001 ⇒ wśród kibiców Widzewa cz. notowany miał istotny wpływ na liczbę ran. Zadanie 7. Większy wpływ na liczbę odniesionych ran ciętych miał fakt, czy kibic był notowany na policji, niż to 2 2 z jakiego był klubu (ηnotowany = 0, 258 > 0, 207 = ηklub ). 4