Zestaw 5. - Uniwersytet Ekonomiczny w Katowicach

Transkrypt

Zestaw 5. - Uniwersytet Ekonomiczny w Katowicach
Uniwersytet Ekonomiczny w Katowicach
Wydział Zarządzania, Kierunek: Analityka gospodarcza
Zestaw 5. z wielowymiarowej analizy statystycznej1
Analiza wariancji
Do rozwiązania zadań 4. – 7. w tym zestawie wykorzystaj zbiór danych znajdujący się na stronie internetowej:
http://web2.ae.katowice.pl/trzesiok/j dane kibice.sav
Zadanie 1. Studenci zostali losowo podzieleni na 3 grupy, w których pisali test ze statystyki (wcześniej
zapowiedziany). Zanim zaczęli pisać, prowadzący zajęcia przedstawił różnego rodzaju komunikat motywujący. W pierwszej grupie powiedział, że jest to niezbyt ważny test a studenci mają napisać luźno tyle ile
potrafią. W drugiej grupie zdecydował się na motywację pozytywną. Ogłosił, że jest to ważny sprawdzian
i mają postarać się napisać jak najlepiej. W trzeciej grupie przedstawił motywację negatywną, że jest to
krytyczny sprawdzian, który jest warunkiem zaliczenia całego roku.
Wykorzystując dane przedstawione w poniższej tabeli odpowiedz na pytanie, czy w tym przypadku
spełnione są założenia do wykonania analizy wariancji testem Fishera-Snedecora.
Zadanie 2. Zinterpretuj wynik testu Browna-Forsythe’a (będącego „mocnym odpowiednikiem” testu
Fishera-Snedecora w analizie wariancji) przedstawionego w poniższej tabeli. Czy przedstawiony przed
testem komunikat motywacyjny miał wpływ na wyniki testu? Odpowiedź uzasadnij.
Zadanie 3. Wykorzystując wartości testów post-hoc przedstawionych w tabeli (porównań wielokrotnych)
wskaż, które grupy studentów różnią się istotnie (odpowiedź uzasadnij).
1
Zestaw dostępny na stronie: http://web2.ae.katowice.pl/trzesiok/j zestaw5 was.pdf
1
Zadanie 4. Dane w zbiorze „kibice” dotyczą wylosowanej próby pseudokibiców trzech klubów piłkarskich:
Legii, Cracovii oraz Widzewa. Badano jak kształtuje się stopień zaangażowania w „kibicowanie”, który był
mierzony liczbą ran ciętych odniesionych przy okazji rozgrywek piłkarskich. Pozyskano również informacje,
czy dana osoba jest notowana przez policję.
Wykorzystując dwuczynnikowa analizę wariancji zbadać, czy zaangażowanie pseudokibica, tj. liczba ran
ciętych odniesionych przy okazji rozgrywek piłkarskich, różni się w grupach wyznaczonych przez zmienne
klub i notowany. W tym celu:
a) sprawdź i skomentuj spełnienie założeń dwuczynnikowej analizy wariancji,
b) przeprowadź analizę wariancji i odpowiedz na pytanie, który z czynników (klub, notowany) ma istotny
wpływ na zmienną zależną (liczbę ran ciętych odniesionych przy okazji rozgrywek piłkarskich),
c) odpowiedz na pytanie, czy interakcje mają istotny wpływ na zmienną zależną,
d) wykorzystując test post-hoc Bonferroniego określ w których klubach piłkarskich średnie liczby odniesionych ran ciętych różnią się istotnie (bez względu na to, czy byli notowani).
Zadanie 5. Wykorzystując wartości testów post-hoc przedstawionych w tabeli „Porównania parami”
wskaż, które grupy kibiców różnią się istotnie. Zapisz odpowiednie uzasadnienie i interpretację.
2
Zadanie 6. W poniższej tabeli przedstawiono wyniki testowania w grupach wyznaczonych przez zmienną
klub hipotezy, czy zmienna notowany wpływa istotnie na zmienną zależną. Wykorzystując te dane odpowiedz na pytanie, w którym z klubów piłkarskich fakt, czy kibic był notowany przez policję, czy nie, ma
istotny wpływu na liczbę odniesioną ran ciętych. Odpowiedź uzasadnij.
Zadanie 7. Wykorzystując dane przedstawione w poniższej tabeli odpowiedz na pytanie, który z czynników ma większy wpływ na liczbę odniesioną ran ciętych wśród kibiców.
c 2017 Joanna Trzęsiok
Copyright Odpowiedzi
Zadanie 1.
• Zamienna zależna (wynik z testu) mierzona jest na skali ilorazowej (metrycznej).
• Czynnik (komunikat motywujący) jest zmienną nominalną (niemetryczną).
• Spełnione jest założenie o normalności rozkładu zmiennej Y w grupach.
1) Wsw (57) = 0, 977; p = 0, 34 > 0, 05;
2) Wsw (68) = 0, 974; p = 0, 16;
3) Wsw (55) = 0, 966; p = 0, 12.
Zatem w żadnej z badanych grup nie ma podstaw do odrzucenia hipotezy o normalności rozkładu zmiennej
zależnej.
• Natomiast nie spełnione jest założenie o jednorodności wariancji.
F (2, 177) = 9, 52; p < 0, 001 < 0, 05 ⇒ zatem hipotezę o równości wariancji w grupach należy odrzucić
Zadanie 2. BF (2, 144) = 43, 86; p < 0, 001 < 0, 05, co oznacza, że H0 należy odrzucić, a więc komunikat motywacyjny miał wpływ na wynik testu w poszczególnych grupach studentów.
3
Zadanie 3.
Oznaczenia: A – grupa w której zapowiedziano, że test jest niezbyt ważny,
B – grupa, której powiedziano, że test jest ważny i mają pisać jak najlepiej,
C – grupa, której powiedziano, że test jest warunkiem zaliczenia roku.
Mamy
mA − mB = −7, 69; p < 0, 001 ⇒ różnica istotna,
mA − mC = −8, 36; p < 0, 001 ⇒ różnica istotna,
mB − mC = −0, 67; p = 0, 905 ⇒ różnica nieistotna.
Zatem istotne różnice w wynikach testu obserwujemy, pomiędzy studentami (z grupy A), którym powiedziano, że to
niezbyt ważny test, a studentami (z grup B i C), którym zapowiedziano, że test jest ważny. Nie ma istotnych różnic
w wynikach pomiędzy studentami z grupy B motywowanymi pozytywnie, że mają pisać jak najlepiej potrafią, a tymi
z grupy C, których „straszono”, że test jest warunkiem zaliczenia roku.
Zadanie 4.
Ad a) Spełnione są wszystkie założenia analizy czynnikowej:
– zmienna zależna jest mierzona na skali ilorazowej, zaś czynniki klub i notowany są zmiennymi nominalnymi,
– spełnione jest założenie o normalności rozkładu w grupach,
– spełnione jest założenie o jednorodności wariancji (F (5, 76) = 1, 4; p = 0, 235 > 0, 05)
Ad b) Zarówno przynależność do klubu, jak i fakt, czy kibic był notowany na policji mają istotny wpływ na liczbę
odniesionych ran ciętych:
F (2, 76) = 9, 93; p < 0, 001 < 0, 05 ⇒ zmienna klub ma istotny wpływ na liczbę ran,
F (1, 76) = 26, 39; p < 0, 001 < 0, 05 ⇒ zmienna notowany ma istotny wpływ na liczbę ran.
Ad c) F (1, 76) = 1, 36; p = 0, 264 > 0, 05 ⇒ interakcje czynników nie mają istotnego wpływu na liczbę ran.
Ad d) Istotne różnice w liczbie odniesionych ran ciętych obserwujemy tylko pomiędzy kibicami Cracovii a Widzewa:
mL − mC = −1, 83; p = 0, 125 ⇒ różnica nieistotna,
mL − mW = 1, 52; p = 0, 3 ⇒ różnica nieistotna,
mC − mW = 3, 35; p = 0, 001 ⇒ różnica istotna.
Zadanie 5. Wśród osób, które nie były notowane na policji, pod względem odniesionych ran ciętych istotnie różnią
się kibice Widzewa od kibiców Legii i Cracovii. Nie ma istotnych różnic w liczbie ran ciętych pomiędzy kibicami
Legii a Cracovii wśród nienotowanych:
NIE
mL − mC = −1, 26; p = 0, 785 ⇒ różnica nieistotna,
mL − mW = 2, 97; p = 0, 037 ⇒ różnica istotna,
mC − mW = 4, 23; p = 0, 001 ⇒ różnica istotna.
Wśród osób, które były notowane na policji, pod względem odniesionych ran ciętych istotnie różnią się tylko kibice
Widzewa od kibiców Cracovii. Nie ma istotnych różnic w liczbie ran ciętych pomiędzy kibicami Legii a Cracovii oraz
pomiędzy kibicami Legii a Widzewa (wśród notowanych):
TAK
mL − mC = −2, 37; p = 0, 09 ⇒ różnica nieistotna,
mL − mW = 0, 36; p = 1, 0 ⇒ różnica nieistotna,
mC − mW = 2, 73; p = 0, 039 ⇒ różnica istotna.
Zadanie 6. Wśród kibiców Cracovii oraz Widzewa fakt, że ktoś był notowany na policji miał istotny wpływ na
liczbę odniesionych ran ciętych:
Legia
Cracovia
W idzew
F (1, 76) = 3, 38; p = 0, 07 ⇒ wśród kibiców Legii cz. notowany nie miał istotnego wpływu na liczbę ran,
F (1, 76) = 8, 65; p = 0, 004 ⇒ wśród kibiców Cracovii cz. notowany miał istotny wpływ na liczbę ran,
F (1, 76) = 16, 78; p < 0, 001 ⇒ wśród kibiców Widzewa cz. notowany miał istotny wpływ na liczbę ran.
Zadanie 7. Większy wpływ na liczbę odniesionych ran ciętych miał fakt, czy kibic był notowany na policji, niż to
2
2
z jakiego był klubu (ηnotowany
= 0, 258 > 0, 207 = ηklub
).
4