Ćwiczenia 8 – ANALIZA WARIANCJI Zadanie 1. Kontrola - E-SGH

Transkrypt

Ćwiczenia 8 – ANALIZA WARIANCJI Zadanie 1. Kontrola - E-SGH
Ćwiczenia 8 – ANALIZA WARIANCJI
Zadanie 1. Kontrola jakości produkcji pewnego wyrobu wykazała, że liczba braków w jednakowo licznych
losowo wybranych próbach tych wyrobów w gatunku I, II, III była następująca:
Gatunek I
1
1
1
1
Gatunek II
2
2
3
1
Gatunek III
3
3
4
2
Czy gatunek jest czynnikiem różnicującym średnią liczbę braków w partiach tych wyrobów? Przyjąć poziom
istotności α=0,05.
Zadanie 2. W celu ustalenia, czy poziom wykształcenia głowy rodziny (wyróżniono 4 poziomy wykształcenia)
istotnie różnicuje wydatki gospodarstw domowych na rekreację i kulturę zbadano 124 losowo wybranych
gospodarstw domowych. Otrzymano następujące wyniki:
• suma kwadratów różnic pomiędzy wydatkami poszczególnych gospodarstw domowych od średnich
wydatków wszystkich badanych gospodarstw domowych wynosiła 408,
• suma kwadratów odchyleń wewnątrz grup gospodarstw domowych od średnich grupowych wydatków
wynosiła 360.
Należy zweryfikować odpowiednią hipotezę przy poziomie istotności 0,05.
Zadanie 3. Firma badawcza przeprowadziła badanie czasu obsługi klienta w zależności od instytucji
(uwzględniono 3 typy instytucji – administracja, firma komercyjna, uczelnia). Czy na podstawie poniższych
wyników można stwierdzić, że typ instytucji nie wpływa znacząco na średni czas obsługi klienta. Przyjąć poziom
istotności α=0,05.
Źródło zmienności
Suma kwadratów odchyleń
Stopnie swobody
Zmienność międzygrupowa
...
...
Zmienność wewnątrzgrupowa
20,508
...
Zmienność całkowita
20,947
18
Zadanie 4. Badając wpływ typu własności na koszty produkcji pewnego wyrobu w 50 przedsiębiorstwach
otrzymano następujące informacje (X – typ własności, Y – koszty w tys. zł)
Typ własności (X)
Średnie warunkowe
Liczebności
prywatna
4
20
państwowa
7
30
Źródła zmienności zmiennej
Suma kwadratów odchyleń
Y
Zmienność międzygrupowa
108,00
Zmienność ogólna
138,75
Korzystając z analizy wariancji należy sprawdzić hipotezę o jednakowym średnim koszcie według typu
własności. Przyjąć poziom istotności α=0,1.
Zadanie 5. Właściciel sieci hoteli próbuje ocenić, czy hotele w 5 wybranych miastach Polski są jednakowo
lubiane przez gości. W każdym hotelu wylosowano 40 gości, którzy oceniali świadczone im usługi w skali od 1
do 100. Średnie oceny były następujące: 89, 75, 73, 91, 85. Wiadomo, że suma kwadratów odchyleń
poszczególnych ocen od średniej oceny uzyskanej dla wszystkich 200 ankietowanych osób wyniosła 112 564.
Zbadać – wykorzystując analizę wariancji – czy badane hotele są oceniane jednakowo. Przyjąć poziom istotności
α=0,05.
Zadanie 6. Zbadano liczbę transakcji akcji wybranych losowo 69 spółek giełdowych podchodzących z pięciu
sektorów, w wybranym dniu notowań. Transakcje sklasyfikowano w 5 grup według sektora, z którego
pochodziła spółka. Uzyskano następujące wyniki analizy wariancji:
Międzygrupowa suma kwadratów odchyleń
Całkowita suma kwadratów odchyleń
43,37
100,05
Czy wpływ sektora (czynnika klasyfikacyjnego) na ilość zawartych transakcji był istotny przy poziomie istotności
α=0,05?
Zadanie 7. Sprawdzono czas obsługi klientów (w min.) w oddziałach pewnego urzędu w trzech wybranych
województwach. Uzyskano następujące wyniki:
Województwo
Liczba oddziałów
Średni czas obsługi
mazowieckie
8
40,0
śląskie
4
32,5
lubelskie
3
50,0
Całkowita suma kwadratów odchyleń od średniej ogólnej wyniosła 1500. Czy można uznać, że czas obsługi w
oddziale urzędu zależy od województwa, w którym ten oddział się znajduje? Przyjmując odpowiednie założenia
należy przeprowadzić analizę wariancji i zweryfikować właściwą hipotezę. Przyjąć poziom istotności α=0,05.
Zadanie 8. Przeprowadzono badanie wielkości obrotów 138 firm, klasyfikując je w 7 grup w zależności od
branży. Czy przy poziomie istotności 0,1 można uznać, że obroty firm zależą od branży, w której działa firma,
jeśli suma kwadratów odchyleń międzygrupowych (SSB) wynosiła 256, a wewnątrzgrupowych (SSE) 3560?
Zadanie 9. W badaniu wpływu wielkości opakowań płynów do mycia naczyń A, B, C na rozmiary ich sprzedaży
(Y-w l) w 70 sklepach uzyskano następujące dane:
Wariancje w grupach (obciążone)
A
24
B
23
C
23
=30
=63
=90
= 784
= 4096
= 7225
Obliczono także:
− ) = 42507,
= 60
(
Proszę zweryfikować hipotezę, czy przyjęta przez producenta wielkość opakowań wpływa na średnie rozmiary
ich sprzedaży. Przyjąć α=0,01.
Zadania sprawdzające na podst. M. Wieczorek, Statystyka. Lubię to! Zbiór zadań, Oficyna Wydawnicza SGH,
Warszawa 2013.
Każdą odpowiedź jako: T – prawdziwą lub N – nieprawdziwą.
Zadanie 1.1 Analizę wariancji można zastosować do oceny:
a. czy średnie w wyodrębnionych populacjach są identyczne,
b. czy istnieje wpływ wyróżnionego czynnika na badaną zmienną,
c. czy wariancje w wyodrębnionych populacjach są identyczne.
Zadanie 1.2 Które z założeń są niezbędne w analizie wariancji:
a. próby mają dowolną liczebność, ale mają taką samą wariancję,
b. rozkłady populacji, z których pobrano próby, są normalne, a wariancje jednakowe,
c. próby zostały pobrane niezależnie.
Zadanie 1.3 Hipoteza alternatywna w analizie wariancji informuje o tym, że:
a. średnie we wszystkich wyodrębnionych populacjach różnią się między sobą,
b. co najmniej dwie średnie w populacjach są identyczne,
c. wyodrębiony czynnik powoduje istotne różnice pomiędzy przynajmniej dwiema wariancjami w
populacjach.
Wzory – Analiza wariancji
Równość wariancyjna
!"
#
− !"
#
= − SST
=
SSE
#
+ ( − )
+
SSB
Liczba stopni swobody:
n-1
n-k
gdzie:
n – liczebność próby
k – liczba grup
SST – sum of squares total (zmienność całkowita)
SSE – sum of squares error (zmienność wewnątrzgrupowa)
SSB – sum of squares between groups (zmienność międzygrupowa)
#
!"
% = − k-1
= & ∗ 1
= ) ∗ gdzie:
n – liczebność próby
) − średnie grupowe
− liczebności grupowe
Średnie kwadraty odchyleń
++,
*% = !-#
++
*. = #-
Założenia w analizie wariancji:
1. Wyodrębniamy / populacji, opisanych za pomocą zmiennych 0 = 1,2, … , /, które mają
rozkłady normalne z wartością oczekiwaną 23 oraz jednakową we wszystkich populacjach
wariancją 4 2. Z każdej z tych populacji wybieramy niezależną próbę losową o liczebnościach odpowiednio:
, … , # , gdzie ∑# = .
3. Założenie o normalności i niezależności składników losowych.
4. Założenie o jednorodności ich wariancji (założenie o identyczności wariancji zmiennej
objaśnianej w grupach).
67 : 9 = 9 = 9 = ⋯ = 9;
6 : 9 ≠ 9 , dla ≠ =
lub
67 : ⋀ , = 9 = 9 = 9 = ⋯ = 9; (czynnik klasyfikacyjny nie
jest czynnikiem różnicującym wartości badanej zmiennej)
lub
6 : ⋁ , = 9 ≠ 9 , dla ≠ =
Test F (Fishera)
@ABC =
. %
*.
:
=
/ − 1 − / *%
D@ ≥ @F,GH ,GI = J
@F,GH ,GI , - odczytujemy z tablic rozkładu F-Snedecora, gdzie
J −poziom istotności
s1 = k-1 – pierwszy stopień swobody
s2=n-k – drugi stopień swobody