Ćwiczenia 8 – ANALIZA WARIANCJI Zadanie 1. Kontrola - E-SGH
Transkrypt
Ćwiczenia 8 – ANALIZA WARIANCJI Zadanie 1. Kontrola - E-SGH
Ćwiczenia 8 – ANALIZA WARIANCJI Zadanie 1. Kontrola jakości produkcji pewnego wyrobu wykazała, że liczba braków w jednakowo licznych losowo wybranych próbach tych wyrobów w gatunku I, II, III była następująca: Gatunek I 1 1 1 1 Gatunek II 2 2 3 1 Gatunek III 3 3 4 2 Czy gatunek jest czynnikiem różnicującym średnią liczbę braków w partiach tych wyrobów? Przyjąć poziom istotności α=0,05. Zadanie 2. W celu ustalenia, czy poziom wykształcenia głowy rodziny (wyróżniono 4 poziomy wykształcenia) istotnie różnicuje wydatki gospodarstw domowych na rekreację i kulturę zbadano 124 losowo wybranych gospodarstw domowych. Otrzymano następujące wyniki: • suma kwadratów różnic pomiędzy wydatkami poszczególnych gospodarstw domowych od średnich wydatków wszystkich badanych gospodarstw domowych wynosiła 408, • suma kwadratów odchyleń wewnątrz grup gospodarstw domowych od średnich grupowych wydatków wynosiła 360. Należy zweryfikować odpowiednią hipotezę przy poziomie istotności 0,05. Zadanie 3. Firma badawcza przeprowadziła badanie czasu obsługi klienta w zależności od instytucji (uwzględniono 3 typy instytucji – administracja, firma komercyjna, uczelnia). Czy na podstawie poniższych wyników można stwierdzić, że typ instytucji nie wpływa znacząco na średni czas obsługi klienta. Przyjąć poziom istotności α=0,05. Źródło zmienności Suma kwadratów odchyleń Stopnie swobody Zmienność międzygrupowa ... ... Zmienność wewnątrzgrupowa 20,508 ... Zmienność całkowita 20,947 18 Zadanie 4. Badając wpływ typu własności na koszty produkcji pewnego wyrobu w 50 przedsiębiorstwach otrzymano następujące informacje (X – typ własności, Y – koszty w tys. zł) Typ własności (X) Średnie warunkowe Liczebności prywatna 4 20 państwowa 7 30 Źródła zmienności zmiennej Suma kwadratów odchyleń Y Zmienność międzygrupowa 108,00 Zmienność ogólna 138,75 Korzystając z analizy wariancji należy sprawdzić hipotezę o jednakowym średnim koszcie według typu własności. Przyjąć poziom istotności α=0,1. Zadanie 5. Właściciel sieci hoteli próbuje ocenić, czy hotele w 5 wybranych miastach Polski są jednakowo lubiane przez gości. W każdym hotelu wylosowano 40 gości, którzy oceniali świadczone im usługi w skali od 1 do 100. Średnie oceny były następujące: 89, 75, 73, 91, 85. Wiadomo, że suma kwadratów odchyleń poszczególnych ocen od średniej oceny uzyskanej dla wszystkich 200 ankietowanych osób wyniosła 112 564. Zbadać – wykorzystując analizę wariancji – czy badane hotele są oceniane jednakowo. Przyjąć poziom istotności α=0,05. Zadanie 6. Zbadano liczbę transakcji akcji wybranych losowo 69 spółek giełdowych podchodzących z pięciu sektorów, w wybranym dniu notowań. Transakcje sklasyfikowano w 5 grup według sektora, z którego pochodziła spółka. Uzyskano następujące wyniki analizy wariancji: Międzygrupowa suma kwadratów odchyleń Całkowita suma kwadratów odchyleń 43,37 100,05 Czy wpływ sektora (czynnika klasyfikacyjnego) na ilość zawartych transakcji był istotny przy poziomie istotności α=0,05? Zadanie 7. Sprawdzono czas obsługi klientów (w min.) w oddziałach pewnego urzędu w trzech wybranych województwach. Uzyskano następujące wyniki: Województwo Liczba oddziałów Średni czas obsługi mazowieckie 8 40,0 śląskie 4 32,5 lubelskie 3 50,0 Całkowita suma kwadratów odchyleń od średniej ogólnej wyniosła 1500. Czy można uznać, że czas obsługi w oddziale urzędu zależy od województwa, w którym ten oddział się znajduje? Przyjmując odpowiednie założenia należy przeprowadzić analizę wariancji i zweryfikować właściwą hipotezę. Przyjąć poziom istotności α=0,05. Zadanie 8. Przeprowadzono badanie wielkości obrotów 138 firm, klasyfikując je w 7 grup w zależności od branży. Czy przy poziomie istotności 0,1 można uznać, że obroty firm zależą od branży, w której działa firma, jeśli suma kwadratów odchyleń międzygrupowych (SSB) wynosiła 256, a wewnątrzgrupowych (SSE) 3560? Zadanie 9. W badaniu wpływu wielkości opakowań płynów do mycia naczyń A, B, C na rozmiary ich sprzedaży (Y-w l) w 70 sklepach uzyskano następujące dane: Wariancje w grupach (obciążone) A 24 B 23 C 23 =30 =63 =90 = 784 = 4096 = 7225 Obliczono także: − ) = 42507, = 60 ( Proszę zweryfikować hipotezę, czy przyjęta przez producenta wielkość opakowań wpływa na średnie rozmiary ich sprzedaży. Przyjąć α=0,01. Zadania sprawdzające na podst. M. Wieczorek, Statystyka. Lubię to! Zbiór zadań, Oficyna Wydawnicza SGH, Warszawa 2013. Każdą odpowiedź jako: T – prawdziwą lub N – nieprawdziwą. Zadanie 1.1 Analizę wariancji można zastosować do oceny: a. czy średnie w wyodrębnionych populacjach są identyczne, b. czy istnieje wpływ wyróżnionego czynnika na badaną zmienną, c. czy wariancje w wyodrębnionych populacjach są identyczne. Zadanie 1.2 Które z założeń są niezbędne w analizie wariancji: a. próby mają dowolną liczebność, ale mają taką samą wariancję, b. rozkłady populacji, z których pobrano próby, są normalne, a wariancje jednakowe, c. próby zostały pobrane niezależnie. Zadanie 1.3 Hipoteza alternatywna w analizie wariancji informuje o tym, że: a. średnie we wszystkich wyodrębnionych populacjach różnią się między sobą, b. co najmniej dwie średnie w populacjach są identyczne, c. wyodrębiony czynnik powoduje istotne różnice pomiędzy przynajmniej dwiema wariancjami w populacjach. Wzory – Analiza wariancji Równość wariancyjna !" # − !" # = − SST = SSE # + ( − ) + SSB Liczba stopni swobody: n-1 n-k gdzie: n – liczebność próby k – liczba grup SST – sum of squares total (zmienność całkowita) SSE – sum of squares error (zmienność wewnątrzgrupowa) SSB – sum of squares between groups (zmienność międzygrupowa) # !" % = − k-1 = & ∗ 1 = ) ∗ gdzie: n – liczebność próby ) − średnie grupowe − liczebności grupowe Średnie kwadraty odchyleń ++, *% = !-# ++ *. = #- Założenia w analizie wariancji: 1. Wyodrębniamy / populacji, opisanych za pomocą zmiennych 0 = 1,2, … , /, które mają rozkłady normalne z wartością oczekiwaną 23 oraz jednakową we wszystkich populacjach wariancją 4 2. Z każdej z tych populacji wybieramy niezależną próbę losową o liczebnościach odpowiednio: , … , # , gdzie ∑# = . 3. Założenie o normalności i niezależności składników losowych. 4. Założenie o jednorodności ich wariancji (założenie o identyczności wariancji zmiennej objaśnianej w grupach). 67 : 9 = 9 = 9 = ⋯ = 9; 6 : 9 ≠ 9 , dla ≠ = lub 67 : ⋀ , = 9 = 9 = 9 = ⋯ = 9; (czynnik klasyfikacyjny nie jest czynnikiem różnicującym wartości badanej zmiennej) lub 6 : ⋁ , = 9 ≠ 9 , dla ≠ = Test F (Fishera) @ABC = . % *. : = / − 1 − / *% D@ ≥ @F,GH ,GI = J @F,GH ,GI , - odczytujemy z tablic rozkładu F-Snedecora, gdzie J −poziom istotności s1 = k-1 – pierwszy stopień swobody s2=n-k – drugi stopień swobody