Laboratorium 4 z Pakietów: procedura freq
Transkrypt
Laboratorium 4 z Pakietów: procedura freq
Laboratorium 4 z Pakietów: procedura freq Dane ze zbioru ’dane1.txt’. 1. Niech p oznacza prawdopodobieństwo osiągnięcia godzinnej stawki powyżej 10 dolarów. Skonstruować przedział ufności dla p na poziomie ufności 0.95 i dla kilku wybranych wartości p0 zweryfikować hipotezę H0 : p = p0 przy alternatywie H1 : p > p0 . 2. Niech p1 i p2 oznaczają prawdopodobieństwa osiągnięcia godzinnej stawki powyżej 10 dolarów dla kobiet i mężczyzn, odpowiednio. Skonstruować przedział ufności dla różnicy p1 − p2 na poziomie ufności 0.98. Zweryfikować odpowiednie hipotezy o tej różnicy. 3. Podzielić wartości przyjmowane przez zmienne zarobki i edukacja na takie przedziały by możliwe było sensowne przeprowadzanie testów typu chi-kwadrat w oparciu o otrzymane tablice wielodzielcze. 4. Skonstruować tablicę wielodzielczą 1-wymiarową dla każdej ze zmiennych zarobki, płeć i edukacja. Skonstruować tablicę 2-wymiarową dla każdej pary stworzonej z 2 z tych 3 zmiennych. 5. Dla zmiennych płeć, stanowisko i rasa przeprowadzić test zgodności chikwadrat (dla zaproponowanych przez siebie prawdopodobieństw przynależności osoby do poszczególnych kategorii). 6. Zbadać, za pomocą odpowiednich testów, czy któraś ze zmiennych płeć i edukacja wplywa na zmienną zarobki. 7. Za pomocą testu dokładnego zweryfikować hipotezę, że płeć nie wpływa na zarobki. Dane ze zbioru ’bronchit.txt’. 1. Zbadać czy istnieje związek między poziomem cząstek organicznych w powietrzu a zachorowalnością na bronchit. Analizę przeprowadzić za pomocą testu chi-kwadrat (a) oddzielnie dla każdej z grup wiekowych, (b) łącznie dla wszystkich grup wiekowych, (c) łącznie dla wszystkich grup wiekowych, ale z wykorzystaniem opcji cmh (statystyka Cochrana-Mantela-Haenszela). Które z tych podejść jest właściwe? Jaka jest postać hipotezy zerowej w teście opartym na statystyce Cochrana-Mantela-Haenszela? Poniższa tabela zawiera dane o zarobkach i satysfakcji z wykonywanej pracy dla 96 losowo wybranych osób. Job satisfaction Very dissat. Little dissat. Moderately < 15000 1 3 15000 − 25000 2 3 25000 − 40000 1 6 > 40000 0 1 Income sat. Very satisfied 10 6 10 7 14 12 9 11 Celem analizy jest sprawdzenie czy zarobki wpływają na satysfakcję z wykonywanej pracy, a jeśli tak to w jaki sposób. Tę analizę należy przeprowadzić za pomocą: 1. testu niezależności chi-kwadrat, 2. testu Mantela-Haenszela dla liniowego trendu (przypisując poszczególnym kategoriom dla płacy i satysfakcji odpowiednie liczby, odzwierciedlające ich naturalne uporządkowanie, np. 1, 2, 3, 4 dla satysfakcji i 7.5, 20, 32.5, 60 dla płacy). Jakie są wyniki tych analiz? Która z tych dwóch metod jest sensowniejsza? Czy wynik testu Mantela-Haenszela zmieni się, gdy kategoriom przypiszemy inne liczby (odzwierciedlające ich naturalne uporządkowanie)? Maciej Wilczyński