Laboratorium 4 z Pakietów: procedura freq

Transkrypt

Laboratorium 4 z Pakietów: procedura freq
Laboratorium 4 z Pakietów: procedura freq
Dane ze zbioru ’dane1.txt’.
1. Niech p oznacza prawdopodobieństwo osiągnięcia godzinnej stawki powyżej 10 dolarów. Skonstruować przedział ufności dla p na poziomie
ufności 0.95 i dla kilku wybranych wartości p0 zweryfikować hipotezę
H0 : p = p0 przy alternatywie H1 : p > p0 .
2. Niech p1 i p2 oznaczają prawdopodobieństwa osiągnięcia godzinnej stawki powyżej 10 dolarów dla kobiet i mężczyzn, odpowiednio. Skonstruować przedział ufności dla różnicy p1 − p2 na poziomie ufności 0.98.
Zweryfikować odpowiednie hipotezy o tej różnicy.
3. Podzielić wartości przyjmowane przez zmienne zarobki i edukacja na
takie przedziały by możliwe było sensowne przeprowadzanie testów
typu chi-kwadrat w oparciu o otrzymane tablice wielodzielcze.
4. Skonstruować tablicę wielodzielczą 1-wymiarową dla każdej ze zmiennych zarobki, płeć i edukacja. Skonstruować tablicę 2-wymiarową dla
każdej pary stworzonej z 2 z tych 3 zmiennych.
5. Dla zmiennych płeć, stanowisko i rasa przeprowadzić test zgodności chikwadrat (dla zaproponowanych przez siebie prawdopodobieństw przynależności osoby do poszczególnych kategorii).
6. Zbadać, za pomocą odpowiednich testów, czy któraś ze zmiennych płeć
i edukacja wplywa na zmienną zarobki.
7. Za pomocą testu dokładnego zweryfikować hipotezę, że płeć nie wpływa
na zarobki.
Dane ze zbioru ’bronchit.txt’.
1. Zbadać czy istnieje związek między poziomem cząstek organicznych w
powietrzu a zachorowalnością na bronchit. Analizę przeprowadzić za
pomocą testu chi-kwadrat
(a) oddzielnie dla każdej z grup wiekowych,
(b) łącznie dla wszystkich grup wiekowych,
(c) łącznie dla wszystkich grup wiekowych, ale z wykorzystaniem opcji
cmh (statystyka Cochrana-Mantela-Haenszela).
Które z tych podejść jest właściwe? Jaka jest postać hipotezy zerowej
w teście opartym na statystyce Cochrana-Mantela-Haenszela?
Poniższa tabela zawiera dane o zarobkach i satysfakcji z wykonywanej
pracy dla 96 losowo wybranych osób.
Job satisfaction
Very dissat. Little dissat. Moderately
< 15000
1
3
15000 − 25000
2
3
25000 − 40000
1
6
> 40000
0
1
Income
sat. Very satisfied
10
6
10
7
14
12
9
11
Celem analizy jest sprawdzenie czy zarobki wpływają na satysfakcję z
wykonywanej pracy, a jeśli tak to w jaki sposób. Tę analizę należy przeprowadzić
za pomocą:
1. testu niezależności chi-kwadrat,
2. testu Mantela-Haenszela dla liniowego trendu (przypisując poszczególnym kategoriom dla płacy i satysfakcji odpowiednie liczby, odzwierciedlające ich naturalne uporządkowanie, np. 1, 2, 3, 4 dla satysfakcji i
7.5, 20, 32.5, 60 dla płacy).
Jakie są wyniki tych analiz? Która z tych dwóch metod jest sensowniejsza? Czy wynik testu Mantela-Haenszela zmieni się, gdy kategoriom
przypiszemy inne liczby (odzwierciedlające ich naturalne uporządkowanie)?
Maciej Wilczyński