ZAJĘCIA V-VI Zad. 1 Sprawdź hipotezę o jednorodności wariancji w
Transkrypt
ZAJĘCIA V-VI Zad. 1 Sprawdź hipotezę o jednorodności wariancji w
ZAJĘCIA V-VI ANALIZA WARIANCJI, ANALIZA REGRESJI Zad. 1 Sprawdź hipotezę o jednorodności wariancji w grupach dla danych o formie: GRUPA I w11 ... wm1 GRUPA II w12 ... wm2 ... ... ... ... GRUPA N w1n ... wmn GRUPA I 2.95 2.80 3.10 3.00 3.15 GRUPA II 3.20 3.05 2.90 3.10 3.15 GRUPA III 3.05 3.30 3.15 3.20 2.80 GRUPA IV 2.60 2.55 2.75 2.25 2.50 Przykładowe dane: Należy stworzyć funkcję, która na wejściu otrzymywałaby tabelę z danymi (ilość kolumn i wymiar kolumn dowolny) oraz poziom istotności. W tabeli może brakować danych („wartości” NA). Zweryfikować hipotezę o równości średnich w grupach. Zad. 2 Narysować wykres przedstawiający wartość zmiennej z podziałem na grupy (na osi X powinny być numery grup, oś Y to wartości zmiennej) oraz przedstawić dane za pomocą wykresów „skrzynki z wąsami” (boxplot) . Funkcja na wejściu otrzymuje tabelę. Zad. 3 Wylosowano n par zawierających związek małżeński i otrzymano dla nich następujące dane o wieku (w latach) kobiety i mężczyzny: K M k1 m1 k2 m2 ... ... kn mn Napisać funkcję przyjmującą jako argumenty dwa wektory danych oraz poziom istotności i weryfikującą hipotezę, że istnieje dodatnia korelacja między wiekiem osób zawierających małżeństwo. Zad. 4 W klasach szóstych szkół podstawowych przeprowadzono badania nad zależnością wzrostu uczniów i ich wagi. W jednej ze szkół uzyskano następujące wyniki: WZROST [cm] wz1 wz2 ... wzn WAGA [kg] wa1 wa2 ... wan 1. Napisać funkcję szacującą parametry równania regresji (funkcja powinna m. in. przyjmować wektory danych). 2. Przedstawić na jednym wykresie dane doświadczalne (punkty) i prostą regresji. Metody probabilistyczne i statystyka | Analiza wariancji, analiza regresji Zad. 5 Badając zależność zużycia energii elektrycznej (w tys. Kwh) od wartości produkcji globalnej (w mln PLN) w pewnym zakładzie produkcyjnym zaobserwowano w kolejnych latach następujące dane: zużycie energii wartość produkcji z1 w1 z2 w2 ... ... zn wn 1. Wyznaczyć i narysować proste regresji (zużycia energii względem wartości produkcji i odwrotnie). 2. Sporządzić wykres reszt. 3. Oszacować wartość produkcji dla nowej wartości zużycia energii. POMOC Zad. 1 bartlett.test, is.na, kruskal.test, anova, aov Przykład Dla tabeli postaci (jest to data.frame o nazwie dane) Wyniki 2.95 2.80 3.10 3.00 3.15 3.20 3.05 2.90 3.10 3.15 Grupa 1 1 1 1 1 2 2 2 2 2 .................. Testy bartlett.test(wyniki~grupa,dane) kruskal.test(wyniki~grupa,dane) - jeśli wariancje nie są jednorodne anova(aov(wyniki~grupa,dane)) - jeśli wariancje są jednorodne Zad. 2 plot(wyniki ~grupa, data=dane) boxplot(wyniki ~grupa, data=dane) Zad. 3-5 qnorm() cor()- korelacja cor.test()- test dla współczynnika korelacji liniowej lm()- liniowy model regresji, np.: z<-lm(formula=y~x) z$coefficients – współczynniki prostej regresji z$coefficients[1] – wyraz wolny z$coefficients[2] – współczynnik kierunkowy prostej z$residuals – wektor reszt Metody probabilistyczne i statystyka | Analiza wariancji, analiza regresji x = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) y = c(2, 3.8, 6.2, 8.4, 9.9, 12.5, 13.7, 15.9, 17.9, 20.3) plot(x, y, pch="+") lines(x, y=2*x) t()- transponowanie as.vector Metody probabilistyczne i statystyka | Analiza wariancji, analiza regresji