ZAJĘCIA V-VI Zad. 1 Sprawdź hipotezę o jednorodności wariancji w

Transkrypt

ZAJĘCIA V-VI Zad. 1 Sprawdź hipotezę o jednorodności wariancji w
ZAJĘCIA V-VI
ANALIZA WARIANCJI, ANALIZA REGRESJI
Zad. 1
Sprawdź hipotezę o jednorodności wariancji w grupach dla danych o formie:
GRUPA I
w11
...
wm1
GRUPA II
w12
...
wm2
...
...
...
...
GRUPA N
w1n
...
wmn
GRUPA I
2.95
2.80
3.10
3.00
3.15
GRUPA II
3.20
3.05
2.90
3.10
3.15
GRUPA III
3.05
3.30
3.15
3.20
2.80
GRUPA IV
2.60
2.55
2.75
2.25
2.50
Przykładowe dane:
Należy stworzyć funkcję, która na wejściu otrzymywałaby tabelę z danymi (ilość kolumn i wymiar kolumn
dowolny) oraz poziom istotności. W tabeli może brakować danych („wartości” NA). Zweryfikować hipotezę o
równości średnich w grupach.
Zad. 2
Narysować wykres przedstawiający wartość zmiennej z podziałem na grupy (na osi X powinny być numery
grup, oś Y to wartości zmiennej) oraz przedstawić dane za pomocą wykresów „skrzynki z wąsami” (boxplot) .
Funkcja na wejściu otrzymuje tabelę.
Zad. 3
Wylosowano n par zawierających związek małżeński i otrzymano dla nich następujące dane o wieku (w
latach) kobiety i mężczyzny:
K
M
k1
m1
k2
m2
...
...
kn
mn
Napisać funkcję przyjmującą jako argumenty dwa wektory danych oraz poziom istotności i weryfikującą
hipotezę, że istnieje dodatnia korelacja między wiekiem osób zawierających małżeństwo.
Zad. 4
W klasach szóstych szkół podstawowych przeprowadzono badania nad zależnością wzrostu uczniów i ich
wagi. W jednej ze szkół uzyskano następujące wyniki:
WZROST [cm]
wz1
wz2
...
wzn
WAGA [kg]
wa1
wa2
...
wan
1. Napisać funkcję szacującą parametry równania regresji (funkcja powinna m. in. przyjmować wektory
danych).
2. Przedstawić na jednym wykresie dane doświadczalne (punkty) i prostą regresji.
Metody probabilistyczne i statystyka | Analiza wariancji, analiza regresji
Zad. 5
Badając zależność zużycia energii elektrycznej (w tys. Kwh) od wartości produkcji globalnej (w mln PLN) w
pewnym zakładzie produkcyjnym zaobserwowano w kolejnych latach następujące dane:
zużycie energii
wartość produkcji
z1
w1
z2
w2
...
...
zn
wn
1. Wyznaczyć i narysować proste regresji (zużycia energii względem wartości produkcji i odwrotnie).
2. Sporządzić wykres reszt.
3. Oszacować wartość produkcji dla nowej wartości zużycia energii.
POMOC
Zad. 1
bartlett.test, is.na, kruskal.test, anova, aov
Przykład
Dla tabeli postaci (jest to data.frame o nazwie dane)
Wyniki
2.95
2.80
3.10
3.00
3.15
3.20
3.05
2.90
3.10
3.15
Grupa
1
1
1
1
1
2
2
2
2
2 ..................
Testy
bartlett.test(wyniki~grupa,dane)
kruskal.test(wyniki~grupa,dane) - jeśli wariancje nie są jednorodne
anova(aov(wyniki~grupa,dane)) - jeśli wariancje są jednorodne
Zad. 2
plot(wyniki ~grupa, data=dane)
boxplot(wyniki ~grupa, data=dane)
Zad. 3-5
qnorm()
cor()- korelacja
cor.test()- test dla współczynnika korelacji liniowej
lm()- liniowy model regresji, np.:
z<-lm(formula=y~x)
z$coefficients – współczynniki prostej regresji
z$coefficients[1] – wyraz wolny
z$coefficients[2] – współczynnik kierunkowy prostej
z$residuals – wektor reszt
Metody probabilistyczne i statystyka | Analiza wariancji, analiza regresji
x = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
y = c(2, 3.8, 6.2, 8.4, 9.9, 12.5, 13.7, 15.9, 17.9, 20.3)
plot(x, y, pch="+")
lines(x, y=2*x)
t()- transponowanie
as.vector
Metody probabilistyczne i statystyka | Analiza wariancji, analiza regresji