Testy statystyczne do badania za- leżności między dwiema zmienny

Transkrypt

Testy statystyczne do badania za- leżności między dwiema zmienny
Testy statystyczne do badania zależności między dwiema zmiennymi
X\Y
a1j
a1l
...
ai1
aij
ail
P
(
H0 : ρx ,y = 0 ,
H1 : ρx ,y 6= 0 .
Hipotezę alternatywną może także stanowić ρx,y < 0 bądź też
ρx,y > 0.
alternative - wybór hipotezy alternatywnej
method - współczynnik korelacji którego istotność będzie testowana
conf.level - wskazuje poziom ufności
correct - jeśli jest TRUE, uwzględniona zostanie poprawka na ciągłość podczas liczenia statystyki
cor(x, y = NULL, use = "everything", method = c("pearson",
"kendall", "spearman"))
- funkcja licząca współczynnik korelacji zmiennych ρx,y
use - określa działanie funkcji w przypadku istnienia braków danych
method - wyznacza który współczynnik korelacji ma być policzony
(domyślnie "pearson")
Analiza zależności zmiennych jakościowych
ˆ Macierze kontyngencji
X, Y - zmienne jakościowe. Można je przedstawić w postaci macierzy kontyngencji k × l (k - liczba poziomów zmiennej X, l - liczba
poziomów zmiennej Y ):
a
i=1 i1
akj
Pk
a
i=1 ij
akl
Pk
a
i=1 il
Pl
Pj=1
l
Plj=1
j=1
a1j
aij
akj
n
Wszystkie wyżej wymienione funkcje służące do weryfikacji hipotez
(także funkcja cor.test) są obiektami klasy htest. Poniżej wybrane pola tych obiektów:
$statistic - wartość statystyki testowej
$p-value - p-wartość testu
$method - nazwa wykonanego testu
$data.name - nazwa użytej ramki danych
gdzie aij to ilość obserwacji na xi -tym poziomie zmiennej X oraz
yj -tym poziomie zmiennej Y .
ˆ Współczynniki zgodności
chisq.test(x, y = NULL, p = rep(1/length(x), length(x)),
rescale.p = FALSE, simulate.p.value = FALSE, ...)
- funkcja (test χ2 Pearsona) weryfikująca hipotezę o zależności
zmiennych X,Y o zestawie hipotez:
Do badania zależności pomiędzy zmiennymi jakościowymi wykorzystuje się także tzw. współczynniki zgodności. Zmiennymi często są oceny dwóch oceniających w skali k uporządkowanych ocen.
Najpopularniejszy jest współczynnik κ (występujący w kilku wersjach).
(
cor.test(x, y, alternative = c("two.sided", "less",
"greater"), method = c("pearson", "kendall", "spearman"),
conf.level = 0.95, ...)
- funkcja (test) weryfikująca hipotezę o istotności współczynnika
korelacji o zestawie hipotez:
ak1
Pk
P
poziom yl
a11
poziom xk
Najpopularniejszą miarą zależności między dwiema zmiennymi ilościowymi są współczynniki korelacji Pearsona, Spearmana oraz
Kendalla. X,Y - zmienne o wartościach liczbowych.
...
poziom x1
Piotr Piętak, Programowanie i analiza danych w R
(2010/2011)
Analiza zależności zmiennych ilościowych
poziom y1
H0 : pxi yj = pxi pyj ,
H1 : wpp.
gdzie pxi (pyj ) to p-stwo wystąpienia obserwacji na xi -tym (yj tym) poziomie zmiennej X (Y ), natomiast pxi yj to p-stwo wystąpienia obserwacji na xi -tym poziomie zmiennej X oraz yj -tym
poziomie zmiennej Y .
kappa2(ratings, weight = c("unweighted", "equal",
"squared"))
- funkcja (test, library(irr)) weryfikująca hipotezę o istotności
współczynnika κ Cohena o zestawie hipotez:
(
H0 : κ = 0 ,
H1 : wpp.
p - wektor prawdopodobieństw o tej samej długości co x
rescale.p - wartość logiczna, jeśli ustawimy TRUE to p zostanie
przeskalowane tak, by jego wartości sumowały się do 1
simulate.p.value - jeśli jest TRUE to p-value zostanie wyznaczone
symulacyjnie
ratings - dane (matrix lub dataframe)
weights - wybór wag (można wybrać zdefiniowane, lub wprowadzić
własne)
fisher.test(x, y = NULL, alternative = "two.sided",
conf.level = 0.95, simulate.p.value = FALSE, ...)
- funkcja (dokładny test Fishera) o identycznym zestawie hipotez
jak w przypadku testu χ2 Pearsona. Jest skuteczniejszy od χ2 gdy
liczności komórek macierzy nie przekraczają 10.
lkappa(r, weights="squared", ...)
- oblicza współczynnik κ Lighta (library(psy))
mantelhaen.test(x, y = NULL, z = NULL, alternative =
c("two.sided", "less", "greater"), correct = TRUE,
conf.level = 0.95, ...)
- funkcja (test Cochrana-Mantela-Haenszela) o tym samym zestawie hipotez. Weryfikuje zależności pomiędzy zmiennymi jakościowymi uwzględniając podpopulacje opisane przez poziomy trzeciej
zmiennej jakościowej.
mcnemar.test(x, y = NULL, correct = TRUE)
- funkcja (test symetrii McNemary) weryfikująca hipotezę o symetrii macierzy kontyngencji o zestawie hipotez:
(
H0 : pxi yj = pxj yi ,
H1 : wpp.
ckappa(r)
- oblicza współczynnik κ Cohena (library(psy))
wkappa(r,weights="squared")
- oblicza ważony współczynnik κ (library(psy))
Istnieje także wiele innych miar zgodności zaimplementowanych w
programie R.
partialAssociations(a = "", b = "", c = "", options, data
= NULL, object = .object.of.thing(data = data, ...), ...)
- funkcja wyznaczająca współczynniki C Pearsona, d Sommera, V Cramera, τ Goodmana Kruskala i wiele innych. Poniżej
przykładowe wywołanie:
library(CoCo);
data(HairEyeColor);
CoCoObject <- makeCoCo();
enterTable(HairEyeColor, object = CoCoObject);
partialAssociations(":Hair:Eye", object = CoCoObject);
endCoCo(object = CoCoObject);