Testy statystyczne do badania za- leżności między dwiema zmienny
Transkrypt
Testy statystyczne do badania za- leżności między dwiema zmienny
Testy statystyczne do badania zależności między dwiema zmiennymi X\Y a1j a1l ... ai1 aij ail P ( H0 : ρx ,y = 0 , H1 : ρx ,y 6= 0 . Hipotezę alternatywną może także stanowić ρx,y < 0 bądź też ρx,y > 0. alternative - wybór hipotezy alternatywnej method - współczynnik korelacji którego istotność będzie testowana conf.level - wskazuje poziom ufności correct - jeśli jest TRUE, uwzględniona zostanie poprawka na ciągłość podczas liczenia statystyki cor(x, y = NULL, use = "everything", method = c("pearson", "kendall", "spearman")) - funkcja licząca współczynnik korelacji zmiennych ρx,y use - określa działanie funkcji w przypadku istnienia braków danych method - wyznacza który współczynnik korelacji ma być policzony (domyślnie "pearson") Analiza zależności zmiennych jakościowych Macierze kontyngencji X, Y - zmienne jakościowe. Można je przedstawić w postaci macierzy kontyngencji k × l (k - liczba poziomów zmiennej X, l - liczba poziomów zmiennej Y ): a i=1 i1 akj Pk a i=1 ij akl Pk a i=1 il Pl Pj=1 l Plj=1 j=1 a1j aij akj n Wszystkie wyżej wymienione funkcje służące do weryfikacji hipotez (także funkcja cor.test) są obiektami klasy htest. Poniżej wybrane pola tych obiektów: $statistic - wartość statystyki testowej $p-value - p-wartość testu $method - nazwa wykonanego testu $data.name - nazwa użytej ramki danych gdzie aij to ilość obserwacji na xi -tym poziomie zmiennej X oraz yj -tym poziomie zmiennej Y . Współczynniki zgodności chisq.test(x, y = NULL, p = rep(1/length(x), length(x)), rescale.p = FALSE, simulate.p.value = FALSE, ...) - funkcja (test χ2 Pearsona) weryfikująca hipotezę o zależności zmiennych X,Y o zestawie hipotez: Do badania zależności pomiędzy zmiennymi jakościowymi wykorzystuje się także tzw. współczynniki zgodności. Zmiennymi często są oceny dwóch oceniających w skali k uporządkowanych ocen. Najpopularniejszy jest współczynnik κ (występujący w kilku wersjach). ( cor.test(x, y, alternative = c("two.sided", "less", "greater"), method = c("pearson", "kendall", "spearman"), conf.level = 0.95, ...) - funkcja (test) weryfikująca hipotezę o istotności współczynnika korelacji o zestawie hipotez: ak1 Pk P poziom yl a11 poziom xk Najpopularniejszą miarą zależności między dwiema zmiennymi ilościowymi są współczynniki korelacji Pearsona, Spearmana oraz Kendalla. X,Y - zmienne o wartościach liczbowych. ... poziom x1 Piotr Piętak, Programowanie i analiza danych w R (2010/2011) Analiza zależności zmiennych ilościowych poziom y1 H0 : pxi yj = pxi pyj , H1 : wpp. gdzie pxi (pyj ) to p-stwo wystąpienia obserwacji na xi -tym (yj tym) poziomie zmiennej X (Y ), natomiast pxi yj to p-stwo wystąpienia obserwacji na xi -tym poziomie zmiennej X oraz yj -tym poziomie zmiennej Y . kappa2(ratings, weight = c("unweighted", "equal", "squared")) - funkcja (test, library(irr)) weryfikująca hipotezę o istotności współczynnika κ Cohena o zestawie hipotez: ( H0 : κ = 0 , H1 : wpp. p - wektor prawdopodobieństw o tej samej długości co x rescale.p - wartość logiczna, jeśli ustawimy TRUE to p zostanie przeskalowane tak, by jego wartości sumowały się do 1 simulate.p.value - jeśli jest TRUE to p-value zostanie wyznaczone symulacyjnie ratings - dane (matrix lub dataframe) weights - wybór wag (można wybrać zdefiniowane, lub wprowadzić własne) fisher.test(x, y = NULL, alternative = "two.sided", conf.level = 0.95, simulate.p.value = FALSE, ...) - funkcja (dokładny test Fishera) o identycznym zestawie hipotez jak w przypadku testu χ2 Pearsona. Jest skuteczniejszy od χ2 gdy liczności komórek macierzy nie przekraczają 10. lkappa(r, weights="squared", ...) - oblicza współczynnik κ Lighta (library(psy)) mantelhaen.test(x, y = NULL, z = NULL, alternative = c("two.sided", "less", "greater"), correct = TRUE, conf.level = 0.95, ...) - funkcja (test Cochrana-Mantela-Haenszela) o tym samym zestawie hipotez. Weryfikuje zależności pomiędzy zmiennymi jakościowymi uwzględniając podpopulacje opisane przez poziomy trzeciej zmiennej jakościowej. mcnemar.test(x, y = NULL, correct = TRUE) - funkcja (test symetrii McNemary) weryfikująca hipotezę o symetrii macierzy kontyngencji o zestawie hipotez: ( H0 : pxi yj = pxj yi , H1 : wpp. ckappa(r) - oblicza współczynnik κ Cohena (library(psy)) wkappa(r,weights="squared") - oblicza ważony współczynnik κ (library(psy)) Istnieje także wiele innych miar zgodności zaimplementowanych w programie R. partialAssociations(a = "", b = "", c = "", options, data = NULL, object = .object.of.thing(data = data, ...), ...) - funkcja wyznaczająca współczynniki C Pearsona, d Sommera, V Cramera, τ Goodmana Kruskala i wiele innych. Poniżej przykładowe wywołanie: library(CoCo); data(HairEyeColor); CoCoObject <- makeCoCo(); enterTable(HairEyeColor, object = CoCoObject); partialAssociations(":Hair:Eye", object = CoCoObject); endCoCo(object = CoCoObject);