Spis treści Wariancja, korelacja, mediana

Transkrypt

Spis treści Wariancja, korelacja, mediana
Wnioskowanie_Statystyczne_-_wykład
Spis treści
1 Wariancja, korelacja, mediana
1.1 Wartość oczekiwana
1.2 Mediana
1.3 Wariancja
1.3.1 Dowód
1.4 Kowariancja i współczynnik korelacji
Wariancja, korelacja, mediana
Jak widać, własności rozkładów ciągłych i dyskretnych będą opisywać nieco odmienne wzory; poniżej
przytaczamy najczęściej wykorzystywane w praktyce definicje i zależności.
Wartość oczekiwana
Zgodnie z nazwą i intuicją, wartość oczekiwana określa środek rozkładu, czyli okolicę, w którą
najczęściej powinny "trafiać" wyniki.[1] Dla rozkładów dyskretnych będzie się ona wyrażać wzorem:
a dla rozkładów ciągłych:
Na podstawie tych wzorów łatwo dowieść liniowości wartości oczekiwanej; dla zmiennych losowych
i oraz stałych i
Mediana
Mediana to inna od wartości oczekiwanej miara położenia środka rozkładu. Określamy ją jako taką
wartość zmiennej losowej , która dzieli rozkład gęstości prawdopodobieństwa na dwie równe
części — wartościom zmiennych losowych mniejszym niż
odpowiada tyle samo przypadków, co
wartościom większym:
Dla rozkładów symetrycznych mediana i wartość oczekiwana są sobie równe, w ogólnym przypadku
rozkładów niesymetrycznych -- NIE, por. np. ilustracja różnic z Wikipedii
Wariancja
Wariancja jest miarą rozrzutu zmiennej losowej wokół wartości oczekiwanej, czyli "szerokości"
rozkładu prawdopodobieństwa. Mała wariancja oznacza, że zmienne (np. wyniki losowań) będą
gromadzić się ("wypadać") blisko wartości oczekiwanej (i blisko siebie).
Wariancję określamy jako wartość oczekiwaną kwadratu różnicy zmiennej i jej wartości oczekiwanej;
dla rozkładów dyskretnych:
Dla rozkładów ciągłych:
Pierwiastek wariancji
nosi nazwę odchylenia standardowego.
Wyprowadzimy jeszcze jeden ogólny wzór na obliczanie wariancji, użyteczny w wielu przypadkach:
Dowód
Czyli wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i
kwadratu jej wartości oczekiwanej.
Kowariancja i współczynnik korelacji
Przykładowe wartości współczynnika
korelacji dla 300 par
o różnych
stopniach współzależności.
Miarą związku między zmiennymi
i
jest kowariancja
lub unormowany do jedności współczynnik korelacji zmiennych
i :
gdzie
i
to odpowiednio wartości oczekiwane zmiennych i . Jeśli zmienne i związane są
deterministyczną zależnością liniową (typu
), to ich korelacja wynosi (lub
, jeśli
). Jeśli wzrostowi zmiennej towarzyszy statystycznie wzrost zmiennej , to ich korelacja jest
dodatnia (pomiędzy a ). Dla zmiennych niezależnych korelacja wynosi .
Por. także ilustracje z Wikipedii.
1. ↑ Nie musi być równa wartości zmiennej losowej, dla której prawdopodobieństwo jest
największe.