Wyk³ad 7 - Statystyki opisowe

Transkrypt

Wyk³ad 7 - Statystyki opisowe
Wykład 7
Statystyki opisowe
Statystyka opisowa zajmuje się wstępnym opracowaniem wyników
pomiarów (próbki) bez posługiwania się rachunkiem
prawdopodobieństwa. Nie wyciągamy wniosków dotyczących
populacji generalnej.
Niech x1, x2, x3,....., xn będzie próbką n - elementową. n – liczność
(liczebność). Parametry obliczone z próbki są nazywane
statystykami.
Populacja generalna
Próba
Próba uporządkowana
x1, x2,........, xn → xi(1) ≤ xi(2) ≤ ....... ≤ xi(n)
Szereg rozdzielczy
< xi -1, xi) - przedział lub kategoria ("klasy") wartości badanej zmiennej
losowej X
ni
- liczebność i-tej klasy
Szereg rozdzielczy stanowi K par liczb (x•i, ni ): środki klas x•i oraz ich
liczności ni.
x•i = (xi -1 + xi) / 2
Histogram
ni / n
- częstości
częstości skumulowane
rozkład kumulacyjny
Histogram
16
14
12
ni
10
8
6
4
2
0
0
20
40
60
80
100
120
140
160
xi
. Histogram próbki. Zaznaczono granice klas (na osi x) i ilość
elementów w klasie (na osi y)
Wykres skumulowanego prawdopodobieństwa
100
80
pi
60
40
20
0
20
40
60
80
100
120
140
160
xi
Wykres skumulowanego prawdopodobieństwa pi(xi)
[wyraŜonego w %] tego, Ŝe znajdziemy w próbce wartość ≤ xi
Charakterystyki połoŜenia
_
- średnia arytmetyczna
( x = Σ xi / n - średnia z próby)
i = 1,....,n
- średnia waŜona xw (xw = Σ ni x•i / n, gdzie ni jest licznością i-tej klasy)
_ i = 1,....,K
n
-średnia geometryczna g liczb dodatnich xi
g = n ∏ xi
(pomiar w jednostkach względnych np. km/godz.)
i =1
_
−1
1 n 1 
- średnia harmoniczna h róŜnych od zera liczb
h =  ∑ 
x1, x2, x3,...,xn nazywamy odwrotność
 n i =1 x i 
średniej arytmetycznej odwrotności tych liczb
_
_
-średnia kwadratowa xk: xk = [(1/n) Σ (xi)2 ]1/2
Przykład: Gęstość zaludnienia w dwu 60 – tysięcznych miastach
wynosiła odpowiednio 400 osób / km2 i 600 osób / km2. Jaka była
przeciętna gęstość zaludnienia xh w tych miastach?
xh = 2 / (1/400 + 1/600) = 480 osób / km2
Charakterystyki połoŜenia
_
- mediana (Me, wartość środkowa)
- modalna (Mo, dominanta, wartość najczęściej występująca w
zbiorowości )
-Kwantyle
Q1, Q2, Q3
D1, D2,....., D9
C1, C2,....., C99
- kwartyle
- decyle
- centyle
x(k) - k-ta statystyka pozycyjna (oparta na próbie uporządkowanej)
x([nλ] + 1)
- kwantyl rzędu λ (0 < λ <1)
[n λ]
- część całkowita liczby n
Charakterystyki rozrzutu
- rozstęp R = xmax - xmin - róŜnica pomiędzy największym a
najmniejszym elementem próby
- wariancja z próby
_
s2 = (1/n) Σ (xi - x )2
i = 1,....,n
I
- odchylenie standardowe
s = ( s2 )1/2
Charakterystyki kształtu rozkładu
Momentem zwykłym ml rzędu l próbki x1, x2, x3,..., xn nazywamy średnią
arytmetyczną l-tych potęg wartości xi
1 n l
ml = ∑ xi
n i =1
_
ZauwaŜmy, Ŝe m1 = x.
Momentem centralnym Ml rzędu l próbki x1, x2, x3,..., xn nazywamy
średnią arytmetyczną l-tych potęg odchyleń wartości xi od średniej
arytmetycznej próbki.
1n
l
Ml = ∑ (xi − x)
n i =1
ZauwaŜmy, Ŝe M1 = 0, M2 = s2.
- współczynnik asymetrii
- współczynnik spłaszczenia (kurtoza)
Wykres ramkowy
180
160
140
120
100
xi
95%
80
75%
60
50%
40
25%
5%
20
0
-20
A
. Wykres ramkowy: wartość średnia (kółko z poziomą kreską),
wartości ekstremalne (poziome kreski), kwartyle (pudełko),
kwantyle 0.05 i 0.95 (wąsy), kwantyle 0.01 i 0.99 (krzyŜyki)
Dystrybuanta empiryczna
(z próby n-elementowej)
Fn(x) = #{1≤ j ≤ n: xj < x} / n
- rozkład z próby
pn(x) = #{j: xj = x} / n
Tw. Gliwienki - Cantelliego:
Niech
Dn = sup | Fn(x) - F(x) |
-∞ < x < ∞
JeŜeli próba x1, x2,........, xn pochodzi z populacji o
dystrybuancie F, to Dn → 0 z prawdopodobieństwem 1.