Wyk³ad 7 - Statystyki opisowe
Transkrypt
Wyk³ad 7 - Statystyki opisowe
Wykład 7 Statystyki opisowe Statystyka opisowa zajmuje się wstępnym opracowaniem wyników pomiarów (próbki) bez posługiwania się rachunkiem prawdopodobieństwa. Nie wyciągamy wniosków dotyczących populacji generalnej. Niech x1, x2, x3,....., xn będzie próbką n - elementową. n – liczność (liczebność). Parametry obliczone z próbki są nazywane statystykami. Populacja generalna Próba Próba uporządkowana x1, x2,........, xn → xi(1) ≤ xi(2) ≤ ....... ≤ xi(n) Szereg rozdzielczy < xi -1, xi) - przedział lub kategoria ("klasy") wartości badanej zmiennej losowej X ni - liczebność i-tej klasy Szereg rozdzielczy stanowi K par liczb (x•i, ni ): środki klas x•i oraz ich liczności ni. x•i = (xi -1 + xi) / 2 Histogram ni / n - częstości częstości skumulowane rozkład kumulacyjny Histogram 16 14 12 ni 10 8 6 4 2 0 0 20 40 60 80 100 120 140 160 xi . Histogram próbki. Zaznaczono granice klas (na osi x) i ilość elementów w klasie (na osi y) Wykres skumulowanego prawdopodobieństwa 100 80 pi 60 40 20 0 20 40 60 80 100 120 140 160 xi Wykres skumulowanego prawdopodobieństwa pi(xi) [wyraŜonego w %] tego, Ŝe znajdziemy w próbce wartość ≤ xi Charakterystyki połoŜenia _ - średnia arytmetyczna ( x = Σ xi / n - średnia z próby) i = 1,....,n - średnia waŜona xw (xw = Σ ni x•i / n, gdzie ni jest licznością i-tej klasy) _ i = 1,....,K n -średnia geometryczna g liczb dodatnich xi g = n ∏ xi (pomiar w jednostkach względnych np. km/godz.) i =1 _ −1 1 n 1 - średnia harmoniczna h róŜnych od zera liczb h = ∑ x1, x2, x3,...,xn nazywamy odwrotność n i =1 x i średniej arytmetycznej odwrotności tych liczb _ _ -średnia kwadratowa xk: xk = [(1/n) Σ (xi)2 ]1/2 Przykład: Gęstość zaludnienia w dwu 60 – tysięcznych miastach wynosiła odpowiednio 400 osób / km2 i 600 osób / km2. Jaka była przeciętna gęstość zaludnienia xh w tych miastach? xh = 2 / (1/400 + 1/600) = 480 osób / km2 Charakterystyki połoŜenia _ - mediana (Me, wartość środkowa) - modalna (Mo, dominanta, wartość najczęściej występująca w zbiorowości ) -Kwantyle Q1, Q2, Q3 D1, D2,....., D9 C1, C2,....., C99 - kwartyle - decyle - centyle x(k) - k-ta statystyka pozycyjna (oparta na próbie uporządkowanej) x([nλ] + 1) - kwantyl rzędu λ (0 < λ <1) [n λ] - część całkowita liczby n Charakterystyki rozrzutu - rozstęp R = xmax - xmin - róŜnica pomiędzy największym a najmniejszym elementem próby - wariancja z próby _ s2 = (1/n) Σ (xi - x )2 i = 1,....,n I - odchylenie standardowe s = ( s2 )1/2 Charakterystyki kształtu rozkładu Momentem zwykłym ml rzędu l próbki x1, x2, x3,..., xn nazywamy średnią arytmetyczną l-tych potęg wartości xi 1 n l ml = ∑ xi n i =1 _ ZauwaŜmy, Ŝe m1 = x. Momentem centralnym Ml rzędu l próbki x1, x2, x3,..., xn nazywamy średnią arytmetyczną l-tych potęg odchyleń wartości xi od średniej arytmetycznej próbki. 1n l Ml = ∑ (xi − x) n i =1 ZauwaŜmy, Ŝe M1 = 0, M2 = s2. - współczynnik asymetrii - współczynnik spłaszczenia (kurtoza) Wykres ramkowy 180 160 140 120 100 xi 95% 80 75% 60 50% 40 25% 5% 20 0 -20 A . Wykres ramkowy: wartość średnia (kółko z poziomą kreską), wartości ekstremalne (poziome kreski), kwartyle (pudełko), kwantyle 0.05 i 0.95 (wąsy), kwantyle 0.01 i 0.99 (krzyŜyki) Dystrybuanta empiryczna (z próby n-elementowej) Fn(x) = #{1≤ j ≤ n: xj < x} / n - rozkład z próby pn(x) = #{j: xj = x} / n Tw. Gliwienki - Cantelliego: Niech Dn = sup | Fn(x) - F(x) | -∞ < x < ∞ JeŜeli próba x1, x2,........, xn pochodzi z populacji o dystrybuancie F, to Dn → 0 z prawdopodobieństwem 1.