Statystyka opisowa – Wzory - Uniwersytet Ekonomiczny w Katowicach
Transkrypt
Statystyka opisowa – Wzory - Uniwersytet Ekonomiczny w Katowicach
Uniwersytet Ekonomiczny w Katowicach Statystyka opisowa – Wzory I. Analiza struktury 1. Miary tendencji centralnej (średnie, przeciętne) Średnia arytmetyczna Dla szeregu wyliczającego: x̄ = N 1 X xi N i=1 Dla sz. ważonego dla zmiennej skokowej x̄ = Dla sz. ważonego dla zm. ciągłej (przedziałowego) k k X 1 X xi ni = x i wi N i=1 i=1 x̄ = k k X 1 X x̂i ni = x̂i wi N i=1 i=1 gdzie ni – liczebności, wi – częstości, x̂i – środek przedziału k, – liczba przedziałów (grup) Dominanta Dla sz. ważonego Dla sz. ważonego dla zm. ciągłej dla zmiennej skokowej (przedziałowego) D = xD dla której nD = max{ni } D = xD + gD − gD−1 · ∆D , (gD − gD−1 ) + (gD − gD+1 ) gdzie xD – lewy koniec przedziału z D (tj. przedziału o największej gęstości), gD – gęstość przedziału z D, gD−1 – gęstość przedziału poprzedzającego przedział D, gD+1 – gęstość przedziału następującego po przedziale D, ∆D – długość przedziału D. Jeśli szereg ma przedziały o równej długości, to można korzystać ze wzoru: D = xD + nD − nD−1 · ∆D , (nD − nD−1 ) + (nD − nD+1 ) gdzie nD – liczebność przedziału z D, nD−1 – liczebność przedziału poprzedzającego przedział D, nD+1 – liczebność przedziału następującego po przedziale D, Kwantyl rzędu p Dla sz. ważonego dla zmiennej skokowej Dla sz. ważonego dla zm. ciągłej (przedziałowego) Qp = x[N ·p]+1 gdzie p to rząd kwantyla Qp = xQp + p · N − cum nQp −1 · ∆Qp nQp lub Qp = xQp + Mediana to M e = Q0,5 jeśli N jest parzyste, to x0,5N + x0,5N +1 Me = 2 jeśli N jest nieparzyste,to M e = x0,5(N +1) p − cum wQp −1 · ∆Qp wQ p gdzie xQp – lewy koniec przedziału z Qp cum nQp −1 – skumulowana liczebność do przedziału poprzedzającego przedział z Qp , cum wQp −1 – skumulowana częstość do przedziału poprzedzającego przedział z Qp , nQp – liczebność przedziału z Qp , wQp – częstość przedziału z Qp , ∆Qp – długość przedziału z Qp , 1 2. Miary zróżnicowania (rozproszenia, zmienności, dyspersji) Wariancja Dla szeregu wyliczającego: Dla sz. ważonego dla zmiennej skokowej Dla sz. ważonego dla zm. ciągłej (przedziałowego) N 1 X S (x) = (xi − x̄)2 N i=1 k 1 X S (x) = (xi − x̄)2 ni N i=1 k 1 X S (x) = (x̂i − x̄)2 ni N i=1 2 2 2 Odchylenie standardowe s(x) = q S 2 (x) Odchylenie przeciętne Dla szeregu wyliczającego: d(x) = N 1 X |xi − x̄| N i=1 Dla sz. ważonego dla zmiennej skokowej d(x) = Dla sz. ważonego dla zm. ciągłej (przedziałowego) k 1 X |xi − x̄|ni N i=1 d(x) = k 1 X |x̂i − x̄|ni N i=1 Klasyczny współczynnik zmienności V (x) = s(x) · 100% x̄ Rozstęp R = xmax − xmin Odchylenie ćwiartkowe Q= Q3 − Q1 2 Pozycyjny współczynnik zmienności VQ = Q Me 3. Miary asymetrii (skośności) Moment centralny trzeciego rzędu Dla sz. ważonego Dla szeregu wyliczającego: dla zmiennej skokowej M3 (x) = N 1 X (xi − x̄)3 N i=1 M3 (x) = Dla sz. ważonego dla zm. ciągłej (przedziałowego) k 1 X (xi − x̄)3 ni N i=1 Zestandaryzowany moment centralny trzeciego rzędu M3 (x) λ3 (x) = (s(x))3 Wskaźnik asymetrii Ws = x̄ − D Współczynnik asymetrii Pearsona x̄ − D γ= s(x) Współczynnik asymetrii Yule’a-Kendall’a (pozycyjny) A= (Q3 − M e) − (M e − Q1 ) Q3 − Q1 2 M3 (x) = k 1 X (x̂i − x̄)3 ni N i=1 II. Analiza zależności (współzależności) zjawisk Kowariancja N 1 X (xi − x̄) · (yi − ȳ) N i=1 cov(x, y) = Współczynnik korelacji liniowej Pearsona cov(x, y) rxy = s(x) · s(y) gdzie s(x), s(y) – odchylenia standardowe zmiennych x, y. ∗ rxy bada tylko liniową zależność między zmiennymi, ∗ rxy ∈ h−1, 1i i pozwala określić siłę i kierunek zależności liniowej − − − − jeśli jeśli jeśli jeśli |rxy | jest bliskie 0, to mamy słabą zależność liniową między zmiennymi, |rxy | jest bliskie 1, to mamy silną zależność liniową między zmiennymi, rxy > 0, to zależność między zmiennymi jest dodatnia, rxy < 0, to zależność między zmiennymi jest ujemna. Funkcja regresji (II rodzaju) ŷi = axi + b gdzie a= cov(x, y) , S 2 (x) b = ȳ − ax̄ ŷi to wartości teoretyczne zm. Y , S 2 (x) – wariancja zm. X, zaś x̄, ȳ – średnie dla zm. X i Y . Miary dopasowania funkcji regresji ∗ odchylenie standardowe reszt: v su = − ŷi )2 N −k uP u N (y t i=1 i gdzie k to liczba parametrów funkcji regresji; ∗ współczynnik zbieżności: (yi − ŷi )2 2 i=1 (yi − ȳ) PN ϕ = Pi=1 N 2 ∗ współczynnik determinacji: R 2 = 1 − ϕ2 − R2 ∈ h0, 1i, − im większe R2 tym lepsze dopasowanie funkcji regresji do danych. Standardowy błąd prognozyv su u u · t1 + 1 (xnew − x̄)2 + PN 2 N i=1 (xi − x̄) gdzie xnew to nowa obserwacja, dla której chcemy zrobić prognozę fˆ(xnew ); Tablica korelacyjna X \Y x1 x2 .. . y1 n11 n21 .. . y2 n12 n22 .. . ... ... ... .. . ym n1m n2m .. . ni· n1· n2· .. . xn n·j nn1 n·1 nn2 n·2 ... ... nnm n·m nn· N 3 Stosunki korelacyjne (wskaźniki siły korelacyjnej) ∗ zm. Y względem zm. X v u 2 u S (y|x ) ey/x = t 2 i S (y) gdzie S 2 (y|xi ) = n 1 X 2 (y|xi − ȳ) ni· N i=1 oraz S 2 (y) = m 1 X 2 (yj − ȳ) n·j N j=1 ∗ zm. X względem zm. Y ex/y = gdzie S 2 (x|yj ) = 1 N m X x|yj − x̄ v u 2 u S (x|yj ) t S 2 (x) 2 n·j S 2 (x) = oraz j=1 n 1 X 2 (xi − x̄) ni· N i=1 ey/x , ey/x ∈ h0, 1i, x|yj , y|xi – średnie warunkowe. III. Analiza dynamiki zjawisk Przyrosty absolutne ∗ o stałej podstawie: ∆t/c = yt − yc Przyrosty względne yt − yc ∗ o stałej podstawie: dt/c = yc Indeksy indywidualne yt ∗ o stałej podstawie: it/c = yc Średni indeks zmian v īG = ∗ łańcuchowe: ∆t/t−1 = yt − yt−1 ∗ łańcuchowe: dt/t−1 = yt − yt−1 yt−1 ∗ łańcuchowe: it/t−1 = yt yt−1 u n uY t i n−1 s t/t−1 = n−1 t=2 yn y1 Prognoza na k okresów w przyszłość ỹt+k = yt · (īG )k Agregatowy indeks wartości n X Iw = i=1 n X pit qit pi0 qi0 i=1 gdzie pi0 , pit – ceny w okresie bazowym i badanym, qi0 , qit – ilości w okresie bazowym i badanym. Agregatowe indeksy cen n X ∗ formuła Laspeyresa Ip/q0 = i=1 n X n X pit qi0 ∗ formuła Paaschego: Ip/qt = pi0 qi0 i=1 i=1 n X pit qit pi0 qit i=1 Agregatowe indeksy ilości n X ∗ formuła Laspeyresa Iq/p0 = i=1 n X n X pi0 qit ∗ formuła Paaschego: Iq/pt = pi0 qi0 i=1 i=1 n X i=1 4 pit qit pit qi0