Statystyka opisowa – Wzory - Uniwersytet Ekonomiczny w Katowicach

Transkrypt

Statystyka opisowa – Wzory - Uniwersytet Ekonomiczny w Katowicach
Uniwersytet Ekonomiczny w Katowicach
Statystyka opisowa – Wzory
I. Analiza struktury
1. Miary tendencji centralnej (średnie, przeciętne)
Średnia arytmetyczna
Dla szeregu wyliczającego:
x̄ =
N
1 X
xi
N i=1
Dla sz. ważonego
dla zmiennej skokowej
x̄ =
Dla sz. ważonego dla zm. ciągłej
(przedziałowego)
k
k
X
1 X
xi ni =
x i wi
N i=1
i=1
x̄ =
k
k
X
1 X
x̂i ni =
x̂i wi
N i=1
i=1
gdzie ni – liczebności, wi – częstości, x̂i – środek przedziału k, – liczba przedziałów (grup)
Dominanta
Dla sz. ważonego
Dla sz. ważonego dla zm. ciągłej
dla zmiennej skokowej
(przedziałowego)
D = xD
dla której
nD = max{ni }
D = xD +
gD − gD−1
· ∆D ,
(gD − gD−1 ) + (gD − gD+1 )
gdzie
xD – lewy koniec przedziału z D (tj. przedziału o największej gęstości),
gD – gęstość przedziału z D,
gD−1 – gęstość przedziału poprzedzającego przedział D,
gD+1 – gęstość przedziału następującego po przedziale D,
∆D – długość przedziału D.
Jeśli szereg ma przedziały o równej długości,
to można korzystać ze wzoru:
D = xD +
nD − nD−1
· ∆D ,
(nD − nD−1 ) + (nD − nD+1 )
gdzie
nD – liczebność przedziału z D,
nD−1 – liczebność przedziału poprzedzającego przedział D,
nD+1 – liczebność przedziału następującego po przedziale D,
Kwantyl rzędu p
Dla sz. ważonego
dla zmiennej skokowej
Dla sz. ważonego dla zm. ciągłej
(przedziałowego)
Qp = x[N ·p]+1
gdzie p to rząd kwantyla
Qp = xQp +
p · N − cum nQp −1
· ∆Qp
nQp
lub
Qp = xQp +
Mediana to M e = Q0,5
jeśli N jest parzyste, to
x0,5N + x0,5N +1
Me =
2
jeśli N jest nieparzyste,to
M e = x0,5(N +1)
p − cum wQp −1
· ∆Qp
wQ p
gdzie
xQp – lewy koniec przedziału z Qp
cum nQp −1 – skumulowana liczebność do przedziału
poprzedzającego przedział z Qp ,
cum wQp −1 – skumulowana częstość do przedziału
poprzedzającego przedział z Qp ,
nQp – liczebność przedziału z Qp ,
wQp – częstość przedziału z Qp ,
∆Qp – długość przedziału z Qp ,
1
2. Miary zróżnicowania (rozproszenia, zmienności, dyspersji)
Wariancja
Dla szeregu wyliczającego:
Dla sz. ważonego
dla zmiennej skokowej
Dla sz. ważonego dla zm. ciągłej
(przedziałowego)
N
1 X
S (x) =
(xi − x̄)2
N i=1
k
1 X
S (x) =
(xi − x̄)2 ni
N i=1
k
1 X
S (x) =
(x̂i − x̄)2 ni
N i=1
2
2
2
Odchylenie standardowe
s(x) =
q
S 2 (x)
Odchylenie przeciętne
Dla szeregu wyliczającego:
d(x) =
N
1 X
|xi − x̄|
N i=1
Dla sz. ważonego
dla zmiennej skokowej
d(x) =
Dla sz. ważonego dla zm. ciągłej
(przedziałowego)
k
1 X
|xi − x̄|ni
N i=1
d(x) =
k
1 X
|x̂i − x̄|ni
N i=1
Klasyczny współczynnik zmienności
V (x) =
s(x)
· 100%
x̄
Rozstęp
R = xmax − xmin
Odchylenie ćwiartkowe
Q=
Q3 − Q1
2
Pozycyjny współczynnik zmienności
VQ =
Q
Me
3. Miary asymetrii (skośności)
Moment centralny trzeciego rzędu
Dla sz. ważonego
Dla szeregu wyliczającego:
dla zmiennej skokowej
M3 (x) =
N
1 X
(xi − x̄)3
N i=1
M3 (x) =
Dla sz. ważonego dla zm. ciągłej
(przedziałowego)
k
1 X
(xi − x̄)3 ni
N i=1
Zestandaryzowany moment centralny trzeciego rzędu
M3 (x)
λ3 (x) =
(s(x))3
Wskaźnik asymetrii
Ws = x̄ − D
Współczynnik asymetrii Pearsona
x̄ − D
γ=
s(x)
Współczynnik asymetrii Yule’a-Kendall’a (pozycyjny)
A=
(Q3 − M e) − (M e − Q1 )
Q3 − Q1
2
M3 (x) =
k
1 X
(x̂i − x̄)3 ni
N i=1
II. Analiza zależności (współzależności) zjawisk
Kowariancja
N
1 X
(xi − x̄) · (yi − ȳ)
N i=1
cov(x, y) =
Współczynnik korelacji liniowej Pearsona
cov(x, y)
rxy =
s(x) · s(y)
gdzie
s(x), s(y) – odchylenia standardowe zmiennych x, y.
∗ rxy bada tylko liniową zależność między zmiennymi,
∗ rxy ∈ h−1, 1i i pozwala określić siłę i kierunek zależności liniowej
−
−
−
−
jeśli
jeśli
jeśli
jeśli
|rxy | jest bliskie 0, to mamy słabą zależność liniową między zmiennymi,
|rxy | jest bliskie 1, to mamy silną zależność liniową między zmiennymi,
rxy > 0, to zależność między zmiennymi jest dodatnia,
rxy < 0, to zależność między zmiennymi jest ujemna.
Funkcja regresji (II rodzaju)
ŷi = axi + b
gdzie
a=
cov(x, y)
,
S 2 (x)
b = ȳ − ax̄
ŷi to wartości teoretyczne zm. Y , S 2 (x) – wariancja zm. X, zaś x̄, ȳ – średnie dla zm. X i Y .
Miary dopasowania funkcji regresji
∗ odchylenie standardowe reszt:
v
su =
− ŷi )2
N −k
uP
u N (y
t i=1 i
gdzie k to liczba parametrów funkcji regresji;
∗ współczynnik zbieżności:
(yi − ŷi )2
2
i=1 (yi − ȳ)
PN
ϕ = Pi=1
N
2
∗ współczynnik determinacji:
R 2 = 1 − ϕ2
− R2 ∈ h0, 1i,
− im większe R2 tym lepsze dopasowanie funkcji regresji do danych.
Standardowy błąd prognozyv
su
u
u
· t1 +
1
(xnew − x̄)2
+ PN
2
N
i=1 (xi − x̄)
gdzie xnew to nowa obserwacja, dla której chcemy zrobić prognozę fˆ(xnew );
Tablica korelacyjna
X \Y
x1
x2
..
.
y1
n11
n21
..
.
y2
n12
n22
..
.
...
...
...
..
.
ym
n1m
n2m
..
.
ni·
n1·
n2·
..
.
xn
n·j
nn1
n·1
nn2
n·2
...
...
nnm
n·m
nn·
N
3
Stosunki korelacyjne (wskaźniki siły korelacyjnej)
∗ zm. Y względem zm. X
v
u 2
u S (y|x )
ey/x = t 2 i
S (y)
gdzie
S 2 (y|xi ) =
n
1 X
2
(y|xi − ȳ) ni·
N i=1
oraz
S 2 (y) =
m
1 X
2
(yj − ȳ) n·j
N j=1
∗ zm. X względem zm. Y
ex/y =
gdzie
S 2 (x|yj ) =
1
N
m
X
x|yj − x̄
v
u 2
u S (x|yj )
t
S 2 (x)
2
n·j
S 2 (x) =
oraz
j=1
n
1 X
2
(xi − x̄) ni·
N i=1
ey/x , ey/x ∈ h0, 1i, x|yj , y|xi – średnie warunkowe.
III. Analiza dynamiki zjawisk
Przyrosty absolutne
∗ o stałej podstawie: ∆t/c = yt − yc
Przyrosty względne
yt − yc
∗ o stałej podstawie: dt/c =
yc
Indeksy indywidualne
yt
∗ o stałej podstawie: it/c =
yc
Średni indeks zmian
v
īG =
∗ łańcuchowe:
∆t/t−1 = yt − yt−1
∗ łańcuchowe:
dt/t−1 =
yt − yt−1
yt−1
∗ łańcuchowe:
it/t−1 =
yt
yt−1
u n
uY
t
i
n−1
s
t/t−1
=
n−1
t=2
yn
y1
Prognoza na k okresów w przyszłość
ỹt+k = yt · (īG )k
Agregatowy indeks wartości
n
X
Iw =
i=1
n
X
pit qit
pi0 qi0
i=1
gdzie pi0 , pit – ceny w okresie bazowym i badanym, qi0 , qit – ilości w okresie bazowym i badanym.
Agregatowe indeksy cen
n
X
∗ formuła Laspeyresa Ip/q0 =
i=1
n
X
n
X
pit qi0
∗ formuła Paaschego: Ip/qt =
pi0 qi0
i=1
i=1
n
X
pit qit
pi0 qit
i=1
Agregatowe indeksy ilości
n
X
∗ formuła Laspeyresa Iq/p0 =
i=1
n
X
n
X
pi0 qit
∗ formuła Paaschego: Iq/pt =
pi0 qi0
i=1
i=1
n
X
i=1
4
pit qit
pit qi0