STATYSTYKA ćw 7

Transkrypt

STATYSTYKA ćw 7
LINIOWA FUNKCJA REGRESJI
Po ustaleniu zależności korelacyjnej pomiędzy cechami przechodzimy do znalezienia funkcji regresji, która może
posłużyć do przewidywania wartości jednej cechy przy określonym poziomie drugiej cechy.
W zależności funkcyjnej pomiędzy zmiennymi X i Y zmiana wartości jednej zmiennej (niezależnej) powoduje
ściśle określoną wartość drugiej zmiennej.
Zależnością stochastyczną (probabilistyczną) nazywamy zależność między dwiema zmiennymi losowymi
polegającą na tym, że wraz ze zmianą jednej zmiennej zmienia się rozkład prawdopodobieństwa drugiej
zmiennej.
MODEL
ZALEŻNOŚCI STOCHASTYCZNEJ
Model zależności stochastycznej ma postać:
Y ≈ f(X , e)
Gdzie Y – zmienna zależna, X – zmienna niezależna, e – składnik losowy określający odchylenia przypadkowe
wartości zmiennej Y (rzeczywistych) od wartości funkcji regresji (wartości teoretycznych).
Na podstawie obserwacji zmiennych X i Y funkcję tą można przedstawić w układzie współrzędnych XOY w
postaci linii łamanych, zwanych liniami regresji. Linie te jaki i diagram korelacyjny pozwalają na określenie typu
funkcji matematycznej opisującej zależność pomiędzy badanymi cechami.
Zadanie 1.
Linie te przyjmą postać:
Yi = α 0 + α1 xi + ζ 1i
X i = β 0 + β1 y i + ζ 2 i
ζ - wielkość składnika losowego.
Wartości ocen parametrów a0, a1 i b0, b1 szuka się w ten sposób, aby suma kwadratów odchyleń rzeczywistych
wartości zmiennej Y i X od wartości teoretycznych była najmniejsza (jest to tzw. Metoda Najmniejszych
Kwadratów)
Po oszacowaniu ocen parametrów:
yˆi = a0 + a1 xi
xˆi = b0 + b1 yi
x̂ i , ŷ i - wartości teoretyczne,
a1, b1 – współczynniki kierunkowe funkcji regresji,
Wartość oceny a1 parametru α1 – informuje o ile średnio jednostek zmieni się zmienna Y (zależna), jeśli
zmienna X (niezależna zmieni się o jednostkę)
Zajęcia 7.
Materiały pomocnicze do ćwiczeń ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 1 z 3
Wartość oceny b1 – parametru β1 - informuje o ile jednostek zmieni się zmienna X (zależna), jeśli Y (niezależna)
zmieni się o jednostkę.
a0, b0 – stałe regresji
Rozwiązaniem układu równań jest:
yˆi = a0 + a1 xi
xˆi = b0 + b1 yi
a0 = y − a1 x
b0 = x − b1 y
n
n
∑(x
i
a1 =
− x )( yi − y)
∑(x
i
i =1
b1 =
n
∑
( xi − x )2
− x )( yi − y)
i =1
n
∑ ( y − y)
2
i
i =1
i =1
Zadanie 2.
POMIAR
ODCHYLEŃ EMPIRYCZNYCH OD WARTOŚCI TEORETYCZNYCH
Reszty równania regresji
Stanowią różnice pomiędzy wartościami empirycznymi zmiennej zależnej a wartościami teoretycznymi
ei = yi − yˆi
Gdzie: y i - wartość empiryczna zmiennej zależnej, ŷ i - wartość teoretyczna zmiennej zależnej;
Przy szacowaniu wartości teoretycznych odchylenia te muszą mieć charakter losowy, a ich kwadraty muszą być
minimalne.
Odchylenie standardowe reszt
Pierwiastek kwadratowy z wariancji resztowej
Informuje, że wartości empiryczne zmiennej objaśnianej (zależnej) yi różnią się od wartości teoretycznych y^i,
otrzymanych na podstawie oszacowanej funkcji regresji, średnio o ± Sy
n
∑( y − yˆ )
2
i
S (e)2 =
i =1
i
(n − k )
S (e) = S (e)2
gdzie: n - liczebność próby, k – liczba szacowanych parametrów.
Współczynnik zmienności
Służy do porównań odchyleń wartości teoretycznych dla dwóch funkcji
Podaje jaka część średniej wartości zmiennej zależnej stanowi odchylenie standardowe wartości teoretycznych
od empirycznych.
V (e) =
Zajęcia 7.
S (e)
⋅ 100
y
Materiały pomocnicze do ćwiczeń ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 2 z 3
Współczynnik determinacji R2
Informuje, jaka część całkowitej zmienności (zmian) zmiennej objaśnianej została wyjaśniona przez zmiany
zmiennej objaśniającej.
n
∑( yˆ − y)
2
i
R2 =
i =1
n
∑ ( y − y)
2
i
i =1
( )2
R2 = ryx
2
R jest z przedziału [0,1]. Wartość 1 świadczy o idealnym dopasowaniu funkcji teoretycznej do danych
empirycznych, 0 – brak dopasowania.
Współczynnik zbieżności
Służy do oceny stopnia dopasowania funkcji regresji do danych empirycznych. Określa jaka część zmian
wartości zmiennej zależnej nie została wyjaśniona zmianami zmiennej zależnej.
n
∑( y − yˆ )
2
i
ϕ2 =
i
i =1
n
= 1 − R2
∑ ( y − y)
2
i
i =1
2
φ jest z przedziału [0,1] – im wartość współczynnika zbieżności bliższa zeru, tym lepsze dopasowanie modelu
liniowej regresji do danych empirycznych.
Zadanie 3.
BADANIE
ŚCISŁOŚCI ZWIĄZKU KORELACYJNEGO POMIĘDZY ZMIENNYMI
REGRESJI LINIOWEJ
Współczynnik korelacji liniowej to średnia geometryczna z dwóch współczynników regresji liniowej. Nie
rozpoznamy kierunku zależności na podstawie współczynnika, ale na podstawie współczynników kierunkowych
regresji
rxy 2 = a1 ⋅ b1 , rxy = a1 ⋅ b1
Zajęcia 7.
Materiały pomocnicze do ćwiczeń ze Statystyki
mgr Emilia Modranka
[email protected]
Strona 3 z 3

Podobne dokumenty