STATYSTYKA ćw 7
Transkrypt
STATYSTYKA ćw 7
LINIOWA FUNKCJA REGRESJI Po ustaleniu zależności korelacyjnej pomiędzy cechami przechodzimy do znalezienia funkcji regresji, która może posłużyć do przewidywania wartości jednej cechy przy określonym poziomie drugiej cechy. W zależności funkcyjnej pomiędzy zmiennymi X i Y zmiana wartości jednej zmiennej (niezależnej) powoduje ściśle określoną wartość drugiej zmiennej. Zależnością stochastyczną (probabilistyczną) nazywamy zależność między dwiema zmiennymi losowymi polegającą na tym, że wraz ze zmianą jednej zmiennej zmienia się rozkład prawdopodobieństwa drugiej zmiennej. MODEL ZALEŻNOŚCI STOCHASTYCZNEJ Model zależności stochastycznej ma postać: Y ≈ f(X , e) Gdzie Y – zmienna zależna, X – zmienna niezależna, e – składnik losowy określający odchylenia przypadkowe wartości zmiennej Y (rzeczywistych) od wartości funkcji regresji (wartości teoretycznych). Na podstawie obserwacji zmiennych X i Y funkcję tą można przedstawić w układzie współrzędnych XOY w postaci linii łamanych, zwanych liniami regresji. Linie te jaki i diagram korelacyjny pozwalają na określenie typu funkcji matematycznej opisującej zależność pomiędzy badanymi cechami. Zadanie 1. Linie te przyjmą postać: Yi = α 0 + α1 xi + ζ 1i X i = β 0 + β1 y i + ζ 2 i ζ - wielkość składnika losowego. Wartości ocen parametrów a0, a1 i b0, b1 szuka się w ten sposób, aby suma kwadratów odchyleń rzeczywistych wartości zmiennej Y i X od wartości teoretycznych była najmniejsza (jest to tzw. Metoda Najmniejszych Kwadratów) Po oszacowaniu ocen parametrów: yˆi = a0 + a1 xi xˆi = b0 + b1 yi x̂ i , ŷ i - wartości teoretyczne, a1, b1 – współczynniki kierunkowe funkcji regresji, Wartość oceny a1 parametru α1 – informuje o ile średnio jednostek zmieni się zmienna Y (zależna), jeśli zmienna X (niezależna zmieni się o jednostkę) Zajęcia 7. Materiały pomocnicze do ćwiczeń ze Statystyki mgr Emilia Modranka [email protected] Strona 1 z 3 Wartość oceny b1 – parametru β1 - informuje o ile jednostek zmieni się zmienna X (zależna), jeśli Y (niezależna) zmieni się o jednostkę. a0, b0 – stałe regresji Rozwiązaniem układu równań jest: yˆi = a0 + a1 xi xˆi = b0 + b1 yi a0 = y − a1 x b0 = x − b1 y n n ∑(x i a1 = − x )( yi − y) ∑(x i i =1 b1 = n ∑ ( xi − x )2 − x )( yi − y) i =1 n ∑ ( y − y) 2 i i =1 i =1 Zadanie 2. POMIAR ODCHYLEŃ EMPIRYCZNYCH OD WARTOŚCI TEORETYCZNYCH Reszty równania regresji Stanowią różnice pomiędzy wartościami empirycznymi zmiennej zależnej a wartościami teoretycznymi ei = yi − yˆi Gdzie: y i - wartość empiryczna zmiennej zależnej, ŷ i - wartość teoretyczna zmiennej zależnej; Przy szacowaniu wartości teoretycznych odchylenia te muszą mieć charakter losowy, a ich kwadraty muszą być minimalne. Odchylenie standardowe reszt Pierwiastek kwadratowy z wariancji resztowej Informuje, że wartości empiryczne zmiennej objaśnianej (zależnej) yi różnią się od wartości teoretycznych y^i, otrzymanych na podstawie oszacowanej funkcji regresji, średnio o ± Sy n ∑( y − yˆ ) 2 i S (e)2 = i =1 i (n − k ) S (e) = S (e)2 gdzie: n - liczebność próby, k – liczba szacowanych parametrów. Współczynnik zmienności Służy do porównań odchyleń wartości teoretycznych dla dwóch funkcji Podaje jaka część średniej wartości zmiennej zależnej stanowi odchylenie standardowe wartości teoretycznych od empirycznych. V (e) = Zajęcia 7. S (e) ⋅ 100 y Materiały pomocnicze do ćwiczeń ze Statystyki mgr Emilia Modranka [email protected] Strona 2 z 3 Współczynnik determinacji R2 Informuje, jaka część całkowitej zmienności (zmian) zmiennej objaśnianej została wyjaśniona przez zmiany zmiennej objaśniającej. n ∑( yˆ − y) 2 i R2 = i =1 n ∑ ( y − y) 2 i i =1 ( )2 R2 = ryx 2 R jest z przedziału [0,1]. Wartość 1 świadczy o idealnym dopasowaniu funkcji teoretycznej do danych empirycznych, 0 – brak dopasowania. Współczynnik zbieżności Służy do oceny stopnia dopasowania funkcji regresji do danych empirycznych. Określa jaka część zmian wartości zmiennej zależnej nie została wyjaśniona zmianami zmiennej zależnej. n ∑( y − yˆ ) 2 i ϕ2 = i i =1 n = 1 − R2 ∑ ( y − y) 2 i i =1 2 φ jest z przedziału [0,1] – im wartość współczynnika zbieżności bliższa zeru, tym lepsze dopasowanie modelu liniowej regresji do danych empirycznych. Zadanie 3. BADANIE ŚCISŁOŚCI ZWIĄZKU KORELACYJNEGO POMIĘDZY ZMIENNYMI REGRESJI LINIOWEJ Współczynnik korelacji liniowej to średnia geometryczna z dwóch współczynników regresji liniowej. Nie rozpoznamy kierunku zależności na podstawie współczynnika, ale na podstawie współczynników kierunkowych regresji rxy 2 = a1 ⋅ b1 , rxy = a1 ⋅ b1 Zajęcia 7. Materiały pomocnicze do ćwiczeń ze Statystyki mgr Emilia Modranka [email protected] Strona 3 z 3