Statystyka i eksploracja danych

Transkrypt

Metoda najmniejszych kwadratów
Wykład XI:
Metoda najmniejszych kwadratów i regresja liniowa
5 maja 2014
Wykład XI: Metoda najmniejszych kwadratów
Model liniowy
Szereg czasowy Yt = 16t + Yt , Yt ∼ N (0, 1)
Model liniowy
Estymacja zależnosci liniowej
Model liniowy
Szereg czasowy Yt = 6 − 2t + Yt , Yt ∼ N (0, 1)
Model liniowy
Est. param.: b = 5, 654, a = −1, 923, s 2 = 0, 9727
Model liniowy
Krzywa wyestymowana i krzywa rzeczywista
Model liniowy
Szereg czasowy Yt = 6 − 2t + 3t 2 + Yt , Yt ∼ N (0, 1)
Model liniowy
Est. param.: c = 5, 702, b = −2, 186, a = 3, 258,
s 2 = 0, 9727
Model liniowy
Krzywa wyestymowana i krzywa rzeczywista
Model liniowy
Model liniowy
Model liniowy
Model liniowy
W modelu liniowym przyjmujemy, że d-wymiarowy wektor
~ ma postać
obserwacji Y
~ = X β~ + ~ε,
Y
gdzie X = [xij ] jest macierzą danych (być może losowych) wymiaru
d × k, β~ jest k-wymiarowym wektorem (nieznanych) parametrów,
a ~ε jest d-wymiarowym wektorem błędów (o nieskorelowanych
współrzędnych).
Model liniowy
Model liniowy
W modelu liniowym przyjmujemy, że d-wymiarowy wektor
~ ma postać
obserwacji Y
~ = X β~ + ~ε,
Y
gdzie X = [xij ] jest macierzą danych (być może losowych) wymiaru
d × k, β~ jest k-wymiarowym wektorem (nieznanych) parametrów,
a ~ε jest d-wymiarowym wektorem błędów (o nieskorelowanych
współrzędnych). Problem: regresja liniowa, czyli estymacja
~ i X.
wektora parametrów β~ w oparciu o konkretną realizację Y
Model liniowy
Metoda najmniejszych kwadratów (ang. „Least Squares
Method”)
Model liniowy
Method”)
Rozwiązanie problemu: Postuluje się minimalny wpływ błędu,
poszukując minimum funkcjonału
~ = kY
~ − X βk
~ 2 = (Y
~ − X β)
~ T (Y
~ − X β).
~
S(β)
Model liniowy
Method”)
Rozwiązanie problemu: Postuluje się minimalny wpływ błędu,
poszukując minimum funkcjonału
~ = kY
~ − X βk
~ 2 = (Y
~ − X β)
~ T (Y
~ − X β).
~
S(β)
~ nazywamy estymatorem
Rozwiązanie β̂ minimalizujące S(β)
(uzyskanym) metodą najmniejszych kwadratów (ang. LSE =
„Least Square Estimation”). W skrócie piszemy: EMNK.
Model liniowy
Metoda najmniejszych kwadratów - cd.
Model liniowy
Twierdzenie
~ zawsze posiada minimalizator β̂, który spełnia
Funkcjonał S(β)
równanie
~ = X T X β̂.
XTY
Model liniowy
Twierdzenie
Funkcjonał S(β)
równanie
~ = X T X β̂.
XTY
Wniosek
Jeżeli macierz X T X jest nieosobliwa, to estymatorem MNK jest
~.
β̂ = (X T X )−1 X T Y
Model liniowy
Twierdzenie
Funkcjonał S(β)
równanie
~ = X T X β̂.
XTY
Wniosek
~.
β̂ = (X T X )−1 X T Y
~
Estymator ten jest nieobciążony, tzn. E β̂ = β.
Model liniowy
Twierdzenie
Funkcjonał S(β)
równanie
~ = X T X β̂.
XTY
Wniosek
~.
β̂ = (X T X )−1 X T Y
~ W szczególności
Estymator ten jest nieobciążony, tzn. E β̂ = β.
jego macierz kowariancji ma postać
~ β̂ − β)
~ T.
Cov (β̂) = E (β̂ − β)(
Model liniowy
Metoda najmniejszych kwadratów - przypadek ogólny
Model liniowy
Twierdzenie (Gaussa-Markowa)
Jeżeli składowe ε1 , ε2 , . . . , εd wektora błędów ~ε są białym szumem
(tzn. E εi = 0, Var (εi ) = σ 2 i są nieskorelowane) i jeżeli estymator
~ jest estymatorem nieobciążonym parametru ~c T β,
~
liniowy ~b T Y
T
gdzie X ~b = ~c , to
~ ) Var (~c T β̂).
Var (~b T Y
Model liniowy
Twierdzenie (Gaussa-Markowa)
Jeżeli składowe ε1 , ε2 , . . . , εd wektora błędów ~ε są białym szumem
(tzn. E εi = 0, Var (εi ) = σ 2 i są nieskorelowane) i jeżeli estymator
~ jest estymatorem nieobciążonym parametru ~c T β,
~
liniowy ~b T Y
T
gdzie X ~b = ~c , to
~ ) Var (~c T β̂).
Var (~b T Y
Twierdzenie
W założeniach tw. Gaussa-Markowa wielkość
s2 =
1
~ − X β̂)T (Y
~ − X β̂)
(Y
d −k
jest estymatorem nieobciążonym wariancji błędu:
Eβ~ s 2 = σ 2 .

Statystyka i eksploracja danych

Transkrypt

Podobne dokumenty

Temat: Aproksymacja krzywej metodą najmniejszych kwadratów

35 z forum

Metoda najmniejszych kwadratów Pomiary bezpośrednie o równej

Paryż zaprasza mistrzów - Konkurs Gier Matematycznych i Logicznych

Zestaw 9 Zadanie 1 W trapezie trzy boki są równe m, a czwarty bok

2016/2017 Autor: 1. Dobromił Serwa 2. Tytuł przedmiotu

KARTA ZADAŃ NR 1 Policz figury