Wykres funkcji Y=f(x) Wartości skorelowane ?

Transkrypt

Wykres funkcji Y=f(x) Wartości skorelowane ?
Problemy i pytania z poprzedniego
wykładu:
1. Jaka jest niepewność wyznaczenia
współczynników aˆ0 , aˆ1 ?
2. Czy i jak można ocenić, jak dobrze prosta
ta pasuje do danych pomiarowych?
1
Odp. na pytanie 2.:
W jaki sposób ocenić, dopasowanie prostej, otrzymanej
w metodzie regresji liniowej, do wyników pomiarów?
Opowiedź: obliczyć niepewności współczynników funkcji.
Jaka jest słuszność hipotezy o liniowej zależności dwóch
mierzonych wielkości (wartości funkcji od wartości argumentu)?
Opowiedź: obliczyć wartość współczynnika korelacji liniowej ry,t
N
∑ ( yi − y )(ti − t )
ry ,t =
i =0
1
 N ( y − y ) 2 ⋅ N (t − t ) 2  2
∑ i
∑ i

 i =0
i =0

1 N
1 N
y=
t=
∑ yi
∑ ti
N + 1 i =0
N + 1 i =0
2
Wykres funkcji Y=f(x)
Wartości Y
5
y = -0,002x + 3,821
4
3
2
1
0
0
5
10
15
20
25
Wartości skorelowane ?
Wartości Y
1,0
0,8
0,6
0,4
0,2
0,0
0
10
20
30
40
50
60
-0,2
-0,4
4
Jeżeli ry,t jest bliskie 1, to punkty są rozłożone wzdłuż
pewnej prostej.
Co zrobić, jeśli współczynnik korelacji liniowej osiąga
wartości pośrednie?
Korzystamy wtedy z oceny prawdopodobieństwa
uzyskania (na podstawie N pomiarów) skorelowanych
zmiennych y i t współczynnika r> ry,t (patrz tabela 1).
5
ry,t
Tabela 1.
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
0
N
PN %
3
0
6
13
19
26
33
41
51
59
71
100
99
100
6
0
15
30
44
57
69
79
12
94
10
0
22
42
60
75
86
93
2
99,5
20
0
33
60
80
92
98
50
0
51
84
97
99,6
100
99,5 0,1
100
100
Jeżeli PN jest dostatecznie duże, to jest bardzo
prawdopodobne, że zmienne y-t są skorelowane.
6
Wykład 12.
Metoda najmniejszych kwadratów
The Least-Squares Method (LSM)
• Siegmund Brandt: Analiza danych. PWN,
Warszawa 1998r
• Roman Nowak: Statystyka dla fizyków.
PWN, Warszawa 2002r
• Janusz Piotrowski: Procedury pomiarowe
i estymacja sygnałów, Politechnika Śląska,
Gliwice 1994
7
Metoda regresji a MNK
1. Inne formułowanie celu i znanej informacji:
2. Cel - aproksymacja wyników pomiarów
podanych w postaci numerycznej do postaci
analitycznej.
3. Model matematyczny estymatora dobiera się
arbitralnie z dokładnością do klasy funkcji,
a procedurę estymacji prowadzi się tak długo,
aż wyniki będą zadowalające.
8
4. Miarą jakości estymacji jest zwykle błąd
średniokwadratowy, zwany też błędem
resztowym.
5. Formalnie nie czyni się żadnych założeń
o wariancji składnika losowego (w MR jest ona
jednakowa dla wszystkich wyników), a także
o jego rozkładzie prawdopodobieństwa (w MR
zakładaliśmy rozkład normalny).
9
Recepta (prawie definicja) wprowadzona w roku
1805-1806 przez Adriena M. Legendre’a (17521833) i Carla F. Gaussa (1777-1855)
• Wynik yi kolejnego pomiaru można uważać za
sumę wielkości x (nieznanej) oraz błędu ξi
yi = x + ξ i
• Dobieramy następnie tak wielkości ξi , aby suma
kwadratów błędów ξi była najmniejsza
∑ ξ i2 = ∑ ( x − yi ) 2 = min
i
i
10
Uwaga 1.:
Powyższy przepis można uzyskać stosując metodę
największej wiarogodności, gdyż
ln L = ∑ ln pi (ξ i ) = max ⇔ ∑ ξ i2 → min
i
Uwaga 2.:
Metoda NK daje często najlepsze rezultaty w
porównaniu z innymi metodami i dlatego jest
najczęściej stosowaną w praktyce metodą
statystyczną .
11
Inne sformułowanie
• MNK opiera się na stwierdzeniu, że jeżeli suma
kwadratów różnic między rzędnymi punktów
wyznaczonych z pomiarów i rzędnymi
odpowiadających im punktów leżących na
hipotetycznej krzywej osiąga minimum, to taka
krzywa jest najlepiej dopasowana do wyników
pomiarów
2
∑ ( yˆ i − yi ) = min
i
Stąd konieczność iteracji i wyboru tzw. funkcji ortogonalnych,
którymi aproksymuje się punkty pomiarowe.
12
Aproksymacja metodą NK
• Mamy dany zbiór punktów pomiarowych, o których wiemy, że
są wartościami znanej funkcji f(x) w przedziale [a,b]. Chcemy tą
funkcję aproksymować (przybliżyć) inną funkcją φ(x). Jeżeli
wartość całki b
M = ∫ [ f ( x) − ϕ ( x)]2 dx = min
a
ma wartość najmniejszą, to jest to aproksymacja metodą
najmniejszych kwadratów
•Niech funkcja aproksymująca będzie dana w postaci kombinacji
liniowej pewnych określonych funkcji
(*)
φ(x)= a0 φ0(x)+a1 φ1(x)+ …+ aq φq(x).
•Żądając, by pochodne cząstkowe całki M względem współczynników
a0,a1 … aq określających funkcję φ(x) były równe 0 otrzymamy układ
równań liniowych pozwalający znaleźć najlepsze ich wartości (we
wspomnianym sensie)
13
b
∂M q b
= ∑ ai ∫ ϕi ( x)ϕ k ( x) dx − ∫ f ( x)ϕ k ( x) dx = 0
∂ak i =0 a
a
(**)
k = 0, 1, 2, ... q
Gdy funkcje φi(x) są ortogonalne w przedziale [a,b], to ten układ
równań upraszcza się do postaci
b
b
ak ∫ ϕi ( x)ϕ i ( x )dx = ∫ f ( x)ϕ k ( x )dx
a
a
Patrz znane wzory na współczynniki rozwinięcia funkcji okresowej
f(x) w szereg trygonometryczny Fouriera
1
2
ϕ ( x) = a0 + a1 cos ωx + a2 cos 2ωx + ... + aq cos qωx +
+ b1 sin ωx + b2 sin 2ωx + ... + bq sin qωx
ak =
2T
2T
∫ f ( x) cos kωx dx, bk = ∫ f ( x) sin kωx dx
T0
T0
14
Przykład 1.
• Niech funkcja f(x)=x2. W przedziale [0,1] chcemy ją aproksymować
funkcją liniową postaci φ(x)=a0+a1x .
• Funkcja (*) przyjmuje więc postać φ(x)= a0 φ0(x)+a1 φ1(x), gdzie
φ0(x)=1, a φ1(x)=x, (funkcje te nie są ortogonalne!).
• Z zależności (**) otrzymujemy układ dwóch równań
b
∂M 1 b
= ∑ ai ∫ ϕi ( x )ϕ 0 ( x ) dx − ∫ f ( x )ϕ 0 ( x) dx = 0
∂a0 i =0 a
a
b
∂M 1 b
= ∑ ai ∫ ϕ i ( x )ϕ1 ( x ) dx − ∫ f ( x)ϕ1 ( x ) dx = 0
∂a1 i =0 a
a
b
b
a
a
b
a0 ∫ dx + a1 ∫ x dx − ∫ x 2 dx = 0
a
b
b
a
a
b
2
a0 ∫ x dx + a1 ∫ x dx − ∫ x 2 x dx = 0
a
1
1
a0 x 0 + a1
1
a0
15
1
x2
x3
−
=0
2 0 3 0
1
1
x2
x3
x4
+ a1
−
=0
2 0
3 0 4 0
1 1

a0 + a1 2 − 3 = 0

a 1 + a 1 − 1 = 0
 0 2 1 3 4
1

a0 = − ≈ −0,167
6

a1 = 1
ϕ ( x) = −0,167 + x
16
wartość błędu średniokwadratowego/ilość pomiarów
0,012
0,010
0,008
0,006
0,004
0,002
0,000
0
10
20
30
40
50
60
∑ ( yˆ i − yi ) 2
Przy rosnącej ilości pomiarów wzrasta też
wartość błędu średniokwadratowego
(dlaczego). Jednak bardziej miarodajnym
wskaźnikiem jest
i
i
21
Przykład 2.
• W celu wyznaczenia zależności rezystancji
pewnego elementu od temperatury wykonano 11
pomiarów (obserwacji) rezystancji przyrządem o
błędzie granicznym 4Ω dla następujących
wartości temperatur 0, 10, 20, 30 … 100oC.
• Wyznaczyć współczynniki zależności funkcyjnej
R=a0+a1υ oraz ich niepewności.
• Pominąć niepewności wyników pomiaru
temperatury.
22
yi oC 0
10
20
30
40
50
60
70
80
90
100
Ri Ω 48 70
88
109 125 150 170 185 205 224 242
250
200
150
100
50
0
0
20
40
60
80
100
23
Rozwiązanie (MR):
Po podstawieniu do odpowiednich wzorów (jakich?)
otrzymujemy:
R = aˆ 0 + aˆ1υ , aˆ 0 = 49,909 Ω, aˆ1 = 1,940
∆2
u 2 ( R) = gr = 5,173 u ( R) = 2,3 Ω
3
Ω
u (aˆ0 ) = 1,283 Ω u (aˆ1 ) = 0,022 o
C
u (aˆ 0 )
u rel ( aˆ0 ) =
⋅ 100% = 2,57%
aˆ 0
u rel ( aˆ1 ) =
u ( aˆ1 )
⋅100% = 1,13%
aˆ1
Ω
oC
24
250
równanie linii trendu y = 1,94x + 49,909
200
150
100
50
0
0
20
40
60
80
100
25
Ważne!
• W metodzie NK nie znamy dokładności wyniku, gdyż
niewiadomy jest stan odniesienia.
A jak było w metodzie regresji?
• Jak uwzględnić niejednakowe niepewności wyników
pomiarów yi ?
Odpowiedzią na to pytanie jest metoda najmniejszych ważonych
kwadratów (MNWK)
28