XYY i xxx

Transkrypt

XYY i xxx
Testowanie jakości dopasowania
1
Testowanie jakości dopasowania.
Test χ2 jakości dopasowania
Metoda najmniejszych kwadratów opiera się na założeniu, że najlepszą
funkcją opisującą zależność między wielkościami jest taka, która
minimalizuje ważoną sumę kwadratów odchyleń wartości yi od
dopasowywanej funkcji y ( xi ) . Tę sumę można scharakteryzować
2
wielkością wariancji dopasowania s , która jest estymatorem wariancji
2
danych σ . Dla funkcji y ( xi ) , liniowo zależnej od m parametrów i
dopasowanej do n punktów, mamy:
∑ {(1 σ )[y
n
1
s =
n−m
2
i =1
2
i
− y ( xi ) ]
2
i
(1 n )∑ (1 σ i2 )
n
}
1 n
2
= ∑ wi [yi − y ( xi )]
ν i =1
i =1
gdzie czynnik ν = n − m jest liczbą stopni swobody dopasowania funkcji
o m parametrach do n punktów, a czynniki wagowe dla każdego punktu
wynoszą
1 σ i2
wi =
1 n
(1 σ i2 )
∑
n i =1
2
i są równe odwrotnościom wariancji 1 σ i opisującym niepewności
pomiarowe dla tego punktu unormowanych do średniej z wszystkich
czynników wagowych
wi = n .
(∑
)
Wariancja dopasowania jest również scharakteryzowana przez samą
2
wartość χ :
1
2
χ ≡ ∑  2 [y i − y ( xi ) ] 
i =1 σ i

2
gdzie
n
m
y ( xi ) = ∑ a j f j ( xi )
j =1
Związek między s a χ najwyraźniej widać, jeżeli porównać s ze
2
zredukowana χ ν :
2
2
2
Testowanie jakości dopasowania
2
s2
χ2
χ =
= 2
ν
σi
2
ν
albo
s2
χ =ν 2
σi
2
gdzie σ i
2
jest ważoną średnią indywidualnych wariancji:
σ
2
i
=
1  1  2 
  2 σ i 
∑
n   σ i  
1  1 
∑ 
n  σ i2 
1
1 
= ∑ 2
n σ i 
−1
i jest równe σ w przypadku gdy wszystkie niepewności są jednakowe
σi =σ .
2
Wariancja σ charakteryzuje rozkład jakiemu podlegają wartości
wielkości mierzonej – jest miarą rozrzutu wartości mierzonych – i nie
może być miarą jakości dopasowania. Z drugiej strony estymator
2
wariancji dopasowania s względem dopasowanej funkcji jest miarą
rozrzutu zarówno samych danych jak i jakości dopasowania. Zatem
2
2
określenie χ jako stosunku wariancji dopasowania s do wariancji
2
samych danych σ pomnożonego przez liczbę stopni swobody robi z
niej wygodną miarę jakości dopasowania.
Jeżeli dopasowana funkcja jest dobrym przybliżeniem rzeczywistej
2
2
zależności, to wartość s powinna zgadzać się z wartością σ , a
2
2
wartość zredukowana χ ν powinna być około jedności, χ ν ≈ 1 . Jeżeli
dopasowana funkcja nie jest właściwa dla danych punktów, to różnice
yi − y ( xi ) będą większe i większa będzie wariancja dopasowania dając
2
wartość χ ν większa od jedności. Wartość χ ν mniejsza od 1 nie
oznacza koniecznie lepszego dopasowania – jest prostym
2
2
odzwierciedleniem faktu, że wartości s i χ ν są też zmiennymi losowymi
i fluktuują od jednej serii pomiarowej do drugiej. Bardzo mała wartość
χ ν2 może oznaczać pomyłkę przy ustalaniu niepewności wartości
wielkości mierzonej.
2
2
Testowanie jakości dopasowania
3
W tablicach statystycznych można znaleźć wartości dystrybuanty
2
rozkładu χ i obliczyć prawdopodobieństwo:
Pχ ( χ ;ν ) =
2
∞
∫p
χ
( x 2 ;ν ) dx 2 ,
χ2
że przypadkowy zestaw danych wylosowanych z rozkładu wyjściowego
2
da wartość χ równą lub większą od danej.
W przypadku właściwego doboru funkcji i dobrego dopasowania
2
doświadczalna wartość χ ν powinna być bliska oczekiwanej
i prawdopodobieństwo Pχ ( χ 2 ;ν ) powinno wynosić około 0,5. Gorsze
dopasowanie da powiększoną wartość χ ν , a odpowiednie
prawdopodobieństwo będzie mniejsze.
2
Trzeba pamiętać o pewnej dwuznaczności χ ν , która jest zależna
zarówno od danych pomiarowych i od wybranej funkcji, a zatem nawet
2
właściwie dobrana funkcja może dać czasami dużą wartość χ ν .
2
Testowanie jakości dopasowania
4
Współczynnik korelacji liniowej
Dane pomiarowe składają się z par zmierzonych wartości wielkości
fizycznych {xi , yi }. Zanim dopasujemy do nich funkcje liniową (lub
jakąkolwiek inną), powinniśmy zapytać, czy między mierzonymi
wielkościami w ogóle występuje jakaś zależność fizyczna.
Jeżeli założymy, że wielkość Y jest wielkością zależną, to chcielibyśmy
wiedzieć, czy dane dają się przedstawić przy pomocy funkcji liniowej
y = a x+b
Poprzednio otrzymaliśmy analityczne rozwiązanie dla najlepszej (w
2
sensie metody minimalizacji χ ) parametru a, który jest
współczynnikiem kierunkowym dopasowanej funkcji
a=
n ∑ xi y i − ∑ xi ∑ y i
n∑ xi2 − (∑ xi )
2
(czynniki wagowe zostały opuszczone dla lepszej przejrzystości wzoru).
Jeżeli wielkości X i Y są niezależne od siebie, to również niezależne i
nieskorelowane są wyniki pomiarów. Nie powinniśmy obserwować
żadnej tendencji wzrostu (lub zmniejszania się) wartości y wraz ze
wzrostem x, a współczynnik kierunkowy a wyniesie 0.
Ponieważ interesuje nas wzajemna relacja między wielkościami X i Y, to
równie dobrze możemy zapytać o zależność
x = a ' y + b' .
W tym wypadku parametry a' i b' będą miały inne wartości (i wymiary),
ale jeżeli dane są skorelowane, to powinien między nimi zachodzić jakiś
związek. Dla parametru a' można otrzymać rozwiązanie w postaci
a' =
n ∑ xi y i − ∑ xi ∑ y i
n∑ yi2 − (∑ yi )
2
i jeśli dane nie są skorelowane, to znowu współczynnik kierunkowy
odwróconej zależności powinien wynosić a' = 0 .
Jeżeli dane są zależne w sposób całkowicie jednoznaczny (całkowicie
skorelowane), to powinien zachodzić związek
y=
b'
1
x− = a x+b
a'
a'
Testowanie jakości dopasowania
5
oraz równość współczynników
b'
= b.
a'
W przypadku całkowitej korelacji a a ' = 1 . Jeżeli nie ma żadnej korelacji,
1
=a
a'
−
to oba współczynniki są zerami i związek powyżej w ogóle nie zachodzi.
Jeżeli zdefiniujemy, jako miarę korelacji liniowej, wielkość r
r 2 ≡ a a'
albo
r≡
n ∑ xi y i − ∑ xi ∑ y i
.
n∑ x − (∑ xi ) n∑ y − (∑ yi )
Współczynnik korelacji r przyjmuje wartości od 0, w przypadku braku
2
i
2
2
i
2
korelacji, do ±1 przy całkowitej korelacji. Znak nie jest istotny dla
istnienia korelacji, ważna jest natomiast wartość bezwzględna
współczynnika.
Najczęściej istnienie korelacji testujemy porównując otrzymaną wartość
r z rozkładem prawdopodobieństwa dla populacji, która jest całkowicie
nieskorelowana. Porównanie daje nam informację, czy jest
prawdopodobne, że analizowane dane mogły zostać wylosowane z
populacji nieskorelowanej. Jeżeli prawdopodobieństwo przypadkowego
otrzymania wartości równej lub większej od r (lub równej lub mniejszej
od − r ) jest niewielkie, to mamy prawo sądzić, że nasze dane są
skorelowane.
Współczynnik korelacji liniowej (w przypadku braku korelacji między
zmiennymi) ma następujący symetryczny rozkład prawdopodobieństwa:
pr ( x;ν ) =
1 Γ[(ν + 1) 2]
(1 − x 2 )(ν −2) 2
π Γ(ν 2 )
Tablice statystyczne podają wartości prawdopodobieństwa dla n
nieskorelowanych par wartości
1
Pc (r ; n) = P[(x > r ) ∪ (x < − r )] = 2 ∫ p r ( x; n − 2)dx
r
(W przypadku zależności liniowej liczba stopni swobody ν = n − 2 .)
Testowanie jakości dopasowania
6
Przykład
1.
Dla danych liczbowych z przykładu pomiarów spadku napięcia wzdłuż
drutu oporowego otrzymujemy
r=
=
n∑ xi yi − ∑ xi ∑ yi
n∑ xi2 − (∑ xi )
n∑ yi2 − (∑ yi )
2
2
9 × 779,3 − 450,0 ×12,44
9 × 28500 − (450,0 )
9 × 21,32 − (12,44)
2
2
= 0,9994
W tablicach znajdujemy dla n = 9 wartość Pc(0,898; 9) = 0,001.
Oznacza to, że. Pc(0,9994; 9) < 0,001
2.
Dla danych liczbowych z pomiarów liczby impulsów licznika G-M
w funkcji odległości preparatu otrzymujemy:
r=
=
=
∑ wi ∑ wi xi yi − ∑ wi xi ∑ wi yi
2
2
2
2
(
)
(
)
w
w
x
w
x
w
w
y
w
y
−
×
−
∑ i∑ i i ∑ i i
∑ i∑ i i ∑ i i
(S
S w S xy − S x S y
)(
S xx − (S x ) × S w S yy − (S y )
2
w
2
)
0,03570 × 81,02 − 0,1868 × 10,0
(0,03570 ×1,912 − (0,1868) )× (0,03570 × 3693,0 − (10,0) )
2
2
= 0,9938
Dla n = 10 w tablicach znajdujemy
Pc (0,9938; 10) < Pc (0,872; 10) = 0,001 .
W obu przykładach odpowiednie prawdopodobieństwa są na tyle małe,
że z dużą pewnością możemy uznać istnienie korelacji między
mierzonymi wartościami.
Testowanie jakości dopasowania
7
Współczynniki korelacji liniowej między wieloma zmiennymi
Jeżeli zmienna zależna jest liniową funkcją więcej niż jednej zmiennej
niezależnej,
yi = a0 + a1 xi1 + a 2 xi 2 + a3 xi 3 + !
to możemy sprawdzać korelacje między {yi } a każdą ze zmiennych
niezależnych {xij } (pierwszy indeks oznacza numer pomiaru, a drugi
zmiennej niezależnej). Nie ma znaczenia, czy xij są oddzielnymi
zmiennymi, potęgami xi , czy dowolnymi funkcjami f j (xi ) .
Wprowadzimy pojęcie kowariancji z próby s jk :
1 n
s jk ≡
∑ [(xij − x j )(xik − xk )]
n − 1 i =1
gdzie odpowiednie średnie wynoszą oczywiście:
1 n
x j = ∑ xij
n i =1
1 n
xk = ∑ xik
n i =1
(wagi są pominięte, żeby nie komplikować formy wzorów).
Przy takim podejściu estymatorem wariancji z próby j-tej zmiennej jest
1 n
(xij − x j )2
s ≡ s jj =
∑
n − 1 i =1
2
j
Trzeba zwrócić uwagę, że wariancje z prób są miarą szerokości
przedziałów zmienności odpowiednich zmiennych i nie maja nic
wspólnego z niepewnościami, z jakimi mierzymy ich wartości.
Testowanie jakości dopasowania
8
Zauważmy, że
1 n
s jk ≡
∑ [(xij − x j )(xik − xk )]
n − 1 i =1
1 n
=
∑ (xij xik − x j xik − xij xk + x j xk )
n − 1 i =1
1 n
=
∑ (xij xik − x j xik − xij xk + x j xk )
n − 1 i =1
n
n
n
1  n

x
x
x
x
x
x
x
x
=
−
−
+
∑
∑
∑
∑
ij
ik
j
ik
ij
k
j
k

n − 1  i =1

i =1
i =1
i =1
n
n
n
1 n

x
x
x
x
x
x
x
x
=
−
−
+
1
∑
∑
∑
∑
ij ik
j
ik
k
ij
j k

n − 1  i =1
i =1
i =1
i =1 
1 n

x
x
x
n
x
x
n
x
x
x
n
=
−
−
+
∑
ij
ik
j
k
k
j
j
k

n − 1  i =1

n
n
n
n
1 
1 
1


x
x
n
x
x
x
x
x
x
=
−
=
−
∑
∑
∑
∑
ij ik
j k
ij ik
ij
ik

n − 1  i =1
n i =1 i =1 
 n − 1  i =1
Porównując to z wzorem definiującym współczynnik korelacji
r=
(n∑ x
n∑ xi yi − ∑ xi ∑ yi
)(
)
,
− (∑ xi ) n∑ y − (∑ yi )
który po podzieleniu licznika i mianownika przez n przyjmuje postać
xi yi − n1 ∑ xi ∑ yi
∑
r=
2
2
2
2
1
1
x
x
y
y
−
−
(
)
(
)
∑ i n∑ i ∑ i n∑ i
2
2
i
(
2
i
)(
2
)
możemy przez analogię zapisać
r jk =
s jk
s j ⋅ sk
.
rjk jest współczynnikiem korelacji liniowej z próby między dwoma
dowolnymi zmiennymi x j i xk . Podobnie współczynnikiem korelacji
między j-tą zmienną x j a zmienną zależną y jest
s jy
.
r jy =
s j ⋅ sy
Testowanie jakości dopasowania
9
W szczególnym przypadku dopasowania wielomianu y ( x) =
m
∑a x
k
k
,
k =0
kolejne zmienne x j są potęgami zmiennej niezależnej x
xij = xij
i współczynnik korelacji między zmienną zależną i j-tym składnikiem
wielomianu wynosi
r jy =
s jy
s j ⋅ sy
gdzie
2
1  n 2j 1  n j  
s =
 ∑ xi −  ∑ xi  
n − 1  i =1
n  i =1  
2
j
2
n
n


1
1


2
−
s 2y =
y
y
∑ i  
∑ i
n − 1  i =1
n  i =1  
1  n j
1 n j n 
s jy =
xi ∑ y i 
∑ xi y i − n ∑
n − 1  i =1

i =1
i =1
Jeżeli niepewności punktów pomiarowych nie są wszystkie jednakowe,
to musimy uwzględnić odpowiednie wagi statystyczne w definicjach
wariancji, kowariancji i współczynnika korelacji z próby. Wzory na
wartości współczynników korelacji w formie
r jk =
s jk
s j ⋅ sk
pozostają niezmienione. Wzory na wariancje i kowariancje z próby
muszą 9natomiast być zmodyfikowane:

1 n 1
x
x
x
x
−
−
(
)
(
)
∑
ij
j
ik
k 
n − 1 i =1 σ i2

s jk ≡
n
1
1
∑
n i =1 σ i2
Testowanie jakości dopasowania
10
1 n 1
2
x
x
−
(
)
∑
ij
j

n − 1 i =1 σ i2
.
2
s j ≡ s jj
n
1
1
∑
n i =1 σ i2
Średnie x j i xk są też ważone
n
1 n
x j = ∑ xij wi =
n i =1
xij
∑σ
i =1
n
1
∑σ
i =1
2
i
2
i
unormowanymi czynnikami wagowymi równymi
wi =
1 σ i2
1 n
(1 σ i2 )
∑
n i =1

Podobne dokumenty