XYY i xxx
Transkrypt
XYY i xxx
Testowanie jakości dopasowania 1 Testowanie jakości dopasowania. Test χ2 jakości dopasowania Metoda najmniejszych kwadratów opiera się na założeniu, że najlepszą funkcją opisującą zależność między wielkościami jest taka, która minimalizuje ważoną sumę kwadratów odchyleń wartości yi od dopasowywanej funkcji y ( xi ) . Tę sumę można scharakteryzować 2 wielkością wariancji dopasowania s , która jest estymatorem wariancji 2 danych σ . Dla funkcji y ( xi ) , liniowo zależnej od m parametrów i dopasowanej do n punktów, mamy: ∑ {(1 σ )[y n 1 s = n−m 2 i =1 2 i − y ( xi ) ] 2 i (1 n )∑ (1 σ i2 ) n } 1 n 2 = ∑ wi [yi − y ( xi )] ν i =1 i =1 gdzie czynnik ν = n − m jest liczbą stopni swobody dopasowania funkcji o m parametrach do n punktów, a czynniki wagowe dla każdego punktu wynoszą 1 σ i2 wi = 1 n (1 σ i2 ) ∑ n i =1 2 i są równe odwrotnościom wariancji 1 σ i opisującym niepewności pomiarowe dla tego punktu unormowanych do średniej z wszystkich czynników wagowych wi = n . (∑ ) Wariancja dopasowania jest również scharakteryzowana przez samą 2 wartość χ : 1 2 χ ≡ ∑ 2 [y i − y ( xi ) ] i =1 σ i 2 gdzie n m y ( xi ) = ∑ a j f j ( xi ) j =1 Związek między s a χ najwyraźniej widać, jeżeli porównać s ze 2 zredukowana χ ν : 2 2 2 Testowanie jakości dopasowania 2 s2 χ2 χ = = 2 ν σi 2 ν albo s2 χ =ν 2 σi 2 gdzie σ i 2 jest ważoną średnią indywidualnych wariancji: σ 2 i = 1 1 2 2 σ i ∑ n σ i 1 1 ∑ n σ i2 1 1 = ∑ 2 n σ i −1 i jest równe σ w przypadku gdy wszystkie niepewności są jednakowe σi =σ . 2 Wariancja σ charakteryzuje rozkład jakiemu podlegają wartości wielkości mierzonej – jest miarą rozrzutu wartości mierzonych – i nie może być miarą jakości dopasowania. Z drugiej strony estymator 2 wariancji dopasowania s względem dopasowanej funkcji jest miarą rozrzutu zarówno samych danych jak i jakości dopasowania. Zatem 2 2 określenie χ jako stosunku wariancji dopasowania s do wariancji 2 samych danych σ pomnożonego przez liczbę stopni swobody robi z niej wygodną miarę jakości dopasowania. Jeżeli dopasowana funkcja jest dobrym przybliżeniem rzeczywistej 2 2 zależności, to wartość s powinna zgadzać się z wartością σ , a 2 2 wartość zredukowana χ ν powinna być około jedności, χ ν ≈ 1 . Jeżeli dopasowana funkcja nie jest właściwa dla danych punktów, to różnice yi − y ( xi ) będą większe i większa będzie wariancja dopasowania dając 2 wartość χ ν większa od jedności. Wartość χ ν mniejsza od 1 nie oznacza koniecznie lepszego dopasowania – jest prostym 2 2 odzwierciedleniem faktu, że wartości s i χ ν są też zmiennymi losowymi i fluktuują od jednej serii pomiarowej do drugiej. Bardzo mała wartość χ ν2 może oznaczać pomyłkę przy ustalaniu niepewności wartości wielkości mierzonej. 2 2 Testowanie jakości dopasowania 3 W tablicach statystycznych można znaleźć wartości dystrybuanty 2 rozkładu χ i obliczyć prawdopodobieństwo: Pχ ( χ ;ν ) = 2 ∞ ∫p χ ( x 2 ;ν ) dx 2 , χ2 że przypadkowy zestaw danych wylosowanych z rozkładu wyjściowego 2 da wartość χ równą lub większą od danej. W przypadku właściwego doboru funkcji i dobrego dopasowania 2 doświadczalna wartość χ ν powinna być bliska oczekiwanej i prawdopodobieństwo Pχ ( χ 2 ;ν ) powinno wynosić około 0,5. Gorsze dopasowanie da powiększoną wartość χ ν , a odpowiednie prawdopodobieństwo będzie mniejsze. 2 Trzeba pamiętać o pewnej dwuznaczności χ ν , która jest zależna zarówno od danych pomiarowych i od wybranej funkcji, a zatem nawet 2 właściwie dobrana funkcja może dać czasami dużą wartość χ ν . 2 Testowanie jakości dopasowania 4 Współczynnik korelacji liniowej Dane pomiarowe składają się z par zmierzonych wartości wielkości fizycznych {xi , yi }. Zanim dopasujemy do nich funkcje liniową (lub jakąkolwiek inną), powinniśmy zapytać, czy między mierzonymi wielkościami w ogóle występuje jakaś zależność fizyczna. Jeżeli założymy, że wielkość Y jest wielkością zależną, to chcielibyśmy wiedzieć, czy dane dają się przedstawić przy pomocy funkcji liniowej y = a x+b Poprzednio otrzymaliśmy analityczne rozwiązanie dla najlepszej (w 2 sensie metody minimalizacji χ ) parametru a, który jest współczynnikiem kierunkowym dopasowanej funkcji a= n ∑ xi y i − ∑ xi ∑ y i n∑ xi2 − (∑ xi ) 2 (czynniki wagowe zostały opuszczone dla lepszej przejrzystości wzoru). Jeżeli wielkości X i Y są niezależne od siebie, to również niezależne i nieskorelowane są wyniki pomiarów. Nie powinniśmy obserwować żadnej tendencji wzrostu (lub zmniejszania się) wartości y wraz ze wzrostem x, a współczynnik kierunkowy a wyniesie 0. Ponieważ interesuje nas wzajemna relacja między wielkościami X i Y, to równie dobrze możemy zapytać o zależność x = a ' y + b' . W tym wypadku parametry a' i b' będą miały inne wartości (i wymiary), ale jeżeli dane są skorelowane, to powinien między nimi zachodzić jakiś związek. Dla parametru a' można otrzymać rozwiązanie w postaci a' = n ∑ xi y i − ∑ xi ∑ y i n∑ yi2 − (∑ yi ) 2 i jeśli dane nie są skorelowane, to znowu współczynnik kierunkowy odwróconej zależności powinien wynosić a' = 0 . Jeżeli dane są zależne w sposób całkowicie jednoznaczny (całkowicie skorelowane), to powinien zachodzić związek y= b' 1 x− = a x+b a' a' Testowanie jakości dopasowania 5 oraz równość współczynników b' = b. a' W przypadku całkowitej korelacji a a ' = 1 . Jeżeli nie ma żadnej korelacji, 1 =a a' − to oba współczynniki są zerami i związek powyżej w ogóle nie zachodzi. Jeżeli zdefiniujemy, jako miarę korelacji liniowej, wielkość r r 2 ≡ a a' albo r≡ n ∑ xi y i − ∑ xi ∑ y i . n∑ x − (∑ xi ) n∑ y − (∑ yi ) Współczynnik korelacji r przyjmuje wartości od 0, w przypadku braku 2 i 2 2 i 2 korelacji, do ±1 przy całkowitej korelacji. Znak nie jest istotny dla istnienia korelacji, ważna jest natomiast wartość bezwzględna współczynnika. Najczęściej istnienie korelacji testujemy porównując otrzymaną wartość r z rozkładem prawdopodobieństwa dla populacji, która jest całkowicie nieskorelowana. Porównanie daje nam informację, czy jest prawdopodobne, że analizowane dane mogły zostać wylosowane z populacji nieskorelowanej. Jeżeli prawdopodobieństwo przypadkowego otrzymania wartości równej lub większej od r (lub równej lub mniejszej od − r ) jest niewielkie, to mamy prawo sądzić, że nasze dane są skorelowane. Współczynnik korelacji liniowej (w przypadku braku korelacji między zmiennymi) ma następujący symetryczny rozkład prawdopodobieństwa: pr ( x;ν ) = 1 Γ[(ν + 1) 2] (1 − x 2 )(ν −2) 2 π Γ(ν 2 ) Tablice statystyczne podają wartości prawdopodobieństwa dla n nieskorelowanych par wartości 1 Pc (r ; n) = P[(x > r ) ∪ (x < − r )] = 2 ∫ p r ( x; n − 2)dx r (W przypadku zależności liniowej liczba stopni swobody ν = n − 2 .) Testowanie jakości dopasowania 6 Przykład 1. Dla danych liczbowych z przykładu pomiarów spadku napięcia wzdłuż drutu oporowego otrzymujemy r= = n∑ xi yi − ∑ xi ∑ yi n∑ xi2 − (∑ xi ) n∑ yi2 − (∑ yi ) 2 2 9 × 779,3 − 450,0 ×12,44 9 × 28500 − (450,0 ) 9 × 21,32 − (12,44) 2 2 = 0,9994 W tablicach znajdujemy dla n = 9 wartość Pc(0,898; 9) = 0,001. Oznacza to, że. Pc(0,9994; 9) < 0,001 2. Dla danych liczbowych z pomiarów liczby impulsów licznika G-M w funkcji odległości preparatu otrzymujemy: r= = = ∑ wi ∑ wi xi yi − ∑ wi xi ∑ wi yi 2 2 2 2 ( ) ( ) w w x w x w w y w y − × − ∑ i∑ i i ∑ i i ∑ i∑ i i ∑ i i (S S w S xy − S x S y )( S xx − (S x ) × S w S yy − (S y ) 2 w 2 ) 0,03570 × 81,02 − 0,1868 × 10,0 (0,03570 ×1,912 − (0,1868) )× (0,03570 × 3693,0 − (10,0) ) 2 2 = 0,9938 Dla n = 10 w tablicach znajdujemy Pc (0,9938; 10) < Pc (0,872; 10) = 0,001 . W obu przykładach odpowiednie prawdopodobieństwa są na tyle małe, że z dużą pewnością możemy uznać istnienie korelacji między mierzonymi wartościami. Testowanie jakości dopasowania 7 Współczynniki korelacji liniowej między wieloma zmiennymi Jeżeli zmienna zależna jest liniową funkcją więcej niż jednej zmiennej niezależnej, yi = a0 + a1 xi1 + a 2 xi 2 + a3 xi 3 + ! to możemy sprawdzać korelacje między {yi } a każdą ze zmiennych niezależnych {xij } (pierwszy indeks oznacza numer pomiaru, a drugi zmiennej niezależnej). Nie ma znaczenia, czy xij są oddzielnymi zmiennymi, potęgami xi , czy dowolnymi funkcjami f j (xi ) . Wprowadzimy pojęcie kowariancji z próby s jk : 1 n s jk ≡ ∑ [(xij − x j )(xik − xk )] n − 1 i =1 gdzie odpowiednie średnie wynoszą oczywiście: 1 n x j = ∑ xij n i =1 1 n xk = ∑ xik n i =1 (wagi są pominięte, żeby nie komplikować formy wzorów). Przy takim podejściu estymatorem wariancji z próby j-tej zmiennej jest 1 n (xij − x j )2 s ≡ s jj = ∑ n − 1 i =1 2 j Trzeba zwrócić uwagę, że wariancje z prób są miarą szerokości przedziałów zmienności odpowiednich zmiennych i nie maja nic wspólnego z niepewnościami, z jakimi mierzymy ich wartości. Testowanie jakości dopasowania 8 Zauważmy, że 1 n s jk ≡ ∑ [(xij − x j )(xik − xk )] n − 1 i =1 1 n = ∑ (xij xik − x j xik − xij xk + x j xk ) n − 1 i =1 1 n = ∑ (xij xik − x j xik − xij xk + x j xk ) n − 1 i =1 n n n 1 n x x x x x x x x = − − + ∑ ∑ ∑ ∑ ij ik j ik ij k j k n − 1 i =1 i =1 i =1 i =1 n n n 1 n x x x x x x x x = − − + 1 ∑ ∑ ∑ ∑ ij ik j ik k ij j k n − 1 i =1 i =1 i =1 i =1 1 n x x x n x x n x x x n = − − + ∑ ij ik j k k j j k n − 1 i =1 n n n n 1 1 1 x x n x x x x x x = − = − ∑ ∑ ∑ ∑ ij ik j k ij ik ij ik n − 1 i =1 n i =1 i =1 n − 1 i =1 Porównując to z wzorem definiującym współczynnik korelacji r= (n∑ x n∑ xi yi − ∑ xi ∑ yi )( ) , − (∑ xi ) n∑ y − (∑ yi ) który po podzieleniu licznika i mianownika przez n przyjmuje postać xi yi − n1 ∑ xi ∑ yi ∑ r= 2 2 2 2 1 1 x x y y − − ( ) ( ) ∑ i n∑ i ∑ i n∑ i 2 2 i ( 2 i )( 2 ) możemy przez analogię zapisać r jk = s jk s j ⋅ sk . rjk jest współczynnikiem korelacji liniowej z próby między dwoma dowolnymi zmiennymi x j i xk . Podobnie współczynnikiem korelacji między j-tą zmienną x j a zmienną zależną y jest s jy . r jy = s j ⋅ sy Testowanie jakości dopasowania 9 W szczególnym przypadku dopasowania wielomianu y ( x) = m ∑a x k k , k =0 kolejne zmienne x j są potęgami zmiennej niezależnej x xij = xij i współczynnik korelacji między zmienną zależną i j-tym składnikiem wielomianu wynosi r jy = s jy s j ⋅ sy gdzie 2 1 n 2j 1 n j s = ∑ xi − ∑ xi n − 1 i =1 n i =1 2 j 2 n n 1 1 2 − s 2y = y y ∑ i ∑ i n − 1 i =1 n i =1 1 n j 1 n j n s jy = xi ∑ y i ∑ xi y i − n ∑ n − 1 i =1 i =1 i =1 Jeżeli niepewności punktów pomiarowych nie są wszystkie jednakowe, to musimy uwzględnić odpowiednie wagi statystyczne w definicjach wariancji, kowariancji i współczynnika korelacji z próby. Wzory na wartości współczynników korelacji w formie r jk = s jk s j ⋅ sk pozostają niezmienione. Wzory na wariancje i kowariancje z próby muszą 9natomiast być zmodyfikowane: 1 n 1 x x x x − − ( ) ( ) ∑ ij j ik k n − 1 i =1 σ i2 s jk ≡ n 1 1 ∑ n i =1 σ i2 Testowanie jakości dopasowania 10 1 n 1 2 x x − ( ) ∑ ij j n − 1 i =1 σ i2 . 2 s j ≡ s jj n 1 1 ∑ n i =1 σ i2 Średnie x j i xk są też ważone n 1 n x j = ∑ xij wi = n i =1 xij ∑σ i =1 n 1 ∑σ i =1 2 i 2 i unormowanymi czynnikami wagowymi równymi wi = 1 σ i2 1 n (1 σ i2 ) ∑ n i =1