Testowanie jakości dopasowania. Część 2.
Transkrypt
Testowanie jakości dopasowania. Część 2.
Testowanie jakości dopasowania. Część 2. 1 Testowanie jakości dopasowania. Część 2. Współczynnik korelacji wielokrotnej Pojęcie współczynnika korelacji, który opisuje zależność między dwoma zmiennymi można rozszerzyć tak, żeby uwzględnić wielokrotne korelacje między zachodzące jednocześnie między wieloma zmiennych. Poprzednio otrzymaliśmy wzór, który wyraża współczynnik korelacji przez wariancje i kowariancję oraz współczynnik kierunkowy zależności liniowej obliczone dla zestawu danych pomiarowych r = 2 s xy2 s x2 s 2y =a s xy s y2 . Przez analogię zdefiniujemy współczynnik korelacji wielokrotnej (wielowymiarowej) R s jy m s j R ≡ ∑ a j 2 = ∑ a j r jy s y j =0 s y j =0 Współczynnik korelacji (liniowej) r jy jest przydatny do testowania czy 2 m konkretna zmienna powinna być uwzględniona w modelu dopasowywanym do danych. Współczynnik korelacji wielokrotnej R charakteryzuje dopasowanie całego modelu (pełnej funkcji) do danych i można go używać do porównywania różnych dopasowywanych modeli (postaci funkcji). Test F Zmienna F (Fishera - Snedecora) jest obliczana dla prób (zestawów danych) dwóch zmiennych losowych i jest równa s12 σ 12 F= 2 2. s2 σ 2 gdzie: s1 jest estymatorem wariancji pierwszej zmiennej σ 1 , a s 2 esty2 2 2 matorem drugiej wariancji σ 2 . Zmienna F ma następujący rozkład gęstości prawdopodobieństwa: 2 Γ[(ν 1 + ν 2 ) 2] ν 1 p F ( x; ν 1 ,ν 2 ) = Γ(ν 1 2 ) Γ(ν 2 2 ) ν 2 ν1 2 x (ν 1 − 2 ) 2 (1 + xν 1 ν 2 )(ν1 +ν 2 ) 2 Testowanie jakości dopasowania. Część 2. 2 gdzie x > 0 a ν 1 i ν 2 są liczbami stopni swobody odpowiadającymi s1 2 2 i s2 . Jak wynika z definicji zmiennej F również stosunek zredukowanych 2 zmiennych χ ν ma ten sam rozkład: χ12 ν 1 F= 2 χ2 ν 2 Wykorzystując zmienną F do testowania wartości stosunku χ ν korzy2 stamy z tablic, w których podaje się wartości graniczne Fα ∞ ∫p α= F ( x; ν 1 ,ν 2 ) dx , Fα których przekroczenie może zdarzyć się z określonym prawdopodobieństwem α (zwykle 0,05 i 0,01). Jeżeli uzyskana wartość stosunku F ≥ Fα jest nie mniejsza od granicznej, czyli jest w tym przypadku bardzo mało prawdopodobna (na przykład <0,05 lub <0,01) to mamy prawo przypuszczać, że różnica między 2 wartościami χ ν nie jest przypadkowa, że jest statystycznie istotna, i ich macierzyste rozkłady prawdopodobieństwa (wariancje) są różne. Jeżeli wartość F < Fα , to nie można wykluczyć, że obserwowana różnica jest przypadkowa. Ze względu na konstrukcję tablic wartości granicznych rozkładu zmiennej F przy jej obliczaniu do licznika wstawiamy większą wartość. Rozważmy sumę kwadratów odchyleń S y2 związaną z zakresem danych (rozrzutem względem ich średniej), pomijając dla uproszczenia czynniki wagowe n S = ∑ ( yi − y ) . 2 y 2 i =1 2 S y2 jest statystyką o rozkładzie χ z n − 1 stopniami swobody. Załóżmy dalej, że m y ( xi ) = ∑ a j f j ( x i ) j =0 Testowanie jakości dopasowania. Część 2. 3 oraz oznaczmy 1 n f j = ∑ f j ( xi ) n i =1 Sumę S y2 możemy przekształcić, drogą odpowiednich podstawień i przekształceń (wykorzystując przy tym fakt, że parametry dopasowania spełniają odpowiednie równania), do następującej postaci: n S y2 = ∑ ( yi − y ) 2 i =1 m m n = ∑ ( yi − y ) ∑ a j ( f j ( xi ) − f j ( xi ) ) + ∑ yi − ∑ a j f j ( xi ) i =1 j =0 j =0 i =1 n lub krócej m m n ( yi − y ) = ∑ ( yi − y ) ∑ a j ( f j − f j ) + ∑ yi − ∑ a j f j ∑ i =1 i =1 j =0 j =0 i =1 i po zmianie kolejności sumowania n m n n 2 ( yi − y ) = ∑ a j ∑ [( yi − y ) ( f j − f j )] + ∑ [yi − y ( xi )]2 ∑ i =1 i =1 j =0 i =1 n 2 n 2 W statystyce udowadnia się twierdzenie dotyczące właściwości 2 2 2 zmiennych χ , które mówi, że suma dwóch zmiennych χ1 i χ 2 o ν 1 i ν 2 stopniach swobody jest też zmienną χ 2 o ν = ν 1 + ν 2 stopniach swobody. Jeżeli przyjrzymy się rozkładowi na składniki sumy S y2 , która jest zmienną χ o n − 1 stopniach swobody, to zauważymy, że 2 ∑ [y − y ( x ) ] 2 i i jest też zmienną χ , ale o n − m − 1 stopniach swobody. 2 Zatem pierwszy składnik też musi być zmienną χ o m stopniach 2 swobody. Wróćmy teraz do definicji współczynnika korelacji wielokrotnej R : ∑ (a s ) m s R 2 ≡ ∑ a j jy2 = sy j =0 m j j =0 s y2 jy 2 Testowanie jakości dopasowania. Część 2. 4 Przez analogię możemy przedstawić pierwszy składnik S y2 jako ∑ a j j =0 m Zatem n 2 2 2 [( yi − y ) ( f j − f j )] = R S y = R ∑ ( yi − y )2 ∑ i =1 i =1 n = R 2 ∑ [yi − y ( xi )] + (1 − R 2 )∑ [yi − y ( xi )] gdzie oba składniki po prawej stronie są w dalszym ciągu zmiennymi 2 o rozkładach χ z n − m − 1 i m stopniami swobody. ∑ [y − y ( x ) ] 2 i 2 2 i Sumę S y2 (która jest miarą rozrzutu wartości zmiennej zależnej) nazywa się często początkową sumą kwadratów, a ∑ [y − y ( x ) ] 2 i i resztkową sumą kwadratów (pozostającą po dopasowaniu funkcji y (x) ). W tym kontekście R 2 ∑ [yi − y ( xi )]2 jest częścią początkowego rozrzutu usuniętą przez dopasowania. Dopasowanie (w sensie użytego modelu) jest tym lepsze im większą część początkowego rozrzutu usuwa. Do sprawdzenia czy pozostały rozrzut jest istotnie mniejszy od usuniętego, tzn. czy dopasowanie ma w ogóle sens możemy wykorzystać statystykę F definiując nową wielkość R2 m FR = (1 − R 2 ) (n − m − 1) Testowanie wartości FR jest w istocie testem, że wszystkie współczynniki a j są różne od zera, czyli są znaczące w dopasowywanym modelu. Jeżeli wartość FR nie przekracza granicznej wartości statystyki F , to oznacza to, że parametrów modelu jest za dużo (przynajmniej jeden ze współczynników powinien wynosić zero). Testowanie zasadności dodatkowego parametru modelu Jeżeli dopasujemy do n danych punktów funkcję o m parametrach, to 2 pozostała suma kwadratów (reszt dopasowania) χ (m) ma rozkład o n − m stopniach swobody. Po zwiększeniu liczby parametrów modelu (np. dodając kolejny składnik wielomianu) otrzymujemy sumę kwadratów 2 reszt dopasowania χ (m + 1) o n − m − 1 stopniach swobody. Różnica χ 2 (m) – χ 2 (m + 1) ma zatem rozkład χ 2 o 1 stopniu swobody. Do sprawdzenia czy zmniejszenie sumy kwadratów w wyniku dodania no- Testowanie jakości dopasowania. Część 2. 5 wego parametru jest statystycznie istotne możemy wykorzystać test F . Wielkość χ 2 (m) − χ 2 (m + 1) ∆χ 2 Fχ = 2 = χ (m + 1) (n − m − 1) χ ν2 ma rozkład F z ν 1 = 1 i ν 2 = n − m − 1 . Stosunek Fχ mierzy jak bardzo wprowadzenie nowego parametru poprawiło wartość zredukowanej χν i będzie mały, jeżeli zmiana nie jest 2 istotna. Podobnie jak w przypadku wielkości FR , testujemy czy nowy parametr jest równy zero. Jeżeli wartość Fχ przekracza graniczną, wprowadzenie nowego parametru możemy uznać za uzasadnione. Testowanie jakości dopasowania. Część 2. 1 Przykład i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 xi 0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00 2,20 2,40 2,60 2,80 3,00 3,20 3,40 3,60 3,80 4,00 4,20 4,40 4,60 4,80 yi 1,143 1,241 1,442 1,504 1,725 1,614 1,389 1,217 1,077 0,754 0,450 0,067 -0,351 -0,278 -0,439 -0,757 -0,840 -0,401 -0,606 -0,585 0,430 0,192 0,530 1,403 2,382 u(yi) 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 wi 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 wi(yi-ysr)2 8,14 11,18 18,93 21,73 33,25 27,12 16,68 10,39 6,37 0,83 0,38 6,37 21,30 18,05 25,58 44,15 49,83 23,68 34,71 33,45 0,51 3,60 0,04 17,24 81,86 Przykład do „Testowanie jakości dopasowania. Część 2.” 1 Przykład do „Testowanie jakości dopasowania. Część 2.” Model Y ( X ) = A0 + A1 X + A2 X 2 + A3 X 3 + A4 X 4 + ! A0 = 1,000 A1 = 1,000 A2 = -0,500 A3 = -0,167 A4 = 0,042 A5 = 8,33⋅10-3 A6 = -1,39⋅10-3 A7 = -1,98⋅10-4 ∆Y = N (0, 0,2) Wygenerowane dane i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 xi 0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00 2,20 2,40 2,60 2,80 3,00 3,20 3,40 3,60 3,80 4,00 4,20 4,40 4,60 4,80 yi 1,143 1,241 1,442 1,504 1,725 1,614 1,389 1,217 1,077 0,754 0,450 0,067 -0,351 -0,278 -0,439 -0,757 -0,840 -0,401 -0,606 -0,585 0,430 0,192 0,530 1,403 2,382 ysr = 0,572 u(yi) 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 0,2 wi 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 wi(yi-ysr)2 8,14 11,18 18,93 21,73 33,25 27,12 16,68 10,39 6,37 0,83 0,38 6,37 21,30 18,05 25,58 44,15 49,83 23,68 34,71 33,45 0,51 3,60 0,04 17,24 81,86 Σ = 515,36 1 Przykład do „Testowanie jakości dopasowania. Część 2.” 2 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0 1 2 3 4 5 -0,5 -1,0 -1,5 2 Szablon wykładu m=1 y(xi) 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 0,572 wi(yi-y(xi))2 8,140 11,180 18,929 21,729 33,250 27,121 16,676 10,388 6,365 0,830 0,375 6,370 21,302 18,048 25,583 44,155 49,827 23,677 34,708 33,453 0,506 3,605 0,044 17,242 81,858 Σ = 515,3618 3 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0 1 1 2 2 3 3 4 4 5 5 -0,5 -1,0 -1,5 χ2 = 515,36 3 Szablon wykładu m=2 y(xi) wi(yi-y(xi))2 1,167 0,014 1,117 0,382 1,068 3,509 1,018 5,913 0,969 14,320 0,919 12,065 0,869 6,745 0,820 3,937 0,770 2,347 0,721 0,028 0,671 1,228 0,622 7,682 0,572 21,302 0,523 16,004 0,473 20,816 0,423 34,829 0,374 36,818 0,324 13,155 0,275 19,402 0,225 16,398 0,176 1,615 0,126 0,110 0,077 5,139 0,027 47,303 -0,022 144,497 Σ = 435,5589 4 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0 1 1 2 2 3 3 4 4 5 5 -0,5 -1,0 -1,5 χ2 = 18,937 χ = 435,56 ∆χ = 79,80 n−m 2 2 Fχ = 4,21 P( F ≥ Fχ ) = 0,0516 4 Szablon wykładu m=3 y(xi) 2,293 1,962 1,655 1,373 1,115 0,882 0,674 0,489 0,330 0,194 0,084 -0,003 -0,064 -0,102 -0,115 -0,103 -0,067 -0,006 0,079 0,189 0,323 0,481 0,664 0,872 1,104 wi(yi-y(xi))2 33,072 12,995 1,133 0,431 9,301 13,374 12,790 13,226 13,952 7,839 3,347 0,122 2,053 0,773 2,640 10,692 14,934 3,899 11,734 14,945 0,288 2,084 0,450 7,047 40,831 5 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0 1 2 2 3 3 4 4 5 5 -1,0 -1,5 χ2 χ = 233,95 ∆χ = 201,61 = 10,634 n−m 2 Σ = 233,9511 1 -0,5 2 Fχ = 18,96 P( F ≥ Fχ ) = 0,0003 5 Szablon wykładu m=4 y(xi) 1,073 1,352 1,523 1,597 1,588 1,507 1,366 1,177 0,952 0,703 0,443 0,183 -0,064 -0,287 -0,474 -0,612 -0,689 -0,693 -0,613 -0,436 -0,150 0,257 0,797 1,482 2,324 Σ= wi(yi-y(xi))2 0,122 0,308 0,161 0,216 0,471 0,286 0,013 0,040 0,390 0,065 0,001 0,335 2,053 0,002 0,030 0,527 0,568 2,136 0,001 0,552 8,408 0,104 1,779 0,156 0,084 18,81033 6 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0 1 1 2 2 3 3 4 4 5 5 -0,5 -1,0 -1,5 χ2 = 18,810 ∆χ2 = 215,14 χ2 = 0,896 n−m Fχ = 240,18 P( F ≥ Fχ ) = 5,72 ⋅ 10 −13 6 Szablon wykładu m=5 y(xi) 1,004 1,340 1,546 1,638 1,633 1,546 1,393 1,189 0,948 0,685 0,414 0,146 -0,103 -0,324 -0,503 -0,630 -0,692 -0,681 -0,586 -0,397 -0,105 0,298 0,820 1,470 2,255 Σ= wi(yi-y(xi))2 0,484 0,247 0,270 0,448 0,214 0,115 0,000 0,020 0,413 0,119 0,032 0,156 1,531 0,054 0,101 0,405 0,542 1,962 0,010 0,881 7,160 0,278 2,108 0,114 0,404 18,06697 7 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0 1 1 2 2 3 3 4 4 5 5 -0,5 -1,0 -1,5 χ2 χ = 18,067 ∆χ = 0,74 = 0,903 n−m 2 2 Fχ = 0,82 P( F ≥ Fχ ) = 0,375 7