Elementy statystyki - STA

Transkrypt

Elementy statystyki - STA
Elementy statystyki
dr hab. Waldemar
Wołyński
Elementy statystyki
STA - Wykład 5
Weryfikacja hipotez
dr hab. Waldemar Wołyński
Wydział Matematyki i Informatyki
Uniwersytet im. Adama Mickiewicza
1
Elementy statystyki
dr hab. Waldemar
Wołyński
Testy statystyczne
Weryfikacja hipotez
2
Hipotezy statystyczne
Elementy statystyki
dr hab. Waldemar
Wołyński
Tradycyjnie, niech θ oznacza parametr modelu statystycznego.
Dotychczasowe rozważania dotyczyły metod estymacji tego
parametru (punktowej lub przedziałowej). Teraz zamiast
szacować nieznana˛ wartość parametru bedziemy
˛
weryfikowali
hipotez˛e mówiac
˛ a,
˛ że jego "prawdziwa" wartość nie różni sie˛
istotnie od zadanej wartości, co zapisujemy: θ = θ0 , gdzie θ0
jest ustalone.
Weryfikacja hipotez
Poza sama˛ hipoteza˛ (nazywać ja˛ bedziemy
˛
hipoteza˛ zerowa)
˛
musimy jeszcze podać hipotez˛e alternatywna,
˛ czyli ustalić jaka
jest nasza decyzja w przypadku odrzucenia hipotezy zerowej.
Przykładowo, dla hipotezy zerowej H0 : θ = θ0 , możliwe sa˛
nastepuj
˛ ace
˛ alternatywy: H1 : θ 6= θ0 , H1 : θ > θ0 lub
H1 : θ < θ 0 .
3
Przykłady układów hipotez
I
Hipoteza zerowa: wartość oczekiwana (średnia) badanej
cechy nie różni sie˛ istotnie od 20.
Hipoteza alternatywna: wartość oczekiwana (średnia)
badanej cechy jest istotnie wieksza
˛
od 20.
I
Hipoteza zerowa: wartości oczekiwane (średnie) badanej
cechy w dwóch grupach nie różnia˛ sie˛ istotnie.
Hipoteza alternatywna: wartości oczekiwane (średnie)
badanej cechy w dwóch grupach różnia˛ sie˛ istotnie.
I
Hipoteza zerowa: nie ma istotnej zależności pomiedzy
˛
dwoma badanymi cechami.
Hipoteza alternatywna: istnieje istotna zależność
pomiedzy
˛
dwoma badanymi cechami.
Elementy statystyki
dr hab. Waldemar
Wołyński
Weryfikacja hipotez
4
Obszary krytyczne
Elementy statystyki
dr hab. Waldemar
Wołyński
Konstruujac
˛ procedure˛ testowa˛ wyznaczamy tzw. obszar
krytyczny (obszar odrzuceń hipotezy zerowej). Najbardziej
typowym jest prawostronny obszar krytyczny postaci:
R = {x : T (x) ≥ k },
gdzie T jest statystyka˛ testowa,
˛ a k oznacza wartość
krytyczna.
˛
Stad
˛ jeśli wartość statystyki testowej jest duża (przekracza
wartość krytyczna),
˛ to odrzucamy hipotez˛e zerowa.
˛
Weryfikacja hipotez
Inne postaci obszarów krytycznych:
Lewostronny obszar krytyczny:
R = { x ∈ X : T (x) ≤ k },
Dwustronny obszar krytyczny:
R = { x ∈ X : T (x) ≥ k1 lub T (x) ≤ k2 },
5
Błedy
˛ pierwszego i drugiego rodzaju
Elementy statystyki
dr hab. Waldemar
Wołyński
Przyjmujac
˛ lub odrzucajac
˛ hipotez˛e zerowa˛ podejmujemy
decyzje,
˛ która może być poprawna lub błedna.
˛
Podczas testowania hipotezy zerowej możemy popełnić jeden
z dwóch nastepuj
˛ acych
˛
błedów.
˛
Weryfikacja hipotez
1. Odrzucamy hipotez˛e zerowa˛ gdy jest ona prawdziwa bład
˛ I rodzaju.
2. Przyjmujemy hipotez˛e zerowa˛ gdy jest ona fałszywa - bład
˛
II rodzaju.
6
Błedy
˛ pierwszego i drugiego rodzaju
Elementy statystyki
dr hab. Waldemar
Wołyński
Weryfikacja hipotez
7
Wynik testowania hipotez
Ponieważ decyzja przyjecia
˛
hipotezy zerowej może pociagn
˛ ać
˛
za soba˛ popełnienie błedu
˛
II rodzaju (prawdopodobieństwo
tego błedu
˛
nie jest kontrolowane i nawet w najlepszych testach
może być bardzo duże), to wynikiem testowania hipotez
statystycznych jest jedna z dwóch decyzji:
Elementy statystyki
dr hab. Waldemar
Wołyński
Weryfikacja hipotez
1. "odrzucamy hipotez˛e zerowa"
˛ tzn. stwierdzamy
wystepowanie
˛
istotnych statystycznie różnic (zależności),
na poziomie istotności α,
2. "nie ma podstaw do odrzucenia hipotezy zerowej", tzn.
stwierdzamy brak istotnych statystycznie różnic
(zależności), na poziomie istotności α.
8
Elementy statystyki
dr hab. Waldemar
Wołyński
Metoda ilorazu
wiarogodności
Weryfikacja hipotez
9
Testy ilorazu wiarogodności
Elementy statystyki
dr hab. Waldemar
Wołyński
Załóżmy, że dysponujemy n-elementowa˛ próba,
˛ a θ oznacza
parametr modelu statystycznego. Rozważamy zagadnienie
testowania układu hipotez:
H0 : θ ∈ Θ 0 ,
H1 : θ ∈ Θ1 , Θ0 ∪ Θ1 = Θ, Θ0 ∩ Θ1 = ∅.
Weryfikacja hipotez
Ponadto załóżmy, że populacja, z której pochodzi nasza próba
ma rozkład absolutnie ciagły.
˛
Testem ilorazu wiarogodności nazywamy test z obszarem
krytycznym postaci:
R = {x :
supθ∈Θ L(θ; x)
≥ kα },
supθ∈Θ0 L(θ; x)
gdzie wartość krytyczna˛ kα wyznaczamy tak, aby
prawdopodobieństwo błedu
˛
pierwszego rodzaju było równe α.
10
Elementy statystyki
Przykład
Załóżmy, że dysponujemy n-elementowa˛ próba˛ prosta˛
X = (X1 , X2 , . . . , Xn ), n > 1 z populacji o rozkładzie normalnym
z nieznanymi parametrami µ i σ 2 . Obszar krytyczny testu
ilorazu wiarogodności dla układu hipotez:
dr hab. Waldemar
Wołyński
H0 : µ = µ0
H1 : µ < µ 0
Weryfikacja hipotez
ma nastepuj
˛ ac
˛ a˛ postać:
R = {x :
x̄ − µ0 √
n ≤ t(α, n − 1)}.
s
Uwaga: W modelu jednej próby prostej z populacji o rozkładzie
normalnym: funkcja wiarogodności ma postać:
"
#
n
1 X
2
− n2
2 − n2
2
L(µ, σ ; x) = (2π) (σ ) exp − 2
(xi − µ) ,
2σ
i=1
Ponadto, estymatorami najwiekszej
˛
wiarogodności
parametrów
Pn
µ i σ 2 sa˛ statystyki µ̂ = X̄ , σ̂ 2 = S̃ 2 = n1 i=1 (Xi − X̄ )2 .
11
Elementy statystyki
dr hab. Waldemar
Wołyński
p-wartość
Weryfikacja hipotez
12
p–wartość
Elementy statystyki
dr hab. Waldemar
Wołyński
p–wartość jest najmniejszym poziomem istotności testu, przy
którym odrzucamy hipotez˛e zerowa.
˛
Weryfikacja hipotez
Wniosek
I
Jeżeli p–wartość ≤ α, to odrzucamy H0 .
I
Jeżeli p–wartość > α, to nie ma podstaw do odrzucenia
H0 .
13
Sposób obliczania p–wartości
I
Elementy statystyki
dr hab. Waldemar
Wołyński
Prawostronny obszar krytyczny:
P0 (T ≥ T (x)).
Weryfikacja hipotez
I
Lewostronny obszar krytyczny:
P0 (T ≤ T (x)).
I
Dwustronny obszar krytyczny:
2 min{ P0 (T ≥ T (x)), P0 (T ≤ T (x)) }.
14
Sposób podejmowania decyzji
Elementy statystyki
dr hab. Waldemar
Wołyński
Weryfikacja hipotez
15