Wykład 2 - Netstrefa.pl

Transkrypt

Wykład 2 - Netstrefa.pl
STATYSTYKA I DOŚWIADCZALNICTWO
Wykład 2
Parametry przedziałowe rozkładów ciągłych określane na podstawie
próby (przedziały ufności)
Przedział ufności dla średniej
s
s 

, X + t( α ;n−1 )
 X − t( α ;n−1 )

n
n

t(α; n−1): wartość krytyczna rozkładu t - Studenta
n-1 oznaczane również jako v - stopnie swobody
α - poziom istotności (zazwyczaj przyjmujemy α=0,05)
Poziom ufności: 1−α ustalone z góry prawdopodobieństwo z jakim ten
przedział pokrywa nieznaną wartość parametru np. w tym przypadku średnią
Weryfikacja (testowanie) hipotez statystycznych
sprawdzenie określonych przypuszczeń (założeń) wysuniętych w
stosunku do parametrów lub rozkładu populacji generalnej na
podstawie próby.
Hipotezy możemy podzielić na
– dotyczące typu rozkładu populacji
– dotyczące parametrów rozkładu (który jest znany)
Test statystyczny – reguła postępowania, która pozwala na
przyjęcie (nieodrzucenie) bądź odrzucenie sprawdzanej hipotezy
Procedura testowania hipotez polega na tym, że zakładamy pewną
hipotezę zerową (H0), którą uznajemy za możliwą. Następnie
sprawdzamy, czy ona może być prawdziwa przy pomocy testu
statystycznego. Jeśli podczas weryfikacji hipotezy odrzucimy hipotezę
zerową to przyjmujemy przeciwną do niej hipotezę alternatywną (H1).
Możliwe do popełnienia błędy przy testowaniu hipotez:
Błąd I rodzaju– błąd odrzucenia, występuje, gdy odrzucamy hipotezę,
natomiast jest ona prawdziwa
Błąd II rodzaju – błąd przyjęcia, występuje gdy przyjmujemy hipotezę,
natomiast jest ona fałszywa
Prawdopodobieństwo popełnienia błędu I rodzaju nazywamy
poziomem istotności (α) (przyjmujemy najczęściej α=0,05)
Test t do porównania średniej z normą
Hipoteza zerowa H0: m = m0 Hipoteza alternatywna H1: m ≠ m0
(uwaga: zamiast symbolu m oznaczającego średnią dla populacji używamy również
zamiennie symbolu µ)
założenia:
zmienna ma rozkład normalny
Przykłady zastosowań:
Sprawdzenie, czy urządzenie pakujące pewien produkt w opakowania po 1 kg
średnio pakuje dokładnie 1 kg
(badana zmienna: waga netto produktu)
Funkcja testowa:
x
t emp
x − m0
=
Sx
Średnia dla próby
m0 – zakładana wartość („norma”)
Sx – błąd standardowy
s
Sx =
n
Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,
czy średnia może być równa „normie” (zakładanej wartości), czy też nie.
Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym
poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli
liczebność próby pomniejszona o 1 (n - 1)
Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę
alternatywną H1: m ≠ m0 a więc stwierdzamy że średnia różni się istotnie od
„normy” (zakładanej wartości)
W programach statystycznych zamiast wartości krytycznej podawana jest wartość
p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie
podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i
przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy.
Przyjęło się, że wartość α ustalamy równą 0,05.
Test t do porównania średnich dwóch populacji
Hipoteza zerowa H0: m1= m2 Hipoteza alternatywna H1: m1 ≠ m2
założenia:
zmienne mają rozkład normalny
σ12= σ22 (jeśli to założenie nie jest spełnione stosujemy zmodyfikowaną wersję testu t uwzględniającą nierówność
wariancji)
Przykłady zastosowań:
Porównanie wysokości plonów dwóch odmian roślin uprawnych
(badana zmienna: plon)
Porównanie skuteczności dwóch leków obniżających ciśnienie krwi
(zmienna: ciśnienie krwi)
Porównanie wyników z egzaminu dla dwóch grup studentów (kontrolnej i poddanej
nowemu sposobowi nauczania)
Zmienna: liczba pkt uzyskana z egzaminu
Funkcja testowa:
temp
x1 − x2
=
Sr
x1 Średnia dla próby z pierwszej populacji
x2 Średnia dla próby z drugiej populacji
1
2 1


S
=
S
+
r
e
Sr – błąd różnicy średnich
 n1 n2 
gdzie wspólna wariancja:
n
var X =
∑
i =1
( x i − x )2
Se 2 =
var X 1 + var X 2
( n 1 − 1) + ( n 2 − 1 )
jest sumą kwadratów odchyleń od średniej
Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,
czy średnie mogą być równie, czy też nie.
Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym
poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli
liczebność 2 prób pomniejszona o 2 (n1 +n2 -2)
Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę
alternatywną H1: m1 ≠ m2 a więc stwierdzamy że średnie różnią się istotnie
W programach statystycznych zamiast wartości krytycznej podawana jest wartość
p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie
podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i
przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy.
Przyjęło się, że wartość α ustalamy równą 0,05.
test F - porównanie wariancji 2 populacji pod względem zmienności
(wartości wariancji)
Hipoteza zerowa H0: σ12= σ22
Hipoteza alternatywna H1: σ12 ≠ σ22
Założenie: zmienne mają rozkład normalny
Funkcja testowa
Femp
s1 2
= 2
s2
Gdzie wartość s12>s22
Wartość krytyczna Fα,ν,u dla rozkładu F-Fishera, gdzie α jest przyjętym
poziomem istotności (najczęściej 0,05), a ν i u liczbami stopni
swobody, czyli liczebnością próby pierwszej (n1-1) i drugiej (n2 -1)
test U Manna-Whitneya - porównanie średnich 2 populacji o dowolnych
rozkładach
Test U Manna-Whitneya (nazywany również testem rang Wilcoxona) służy
do porównania zgodności dwóch rozkładów. Wykorzystywany jest natomiast
najczęściej do porównania median. Jeśli rozkłady są symetryczne i ich
wariancje są równe lub bliskie to uzasadnione jest stosowanie tego testu
jako alternatywy dla testu t przy braku założenia normalności rozkładów.
Dlatego też ten test stosuje się często do porównania średnich dla dwóch
populacji o innych rozkładach niż normalne. Statystyka testową jest wartość
U.
Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w hipotezie
zerowej przyjmujemy, że średnie nie różnią się. Jeśli ją odrzucimy to
przyjmujemy hipotezę alternatywną, czyli stwierdzamy, że występuje różnica
między średnimi.
Przykład zastosowania:
Porównanie wyników z odpowiedzi z ankiety między kobietami a
mężczyznami
Zmienna: odpowiedź w skali od 1-5