Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Transkrypt
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość przypuszczenia oceniana jest na podstawie wyników próby losowej. • hipotezy parametryczne: dotyczą konkretnej wartości parametru rozkładu (np. wariancji, średniej) • hipotezy nieparametryczne: dotyczą postaci funkcyjnej rozkładu (zgodność rozkładów empirycznych z teoretycznymi) Weryfikacja hipotez statystycznych za pomocą testów stat. Test statystyczny Reguła postępowania, która każdej możliwej próbie losowej pobranej z populacji generalnej przyporządkowuje decyzję przyjęcia lub odrzucenia stawianej hipotezy. Weryfikacja hipotez statystycznych Zasady konstrukcji testów statystycznych X – cecha populacji, - parametr rozkładu cechy X 1. Formułujemy hipotezę zerową (podstawową), która podlega weryfikacji H0: 1 = 2 2. Formułujemy hipotezę alternatywną H1: 1 > 2 LUB H1: 1 < 2 LUB H1: 1 2 Hipotezy jednostronne Hipoteza dwustronna Weryfikacja hipotez statystycznych za pomocą testów stat. Zasady konstrukcji testów statystycznych 3. Obliczenie funkcji testowej i porównanie jej z wartością krytyczną dla wybranego poziomu istotności Weryfikacja hipotez statystycznych za pomocą testów stat. Terminologia Un – sprawdzian (statystyka testująca) K – zbiór krytyczny (zbiór odrzuceń) - poziom istotności (typowe wartości : 0,1 ; 0,05 ; 0,01) kr – krytyczny poziom istotności (poziom istotności przy którym następuje zmiana decyzji Weryfikacja hipotez statystycznych za pomocą testów stat. Błędy decyzji w teście sprawdzającym hipotezę H0 Weryfikacja hipotez statystycznych za pomocą testów stat. Hipotezy nieparametryczne Badanie zgodności rozkładu empirycznego z rozkładami teoretycznymi Badanie zgodności rozkładu empirycznego z teoretycznym Pytanie badawcze: Jakim rozkładem teoretycznym (konkretnym wzorem matematycznym) możemy opisać rozkład (histogram) naszych danych doświadczalnych ? Badanie zgodności rozkładu empirycznego z teoretycznym Pytanie badawcze: Nie satysfakcjonuje nas sama eksploracja danych? Na podstawie dopasowanego modelu teoretycznego prognozujemy, jak np. zjawisko będzie wyglądało w przyszłym roku Chcemy użyć metody statystycznej wymagającej rozkładu normalnego? Sprawdzamy czy nasza zmienna/zmienne spełnia/spełniają rozkład normalny Badanie zgodności rozkładu empirycznego z teoretycznym 1. Hipoteza zerowa – rozkład jest normalny H0: F(x) = Fn(x) 2. Hipoteza alternatywna – rozkład jest różny od rozkładu normalnego H1: F(x) Fn(x) Badanie zgodności rozkładu empirycznego z teoretycznym 3. Funkcje testowe 𝑘 2 𝜒 = 𝑖=1 2 𝑛𝑖 − 𝑛𝑝𝑖 𝑛𝑝𝑖 2 2 𝜒𝑘𝑟 (𝛼, 𝑓 = 𝑘 − 𝑚 − 1) Stosowana do wyników, które zostały wcześniej podzielone na przedziały! k – ilość przedziałów ni – liczebność empiryczna w danej klasie npi – liczebność teoretyczna w danej klasie (zgodna z rozkładem normalnym) m – liczba parametrów rozkładu (m=2 dla rozkładu normalnego) Badanie zgodności rozkładu empirycznego z teoretycznym 3. Funkcje testowe 2 𝜒 > 2 2 𝜒𝑘𝑟 𝜒 < 2 𝜒𝑘𝑟 2 Odrzucamy H0 Rozkład empiryczny nie jest rozkładem normalnym Przyjmujemy H0 Rozkład empiryczny jest rozkładem normalnym Wynik testu silnie zależy od tego, jak są podzielone wyniki! Badanie zgodności rozkładu empirycznego z teoretycznym 3. Funkcje testowe Kołmogorowa-Smirnowa 𝛿 = sup 𝐹 𝑥 − 𝐹𝑛 (𝑥) Maksymalna różnica między dystrybuantami 𝜆=𝛿 𝑛 lkr odczytujemy z rozkładu l Kołmogorowa-Smirnowa dla danego Badanie zgodności rozkładu empirycznego z teoretycznym 3. Funkcje testowe Kołmogorowa-Smirnowa P=1-=0.95 Badanie zgodności rozkładu empirycznego z teoretycznym 3. Funkcje testowe 𝜆 > 𝜆𝑘𝑟 𝜆 < 𝜆𝑘𝑟 Kołmogorowa-Smirnowa Odrzucamy H0 Rozkład empiryczny nie jest rozkładem normalnym Przyjmujemy H0 Rozkład empiryczny jest rozkładem normalnym