Weryfikacja hipotezy o równości wartości

Transkrypt

Instytut Fizyki
Politechniki Łódzkiej
Laboratorium Metod Analizy Danych
Doświadczalnych
Ćwiczenie 17
Weryfikacja hipotezy o równości
wartości przeciętnych badanej cechy
dwóch populacji. Model 1.
Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ
Ćwiczenie 17
Weryfikacja hipotezy o równości wartości przeciętnych
badanej cechy dwóch populacji. Model 1.
1. Cel ćwiczenia
Celem tego ćwiczenia jest przeprowadzenie weryfikacji hipotezy o równości wartości
przeciętnych badanej cechy dwóch populacji według modelu 1 opisanego w książce [1]. Dla
przeprowadzenia tego testu należy napisać program w dowolnym języku programowania i dla
dowolnego systemu operacyjnego oraz przetestować jego działanie na kilku zestawach
danych otrzymanych za pomocą różnych generatorów liczb losowych. Do sprawozdania
należy dołączyć plik źródłowy programu, plik wykonywalny programu, niestandardowe
biblioteki użyte przy kompilacji programu oraz cztery zestawy danych dla których
przeprowadzono testy (wyniki tych testów i wypływające z nich wnioski muszą się znaleźć w
sprawozdaniu).
2. Wstęp
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu
badanej cechy populacji (w tym przypadku równości wartości przeciętnych), o prawdziwości
lub fałszywości którego wnioskuje się na podstawie badanej próbki. W praktyce przy
weryfikacji hipotez postępuje się w ten sposób, że oprócz weryfikowanej hipotezy zwanej
hipotezą zerową wyróżnia się jeszcze inną hipotezę K, która najczęściej wynika z celu
badania statystycznego, zwaną hipotezą alternatywną. W celu weryfikacji hipotezy budujemy
funkcję opartą na próbie (najlepiej próbie losowej prostej) δ(X1,....,Xn) zwaną statystyką
testową. Przy pobieraniu różnych próbek, nawet o tej samej liczności n – funkcja ta
przyjmuje na ogół różne wartości, z których jedne będą świadczyły o prawdziwości
weryfikowanej hipotezy a inne będą ją odrzucały. Naturalnym zatem jest podzielenie zbioru
wszystkich wartości, które może przyjąć statystyka testowa na dwa dopełniające się zbiory W
i W’, takie że:
δ(X1,....,Xn) ∈ W - hipotezę odrzucamy;
δ(X1,....,Xn) ∈ W’ - hipotezę przyjmujemy.
Zbiór W nazywamy zbiorem krytycznym, zaś zbiór W‘ zbiorem przyjęć.
W testach istotności nie oblicza się błędu drugiego rodzaju (możemy przyjąć
weryfikowaną hipotezę H jako prawdziwą, podczas gdy jest ona fałszywa, czyli jeśli
prawdziwa jest hipoteza alternatywna K), natomiast przy założeniu prawdziwości
weryfikowanej hipotezy budujemy zbiór krytyczny w ten sposób, aby zagwarantować małe
prawdopodobieństwo zaobserwowania wartości statystyki testowej należącej do tego zbioru,
równe z góry obranemu poziomowi istotności α = 5 %. Jeżeli zatem wartość statystyki
testowej wpadnie do zbioru krytycznego, to weryfikowaną hipotezę należy odrzucić. Jeżeli
jednak wartość statystyki
testowej nie znajdzie się w zbiorze krytycznym, a
prawdopodobieństwo takiego zdarzenia jest większe niż α, to można jedynie stwierdzić, że
nie ma podstaw do odrzucenia weryfikowanej hipotezy .
2
Ćwiczenie 17
W ćwiczeniu przyjmujemy, że badana cecha ma w dwóch populacjach rozkłady
N(µ1,σ1) i N(µ2,σ2), o znanych σ1 i σ2 i nieznanych µ1 i µ2 . Weryfikujemy hipotezę zerową
H0: µ1 = µ2 przy możliwych trzech hipotezach alternatywnych
K1: µ1 < µ2;
K2: µ1 > µ2;
K3: µ1 ≠ µ2,
na poziomie istotności 0,05.
3. Algorytm postępowania
Aby przeprowadzić weryfikację hipotezy o równości wartości przeciętnych badanej
cech dwóch populacji budujemy test przebiegający w następujący sposób:
1. Wczytujemy dane z dwóch zbiorów tekstowych zawierających dane liczbowe prób z
dwóch populacji generalnych (z dwóch generatorów liczb losowych).
2. Obliczamy wartość przeciętną (średnią arytmetyczną) x oraz średnie odchylenie
kwadratowe s2 korzystając ze wzoru:
1 n
s 2 = ∑ ( xi − x ) 2
n 1
3. Obliczamy wartość statystyki
U=
x1 − x 2
s12 s 22
+
n1 n2
która przy założeniu prawdziwości hipotezy zerowej ma rozkład N(0,1).
4. Następnie znajdujemy przedziały krytyczne :
Dla K1: µ1 < µ2. jest to (-∞,-u(1-α)]
Dla K2: µ1 > µ2 jest to [u(1-α), +∞ )
Dla K3: µ1 ≠ µ2. jest to (-∞,-u(1-0,5α )] ∪ [u(1-0,5α), +∞ ).
5. Przeprowadzamy sprawdzenie, czy obliczona wartość statystyki należy do przedziału
krytycznego. Jeżeli wartość obliczona nie należy do przedziału krytycznego, wówczas nie
ma podstaw do odrzucenia hipotezy o równości wariancji na założonym poziomie
istotności.
4. Sprawozdanie
W sprawozdaniu przygotowanym w formie elektronicznej lub papierowej nie
zamieszczamy całości lub fragmentów listingu programu, program źródłowy powinien być
natomiast dobrze opisany za pomocą komentarzy. W sprawozdaniu nie zamieszczamy tablic z
których korzystamy w teście, natomiast powinna znaleźć się informacja w postaci odnośnika
literaturowego do tychże. W sprawozdaniu powinny koniecznie znaleźć się poniższe
elementy:
3
Ćwiczenie 17
4.1. Wstęp teoretyczny
Wstęp teoretyczny powinien zawierać podstawowe informacje na temat testów
parametrycznych oraz testu będącego przedmiotem tego ćwiczenia. Powinny w nim się
znaleźć wszystkie wzory stosowane w programie wraz z objaśnieniami wielkości w nich
występujących.
4.2. Dane techniczne
Dane techniczne powinny zawierać spis plików programu oraz plików z testowanymi
danymi taki jak w poniższym przykładzie:
Przykład
Plik:
Test16.exe
Rozmiar: Opis:
64 kB Plik wykonywalny. Do skompilowania programu
wykorzystaliśmy kompilator Borland C++ Version
3.1 . Program należy uruchamiać w systemie MSDOS lub w systemach Windows 3.1/3.11/9x.
Test16.cpp
Test16.obj
gent.h
GenF1.txt
11 kB
27 kB
7 kB
1,2 kB
GenF2.txt
600 B
LosN1.txt
0,3 kB
LosN2.txt
282 B
Plik z kodem źródłowym programu.
Plik z zapisanymi bibliotekami
Biblioteka obliczająca przedziały krytyczne
Plik tekstowy z przykładowymi liczbami losowymi
z rozkładu F-Snedecora:
Ilość liczb n=100, parametry: m=1, n=5
dla rozkładu F-Snedecora:
Ilość liczb n=50, parametry: λ=2, α=2
dla rozkładu N(3,1). Ilość liczb n=20
dla rozkładu N(3,2). Ilość liczb n=20
4.2. Instrukcja obsługi programu
W sprawozdaniu należy umieścić instrukcję obsługi programu pozwalającą na
wykonanie testu przez osobę nie znającą programu i przebiegu testu. Powinien się tu znaleźć
opis formatu zbioru danych akceptowanego przez program oraz objaśnienia komunikatów
wyświetlanych przez program.
Przykład:
W przypadku prawidłowego
zostanie wyświetlony komunikat:
wczytania
danych
Pliki zostaly pomyslnie wczytane
W pliku n_pliku.txt znajduje się n liczb
Zas w pliku n_pliku.txt m liczb
W przypadku gdy wystąpi błąd podczas wczytywania danych,
4
Ćwiczenie 17
zostanie wyświetlony komunikat:
Nie mogę otworzyć pliku”
i nastąpi zamknięcie programu.
4.5.Wnioski
W sprawozdaniu należy zamieścić wyniki testowania programu za pomocą co najmniej
czterech zestawów zbiorów testowych, przygotowanych za pomocą różnych generatorów
(niekoniecznie dla rozkładu normalnego, ale również rozkładów normalnopodobnych). Na
podstawie tych i innych wyników testowania należy wysnuć wnioski na temat przydatności i
zakresu stosowalności testu oraz funkcjonalności Państwa programu.
4.6. Literatura
Spis literatury wykorzystanej przy opracowywaniu sprawozdania oraz pisaniu i
testowaniu programu.
5. Literatura
[1] W. Krysicki i in.: Rachunek prawdopodobieństwa i statystyka matematyczna - część II:
Statystyka matematyczna, PWN, Warszawa 1986, str. 93.
5

Weryfikacja hipotezy o równości wartości

Transkrypt

Podobne dokumenty

Weryfikacja hipotezy o równości wartości przeciętnych badanej

plakat-zaproszenie Jerzy Weyman Wykład im. Sierpińskiego 11

Weryfikacja hipotez statystycznych - Sigma Kwadrat

Weryfikacja modelu

Zalecenia do prowadzenia krytycznej analizy lit..

Kółko dla starszych 5.11.2009

Trudne piękno matematyki

166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu

testy istotności dla wartości oczekiwanej

Programowanie (delphi)