Weryfikacja hipotezy o równości wartości przeciętnych badanej

Transkrypt

Weryfikacja hipotezy o równości wartości przeciętnych badanej
Instytut Fizyki
Politechniki Łódzkiej
Laboratorium Metod Analizy Danych
Doświadczalnych
Ćwiczenie 16
Weryfikacja hipotezy o równości
wartości przeciętnych badanej cechy
dwóch populacji. Model 2.
Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ
Ćwiczenie 16
Weryfikacja hipotezy o równości wartości przeciętnych
badanej cechy dwóch populacji. Model 2.
1. Cel ćwiczenia
Celem tego ćwiczenia jest przeprowadzenie weryfikacji hipotezy o równości wartości
przeciętnych badanej cechy dwóch populacji według modelu 2 opisanego w książce [1]. Dla
przeprowadzenia tego testu należy napisać program w dowolnym języku programowania i dla
dowolnego systemu operacyjnego oraz przetestować jego działanie na kilku zestawach
danych otrzymanych za pomocą różnych generatorów liczb losowych. Do sprawozdania
należy dołączyć plik źródłowy programu, plik wykonywalny programu, niestandardowe
biblioteki użyte przy kompilacji programu oraz cztery zestawy danych dla których
przeprowadzono testy (wyniki tych testów i wypływające z nich wnioski muszą się znaleźć w
sprawozdaniu).
2. Wstęp
Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu
badanej cechy populacji (w tym przypadku równości wartości przeciętnych), o prawdziwości
lub fałszywości którego wnioskuje się na podstawie badanej próbki. W praktyce przy
weryfikacji hipotez postępuje się w ten sposób, że oprócz weryfikowanej hipotezy zwanej
hipotezą zerową wyróżnia się jeszcze inną hipotezę K, która najczęściej wynika z celu
badania statystycznego, zwaną hipotezą alternatywną. W celu weryfikacji hipotezy budujemy
funkcję opartą na próbie (najlepiej próbie losowej prostej) δ(X1,....,Xn) zwaną statystyką
testową. Przy pobieraniu różnych próbek, nawet o tej samej liczności n – funkcja ta
przyjmuje na ogół różne wartości, z których jedne będą świadczyły o prawdziwości
weryfikowanej hipotezy a inne będą ją odrzucały. Naturalnym zatem jest podzielenie zbioru
wszystkich wartości, które może przyjąć statystyka testowa na dwa dopełniające się zbiory W
i W’, takie że:
δ(X1,....,Xn) ∈ W - hipotezę odrzucamy;
δ(X1,....,Xn) ∈ W’ - hipotezę przyjmujemy.
Zbiór W nazywamy zbiorem krytycznym, zaś zbiór W‘ zbiorem przyjęć.
W testach istotności nie oblicza się błędu drugiego rodzaju (możemy przyjąć
weryfikowaną hipotezę H jako prawdziwą, podczas gdy jest ona fałszywa, czyli jeśli
prawdziwa jest hipoteza alternatywna K), natomiast przy założeniu prawdziwości
weryfikowanej hipotezy budujemy zbiór krytyczny w ten sposób, aby zagwarantować małe
prawdopodobieństwo zaobserwowania wartości statystyki testowej należącej do tego zbioru,
równe z góry obranemu poziomowi istotności α = 5 %. Jeżeli zatem wartość statystyki
testowej wpadnie do zbioru krytycznego, to weryfikowaną hipotezę należy odrzucić. Jeżeli
jednak wartość statystyki
testowej nie znajdzie się w zbiorze krytycznym, a
prawdopodobieństwo takiego zdarzenia jest większe niż α, to można jedynie stwierdzić, że
nie ma podstaw do odrzucenia weryfikowanej hipotezy .
2
Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ
Ćwiczenie 16
W ćwiczeniu przyjmujemy, że badana cecha ma w dwóch populacjach rozkłady
N(µ1,σ1) i N(µ2,σ2), gdzie σ1 = σ2 jest nieznane (w naszym przypadku bez przeprowadzania
weryfikacji równości wariancji za pomocą odpowiedniego testu przyjmiemy, że równość ta
zachodzi). Weryfikujemy hipotezę zerową H0: µ1 = µ2 przy możliwych trzech hipotezach
alternatywnych
K1: µ1 < µ2;
K2: µ1 > µ2;
K3: µ1 ≠ µ2,
na poziomie ufności 0,95.
3. Algorytm postępowania
Aby przeprowadzić weryfikację hipotezy o równości wartości przeciętnych badanej
cech dwóch populacji budujemy test przebiegający w następujący sposób:
1. Wczytujemy dane z dwóch zbiorów tekstowych zawierających dane liczbowe prób z
dwóch populacji generalnych (z dwóch generatorów liczb losowych).
2. Obliczamy wartość przeciętną (średnią arytmetyczną) x oraz średnie odchylenie
kwadratowe s2 korzystając ze wzoru:
1 n
s 2 = ∑ ( xi − x ) 2
n 1
3. Obliczamy wartość statystyki
t=
x1 − x 2
n1 s12 + n2 s 22 n1 + n2
⋅
n1 + n2 − 2 n1n 2
4. Następnie znajdujemy przedziały krytyczne :
Dla K1: µ1 < µ2. jest to (-∞,-t(1-α , n1-n2 –2)]
Dla K2: µ1 > µ2 jest to [t(1-α , n1-n2 –2), ∞ )
Dla K3: µ1 ≠ µ2. jest to (-∞,-t(1-0.5α , n1-n2 –2)] ∪ [t(1-0.5α, n1-n2 –2), ∞ ),
gdzie t(p,v) oznacza kwantyl rzędu p rozkładu Studenta o v stopniach swobody.
5. Przeprowadzamy sprawdzenie, czy obliczona wartość statystyki należy do przedziału
krytycznego. Jeżeli wartość obliczona nie należy do przedziału krytycznego, wówczas nie
ma podstaw do odrzucenia hipotezy o równości wariancji na założonym poziomie
istotności.
4. Sprawozdanie
W sprawozdaniu przygotowanym w formie elektronicznej lub papierowej nie
zamieszczamy całości lub fragmentów listingu programu, program źródłowy powinien być
natomiast dobrze opisany za pomocą komentarzy. W sprawozdaniu nie zamieszczamy tablic z
których korzystamy w teście, natomiast powinna znaleźć się informacja w postaci odnośnika
3
Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ
Ćwiczenie 16
literaturowego do tychże. W sprawozdaniu powinny koniecznie znaleźć się poniższe
elementy:
4.1. Wstęp teoretyczny
Wstęp teoretyczny powinien zawierać podstawowe informacje na temat testów
parametrycznych oraz testu będącego przedmiotem tego ćwiczenia. Powinny w nim się
znaleźć wszystkie wzory stosowane w programie wraz z objaśnieniami wielkości w nich
występujących.
4.2. Dane techniczne
Dane techniczne powinny zawierać spis plików programu oraz plików z testowanymi
danymi taki jak w poniższym przykładzie:
Przykład
Plik:
Test16.exe
Rozmiar: Opis:
64 kB Plik wykonywalny. Do skompilowania programu
wykorzystaliśmy kompilator Borland C++ Version
3.1 . Program należy uruchamiać w systemie MSDOS lub w systemach Windows 3.1/3.11/9x.
Test16.cpp
Test16.obj
gent.h
GenF1.txt
11 kB
27 kB
7 kB
1,2 kB
GenF2.txt
600 B
LosN1.txt
0,3 kB
LosN2.txt
282 B
Plik z kodem źródłowym programu.
Plik z zapisanymi bibliotekami
Biblioteka obliczająca przedziały krytyczne
Plik tekstowy z przykładowymi liczbami losowymi
z rozkładu F-Snedecora:
Ilość liczb n=100, parametry: m=1, n=5
Plik tekstowy z przykładowymi liczbami losowymi
dla rozkładu F-Snedecora:
Ilość liczb n=50, parametry: λ=2, α=2
Plik tekstowy z przykładowymi liczbami losowymi
dla rozkładu N(3,1). Ilość liczb n=20
Plik tekstowy z przykładowymi liczbami losowymi
dla rozkładu N(3,2). Ilość liczb n=20
4.2. Instrukcja obsługi programu
W sprawozdaniu należy umieścić instrukcję obsługi programu pozwalającą na
wykonanie testu przez osobę nie znającą programu i przebiegu testu. Powinien się tu znaleźć
opis formatu zbioru danych akceptowanego przez program oraz objaśnienia komunikatów
wyświetlanych przez program.
Przykład:
W przypadku prawidłowego
zostanie wyświetlony komunikat:
Pliki zostaly pomyslnie wczytane
4
wczytania
danych
Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ
Ćwiczenie 16
W pliku n_pliku.txt znajduje się n liczb
Zas w pliku n_pliku.txt m liczb
W przypadku gdy wystąpi błąd podczas wczytywania danych,
zostanie wyświetlony komunikat:
Nie mogę otworzyć pliku”
i nastąpi zamknięcie programu.
4.5.Wnioski
W sprawozdaniu należy zamieścić wyniki testowania programu za pomocą co najmniej
czterech zestawów zbiorów testowych, przygotowanych za pomocą różnych generatorów
(niekoniecznie dla rozkładu normalnego, ale również rozkładów normalnopodobnych). Na
podstawie tych i innych wyników testowania należy wysnuć wnioski na temat przydatności i
zakresu stosowalności testu oraz funkcjonalności Państwa programu.
4.6. Literatura
Spis literatury wykorzystanej przy opracowywaniu sprawozdania oraz pisaniu i
testowaniu programu.
5. Literatura
[1] W. Krysicki i in.: Rachunek prawdopodobieństwa i statystyka matematyczna - część II:
Statystyka matematyczna, PWN, Warszawa 1986, str. 94.
5