Weryfikacja hipotezy o równości wartości
Transkrypt
Weryfikacja hipotezy o równości wartości
Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 17 Weryfikacja hipotezy o równości wartości przeciętnych badanej cechy dwóch populacji. Model 1. Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ Ćwiczenie 17 Weryfikacja hipotezy o równości wartości przeciętnych badanej cechy dwóch populacji. Model 1. 1. Cel ćwiczenia Celem tego ćwiczenia jest przeprowadzenie weryfikacji hipotezy o równości wartości przeciętnych badanej cechy dwóch populacji według modelu 1 opisanego w książce [1]. Dla przeprowadzenia tego testu należy napisać program w dowolnym języku programowania i dla dowolnego systemu operacyjnego oraz przetestować jego działanie na kilku zestawach danych otrzymanych za pomocą różnych generatorów liczb losowych. Do sprawozdania należy dołączyć plik źródłowy programu, plik wykonywalny programu, niestandardowe biblioteki użyte przy kompilacji programu oraz cztery zestawy danych dla których przeprowadzono testy (wyniki tych testów i wypływające z nich wnioski muszą się znaleźć w sprawozdaniu). 2. Wstęp Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji (w tym przypadku równości wartości przeciętnych), o prawdziwości lub fałszywości którego wnioskuje się na podstawie badanej próbki. W praktyce przy weryfikacji hipotez postępuje się w ten sposób, że oprócz weryfikowanej hipotezy zwanej hipotezą zerową wyróżnia się jeszcze inną hipotezę K, która najczęściej wynika z celu badania statystycznego, zwaną hipotezą alternatywną. W celu weryfikacji hipotezy budujemy funkcję opartą na próbie (najlepiej próbie losowej prostej) δ(X1,....,Xn) zwaną statystyką testową. Przy pobieraniu różnych próbek, nawet o tej samej liczności n – funkcja ta przyjmuje na ogół różne wartości, z których jedne będą świadczyły o prawdziwości weryfikowanej hipotezy a inne będą ją odrzucały. Naturalnym zatem jest podzielenie zbioru wszystkich wartości, które może przyjąć statystyka testowa na dwa dopełniające się zbiory W i W’, takie że: δ(X1,....,Xn) ∈ W - hipotezę odrzucamy; δ(X1,....,Xn) ∈ W’ - hipotezę przyjmujemy. Zbiór W nazywamy zbiorem krytycznym, zaś zbiór W‘ zbiorem przyjęć. W testach istotności nie oblicza się błędu drugiego rodzaju (możemy przyjąć weryfikowaną hipotezę H jako prawdziwą, podczas gdy jest ona fałszywa, czyli jeśli prawdziwa jest hipoteza alternatywna K), natomiast przy założeniu prawdziwości weryfikowanej hipotezy budujemy zbiór krytyczny w ten sposób, aby zagwarantować małe prawdopodobieństwo zaobserwowania wartości statystyki testowej należącej do tego zbioru, równe z góry obranemu poziomowi istotności α = 5 %. Jeżeli zatem wartość statystyki testowej wpadnie do zbioru krytycznego, to weryfikowaną hipotezę należy odrzucić. Jeżeli jednak wartość statystyki testowej nie znajdzie się w zbiorze krytycznym, a prawdopodobieństwo takiego zdarzenia jest większe niż α, to można jedynie stwierdzić, że nie ma podstaw do odrzucenia weryfikowanej hipotezy . 2 Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ Ćwiczenie 17 W ćwiczeniu przyjmujemy, że badana cecha ma w dwóch populacjach rozkłady N(µ1,σ1) i N(µ2,σ2), o znanych σ1 i σ2 i nieznanych µ1 i µ2 . Weryfikujemy hipotezę zerową H0: µ1 = µ2 przy możliwych trzech hipotezach alternatywnych K1: µ1 < µ2; K2: µ1 > µ2; K3: µ1 ≠ µ2, na poziomie istotności 0,05. 3. Algorytm postępowania Aby przeprowadzić weryfikację hipotezy o równości wartości przeciętnych badanej cech dwóch populacji budujemy test przebiegający w następujący sposób: 1. Wczytujemy dane z dwóch zbiorów tekstowych zawierających dane liczbowe prób z dwóch populacji generalnych (z dwóch generatorów liczb losowych). 2. Obliczamy wartość przeciętną (średnią arytmetyczną) x oraz średnie odchylenie kwadratowe s2 korzystając ze wzoru: 1 n s 2 = ∑ ( xi − x ) 2 n 1 3. Obliczamy wartość statystyki U= x1 − x 2 s12 s 22 + n1 n2 która przy założeniu prawdziwości hipotezy zerowej ma rozkład N(0,1). 4. Następnie znajdujemy przedziały krytyczne : Dla K1: µ1 < µ2. jest to (-∞,-u(1-α)] Dla K2: µ1 > µ2 jest to [u(1-α), +∞ ) Dla K3: µ1 ≠ µ2. jest to (-∞,-u(1-0,5α )] ∪ [u(1-0,5α), +∞ ). 5. Przeprowadzamy sprawdzenie, czy obliczona wartość statystyki należy do przedziału krytycznego. Jeżeli wartość obliczona nie należy do przedziału krytycznego, wówczas nie ma podstaw do odrzucenia hipotezy o równości wariancji na założonym poziomie istotności. 4. Sprawozdanie W sprawozdaniu przygotowanym w formie elektronicznej lub papierowej nie zamieszczamy całości lub fragmentów listingu programu, program źródłowy powinien być natomiast dobrze opisany za pomocą komentarzy. W sprawozdaniu nie zamieszczamy tablic z których korzystamy w teście, natomiast powinna znaleźć się informacja w postaci odnośnika literaturowego do tychże. W sprawozdaniu powinny koniecznie znaleźć się poniższe elementy: 3 Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ Ćwiczenie 17 4.1. Wstęp teoretyczny Wstęp teoretyczny powinien zawierać podstawowe informacje na temat testów parametrycznych oraz testu będącego przedmiotem tego ćwiczenia. Powinny w nim się znaleźć wszystkie wzory stosowane w programie wraz z objaśnieniami wielkości w nich występujących. 4.2. Dane techniczne Dane techniczne powinny zawierać spis plików programu oraz plików z testowanymi danymi taki jak w poniższym przykładzie: Przykład Plik: Test16.exe Rozmiar: Opis: 64 kB Plik wykonywalny. Do skompilowania programu wykorzystaliśmy kompilator Borland C++ Version 3.1 . Program należy uruchamiać w systemie MSDOS lub w systemach Windows 3.1/3.11/9x. Test16.cpp Test16.obj gent.h GenF1.txt 11 kB 27 kB 7 kB 1,2 kB GenF2.txt 600 B LosN1.txt 0,3 kB LosN2.txt 282 B Plik z kodem źródłowym programu. Plik z zapisanymi bibliotekami Biblioteka obliczająca przedziały krytyczne Plik tekstowy z przykładowymi liczbami losowymi z rozkładu F-Snedecora: Ilość liczb n=100, parametry: m=1, n=5 Plik tekstowy z przykładowymi liczbami losowymi dla rozkładu F-Snedecora: Ilość liczb n=50, parametry: λ=2, α=2 Plik tekstowy z przykładowymi liczbami losowymi dla rozkładu N(3,1). Ilość liczb n=20 Plik tekstowy z przykładowymi liczbami losowymi dla rozkładu N(3,2). Ilość liczb n=20 4.2. Instrukcja obsługi programu W sprawozdaniu należy umieścić instrukcję obsługi programu pozwalającą na wykonanie testu przez osobę nie znającą programu i przebiegu testu. Powinien się tu znaleźć opis formatu zbioru danych akceptowanego przez program oraz objaśnienia komunikatów wyświetlanych przez program. Przykład: W przypadku prawidłowego zostanie wyświetlony komunikat: wczytania danych Pliki zostaly pomyslnie wczytane W pliku n_pliku.txt znajduje się n liczb Zas w pliku n_pliku.txt m liczb W przypadku gdy wystąpi błąd podczas wczytywania danych, 4 Laboratorium Metod Analizy Danych Doświadczalnych Instytutu Fizyki PŁ Ćwiczenie 17 zostanie wyświetlony komunikat: Nie mogę otworzyć pliku” i nastąpi zamknięcie programu. 4.5.Wnioski W sprawozdaniu należy zamieścić wyniki testowania programu za pomocą co najmniej czterech zestawów zbiorów testowych, przygotowanych za pomocą różnych generatorów (niekoniecznie dla rozkładu normalnego, ale również rozkładów normalnopodobnych). Na podstawie tych i innych wyników testowania należy wysnuć wnioski na temat przydatności i zakresu stosowalności testu oraz funkcjonalności Państwa programu. 4.6. Literatura Spis literatury wykorzystanej przy opracowywaniu sprawozdania oraz pisaniu i testowaniu programu. 5. Literatura [1] W. Krysicki i in.: Rachunek prawdopodobieństwa i statystyka matematyczna - część II: Statystyka matematyczna, PWN, Warszawa 1986, str. 93. 5