Znaczenie sekwencyjnego sposobu podejmowania decyzji
Transkrypt
Znaczenie sekwencyjnego sposobu podejmowania decyzji
Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Znaczenie sekwencyjnego sposobu podejmowania decyzji Home Page Title Page JJ II J I Page 1 of 21 Go Back Full Screen Close Quit 1. Podejście klasyczne a podejście sekwencyjne do wnioskowania statystycznego W statystyce klasycznej zakłada się, że liczba obserwacji gromadzonych w przeprowadzanym eksperymencie jest z góry ustalona. Wybór tej liczby jest jednym z elementów planowania doświadczenia. Często jednak dane napływają nie jednocześnie (w jednej paczce), lecz kolejno. Na przykład, przy statystycznej kontroli jakości produkcji partie o bardzo niskiej lub bardzo wysokiej wadliwości mogą być przyjęte lub odrzucone po zbadaniu mniejszej liczby sztuk niż to jest potrzebne, w przypadku partii o wadliwości bliskiej dopuszczalnej. Nie ma matematycznego uzasadnienia kontrolowanie kolejnych produktów skoro częstości pojawiania się wadliwych elementów uzyskiwane dotychczas przemawiają za przyjęciem lub odrzuceniem produkcji przy założonej dokładności (błędzie statystycznym). W wielu badaniach medycznych, w których stosuje się zabiegi (badania) w miarę napływu pacjentów. W takim przypadku Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 2 of 21 Go Back Full Screen Close Quit wydaje się nieetyczne, a także zbędne, kontynuowanie zabiegów na pacjentach w celu osiągnięcia zaplanowanej wcześniej liczności próby, gdy zaobserwowane dotychczas wyniki świadczą wyraźnie o wyższości jednego z porównywanych zabiegów. Także w badaniach naukowych eksperymentator, który uzyskał niezbyt przekonywujące wyniki, skłonny jest często zwiększyć liczbę obserwacji. W podejściu sekwencyjnym nie ustala się z gory liczby obserwacji potrzebnych do analizy i przyjmuje się, że obserwacje mogą być uzyskiwane tak długo jak tego wymaga badanie. Sekwencyjne gromadzenie danych, tzn. zatrzymanie eksperymentowania w momencie wyznaczonym przez zebrane dotychczas dane, wymaga, aby wnioskowanie na podstawie tych danych przebiegało całkiem inaczej niż w statystyce klasycznej. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 3 of 21 Go Back Full Screen Close Quit 2. Abraham Wald i podejście sekwencyjne Podejście klasyczne . . . Twórcą podejścia sekwencyjnego do wnioskowania statystycznego i doniosłych rezultatów inicjujących ten nowy kierunek badań statystyki matematycznej był Abraham Wald (1902 – 1950). Zainicjował w statystyce dwa zupełnie nowe działy: analizę sekwencyjną i ogólną teorię decyzji . Był twórcą teoriodecyzyjnego podejścia sekwencyjnego do wnioskowania statystycznego. Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 4 of 21 Go Back Full Screen Close Quit Sekwencyjne podejście do wnioskowania statystycznego było po raz pierwszy przedmiotem systematycznych badań podczas II wojny światowej. Badania te dotyczyły jakości amunicji i prowadzone były przez Grupę Badań Statystycznych (Statistical Research Group) w Columbia University oraz przez grupę doradców okresu wojennego w Anglii. W statystyce klasycznej metoda wnioskowania (metoda estymacji, metoda testowania hipotez) zawiera przepis na wyciąganie konkluzji z danych doświadczalnych. Przepis ten pozostaje w mocy tylko wtedy, gdy dane zostały zebrane zgodnie ze schematem przewidzianym w tym przepisie, a same dane mają wpływ jedynie na końcowy wynik. W analizie sekwencyjnej dane służą zarówno do decyzji, kiedy skończyć obserwację (pobieranie danych), jak również do wyciągania faktycznych wniosków (dotyczących oszacowywanego parametru czy sprawdzanych hipotez). Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 5 of 21 Go Back Full Screen Close Quit Jak wynika z idei, podejście sekwencyjne wymaga wprowadzenia do matematycznego opisu procedury pojęcia reguły stopu, zwanej inaczej momentem zatrzymania. Jest to zasada, która w każdym kroku decyduje na podstawie dotychczas zebranych danych, czy zakończyć badanie i podjąć decyzję, czy też kontynuować obserwację (pobieranie danych). Reguły stopu tworzą bazę koncepcyjną analizy sekwencyjnej. Okazały się one również jednym z najbardziej owocnych pojęć współczesnej teorii prawdopodobieństwa. Wiele interesujących zagadnień można sprowadzić do problemu znalezienia najlepszej (optymalnej) reguły stopu w konkretnej sytuacji. Analiza sekwencyjna wymaga zarówno określenia momentu zatrzymania obserwacji jak i wyboru decyzji dotyczącej wnioskowania statystycznego. Największym wkładem własnym Walda do analizy sekwencyjnej było wyznaczenie reguły stopu i decyzji w pewnej ogólnej klasie problemów statystyki matematycznej. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 6 of 21 Go Back Full Screen Close Quit 3. Sekwencyjny test ilorazu prawdopodobieństwa Załóżmy, że mamy do czynienia z populacją (zbiorowością), której każdy element może być zakwalifikowany do jednej z dwóch kategorii, np. z partią produktów składających się z elementów dobrych i wadliwych. Przyporządkujemy wartość 0 każdemu elementowi sprawnemu i wartość 1 każdemu elementowi wadliwemu. Niech p oznacza nieznaną proporcję elementów wadliwych w populacji (tzw. wadliwość populacji). Wtedy rezultatem X badania każdego pobranego w sposób losowy elementu z populacji może być jedynie wartość 1 lub 0. Jeżeli Xi oznacza rezultat badania i-tego elementu, to Xi = 1 z prawdopodobieństwem p i Xi = 0 z prawdopodobieństwem 1 − p. Zwykle możliwa jest specyfikacja pewnej wartości p0 , takiej że w przypadku, gdy p ≤ p0 skłonni jesteśmy zaakceptować partię, a przy p > p0 partię odrzucimy. Zatem problem podjęcia decyzji, czy partię należy odrzucić czy przyjąć na podstawie próby losowej, można sformułować jako problem testowania hipotezy H0 : p ≤ p0 przeciwko hipotezie alternatywnej H1 : p > p0 . Aspekty praktyczne wskazują, że możliwa jest specyfikacja dwóch wartości p0 i p1 (p0 < p0 , p1 > p0 ), takich że Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 7 of 21 Go Back Full Screen Close Quit zaakceptowanie partii w przypadku, gdy p ≥ p1 będzie traktowane jako błąd o wtórnym praktycznym znaczeniu, natomiast odrzucenie partii w przypadku, gdy p ≤ p0 będzie uważane za błąd o istotnym praktycznym znaczeniu. Nie rozpatruje się problemu wyboru decyzji w przypadku, gdy p ∈ (p0 , p1 ). Zatem problem kontroli jakości danej partii elementów można sformułować jako problem testowania hipotezy H0 : p ≤ p0 przeciwko hipotezie alternatywnej H1 : p ≥ p1 , gdzie p0 < p1 . Po wybraniu wartości p0 i p1 , akceptowalne przez nas ryzyko związane z podjęciem błędnych decyzji może być określone w następujący sposób: prawdopodobieństwo odrzucenia partii nie powinno przekraczać pewnej małej ustalonej z góry wartości α w przypadku, gdy p ≤ p0 , natomiast prawdopodobieństwo akceptacji partii nie powinno przekraczać pewnej małej ustalonej z góry wartości β w przypadku, gdy p ≥ p1 . Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 8 of 21 Go Back Full Screen Close Quit Możliwe ryzyka w procedurze testowania, którą należy skonstruować, scharakteryzowane są poprzez cztery liczby: p0 , p1 , α, β. Wybór tych wielkości nie jest problemem statystycznym; są one określone w zależności od praktycznych aspektów każdego poszczególnego przypadku. Zakłada się, że nie ma żadnego ograniczenia co do liczby elementów pobieranych do próbki w trakcie inspekcji. Sekwencyjna procedura testowania hipotezy H0 : p ≤ p0 przeciwko hipotezie alternatywnej H1 : p ≥ p1 jest taka sama jak sekwencyjna procedura testowania hipotezy H0 : p = p0 przeciwko hipotezie alternatywnej H1 : p = p1 . Wybieramy elementy w sposób niezależny tworząc próbkę (x1 , . . . , xn ). Prawdopodobieństwo realizacji takiego ciągu obserwacji przy hipotezie H1 : p = p1 wynosi Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 9 of 21 p1n = gdzie sn = Pn i=1 xi , ps1n (1 n−sn − p1 ) , a przy hipotezie H0 : p = p0 , p0n = ps0n (1 − p0 )n−sn . W każdym kroku inspekcji, tzn. po zbadaniu każdego kolejnego Go Back Full Screen Close Quit n-tego elementu, obliczamy iloraz p1n Ln = p0n i postępujemy według następującej procedury: Podejście klasyczne . . . Abraham Wald i . . . jeżeli Ln ≤ A, należy zatrzymać próbkowanie i przyjąć H0 ; jeżeli Ln ≥ B, należy zatrzymać próbkowanie i przyjąć H1 ; (1) jeżeli A < Ln < B, należy pobrać kolejną obserwację, gdzie A i B, są pewnymi liczbami, takimi że A < 1, B > 1. Uzasadnienie jest oczywiste: otrzymana wartość Ln ≤ A < 1 świadczy o tym, że bardziej prawdopodobne jest to, że pobrana próbka pochodzi z populacji o wadliwości p0 niż to, że pochodzi z populacji o wadliwości p1 . Procedura określona przez (1) i stałe A, B nazywa się sekwencyjnym testem ilorazu prawdopodobieństwa (STIP) o brzegach (barierach) zatrzymania A i B. W rozpatrywanym problemie statystycznej kontroli jakości, przyjęcie H0 oznacza zaakceptowanie partii produktów, a przyjęcie H1 oznacza jej odrzucenie. Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 10 of 21 Go Back Full Screen Close Quit Ponieważ funkcja log y jest monotoniczna względem y, więc STIP można opisać w sposób równoważny zastępując we wzorze (1) wielkości Ln , A, B odpowiednio wielkościami log Ln , log A, log B. Następnie, korzystając z aproksymacji podanych przez Walda, STIP można przedstawić w zależności od zadanych prawdopodobieństw błędów α i β: jeżeli log Ln ≤ log β , 1−α 1−β , α to należy zatrzymać próbkowanie i przyjąć H1 ; jeżeli to należy kontynuować badanie pobierając kolejną obserwację. Uwzględniając postać funkcji Ln , n−sn sn 1 − p1 p1 , Ln = p0 1 − p0 Sekwencyjny test . . . Home Page Title Page log Ln ≥ log β 1−β < log Ln < log , 1−α α Abraham Wald i . . . Obcięty i . . . to należy zatrzymać próbkowanie i przyjąć H0 ; jeżeli log Podejście klasyczne . . . (2) JJ II J I Page 11 of 21 Go Back Full Screen Close Quit obszar kontynuacji procedury, określony wzorem (2), można przedstawić w postaci 1 − p0 β log 1 − p1 1−α < sn an = +n 1 − p1 1 − p1 p1 p1 log − log log − log p0 1 − p0 p0 1 − p0 1 − p0 1−β log log 1 − p1 α = rn . +n < p1 1 − p1 p1 1 − p1 log − log log − log p0 1 − p0 p0 1 − p0 Podejście klasyczne . . . log Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . (3) Home Page Title Page JJ II J I Page 12 of 21 Go Back Full Screen Close Quit Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 13 of 21 Go Back Rysunek 1: Bariery sekwencyjnego testu ilorazu prawdopodobieństwa dla prób Bernoulliego. Przyjęto p0 = 0.1, p1 = 0.3, α = 0.02, β = 0.03. Full Screen Close Quit Jak widać, metoda wnioskowania i reguła stopu mogą być opisane łacznie przez narysowanie dwóch barier na wykresie liczby sukcesów jako funkcji liczby wykonanych obserwacji. Dopóki błądzenie losowe pozostaje między tymi barierami, należy kontynuować badanie. Jeśli trajektoria przetnie górną barierę (za dużo sukcesów – za dużo wykrytych elementów wadliwych), zakończymy eksperyment i podejmiemy decyzję o odrzuceniu partii produktów. Gdy zostanie przecięta dolna bariera (za mało sukcesów), zakończymy eksperyment i podejmiemy decyzję o zaakceptowaniu danej partii. Liczby an i rn określone we wzorze (3) nazywają się odpowiednio wartością akceptacji i wartością odrzucenia. Wald udowodnił, że procedura STIP z pewnością doprowadzi do rozstrzygnięcia w skończonej liczbie kroków. Jak łatwo zauważyć, żądanie mniejszych prawdopodobieństw błędnych decyzji powoduje szersze rozsunięcie barier i wzrost średniej liczby prób potrzebnych do podjęcia decyzji. Procedura STIP ma bardzo przekonujące wyjaśnienie. Ponieważ bariery zatrzymania są równoległymi liniami prostymi, test ten jest prosty w użyciu. Ale przede wszystkim test ten jest testem optymalnym względem pewnego kryterium. Okazało się Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 14 of 21 Go Back Full Screen Close Quit w praktyce, że STIP często dawał oszczędność rzędu 50% obserwacji wymaganych przez niesekwencyjną procedurę o tych samych prawdopodobieństwach błędów. Ten fakt miał taką wartość przy testowaniu amunicji, że STIP przez pewien czas był tajemnicą wojskową. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 15 of 21 Go Back Full Screen Close Quit Wald i Wolfowitz (1948) udowodnili, że średnia liczba obserwacji wymagana w STIP do wydania decyzji jest mniejsza niż analogiczna średnia w jakiejkolwiek innej procedurze (sekwencyjnej lub nie) mającej te same lub mniejsze prawdopodobieństwa błędów. STIP może być skonstruowany w każdej sytuacji decyzyjnej, gdy chodzi o przyjęcie jednej z dwóch alternatyw na podstawie ciągu niezależnych obserwacji. Prowadzi to zawsze do badania błądzenia losowego (lub ogólniej, przebiegu pewnego procesu losowego) z dwiema równoległymi barierami. STIP dla ogólniejszych procesów losowych wymaga zaangażowania bardziej skomplikowanej teorii matematycznej, w szczególności teorii procesów losowych, ale idee Walda można zastosować także w takich przypadkach. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 16 of 21 Go Back Full Screen Close Quit 4. Obcięty i uogólniony STIP W niektórych sytuacjach (np. gdy prawdziwa wartość testowanego parametru różni się znacznie od wartości parametrów określonych przez obie hipotezy) STIP wymaga bardzo wielu obserwacji przed podjęciem decyzji. Jeżeli obserwacje są zbyt kosztowne, stosuje się często zamiast STIP tzw. obcięty STIP, w którym określa się górną granicę wielkości próbki. Na Rysunkach 2 i 3 przedstawione są bariery zatrzymania STIP, w których liczba dokonywanych obserwacji jest ograniczona. Z testami o takich barierach zatrzymania mamy do czynienia np. w sytuacjach, gdy chcemy porównać dwa leki podając je (w różnych czasach i losowej kolejności) tym samym pacjentom. Na podstawie badań każdego pacjenta uzyskujemy informację, który z tych dwóch leków okazał się bardziej skuteczny. Trajektoria wznosząca się o jednostkę do góry, gdy preferowany jest lek A i opadająca o jednostkę w dół, gdy preferowany jest lek B, tworzy symetryczne błądzenie losowe. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 17 of 21 Go Back Full Screen Close Quit Zadanie polega na sprawdzeniu hipotezy, że oba leki są jednakowo skuteczne przy hipotezie alternatywnej, że jeden z nich jest lepszy od drugiego. Decyzja przyjęcia pierwszej z tych hipotez jest konsekwencją przekroczenia bariery pionowej, podczas gdy przekroczenie bariery górnej lub dolnej pociąga za sobą przyjęcie hipotezy alternatywnej. Bariera pionowa wyznacza górną granicę liczby pacjentów, którzy będą badani. Barierę pionową na Rysunku 2 można ściągnąć do linii przerywanej, ponieważ trajektoria, która przetnie linię przerywaną, w dalszym swym biegu zawsze już musi przekroczyć barierę pionową. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 18 of 21 Go Back Full Screen Close Quit Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 19 of 21 Go Back Full Screen Rysunek 2: Bariery ograniczonego STIP Close Quit Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 20 of 21 Go Back Rysunek 3: Bariery podwójnie trójkątnego STIP Full Screen Close Quit Zmodyfikowany STIP, w którym bariery równoległe zastąpione są przez inne linie proste, tak jak na Rysunku 2 lub 3 nazywa się uogólnionym STIP. Innego rodzaju zagadnienie pojawia się w statystycznej kontroli jakości w przypadku, gdy często ze względów technicznych wygodniej jest pobierać do badania nie pojedyncze sztuki lecz całe ich zespoły (wiązki, skrzynki, paczki). Procedury sekwencyjne dopuszczające taką możliwość znajdują zastosowania w przemyśle. Przedstawiony STIP jest narzędziem w problemach decyzyjnych, w których dokonuje się wyboru jednej z dwóch decyzji. Trudniejszy problem dotyczy sytuacji, w której należy dokonać wyboru jednej spośród więcej niż dwóch decyzji. Taki problem związany jest z rozszerzeniem koncepcji Walda na ogólniejsze modele statystyczne w celu wyznaczenia nowych narzędzi statystyki matematycznej do rozwiązań wielu zadań w praktyce. Powstające przy tym problemy matematyczne dotyczą m.in. własności reguł stopu dla bardzo ogólnych barier i procesów losowych na płaszczyźnie lub w przestrzeniach o większej liczbie wymiarów. Podejście klasyczne . . . Abraham Wald i . . . Sekwencyjny test . . . Obcięty i . . . Home Page Title Page JJ II J I Page 21 of 21 Go Back Full Screen Close Quit