Znaczenie sekwencyjnego sposobu podejmowania decyzji

Transkrypt

Podejście klasyczne . . .
Abraham Wald i . . .
Sekwencyjny test . . .
Obcięty i . . .
Znaczenie sekwencyjnego
sposobu podejmowania
decyzji
Home Page
Title Page
JJ
II
J
I
Page 1 of 21
Go Back
Full Screen
Close
Quit
1. Podejście klasyczne a podejście sekwencyjne do
wnioskowania statystycznego
W statystyce klasycznej zakłada się, że liczba obserwacji
gromadzonych w przeprowadzanym eksperymencie jest z
góry ustalona. Wybór tej liczby jest jednym z elementów
planowania doświadczenia.
Często jednak dane napływają nie jednocześnie (w jednej paczce),
lecz kolejno.
Na przykład, przy statystycznej kontroli jakości produkcji partie o bardzo niskiej lub bardzo wysokiej wadliwości mogą
być przyjęte lub odrzucone po zbadaniu mniejszej liczby sztuk niż
to jest potrzebne, w przypadku partii o wadliwości bliskiej dopuszczalnej. Nie ma matematycznego uzasadnienia kontrolowanie kolejnych produktów skoro częstości pojawiania się wadliwych
elementów uzyskiwane dotychczas przemawiają za przyjęciem lub
odrzuceniem produkcji przy założonej dokładności (błędzie statystycznym).
W wielu badaniach medycznych, w których stosuje się zabiegi (badania) w miarę napływu pacjentów. W takim przypadku
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 2 of 21
Go Back
Full Screen
Close
Quit
wydaje się nieetyczne, a także zbędne, kontynuowanie zabiegów
na pacjentach w celu osiągnięcia zaplanowanej wcześniej liczności
próby, gdy zaobserwowane dotychczas wyniki świadczą wyraźnie o
wyższości jednego z porównywanych zabiegów.
Także w badaniach naukowych eksperymentator, który uzyskał niezbyt przekonywujące wyniki, skłonny jest często zwiększyć
liczbę obserwacji.
W podejściu sekwencyjnym nie ustala się z gory liczby
obserwacji potrzebnych do analizy i przyjmuje się, że obserwacje mogą być uzyskiwane tak długo jak tego wymaga
badanie.
Sekwencyjne gromadzenie danych, tzn. zatrzymanie eksperymentowania w momencie wyznaczonym przez zebrane dotychczas dane,
wymaga, aby wnioskowanie na podstawie tych danych przebiegało
całkiem inaczej niż w statystyce klasycznej.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 3 of 21
Go Back
Full Screen
Close
Quit
2. Abraham Wald i podejście sekwencyjne
Twórcą podejścia sekwencyjnego do wnioskowania statystycznego i doniosłych rezultatów inicjujących ten nowy kierunek badań statystyki matematycznej był Abraham Wald
(1902 – 1950). Zainicjował w
statystyce dwa zupełnie nowe
działy: analizę sekwencyjną
i ogólną teorię decyzji . Był
twórcą teoriodecyzyjnego podejścia sekwencyjnego do wnioskowania statystycznego.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 4 of 21
Go Back
Full Screen
Close
Quit
Sekwencyjne podejście do wnioskowania statystycznego było po
raz pierwszy przedmiotem systematycznych badań podczas II wojny
światowej. Badania te dotyczyły jakości amunicji i prowadzone
były przez Grupę Badań Statystycznych (Statistical Research Group)
w Columbia University oraz przez grupę doradców okresu wojennego w Anglii.
W statystyce klasycznej metoda wnioskowania (metoda estymacji, metoda testowania hipotez) zawiera przepis na wyciąganie
konkluzji z danych doświadczalnych. Przepis ten pozostaje w mocy
tylko wtedy, gdy dane zostały zebrane zgodnie ze schematem przewidzianym w tym przepisie, a same dane mają wpływ jedynie na
końcowy wynik.
W analizie sekwencyjnej dane służą zarówno do
decyzji, kiedy skończyć obserwację (pobieranie
danych), jak również do wyciągania faktycznych
wniosków (dotyczących oszacowywanego parametru czy sprawdzanych hipotez).
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 5 of 21
Go Back
Full Screen
Close
Quit
Jak wynika z idei, podejście sekwencyjne wymaga
wprowadzenia do matematycznego opisu procedury
pojęcia reguły stopu, zwanej inaczej momentem zatrzymania. Jest to zasada, która w każdym kroku
decyduje na podstawie dotychczas zebranych danych, czy zakończyć badanie i podjąć decyzję, czy
też kontynuować obserwację (pobieranie danych).
Reguły stopu tworzą bazę koncepcyjną analizy sekwencyjnej.
Okazały się one również jednym z najbardziej owocnych pojęć
współczesnej teorii prawdopodobieństwa.
Wiele interesujących zagadnień można sprowadzić do problemu
znalezienia najlepszej (optymalnej) reguły stopu w konkretnej sytuacji.
Analiza sekwencyjna wymaga zarówno określenia
momentu zatrzymania obserwacji jak i wyboru decyzji dotyczącej wnioskowania statystycznego.
Największym wkładem własnym Walda do analizy sekwencyjnej
było wyznaczenie reguły stopu i decyzji w pewnej ogólnej klasie
problemów statystyki matematycznej.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 6 of 21
Go Back
Full Screen
Close
Quit
3. Sekwencyjny test ilorazu prawdopodobieństwa
Załóżmy, że mamy do czynienia z populacją (zbiorowością), której
każdy element może być zakwalifikowany do jednej z dwóch kategorii, np. z partią produktów składających się z elementów dobrych
i wadliwych. Przyporządkujemy wartość 0 każdemu elementowi
sprawnemu i wartość 1 każdemu elementowi wadliwemu. Niech
p oznacza nieznaną proporcję elementów wadliwych w populacji
(tzw. wadliwość populacji). Wtedy rezultatem X badania każdego pobranego w sposób losowy elementu z populacji może być
jedynie wartość 1 lub 0. Jeżeli Xi oznacza rezultat badania i-tego
elementu, to Xi = 1 z prawdopodobieństwem p i Xi = 0 z prawdopodobieństwem 1 − p. Zwykle możliwa jest specyfikacja pewnej
wartości p0 , takiej że w przypadku, gdy p ≤ p0 skłonni jesteśmy
zaakceptować partię, a przy p > p0 partię odrzucimy. Zatem problem podjęcia decyzji, czy partię należy odrzucić czy przyjąć na
podstawie próby losowej, można sformułować jako problem testowania hipotezy H0 : p ≤ p0 przeciwko hipotezie alternatywnej
H1 : p > p0 . Aspekty praktyczne wskazują, że możliwa jest specyfikacja dwóch wartości p0 i p1 (p0 < p0 , p1 > p0 ), takich że
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 7 of 21
Go Back
Full Screen
Close
Quit
zaakceptowanie partii w przypadku, gdy p ≥ p1 będzie traktowane jako błąd o wtórnym praktycznym znaczeniu, natomiast odrzucenie partii w przypadku, gdy p ≤ p0 będzie uważane za błąd
o istotnym praktycznym znaczeniu. Nie rozpatruje się problemu
wyboru decyzji w przypadku, gdy p ∈ (p0 , p1 ). Zatem problem
kontroli jakości danej partii elementów można sformułować jako
problem testowania hipotezy H0 : p ≤ p0 przeciwko hipotezie alternatywnej H1 : p ≥ p1 ,
gdzie p0 < p1 .
Po wybraniu wartości p0 i p1 , akceptowalne przez nas ryzyko
związane z podjęciem błędnych decyzji może być określone w następujący sposób: prawdopodobieństwo odrzucenia partii nie powinno przekraczać pewnej małej ustalonej z góry wartości α w
przypadku, gdy p ≤ p0 , natomiast prawdopodobieństwo akceptacji partii nie powinno przekraczać pewnej małej ustalonej z góry
wartości β w przypadku, gdy p ≥ p1 .
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 8 of 21
Go Back
Full Screen
Close
Quit
Możliwe ryzyka w procedurze testowania, którą należy skonstruować, scharakteryzowane są poprzez cztery
liczby: p0 , p1 , α, β. Wybór tych wielkości nie jest problemem statystycznym; są one określone w zależności
od praktycznych aspektów każdego poszczególnego przypadku.
Zakłada się, że nie ma żadnego ograniczenia co do liczby elementów pobieranych do próbki w trakcie inspekcji. Sekwencyjna
procedura testowania hipotezy H0 : p ≤ p0 przeciwko hipotezie alternatywnej H1 : p ≥ p1 jest taka sama jak sekwencyjna
procedura testowania hipotezy H0 : p = p0 przeciwko hipotezie
alternatywnej H1 : p = p1 . Wybieramy elementy w sposób niezależny tworząc próbkę (x1 , . . . , xn ). Prawdopodobieństwo realizacji
takiego ciągu obserwacji przy hipotezie H1 : p = p1 wynosi
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 9 of 21
p1n =
gdzie sn =
Pn
i=1 xi ,
ps1n (1
n−sn
− p1 )
,
a przy hipotezie H0 : p = p0 ,
p0n =
ps0n (1
− p0 )n−sn .
W każdym kroku inspekcji, tzn. po zbadaniu każdego kolejnego
Go Back
Full Screen
Close
Quit
n-tego elementu, obliczamy iloraz
p1n
Ln =
p0n
i postępujemy według następującej procedury:
jeżeli Ln ≤ A,
należy zatrzymać próbkowanie i przyjąć H0 ;
jeżeli Ln ≥ B,
należy zatrzymać próbkowanie i przyjąć H1 ; (1)
jeżeli A < Ln < B, należy pobrać kolejną obserwację,
gdzie A i B, są pewnymi liczbami, takimi że A < 1, B > 1.
Uzasadnienie jest oczywiste: otrzymana wartość Ln ≤ A < 1
świadczy o tym, że bardziej prawdopodobne jest to, że pobrana
próbka pochodzi z populacji o wadliwości p0 niż to, że pochodzi
z populacji o wadliwości p1 . Procedura określona przez (1) i stałe
A, B nazywa się sekwencyjnym testem ilorazu prawdopodobieństwa (STIP) o brzegach (barierach) zatrzymania A i
B.
W rozpatrywanym problemie statystycznej kontroli jakości, przyjęcie H0 oznacza zaakceptowanie partii produktów, a przyjęcie H1
oznacza jej odrzucenie.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 10 of 21
Go Back
Full Screen
Close
Quit
Ponieważ funkcja log y jest monotoniczna względem y, więc
STIP można opisać w sposób równoważny zastępując we wzorze (1)
wielkości Ln , A, B odpowiednio wielkościami log Ln , log A, log B.
Następnie, korzystając z aproksymacji podanych przez Walda, STIP
można przedstawić w zależności od zadanych prawdopodobieństw
błędów α i β: jeżeli
log Ln ≤ log
β
,
1−α
1−β
,
α
to należy zatrzymać próbkowanie i przyjąć H1 ; jeżeli
to należy kontynuować badanie pobierając kolejną obserwację.
Uwzględniając postać funkcji Ln ,
n−sn
sn 1 − p1
p1
,
Ln =
p0
1 − p0
Home Page
Title Page
log Ln ≥ log
β
1−β
< log Ln < log
,
1−α
α
Obcięty i . . .
to należy zatrzymać próbkowanie i przyjąć H0 ; jeżeli
log
(2)
JJ
II
J
I
Page 11 of 21
Go Back
Full Screen
Close
Quit
obszar kontynuacji procedury, określony wzorem (2), można przedstawić w postaci
1 − p0
β
log
1 − p1
1−α
< sn
an =
+n
1 − p1
1 − p1
p1
p1
log − log
log − log
p0
1 − p0
p0
1 − p0
1 − p0
1−β
log
log
1 − p1
α
= rn .
+n
<
p1
1 − p1
p1
1 − p1
log − log
log − log
p0
1 − p0
p0
1 − p0
log
Obcięty i . . .
(3)
Home Page
Title Page
JJ
II
J
I
Page 12 of 21
Go Back
Full Screen
Close
Quit
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 13 of 21
Go Back
Rysunek 1: Bariery sekwencyjnego testu ilorazu prawdopodobieństwa dla
prób Bernoulliego. Przyjęto p0 = 0.1, p1 = 0.3, α = 0.02, β = 0.03.
Full Screen
Close
Quit
Jak widać, metoda wnioskowania i reguła stopu mogą być opisane łacznie przez narysowanie dwóch barier na wykresie liczby
sukcesów jako funkcji liczby wykonanych obserwacji. Dopóki błądzenie losowe pozostaje między tymi barierami, należy kontynuować badanie. Jeśli trajektoria przetnie górną barierę (za dużo
sukcesów – za dużo wykrytych elementów wadliwych), zakończymy eksperyment i podejmiemy decyzję o odrzuceniu partii produktów. Gdy zostanie przecięta dolna bariera (za mało sukcesów),
zakończymy eksperyment i podejmiemy decyzję o zaakceptowaniu
danej partii. Liczby an i rn określone we wzorze (3) nazywają
się odpowiednio wartością akceptacji i wartością odrzucenia. Wald udowodnił, że procedura STIP z pewnością doprowadzi
do rozstrzygnięcia w skończonej liczbie kroków.
Jak łatwo zauważyć, żądanie mniejszych prawdopodobieństw
błędnych decyzji powoduje szersze rozsunięcie barier i wzrost średniej liczby prób potrzebnych do podjęcia decyzji.
Procedura STIP ma bardzo przekonujące wyjaśnienie. Ponieważ bariery zatrzymania są równoległymi liniami prostymi, test
ten jest prosty w użyciu. Ale przede wszystkim test ten jest testem optymalnym względem pewnego kryterium. Okazało się
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 14 of 21
Go Back
Full Screen
Close
Quit
w praktyce, że STIP często dawał oszczędność rzędu 50% obserwacji wymaganych przez niesekwencyjną procedurę o tych samych
prawdopodobieństwach błędów. Ten fakt miał taką wartość przy
testowaniu amunicji, że STIP przez pewien czas był tajemnicą wojskową.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 15 of 21
Go Back
Full Screen
Close
Quit
Wald i Wolfowitz (1948) udowodnili, że średnia liczba obserwacji wymagana w STIP do wydania decyzji jest mniejsza niż analogiczna średnia w jakiejkolwiek innej procedurze (sekwencyjnej lub
nie) mającej te same lub mniejsze prawdopodobieństwa błędów.
STIP może być skonstruowany w każdej sytuacji decyzyjnej, gdy
chodzi o przyjęcie jednej z dwóch alternatyw na podstawie ciągu
niezależnych obserwacji. Prowadzi to zawsze do badania błądzenia losowego (lub ogólniej, przebiegu pewnego procesu losowego) z
dwiema równoległymi barierami. STIP dla ogólniejszych procesów
losowych wymaga zaangażowania bardziej skomplikowanej teorii
matematycznej, w szczególności teorii procesów losowych, ale idee
Walda można zastosować także w takich przypadkach.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 16 of 21
Go Back
Full Screen
Close
Quit
4. Obcięty i uogólniony STIP
W niektórych sytuacjach (np. gdy prawdziwa wartość testowanego
parametru różni się znacznie od wartości parametrów określonych
przez obie hipotezy) STIP wymaga bardzo wielu obserwacji przed
podjęciem decyzji. Jeżeli obserwacje są zbyt kosztowne, stosuje się
często zamiast STIP tzw. obcięty STIP, w którym określa się
górną granicę wielkości próbki.
Na Rysunkach 2 i 3 przedstawione są bariery zatrzymania STIP,
w których liczba dokonywanych obserwacji jest ograniczona. Z testami o takich barierach zatrzymania mamy do czynienia np. w
sytuacjach, gdy chcemy porównać dwa leki podając je (w różnych
czasach i losowej kolejności) tym samym pacjentom. Na podstawie badań każdego pacjenta uzyskujemy informację, który z tych
dwóch leków okazał się bardziej skuteczny. Trajektoria wznosząca
się o jednostkę do góry, gdy preferowany jest lek A i opadająca o
jednostkę w dół, gdy preferowany jest lek B, tworzy symetryczne
błądzenie losowe.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 17 of 21
Go Back
Full Screen
Close
Quit
Zadanie polega na sprawdzeniu hipotezy, że oba leki są jednakowo skuteczne przy hipotezie alternatywnej, że jeden z
nich jest lepszy od drugiego.
Decyzja przyjęcia pierwszej z tych hipotez jest konsekwencją
przekroczenia bariery pionowej, podczas gdy przekroczenie bariery
górnej lub dolnej pociąga za sobą przyjęcie hipotezy alternatywnej.
Bariera pionowa wyznacza górną granicę liczby pacjentów, którzy
będą badani. Barierę pionową na Rysunku 2 można ściągnąć do
linii przerywanej, ponieważ trajektoria, która przetnie linię przerywaną, w dalszym swym biegu zawsze już musi przekroczyć barierę
pionową.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 18 of 21
Go Back
Full Screen
Close
Quit
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 19 of 21
Go Back
Full Screen
Rysunek 2: Bariery ograniczonego STIP
Close
Quit
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 20 of 21
Go Back
Rysunek 3: Bariery podwójnie trójkątnego STIP
Full Screen
Close
Quit
Zmodyfikowany STIP, w którym bariery równoległe zastąpione
są przez inne linie proste, tak jak na Rysunku 2 lub 3 nazywa się
uogólnionym STIP.
Innego rodzaju zagadnienie pojawia się w statystycznej kontroli
jakości w przypadku, gdy często ze względów technicznych wygodniej jest pobierać do badania nie pojedyncze sztuki lecz całe ich
zespoły (wiązki, skrzynki, paczki). Procedury sekwencyjne dopuszczające taką możliwość znajdują zastosowania w przemyśle.
Przedstawiony STIP jest narzędziem w problemach decyzyjnych, w których dokonuje się wyboru jednej z dwóch decyzji. Trudniejszy problem dotyczy sytuacji, w której należy dokonać wyboru
jednej spośród więcej niż dwóch decyzji. Taki problem związany
jest z rozszerzeniem koncepcji Walda na ogólniejsze modele statystyczne w celu wyznaczenia nowych narzędzi statystyki matematycznej do rozwiązań wielu zadań w praktyce. Powstające przy
tym problemy matematyczne dotyczą m.in. własności reguł stopu
dla bardzo ogólnych barier i procesów losowych na płaszczyźnie
lub w przestrzeniach o większej liczbie wymiarów.
Obcięty i . . .
Home Page
Title Page
JJ
II
J
I
Page 21 of 21
Go Back
Full Screen
Close
Quit

Znaczenie sekwencyjnego sposobu podejmowania decyzji

Transkrypt

Podobne dokumenty

Toplista Toplista

Podręczniki. Nagrody uzyskane przez

pobierz - Skanska

Badania i Rozwój

Hurtownia napoje BLACK Vitamin Pomarańczowy 250ml

Macie jakie? bardzo trudne puzzle? - Mamy. Mo?e by

Hurtownia napoje Tymbark 0,5l vega śródziemnomorski

DobreSwiece.pl Lampka olejowa Memoriam „Madonna” 4