Jak (nie) oszukiwać - Wydział Elektroniki i Telekomunikacji

Transkrypt

Jak (nie) oszukiwać - Wydział Elektroniki i Telekomunikacji
matematyka
>>r a c h u n e k p r a w d o p o d o b i e ń s t w a
Jak (nie) oszukiwać
FISKUSA
Do czego przydaje się matematyka?
Wbrew pozorom nie tylko do dręczenia
humanistów. Pomocna może być sędziom
w wydawaniu sprawiedliwych wyroków,
uczestnikom teleturniejów w podejmowaniu korzystnych wyborów, a oszustom...
w fałszowaniu zeznań podatkowych.
PIOTR WOŁOWIK
P
IERWSZY AKAPIT dobrego scenariusza powinien
według Hitchcocka rozpoczynać się od przerażającego morderstwa. Potem napięcie ma tylko
rosnąć. W naszych rozważaniach pójdziemy dokładnie tym tropem. Zaczniemy od zbrodni i poprzez
hazard dotrzemy do oszustw podatkowych.
Zbieg w taksówce
W Santa Claus City działają dwie korporacje taksówkowe: Czarna Wołga i Błękitna Nysa. Kierowcy
pierwszej firmy – jak sama nazwa wskazuje – zawsze jeżdżą czarnymi autami, samochody drugiej są niebieskie. Czarne taksówki stanowią 85%, a niebieskie 15% całego
taboru. Pewnej nocy w wypadku zginął pieszy. Potrąciła go
rozpędzona taksówka. Kierowca zbiegł z miejsca wypadku,
nawet nie próbując udzielić pomocy ofierze. Jedynym świadkiem zajścia był starszy człowiek, który umilał sobie samotność podglądaniem bliźnich na ulicy, przesiadując wieczorami przy uchylonych zasłonach. Sąd przeprowadził badania
wiarygodności zeznań świadka w warunkach analogicznych
do tych, w których miał miejsce wypadek. Ocenił, że mężczyzna jest wiarygodny w 80%, tzn. w 4 przypadkach na
5 prawidłowo rozpoznawał kolory taksówek (w nocy oba
mogą wyglądać identycznie). Staruszek zeznał, że sprawcą
feralnego zajścia był kierowca niebieskiego auta.
faktycznie brało udział auto z Błękitnej Nysy, wynosi zaledwie 12%, podczas gdy prawdopodobieństwo, że mimo
wrażenia świadka wypadek spowodowała Czarna Wołga,
wynosi 17%. Niemożliwe? Sprawdźmy!
Możliwe są cztery przypadki:
1.Taksówka była niebieska i świadek właściwie ją rozpoznał
2. Taksówka była niebieska, a świadek się myli, zeznając,
że widział czarną
3. Taksówka była czarna i świadek właściwie ją rozpoznał
4. Taksówka była czarna, świadek uważa, że widział niebieską.
Prawdopodobieństwa wszystkich czterech zdarzeń
obliczone są w poniższej tabeli.
Prawdopodobieństwo,
że świadek się myli,
20%, czyli 0,2
66
W I E D Z A I �ŻŻYYYCCIIEE
SMT AY JC Z2E0Ń0 52 0 0 5
Rys. Bogna Sroka
Fot. Getty Images/Flash Press Media
Wydaj wyrok
Jakie jest prawdopodobieństwo, że taksówka, która spowodowała wypadek, naprawdę była koloru
niebieskiego? Czy można zasądzić od korporacji
Błękitna Nysa odszkodowanie dla rodziny potrąconego
przechodnia? Intuicja podpowiada, że świadkowi można
wierzyć. Jednak, co zdumiewające, szansa, że odpowiedź
udzielona przez świadka jest prawdziwa, tj. że w zajściu
Prawdopodobieństwo,
że świadek się nie myli, 80%,
czyli 0,8
Prawdopodobieństwo,
że taksówka była czarna, 85%,
czyli 0,85
0,2x0,85=0,17
0,85x0,8=0,68
Prawdopodobieństwo,
że taksówka była
niebieska, 15%, czyli 0,15
0,2x0,15=0,03
0,8x0,15=0,12
MAJ 2005
WIEDZA I ŻYCIE
67
Naturalnie prowadzący świetnie wie, gdzie jest nagroda
i ZAWSZE otwiera pustą skrzynkę. Show must go on – prowadzący brnie dalej i kusi: – Może przemyśli pan jeszcze swoją
decyzję? Może pan jeszcze zmienić zdanie! Co na to Kowalski?
Z jednej strony wydaje się, że nie ma co się miotać.
W końcu jest jeden samochód, trzy bramki, szansa trafienia
jest jak jeden do trzech – jakkolwiek by się kombinowało.
A może nie? – Może wcale nie jak jeden do trzech? Może raczej
1324
1342
1423
1432
2134
2143
2314
2341
2413
2431
3124
3142
3214
3241
3412
3421
4123
4132
4213
4231
4312
4321
Zakładamy, że kandydatka nr 1 jest najlepsza, a nr 4 najgorsza.
Kolorem czerwonym zaznaczyliśmy kandydatkę, która zostanie wybrana
w poszczególnych przypadkach, a na żółto te uporządkowania, w których nasza
reguła prowadzi do wyboru najlepszej kandydatki. Zdarza się to, jak widać,
w 11 przypadkach na 24. Strategia optymalnego wyboru zapewni nam więc
sukces z prawdopodobieństwem 11/24, co jest istotną przewagą
nad prymitywną metodą losowego wyboru (wezmę pierwszą lepszą),
co prowadzi do sukcesu z prawdopodobieństwem niemal dwukrotnie mniejszym:
1/4=6/24.
Znajomość rachunku prawdopodobieństwa pozwala
na wyciągnięcie zdumiewającego wniosku: oto składając
zeznania, że widział niebieską taksówkę, świadek z większym prawdopodobieństwem (17%) myli się, niż ma rację
(12%), mimo iż w 4 przypadkach na 5 poprawnie rozpoznaje kolory aut! Ktoś nieobeznany z tymi regułami wnioskowania może podejrzewać, że prawdopodobieństwo,
iż w wypadku uczestniczyła taksówka niebieska, wynosi
80%, czyli tyle co wiarygodność świadka. Oznacza to, że
naiwne wnioskowanie bez znajomości matematyki może
przyczynić się do oskarżenia i skazania całkowicie niewinnych osób.
Idź na całość
Nie tak dawno bardzo modny był w telewizji Polsat teleturniej „Idź na całość” prowadzony przez Zygmunta
Chajzera. Mieliśmy tam do czynienia z kolejnym paradoksem złudnego postrzegania zwanym „Monty Hall”. Uczestnik
pod koniec gry ma wybrać jedną z trzech bram, za którą ukryta jest główna nagroda. Kiedy już się zdecyduje, prowadzący
– dla lepszego efektu dramatycznego – mówi: – A teraz przekonajmy się, co my tu mamy… – i otwiera jedną z bramek
odrzuconych przez zwycięzcę teleturnieju. – Czy tu jest samochód? Zobaczmy! Nie!!! – wykrzykuje. – To prawdziwe szczęście,
że nie na tę bramkę pan stawiał, panie Kowalski! Gratulacje.
68
WIEDZA I ŻYCIE
MAJ 2005
Matematyka matrymonialna
W bajkach książęta przed dokonaniem najważniejszego życiowego kroku długo podróżują po egzotycznych królestwach w poszukiwaniu kandydatki
na żonę. Im więcej księżniczek obejrzą, tym większy mają
wybór, ale – z drugiej strony – nie warto tych eliminacji ciągnąć w nieskończoność. W końcu przecież – dbając
o ciągłość sukcesji – trzeba podjąć decyzję i „żyć długo
i szczęśliwie”. Czy i w tym wypadku istnieje optymalna
strategia wyboru? Okazuje się, że tak, i to nawet wówczas, gdy weźmiemy pod uwagę, że – jak to często w życiu bywa – raz odrzucona dama nigdy już nie przyjmie
ponownie oferowanych jej względów. Inaczej mówiąc,
po obejrzeniu 107. księżniczki nie możemy zdecydować
się na tę z pierwszego królestwa – zresztą zapewne jest już
na to za późno, została dawno wyswatana. Musimy więc
zdecydować się na aktualną kandydatkę lub prowadzić poszukiwania dalej.
Podobna sytuacja miałaby miejsce, gdyby nasz bogaty
ekscentryczny wujek dysponujący kilkudziesięcioma samochodami chciał nam jeden z nich podarować. Daje nam do
sprawdzenia kolejne, ale pod warunkiem że wybierzemy
aktualnie testowane auto, tzn. nie mamy możliwości powrotu do poprzednich modeli, które z jakichś powodów
odrzuciliśmy.
Jak wybrać najlepsze auto? Jeżeli podoba nam się to,
które właśnie testujemy, to przyjmując je, automatycznie
tracimy możliwość trafienia na jeszcze bardziej wystrzałowe. Jeżeli zaś je odrzucimy, ryzykujemy, że wśród reszty
pozostały już tylko dużo gorsze modele. Jaka jest optymalna
strategia postępowania w tym przypadku?
waniami a rzeczywistością wykrycie fałszerstwa jest stosunkowo proste. Programy wykorzystujące prawo Benforda są już
używane przez urzędy skarbowe w niektórych krajach. Samo
prawo – co jest bardzo istotne – jest niezmienne w skali, tzn.
nie ma znaczenia, czy na przykład kwoty pieniężne podane
są w złotówkach, euro, jenach, czy dolarach.
Przeglądając przedstawione wykresy, zauważamy, że częstość występowania cyfr o małych wartościach na najbardziej
znaczącej pozycji jest bardziej prawdopodobna niż o du��������������
������
�����
�����
����
����
����
����
����
���
����
����
����
���
�����
����
����
�
��������������������������
������
�����
�����
����
����
���
����
��
����
�����
�������������������������������
���������������������������������
�����
�����
�����
����
����
����
����
����
���
��
��
��
��
��
��
Prawo Benforda
opisuje rozkład
prawdopodobieństwa wystąpienia
określonej cyfry
od 1 do 9 na pozycji najbardziej
znaczącej.
Matematycznie
definiuje to następująca formuła:
P(d)= log(1+1/d)
dla d={1, 2,...,9}
��������������������������
��������������������
1243
Teodor Hill, dr matematyki na politechnice w Georgii, poprosił swych studentów, aby w ramach pracy
domowej rzucili 200 razy monetą i zapisali na kartce wyniki poszczególnych losowań albo – jeśli wolą – by
jedynie udawali, że rzucają i oddali kartkę z wymyślonym
losowym ciągiem liter O i R (orły i reszki). Następnego dnia
oglądał ich notatki i – niczym jasnowidz – ku powszechnemu zdumieniu zgadywał, kto faktycznie rzucał monetą,
a kto zapisał wyniki eksperymentu z głowy. Jak to możliwe?
Wymyślając wyniki, ludzie unikają ciągów „orłów lub reszek” występujących po sobie kolejno sześć lub więcej razy,
ponieważ wydają się im one bardzo mało prawdopodobne,
choć naprawdę taka kombinacja zdarza się całkiem często.
Z podobnym „problemem” ma do czynienia osoba próbująca sfałszować wyniki na przykład zeznania podatkowego. To, że liczby w formularzu PIT wzięte są z głowy, można
bardzo łatwo wykryć przy użyciu programu komputerowego
bazującego na tzw. prawie Benforda. Dotyczy ono rozkładu
cyfr znaczących (czyli występujących na pierwszym miejscu) we wszelkiego rodzaju zbiorach danych. Okazuje się,
że częstość występowania poszczególnych cyfr na pierwszej
pozycji w różnego rodzaju liczbach kilkucyfrowych nie jest
jednakowa. Dzięki tej rozbieżności między ludzkimi oczeki-
��������������������
1234
„Oszukać” fiskusa
������
�����
�����
��
��
��
�����
����
�����
���
����
���
��
��
��
��
��
�
��
��
��
��
��
��
Dzięki niemu
możliwe jest wykrycie osób próbujących uniknąć
płacenia podatków lub osób podejrzanych o różnego typu inne
fałszerstwa
�
�
�
�
��
��
��
��
��
��
��������������
��������������� ������� ��������������
Rys. na podstawie „American Scientist” – Piotr Zagórowski
Optymalna strategia wyboru żony spośród czterech kandydatek zakłada
obejrzenie i odrzucenie pierwszej kandydatki, a następnie przystanie na
tę z kolejnych, która będzie lepsza od pierwszej (lub wybór ostatniej, jeśli
pierwsza jednak okazała się najlepsza). Poniżej wypisano wszystkie możliwe
uporządkowania, w jakich kandydatki mogą zgłaszać się na rozmowę:
jeden do dwóch – w końcu już wiem, gdzie samochodu na pewno
nie ma. Nawet jeśli mam 50% szansy na samochód – spekuluje
Kowalski – to w końcu nie ma żadnego znaczenia, czy zmienię
bramkę, czy nie. Nie dam się podpuścić!
Tymczasem gracz obeznany z rachunkiem prawdopodobieństwa wie, że optymalną strategią jest jednak
w tym wypadku zmiana bramy. Strategia ta gwarantuje zwycięstwo aż w 2/3 przypadków, a więc szansa na
zwycięstwo rośnie do ponad 66%. Intuicyjnie wydaje się
to niemożliwością, ale ma swoje matematyczne uzasadnienie, a nieznajomość tego paradoksu często kosztowała
uczestników gry utratę głównej wygranej.
Jak to możliwe? I dlaczego prawdopodobieństwo wygranej tak gwałtownie rośnie? Otóż mamy przecież w tej
rozgrywce pomocnika – prowadzącego program – i wiemy,
że wystąpi on w pewnym momencie z bardzo istotną podpowiedzią – mianowicie pokaże bramkę, za którą nie będzie
samochodu. Jeśli za pierwszym razem wybraliśmy dobrze
i stanęliśmy przy drzwiach, za którymi kryje się główna wygrana, a potem zmienimy zdanie – no to faktycznie, mieliśmy pecha. Ale ten pech dopada nas jedynie w 1/3 przypadków. W pozostałych 2/3, gdy początkowo staliśmy przy
pustej bramce, a prowadzący pokazał nam, gdzie jest druga
pusta, kluczyki do samochodu już nam brzęczą w kieszeni!
Rys. Bogna Sroka
Matematyka matrymonialna, czyli lepsze wrogiem dobrego
Otóż należy obejrzeć 37% aut, wybrać najlepsze z nich
(dajmy na to, niech to będzie znakomicie zachowany bentley z 1926 roku, rówieśnik miesięcznika „Wiedza i Życie”)
i w dalszych testach zdecydować się na pierwsze auto, które
zachwyci nas bardziej niż blisko stuletni bentley.
Szansa trafienia w dziesiątkę, czyli wyboru najlepszego
auta przy zastosowaniu tej strategii, wynosi 37%. Zagadnienie
nie jest tak abstrakcyjne, jak je tu żartobliwie przedstawiamy, i znajduje zastosowanie dużo szersze niż rozwiązywanie
problemów matrymonialnych książąt czy ekscentrycznych
bogaczy. Znajomość tej strategii przydaje się podczas podejmowania decyzji ekonomicznych, takich jak przyjmowanie
ofert produkcyjnych lub proponowanych cen wystawionej
na sprzedaż nieruchomości (tj. sprzedać mieszkanie teraz czy
czekać, aż znajdzie się klient, który da więcej?).
��
��
�
������������������
Rysunek przedstawia rozkład Benforda dla cyfr znajdujących się
w gazetach, spisie ludności oraz na giełdzie (Dow Jones jest to
główny indeks Nowojorskiej Giełdy Papierów Wartościowych, odpowiednik naszego indeksu WIG). Dotyczy on również wszystkich
innych danych tabelarycznych występujących w przyrodzie, takich
z jakimi mamy do czynienia w tablicach matematycznych, fizycznych, geograficznych, tabelach wyników sportowych, tabelach rachunków za energię elektryczną oraz tabelach zeznań płatniczych
lub podatkowych.
��������������
��������������
�����������������
������������
������������
������
żych. Ktoś, kto losowo starałby się wymyślać dane do PIT-ów,
nie znając tego prawa, naraziłby się na wykrycie fałszerstwa
przez program testujący pracujący na usługach skarbówki.
Znajomość tego prawa może jednak nieuczciwym osobom
pomóc w uniknięciu wykrycia fałszerstwa – wystarczy przecież wpisać liczby wymyślone zgodnie z tym prawem.
Autor przedstawił to zagadnienie jako ciekawostkę matematyczną w ramach popularyzacji nauki i w żadnym razie nie zachęca do prób oszukiwania fiskusa.
PIOTR WOŁOWIK
jest doktorantem
w Instytucie Elektroniki
i Telekomunikacji
Politechniki Poznańskiej.
MAJ 2005
WIEDZA I ŻYCIE
69