Gdy rządzi przypadek... - Centrum Nauki Kopernik

Transkrypt

Gdy rządzi przypadek... - Centrum Nauki Kopernik
Eksperymentuj!
Gdy rządzi przypadek...
Do czego może się przydać znajomość rachunku
prawdopodobieństwa? Okazuje się, że pozwala on
fiskusowi łapać nieuczciwych podatników, pomaga
w łamaniu szyfrów, przydaje się grającym w lotto,
a także znajduje zastosowanie przy szyciu ubrań.
CENTRUM NAUKI
KOPERNIK
Trochę teorii
Eksperymentuj!
D
ziwna deska z kołkami i przegródkami, którą można obejrzeć na
wystawie, zwana jest tablicą Galtona.
Pozwala ona eksperymentalnie pokazać, na czym polega tak zwany rozkład zmiennej losowej – jedno z najważniejszych narzędzi współczesnej
statystyki.
Pojęcie zmiennej losowej pojawiło się
w matematyce w XVIII wieku za sprawą Blaisa Pascala i Pierre’a de Fermata, którzy usiłowali w matematyczne
ramy ująć to, co na pierwszy rzut oka
uchwycić się w te ramy nie da, czyli gry
losowe, takie jak kości czy ruletka.
Matematycy nie są w stanie odpowiedzieć na pytanie, jakie padną liczby w najbliższym losowaniu Dużego
Lotka, mogą jednak zaprojektować
biznesowe podstawy gry losowej. Taka
gra nie może być zbyt trudna, by raz
na kilka losowań ktoś mógł wygrać,
i nie może być zbyt prosta, by nagroda
pieniężna za wylosowanie szóstki była
wystarczająco atrakcyjna.
Z czasem matematycy rozwinęli
ogromny aparat do badania zjawisk,
w których rządzi przypadek.
Tablica Galtona jest sposobem na
pokazanie pewnego eksperymentu
losowego. Kulka wrzucona na samej
górze spada na pierwszy kołek i z jednakowym prawdopodobieństwem
może polecieć w lewo albo w prawo. Piętro niżej jest tak samo i tak
dalej aż do przegródki na samym dole.
Podstawowym rozkładem zmiennych
losowych jest rozkład normalny zwany
też rozkładem Gaussa. Ilustruje on
zjawiska, które cechuje przypadkowość
Eksperyment przypomina wielokrotny rzut monetą – jak wypadnie reszka, kierujemy kulkę w lewo, jak orzeł
– w prawo.
Wystarczy wrzucić kilka kulek do lejka na górze, by zorientować się, że nie
wszystkie przegródki na dole zapełniają
się w jednakowym tempie. To logiczne,
bo do skrajnych przegródek prowadzi
mniej dróg dojścia niż do środkowych.
Prawdopodobieństwo trafienia kulki do
danej przegródki opisane jest przez tak
zwany schemat Bernoulliego, bardzo
często spotykany w szkole na wszelkich
klasówkach i sprawdzianach z rachunku prawdopodobieństwa.
Jeśli ponumerujemy przegródki na
dole tablicy Galtona, to możemy mówić, że numer przegródki, do której trafi kulka, jest zmienną losową. Funkcję,
Szkic wykonany
przez Galtona
w 1889 roku
pokazuje
tablicę,
nazwaną od
jego nazwiska
tablicą Galtona.
Miała ona
zilustrować, jaki
wpływ na
mierzoną
wielkość mają
losowe
zdarzenia, które
z jednakowym
prawdopodobieństwem
zwiększają
i zmniejszają
wyniki pomiaru
Fot. Corbis, East News, archiwum x2; rys. Małgorzata Świentczak
Rozkład normalny jest jednym z najważniejszych rozkładów statystycznych,
ponieważ opisuje wiele zjawisk, które spotykamy w naturze. Podlega mu wiele cech
fizjologicznych, np. wzrost uczniów w danej szkole lub masa ich ciała
która każdemu numerowi przegródki
przyporządkowuje prawdopodobieństwo wpadnięcia do niej kulki, nazywamy rozkładem prawdopodobieństwa.
Łatwo zauważyć, że jeśli wrzucimy do
lejka na górze deski odpowiednio dużo
kulek, to w przegródkach zaczną się
one układać w krzywą przypominającą
dzwon. Dotykamy tu najważniejszego
twierdzenia rachunku prawdopodobieństwa, zwanego centralnym twierdzeniem granicznym. Twierdzenie ma
kilka szczegółowych założeń i nie warto
przytaczać go w całości, ale można je
streścić w następujący sposób: w większości przypadków suma zmiennych
losowych jest zmienną losową o rozkładzie przypominającym dzwon.
Krzywa dzwonowa ma swoją nazwę
– mówimy o niej, że jest albo „rozkładem normalnym”, albo „krzywą
Gaussa”. Mówimy o niej „normalna”,
opisuje bowiem większość zjawisk losowych spotykanych w codziennym życiu,
takich jak np. odchylenie od średniego
wzrostu, błąd pomiaru, wyniki głosowania w wyborach, rozkład punktacji
z testów egzaminacyjnych itp.
Nazwisko Gaussa związane jest
z tym rozkładem dlatego, że ten wielki
niemiecki matematyk bardzo przyczynił się do zrozumienia mechanizmów
rządzących rozkładem normalnym,
choć nie on go odkrył.
O historii
D
zieło „O grze w kości” Gerolama
Cardano (1501-1576) było pierwszą
znaną pracą poświęconą rachunkowi
prawdopodobieństwa.
Później tym samym zagadnieniem
zajmowali się w XVII wieku Pierre de Fermat, Blaise Pascal i Christiaan Huygens.
Jednak dopiero w XVIII wieku Jakob Bernoulli i Abraham de Movire zaczęli traktować rachunek prawdopodobieństwa
jako gałąź matematyki. Ponieważ na
początku głównie chodziło o opisanie
zasad rządzących grami hazardowymi,
wszystkie ówczesne prace skupiały się
na rozkładach dyskretnych, to znaczy
takich, w których liczba losowań jest
skończona (albo przeliczalna).
W XVIII wieku za sprawą Rogera Cotesa zaczęto stosować rachunek prawdopodobieństwa do szacowania błędów
pomiarowych, co było później rozwijane
przez Pierre’a-Simona Laplace’a, który jako pierwszy zaczął przedstawiać rozkład
błędu pomiarowego jako krzywą. To
właśnie jego teorię później wyszlifował
Carl Friedrich Gauss (1777-1855) i dziś
opis rozkładu normalnego jest często
zwany rozkładem Gaussa.
W trakcie badań nad geograficznymi
danymi pomiarowymi Gauss zauważył,
że część wyników odbiega od pewnej
Zasługę odkrycia rozkładu normalnego przypisuje się Carlowi Friedrichowi Gaussowi.
Podobizna tego wielkiego matematyka nazywanego przez sobie współczesnych
księciem matematyków widniała na dziesięciomarkowym banknocie
średniej wartości. Na każdy wynik pomiarów odległości wpływało mnóstwo czynników, takich choćby jak temperatura powietrza w danym dniu. Gauss stwierdził,
że pewne odchylenia są naturalne i nie
trzeba się nimi przejmować. Wcześniej
wielu naukowców tego nie wiedziało,
więc w ich pracach, w których dowodzą
eksperymentalnie swoich tez, możemy
znaleźć wyniki pomiarów, w których błąd
nie ma rozkładu Gaussa. Wprawdzie są
takie zjawiska, w których błąd pomiaru
rzeczywiście ma niegaussowski rozkład,
ale w większości wypadków dane eksperymentalne były po prostu delikatnie
fałszowane – uczeni wyrzucali wyniki ich
zdaniem sprzeczne z dowodzoną tezą.
W XX wieku probabilistyka wkroczyła
w nowe rejony, okazało się bowiem, że
nowa gałąź fizyki – fizyka kwantowa
– rządzi się właśnie prawami rachunku prawdopodobieństwa. Wiele właściwości materii opisywanych jest jako
prawdopodobieństwo wystąpienia sumy
stanów kwantowych poszczególnych
cząsteczek elementarnych.
Współczesne zastosowania
R
ozkłady prawdopodobieństwa stosowane są we wszelkiego rodzaju
badaniach statystycznych. Na przykład
wzrost ludzi w określonej populacji
(np. dorosłych mężczyzn mieszkających w Polsce) układa się według rozkładu normalnego. Gdyby producenci
ubrań robili tyle samo garniturów na
każdy wzrost, w magazynach zostawałoby im mnóstwo ubrań uszytych
na wyjątkowo wysokich ludzi i wyjątkowo niskich. Dzięki rozkładowi normalnemu łatwo oszacować, ile trzeba
zrobić sztuk w każdym rozmiarze przy
założeniu, że chcemy wyprodukować, dajmy na to, 10 tys. garniturów.
W ten sposób każdy, kto wchodzi do
sklepu, ma szansę dobrać ubranie na
swój wzrost, a producenci nie muszą
wydawać niepotrzebnie pieniędzy na
to, co sprzedaje się słabo.
Znajomość rachunku prawdopodobieństwa przydaje się w wielu praktycznych
sytuacjach, np. w prowadzeniu interesów. Producenci ubrań muszą brać pod uwagę,
ile sztuk odzieży w konkretnym rozmiarze ma szanse znaleźć nabywców
E
merytowany dziś profesor matematyki Teodor Hill z Atlanty przeprowadził kiedyś ze studentami eksperyment. Poprosił ich o wykonanie 200
rzutów monetą i zapisanie wyniku
losowania na kartce. Zasugerował też,
że jeśli komuś nie będzie się chciało
przeprowadzić losowania, może oddać kartkę z wymyślonymi wynikami.
Następnego dnia zebrał notatki i ku
zaskoczeniu studentów bez trudu
wskazał tych, którzy wpisali wyniki
z głowy. Na jakiej podstawie? Otóż
zazwyczaj wydaje się nam, że skoro
wypadł np. orzeł, to następna powinna wypaść reszka, żeby było bardziej
losowo. Unikamy więc ciągów orłów
lub reszek występujących po sobie
kilka razy z rzędu.
Tego typu wpadki mogą mieć poważne konsekwencje dla osób, które próbują sfałszować np. zeznanie
podatkowe. Okazuje sie bowiem, że
częstość występowania określonych
cyfr na pierwszym miejscu w różnych
zbiorach danych nie jest jednakowa.
Prawidłowość tę matematycy nazywają prawem Benforda i wystarczy
zastosować program komputerowy
opierający się na tym prawie, aby wytypować zeznania podatkowe, w które
wpisano dane wzięte z głowy.
Rozkład prawdopodobieństwa występowania cyfr na pierwszym miejscu
w różnych zbiorach danych opisuje
prawo Benforda. Pozwala ono na wykrycie sfałszowanych zeznań podatkowych
W kryptologii jednym z najbezpieczniejszych sposobów szyfrowania informacji jest użycie tzw. klucza losowego
– czyli ciągu liczb losowych. W czasie
II wojny światowej Rosjanie wykorzystywali ten sposób do szyfrowania
wiadomości. Tyle że do generowania
ksiąg kodowych wykorzystali litery
„losowo” wypisywane przez ludzi.
Niemcy dość szybko zorientowali się,
że klucze szyfrujące nie są w pełni
losowe – można było znaleźć w nich
pewne regularności wynikające z tego, że osoba pisząca „losowy” ciąg
znaków nie chciała używać liter, które
przed chwilą napisała, a co więcej,
pisząc na maszynie, nie chciała używać znaków ze środka klawiatury. To
pomogło w złamaniu pozornie bezpiecznych szyfrów.
Nawet ciągi liczb otrzymywane za
pomocą komputera są liczbami pseudolosowymi, gdyż są generowane
przez mikroprocesor według algorytmu, którego punktem wyjścia jest
licznik cykli zegara od momentu uruchomienia mikroprocesora. Zakłada się
jednak, że moment startu programu
generującego liczby jest losowy, a poza
tym czas wykonywania zadania zależy
od czynników losowych – na przykład
liczby programów wykonywanych
przez mikroprocesor oprócz generatora liczb losowych. Może się jednak
zdarzyć, że wyniki pracy takiego generatora będą bardzo powtarzalne.
W jaki sposób można więc znaleźć
prawdziwie losowy ciąg znaków.
W praktyce dobrym źródłem może
być na przykład zapis płci dzieci rodzących się po kolei w jakimś szpitalu
w długim okresie.
Więcej doświadczeń
Fot. Corbis, Centrum Nauki Kopernik
W internecie
1. Poproś o pomoc w przeprowadzeniu tego doświadczenia kilku kolegów
i koleżanek z klasy – niech każdy 20 razy rzuci monetą i zapisze, ile wypadło
orłów. Na tablicy narysuj tabelkę z liczbami od 0 do 20, po czym policz, ilu
uczniom wypadło 0 orłów, ilu 1, ilu
2 i tak dalej aż do 20. Dane z tabelki
można przedstawić w postaci wykresu,
gdzie na jednej osi będzie liczba orłów, na drugiej liczba uczniów, którzy
otrzymali dany wynik doświadczenia.
Jak wygląda wykres?
2. Weź z kolektury Lotto 30 kuponów
Dużego Lotka i daj do wypełnienia 30
osobom. Zsumuj liczby zakreślone na
każdym kuponie i przedstaw otrzymane wyniki w formie wykresu jak w poprzednim przypadku. Poproś kogoś,
CENTRUM NAUKI
KOPERNIK
kto ma wystarczająco dużo cierpliwości, żeby wypełnił sam 30 kuponów,
zaznaczając, aby zrobił to losowo.
W tym przypadku sumy skreślonych
liczb prawdopodobnie nie ułożą się
w krzywą dzwonową. Dlaczego?
3. Skreśl na kuponie Dużego Lotka
sześć dowolnych liczb i sześć liczb
w jednym rzędzie (pionowym lub poziomym). Pokaż komuś, kto gra w Lotto, i spytaj, który układ ma większe
szanse na wylosowanie. Prawie nikt
z pytanych nie wskaże na liczby skreślone w jednym rzędzie, choć z punktu
widzenia rachunku prawdopodobieństwa taki układ jest równie dobry jak
każdy inny. Ten sposób typowania
liczb ma jednak pewną zaletę – czy
potrafisz powiedzieć jaką?
Trójkąt Pascala
www.mathsisfun.com/pascalstriangle.html
Interaktywna tablica Galtona
http://demonstrations.wolfram.com/
FlexibleGaltonBoard/
Prawo Benforda
http://mathworld.wolfram.com/
BenfordsLaw.html
Hazard i matematyka
http://serwisy.gazeta.pl/nauka
/1,34148,2476793.html
www.kopernik.org.pl
Eksperymentuj!
A to ciekawe