Gdy rządzi przypadek... - Centrum Nauki Kopernik
Transkrypt
Gdy rządzi przypadek... - Centrum Nauki Kopernik
Eksperymentuj! Gdy rządzi przypadek... Do czego może się przydać znajomość rachunku prawdopodobieństwa? Okazuje się, że pozwala on fiskusowi łapać nieuczciwych podatników, pomaga w łamaniu szyfrów, przydaje się grającym w lotto, a także znajduje zastosowanie przy szyciu ubrań. CENTRUM NAUKI KOPERNIK Trochę teorii Eksperymentuj! D ziwna deska z kołkami i przegródkami, którą można obejrzeć na wystawie, zwana jest tablicą Galtona. Pozwala ona eksperymentalnie pokazać, na czym polega tak zwany rozkład zmiennej losowej – jedno z najważniejszych narzędzi współczesnej statystyki. Pojęcie zmiennej losowej pojawiło się w matematyce w XVIII wieku za sprawą Blaisa Pascala i Pierre’a de Fermata, którzy usiłowali w matematyczne ramy ująć to, co na pierwszy rzut oka uchwycić się w te ramy nie da, czyli gry losowe, takie jak kości czy ruletka. Matematycy nie są w stanie odpowiedzieć na pytanie, jakie padną liczby w najbliższym losowaniu Dużego Lotka, mogą jednak zaprojektować biznesowe podstawy gry losowej. Taka gra nie może być zbyt trudna, by raz na kilka losowań ktoś mógł wygrać, i nie może być zbyt prosta, by nagroda pieniężna za wylosowanie szóstki była wystarczająco atrakcyjna. Z czasem matematycy rozwinęli ogromny aparat do badania zjawisk, w których rządzi przypadek. Tablica Galtona jest sposobem na pokazanie pewnego eksperymentu losowego. Kulka wrzucona na samej górze spada na pierwszy kołek i z jednakowym prawdopodobieństwem może polecieć w lewo albo w prawo. Piętro niżej jest tak samo i tak dalej aż do przegródki na samym dole. Podstawowym rozkładem zmiennych losowych jest rozkład normalny zwany też rozkładem Gaussa. Ilustruje on zjawiska, które cechuje przypadkowość Eksperyment przypomina wielokrotny rzut monetą – jak wypadnie reszka, kierujemy kulkę w lewo, jak orzeł – w prawo. Wystarczy wrzucić kilka kulek do lejka na górze, by zorientować się, że nie wszystkie przegródki na dole zapełniają się w jednakowym tempie. To logiczne, bo do skrajnych przegródek prowadzi mniej dróg dojścia niż do środkowych. Prawdopodobieństwo trafienia kulki do danej przegródki opisane jest przez tak zwany schemat Bernoulliego, bardzo często spotykany w szkole na wszelkich klasówkach i sprawdzianach z rachunku prawdopodobieństwa. Jeśli ponumerujemy przegródki na dole tablicy Galtona, to możemy mówić, że numer przegródki, do której trafi kulka, jest zmienną losową. Funkcję, Szkic wykonany przez Galtona w 1889 roku pokazuje tablicę, nazwaną od jego nazwiska tablicą Galtona. Miała ona zilustrować, jaki wpływ na mierzoną wielkość mają losowe zdarzenia, które z jednakowym prawdopodobieństwem zwiększają i zmniejszają wyniki pomiaru Fot. Corbis, East News, archiwum x2; rys. Małgorzata Świentczak Rozkład normalny jest jednym z najważniejszych rozkładów statystycznych, ponieważ opisuje wiele zjawisk, które spotykamy w naturze. Podlega mu wiele cech fizjologicznych, np. wzrost uczniów w danej szkole lub masa ich ciała która każdemu numerowi przegródki przyporządkowuje prawdopodobieństwo wpadnięcia do niej kulki, nazywamy rozkładem prawdopodobieństwa. Łatwo zauważyć, że jeśli wrzucimy do lejka na górze deski odpowiednio dużo kulek, to w przegródkach zaczną się one układać w krzywą przypominającą dzwon. Dotykamy tu najważniejszego twierdzenia rachunku prawdopodobieństwa, zwanego centralnym twierdzeniem granicznym. Twierdzenie ma kilka szczegółowych założeń i nie warto przytaczać go w całości, ale można je streścić w następujący sposób: w większości przypadków suma zmiennych losowych jest zmienną losową o rozkładzie przypominającym dzwon. Krzywa dzwonowa ma swoją nazwę – mówimy o niej, że jest albo „rozkładem normalnym”, albo „krzywą Gaussa”. Mówimy o niej „normalna”, opisuje bowiem większość zjawisk losowych spotykanych w codziennym życiu, takich jak np. odchylenie od średniego wzrostu, błąd pomiaru, wyniki głosowania w wyborach, rozkład punktacji z testów egzaminacyjnych itp. Nazwisko Gaussa związane jest z tym rozkładem dlatego, że ten wielki niemiecki matematyk bardzo przyczynił się do zrozumienia mechanizmów rządzących rozkładem normalnym, choć nie on go odkrył. O historii D zieło „O grze w kości” Gerolama Cardano (1501-1576) było pierwszą znaną pracą poświęconą rachunkowi prawdopodobieństwa. Później tym samym zagadnieniem zajmowali się w XVII wieku Pierre de Fermat, Blaise Pascal i Christiaan Huygens. Jednak dopiero w XVIII wieku Jakob Bernoulli i Abraham de Movire zaczęli traktować rachunek prawdopodobieństwa jako gałąź matematyki. Ponieważ na początku głównie chodziło o opisanie zasad rządzących grami hazardowymi, wszystkie ówczesne prace skupiały się na rozkładach dyskretnych, to znaczy takich, w których liczba losowań jest skończona (albo przeliczalna). W XVIII wieku za sprawą Rogera Cotesa zaczęto stosować rachunek prawdopodobieństwa do szacowania błędów pomiarowych, co było później rozwijane przez Pierre’a-Simona Laplace’a, który jako pierwszy zaczął przedstawiać rozkład błędu pomiarowego jako krzywą. To właśnie jego teorię później wyszlifował Carl Friedrich Gauss (1777-1855) i dziś opis rozkładu normalnego jest często zwany rozkładem Gaussa. W trakcie badań nad geograficznymi danymi pomiarowymi Gauss zauważył, że część wyników odbiega od pewnej Zasługę odkrycia rozkładu normalnego przypisuje się Carlowi Friedrichowi Gaussowi. Podobizna tego wielkiego matematyka nazywanego przez sobie współczesnych księciem matematyków widniała na dziesięciomarkowym banknocie średniej wartości. Na każdy wynik pomiarów odległości wpływało mnóstwo czynników, takich choćby jak temperatura powietrza w danym dniu. Gauss stwierdził, że pewne odchylenia są naturalne i nie trzeba się nimi przejmować. Wcześniej wielu naukowców tego nie wiedziało, więc w ich pracach, w których dowodzą eksperymentalnie swoich tez, możemy znaleźć wyniki pomiarów, w których błąd nie ma rozkładu Gaussa. Wprawdzie są takie zjawiska, w których błąd pomiaru rzeczywiście ma niegaussowski rozkład, ale w większości wypadków dane eksperymentalne były po prostu delikatnie fałszowane – uczeni wyrzucali wyniki ich zdaniem sprzeczne z dowodzoną tezą. W XX wieku probabilistyka wkroczyła w nowe rejony, okazało się bowiem, że nowa gałąź fizyki – fizyka kwantowa – rządzi się właśnie prawami rachunku prawdopodobieństwa. Wiele właściwości materii opisywanych jest jako prawdopodobieństwo wystąpienia sumy stanów kwantowych poszczególnych cząsteczek elementarnych. Współczesne zastosowania R ozkłady prawdopodobieństwa stosowane są we wszelkiego rodzaju badaniach statystycznych. Na przykład wzrost ludzi w określonej populacji (np. dorosłych mężczyzn mieszkających w Polsce) układa się według rozkładu normalnego. Gdyby producenci ubrań robili tyle samo garniturów na każdy wzrost, w magazynach zostawałoby im mnóstwo ubrań uszytych na wyjątkowo wysokich ludzi i wyjątkowo niskich. Dzięki rozkładowi normalnemu łatwo oszacować, ile trzeba zrobić sztuk w każdym rozmiarze przy założeniu, że chcemy wyprodukować, dajmy na to, 10 tys. garniturów. W ten sposób każdy, kto wchodzi do sklepu, ma szansę dobrać ubranie na swój wzrost, a producenci nie muszą wydawać niepotrzebnie pieniędzy na to, co sprzedaje się słabo. Znajomość rachunku prawdopodobieństwa przydaje się w wielu praktycznych sytuacjach, np. w prowadzeniu interesów. Producenci ubrań muszą brać pod uwagę, ile sztuk odzieży w konkretnym rozmiarze ma szanse znaleźć nabywców E merytowany dziś profesor matematyki Teodor Hill z Atlanty przeprowadził kiedyś ze studentami eksperyment. Poprosił ich o wykonanie 200 rzutów monetą i zapisanie wyniku losowania na kartce. Zasugerował też, że jeśli komuś nie będzie się chciało przeprowadzić losowania, może oddać kartkę z wymyślonymi wynikami. Następnego dnia zebrał notatki i ku zaskoczeniu studentów bez trudu wskazał tych, którzy wpisali wyniki z głowy. Na jakiej podstawie? Otóż zazwyczaj wydaje się nam, że skoro wypadł np. orzeł, to następna powinna wypaść reszka, żeby było bardziej losowo. Unikamy więc ciągów orłów lub reszek występujących po sobie kilka razy z rzędu. Tego typu wpadki mogą mieć poważne konsekwencje dla osób, które próbują sfałszować np. zeznanie podatkowe. Okazuje sie bowiem, że częstość występowania określonych cyfr na pierwszym miejscu w różnych zbiorach danych nie jest jednakowa. Prawidłowość tę matematycy nazywają prawem Benforda i wystarczy zastosować program komputerowy opierający się na tym prawie, aby wytypować zeznania podatkowe, w które wpisano dane wzięte z głowy. Rozkład prawdopodobieństwa występowania cyfr na pierwszym miejscu w różnych zbiorach danych opisuje prawo Benforda. Pozwala ono na wykrycie sfałszowanych zeznań podatkowych W kryptologii jednym z najbezpieczniejszych sposobów szyfrowania informacji jest użycie tzw. klucza losowego – czyli ciągu liczb losowych. W czasie II wojny światowej Rosjanie wykorzystywali ten sposób do szyfrowania wiadomości. Tyle że do generowania ksiąg kodowych wykorzystali litery „losowo” wypisywane przez ludzi. Niemcy dość szybko zorientowali się, że klucze szyfrujące nie są w pełni losowe – można było znaleźć w nich pewne regularności wynikające z tego, że osoba pisząca „losowy” ciąg znaków nie chciała używać liter, które przed chwilą napisała, a co więcej, pisząc na maszynie, nie chciała używać znaków ze środka klawiatury. To pomogło w złamaniu pozornie bezpiecznych szyfrów. Nawet ciągi liczb otrzymywane za pomocą komputera są liczbami pseudolosowymi, gdyż są generowane przez mikroprocesor według algorytmu, którego punktem wyjścia jest licznik cykli zegara od momentu uruchomienia mikroprocesora. Zakłada się jednak, że moment startu programu generującego liczby jest losowy, a poza tym czas wykonywania zadania zależy od czynników losowych – na przykład liczby programów wykonywanych przez mikroprocesor oprócz generatora liczb losowych. Może się jednak zdarzyć, że wyniki pracy takiego generatora będą bardzo powtarzalne. W jaki sposób można więc znaleźć prawdziwie losowy ciąg znaków. W praktyce dobrym źródłem może być na przykład zapis płci dzieci rodzących się po kolei w jakimś szpitalu w długim okresie. Więcej doświadczeń Fot. Corbis, Centrum Nauki Kopernik W internecie 1. Poproś o pomoc w przeprowadzeniu tego doświadczenia kilku kolegów i koleżanek z klasy – niech każdy 20 razy rzuci monetą i zapisze, ile wypadło orłów. Na tablicy narysuj tabelkę z liczbami od 0 do 20, po czym policz, ilu uczniom wypadło 0 orłów, ilu 1, ilu 2 i tak dalej aż do 20. Dane z tabelki można przedstawić w postaci wykresu, gdzie na jednej osi będzie liczba orłów, na drugiej liczba uczniów, którzy otrzymali dany wynik doświadczenia. Jak wygląda wykres? 2. Weź z kolektury Lotto 30 kuponów Dużego Lotka i daj do wypełnienia 30 osobom. Zsumuj liczby zakreślone na każdym kuponie i przedstaw otrzymane wyniki w formie wykresu jak w poprzednim przypadku. Poproś kogoś, CENTRUM NAUKI KOPERNIK kto ma wystarczająco dużo cierpliwości, żeby wypełnił sam 30 kuponów, zaznaczając, aby zrobił to losowo. W tym przypadku sumy skreślonych liczb prawdopodobnie nie ułożą się w krzywą dzwonową. Dlaczego? 3. Skreśl na kuponie Dużego Lotka sześć dowolnych liczb i sześć liczb w jednym rzędzie (pionowym lub poziomym). Pokaż komuś, kto gra w Lotto, i spytaj, który układ ma większe szanse na wylosowanie. Prawie nikt z pytanych nie wskaże na liczby skreślone w jednym rzędzie, choć z punktu widzenia rachunku prawdopodobieństwa taki układ jest równie dobry jak każdy inny. Ten sposób typowania liczb ma jednak pewną zaletę – czy potrafisz powiedzieć jaką? Trójkąt Pascala www.mathsisfun.com/pascalstriangle.html Interaktywna tablica Galtona http://demonstrations.wolfram.com/ FlexibleGaltonBoard/ Prawo Benforda http://mathworld.wolfram.com/ BenfordsLaw.html Hazard i matematyka http://serwisy.gazeta.pl/nauka /1,34148,2476793.html www.kopernik.org.pl Eksperymentuj! A to ciekawe