Zmienna losowa i wprowadzenie do modelowania

Transkrypt

Zmienna losowa i wprowadzenie do modelowania
Zmienne losowe
i wprowadzenie do
modelowania probabilistycznego
Opracował: Zbigniew Rudnicki
1
Spis treści
•
•
•
•
•
•
•
Modele matematyczne
Zmienne deterministyczne i zmienne losowe
Ciąg realizacji zmiennej losowej i jego statystyki
Szeregi , histogramy, rozkład doświadczalny z próby
Estymacja parametrów rozkładów z populacji
Wybrane rozkłady teoretyczne
Proces stochastyczny
2
1
Modele matematyczne
i zmienne
3
Modele i symulacja
Praktyka inżynierska często wymaga badania układów
niedostępnych lub jeszcze nie istniejących (projektowanych)
bądź badania układów istniejących w zakresie niemożliwym
do zrealizowania lub nieopłacalnym.
W tym celu stosuje się badania symulacyjne na różnego rodzaju
modelach. Najczęściej stosowane są modele matematyczne.
Każdy model, a więc i matematyczny, jest tylko hipotetycznym
oraz przybliżonym i uproszczonym odwzorowaniem
wybranych cech rzeczywistego układu - istotnych dla
danego celu i typu badań (np.: )
4
2
Modelowanie matematyczne
• Opisywanie funkcjonowania układów
(mechanicznych, elektrycznych, biologicznych,
ekonomicznych czy innych) językiem matematyki
przy użyciu równań oraz nierówności
zawierających stałe, zmienne, operatory działań
oraz funkcje.
• Najbardziej podstawowym pojęciem
w modelowaniu matematycznym
jest zmienna.
5
DEFINICJA ZMIENNEJ
Zmienna to symboliczna reprezentacja cechy, która posiada:
NAZWĘ lub inny identyfikator np.: adres
TYP określony przez
strukturę (skalar, wektor , macierz, rekord, lista, ...)
rodzaj wartości (liczbowe, tekstowe, logiczne, ...)
dopuszczalny zakres wartości
WARTOŚĆ (lub zbiór wartości jeśli jest to zmienna złożona)
- konkretną w danej chwili, przy czym, w następnej chwili
wartość ta może ulec zmianie
6
3
Zmienne
• Model matematyczny bada zależności zmiennych
wyjściowych od zmiennych wejściowych.
Zmienne
wejściowe
Układ
Zmienne
wyjściowe
• Za zmienne wyjściowe przyjmowane są takie wielkości
fizyczne, których otrzymywanie jest celem działania
układu. Pozostałe mogą być uznawane za wejściowe.
• W maszynach i układach mechanicznych zmiennymi są
np: siły. momenty, naprężenia, odkształcenia,
parametry geometryczne i materiałowe, nazwy
elementów, rodzaje więzów i in.
7
Zmienne c.d.
Zazwyczaj wśród zmiennych wejściowych wyróżnia się:
zmienne sterowalne i mierzalne
zwane też zmiennymi decyzyjnymi
zmienne wejściowe mierzalne lecz niesterowalne
(na przykład temperatura otoczenia)
zmienne mierzalne, niesterowalne i zachowujące
w przybliżeniu stałe wartości w trakcie badań
zmienne niesterowalne i niemierzalne
uznawane za zakłócenia
8
4
Zmienne wyrażają
a) cechy mierzalne:
• otoczenia,
• przetwarzanych mediów (materiałów, energii,
informacji)
• elementów układu (maszyny)
b) mogą także reprezentować nazwy lub umowne
wartości przypisane cechom niemierzalnym.
Np.: zmienna NAZ_MASZ może przechowywać
takie słowa jak: „tokarka”, „wiertarka”, „strugarka”
- określające nazwy maszyn.
9
Rozróżnianie modeli matematycznych
Modele matematyczne można rozróżniać między
innymi ze względu na:
• charakter zmiennych (ciągłe lub dyskretne,
zmienne deterministyczne lub zmienne losowe)
• typy równań i zależności między zmiennymi
(statyczne lub dynamiczne, liniowe lub nieliniowe,
o stałych skupionych lub rozłożonych)
• sposoby rozwiązywania równań
(analityczne lub numeryczne
czyli metodami kolejnych przybliżeń)
10
5
Zmienne ciągłe i zmienne dyskretne
Zmienne DYSKRETNE (czyli skokowe) przyjmują
tylko określone wartości ze skończonego lub
przeliczalnego zbioru (np.: liczba zębów, liczba
uszkodzeń, znormalizowane średnica)
Zmienne CIĄGŁE - posiadają nieskończenie wiele
wartości w każdym dowolnym skończonym
przedziale
Przykłady: siła, temperatura, naprężenie
W praktyce - ze względu na ograniczoną dokładność pomiaru
i cyfrowy sposób zapisu (z ograniczona precyzją)
- zmienne ciągłe ulegają dyskretyzacji
11
Zmienne proste i złożone czyli
TYPY zmiennych ze względu na strukturę:
• zmienna skalarna - jej wartość w danym momencie jest
pojedynczą liczbą
• wektor n wymiarowy - jego wartość jest ciągiem n liczb
np.: może reprezentować przebieg zmian siły
• macierz dwuwymiarowa (przestrzennie)
np.: obraz zużytej powierzchni łożyska
• macierz trójwymiarowa (przestrzennie)
(ciąg macierzy dwuwymiarowych)
np.: film pokazujący przebieg zużycia powierzchni
• Inne zmienne złożone jak:
rekordy, listy, stosy, kolejki, drzewa, sieci
12
6
Zmienne i modele deterministyczne
To zmienne które posiadają w każdym momencie
wartość określoną - czyli - zdeterminowaną, gdyż:
• albo są dane
• lub są wynikami obliczeń otrzymanymi dla tych
danych
Wyniki są uzyskiwane w sposób powtarzalny. Inaczej mówiąc
matematyczny model deterministyczny, przy powtarzaniu
obliczeń dla tych samych danych, produkuje dokładnie takie
same wyniki.
W praktyce zazwyczaj taka powtarzalność powiązana
z dokładnością nie występuje.
13
Zmienne losowe
i modele statystyczne
(probabilistyczne)
14
7
Losowy charakter zmiennych
Mimo powtarzania badania „w możliwie tych samych
warunkach” nie uzyskujemy zazwyczaj jednakowych
wyników (przy odpowiednio dużej dokładności), bo:
• istnieją błędy pomiaru i błędy zadawania wartości
• powszechne są zakłócenia szczególnie w warunkach
przemysłowych
• losowy charakter zmiennych może wynikać ze
złożoności zjawisk
np.:niestabilność, b.wiele stopni swobody, ...
15
Jaki przyjąć model?
deterministyczny czy statystyczny
• należy to do decyzji badacza, uzależnionej m.in.
od:
• metod stosowanych w danej dziedzinie,
• dominującego czynnika (deterministycznego lub
losowego)
• posiadania (lub nie) danych statystycznych
pozwalających wnioskować o rozkładach
prawdopodobieństwa
16
8
Definicja zmiennej losowej
Zmienna losowa to zmienna dla której nie da się
przewidzieć ani określić jaką konkretną przyjmie
wartość a jedynie można oszacować (lub założyć)
rozkład prawdopodobieństwa występowania:
a) poszczególnych wartości (dla zmiennej dyskretnej),
b) lub wartości z poszczególnych przedziałów
(dla zmiennej ciągłej)
Rozkład ten może być stały w czasie (stacjonarny) lub
zmienny (niestacjonarny)
17
Badanie zmiennych losowych
1) Wielokrotny pomiar = zebranie danych statystycznych
- ZBIORÓW REALIZACJI zmiennych losowych.
2) Badanie częstości występowania wartości - HISTOGRAMY (zwykły,
znormalizowany, skumulowany).
3) Jeśli histogram ma kształt zbliżony do krzywej Gauss’a to:
•
•
•
wyznaczenie parametrów (miar) tendencji centralnej
wyznaczenie parametrów (miar) rozproszenia
wyznaczenie parametrów (miar) odchyleń od rozkł. normalnego
4) Testy zgodności danych statystycznych z założonym rozkładem
5) Zastąpienie histogramu - przez dopasowaną do niego krzywą teoretyczną,
na przykład:
•
•
•
rozkład normalny,
rozkład Gamma,
. . . . inny rozkład
6) Wyznaczanie prawdopodobieństw wystąpienia określonych zdarzeń
a) analitycznie - na podstawie funkcji rozkładów teoretycznych
b) symulacyjnie - przez generowanie wartości pseudolosowych (met. Monte Carlo)
18
9
Statystyki opisowe
19
Opis zmiennej losowej
- podstawowe statystyki
Dla zbioru realizacji zmiennej losowej można wyznaczać
podstawowe parametry statystyczne opisowe - zwane
STATYSTYKAMI
Ich główne kategorie to:
1) miary tendencji centralnej
2) miary rozproszenia
3) miary odchyleń od rozkładu normalnego
20
10
Miary tendencji centralnej
Średnia oznaczana jest czasem przez µ
21
Miary rozproszenia
Wariancja = suma kwadratów odchyleń od średniej/N
Odchylenie standardowe σ = pierwiastek z wariancji
22
11
Przykład: Z dwu pól A i B zebrano po N=9 owoców borówki amerykańskiej
wyniki pomiarów średnic przedstawiono w tabeli.
Wartości średnie są takie same ale rozproszenie wyników inne
23
Średnia i wariancja - przykład
24
12
Uogólnienie statystyk - momenty
A więc:
• wartość oczekiwana - to moment zwykły rzędu pierwszego
• wariancja - to moment centralny rzędu drugiego
25
Miary odchyleń od „normalności”
Skośność i kurtoza (eksces) histogramu
Skośność określa asymetrię
krzywej histogramu
Eksces określa jak ostry
lub łagodny kształt ma
histogram
26
13
Miary odchyleń od „normalności”
µ3 - trzeci moment centralny
µ4 - czwarty moment centralny
σ - odchylenie standardowe
27
Histogramy
28
14
Szeregi, histogram
Mały ciąg realizacji (o liczności < 30) można
uporządkować rosnąco. Powstaje w ten sposób:
SZEREG POZYCYJNY
Liczniejsze ciągi (>30) po uporządkowaniu dzieli się na
przedziały i zlicza wartości w każdym przedziale.
Powstaje w ten sposób:
SZEREG ROZDZIELCZY
Graficznym przedstawieniem szeregu rozdzielczego jest
HISTOGRAM
29
Histogram
Matematycznie - to wektor o tylu składowych ile mamy wartości
lub przedziałów wartości zmiennej losowej.
Każda składowa podaje częstość wystąpień wartości zmiennej
losowej z przedziału odpowiadającego tej składowej
Graficznie:
- to słupkowy wykres
częstości występowania
poszczególnych wartości
(lub wartości z kolejnych
przedziałów) zmiennej losowej.
Suma składowych (słupków)
jest równa liczbie pomiarów N.
30
15
Przykładowe zadanie
• Skontrolowano długość 20 gwoździ, które
nominalnie powinny mieć 35 mm a w
praktyce długość ich wahała się w
granicach:
34,95mm do 35,05mm
Na podstawie danych pomiarowych
sporządzić histogram o 5-ciu słupkach
odpowiadających 5-ciu równym przedziałom
31
Przykład Histogramu
oszacuj prawdopodobieństwo, że dł.< 34,99mm
32
16
Funkcje dla histogramów w Mathcadzie
1) hist(XG, X)
XG - wektor granic przedziałów ma LP+1 składowych
gdzie LP = liczba przedziałów i słupków
X - wektor danych pomiarowych
W wyniku zwraca tylko wektor wysokości słupków
-------------------------2) histogram(LP, X)
LP = liczba przedziałów i słupków
,
X - wektor danych pomiarowych
- ta funkcja sama wyznacza minimum i maksimum zakresu zmienności oraz
granice przedziałów.
W wyniku otrzymujemy dwukolumnową macierz - pierwsza kolumna to dane
dla osi poziomej histogramu a druga - dane dla osi pionowej histogramu.
33
Badanie częstości występowania różnych wartości zmiennej losowej
Sporządzenie
HISTOGRAMU
przez:
• podział zakresu
zmienności na przedziały
• zliczenie ile wyników
pomiarów mieści się w
każdym przedziale
• przedstawienie tego na
wykresie słupkowym
34
17
Wyznaczanie histogramu w Mathcadzie
przy pomocy funkcji hist:
35
Wyznaczanie histogramu w Mathcadzie przy
pomocy funkcji histogram:
Funkcja histogram sama określa zakres zmienności, więc jej wyniki mogą być nieco
różne niż funkcji hist. Daje ona w wyniku macierz dwu-kolumnową, w której
pierwsza kolumna stanowi dane dla osi poziomej histogramu (współrzędne
środków słupków) a druga kolumna to dane dla osi pionowej histogramu
(wysokości słupków).
36
18
Histogram - przykład 2
Przez 12 miesięcy notowano ile razy w miesiącu nastąpiło
awaryjne wyłączenie pewnej maszyny z powodu
przeciążenia. Wyniki zamieszczono w tabeli poniżej.
Przez W oznaczono liczbę wyłączeń.
Sporządzić HISTOGRAM
Wmin = 1
Wmax = 4
liczba przedziałów: m=4
6
His togra m liczby a wa rii na mie s ią c
Powtórzenia
5
4
3
2
1
0
1
2
3
Liczba awarii/m-c
4
37
Histogram znormalizowany
Po podzieleniu składowych histogramu przez liczbę wszystkich
pomiarów otrzymujemy histogram znormalizowany podający
względną częstość i stanowiący oszacowanie prawdopodobieństwa
wystąpienia poszczególnych wartości zmiennej losowej
P ra wdopodobie ńs two liczby a wa rii / m-c
6/12
5/12
4/12
3/12
2/12
1/12
0
1
2
3
4
Liczba awarii na mies iąc
38
19
Histogram znormalizowany
czyli doświadczalnie otrzymany, szacunkowy
rozkład prawdopodobieństwa
Graficznie - to słupkowy wykres częstości względnej
występowania wartości zmiennej losowej.
Matematycznie - to wektor o tylu składowych ile mamy
wartości lub przedziałów wartości zmiennej losowej.
Każda składowa podaje względną częstość wystąpień:
• poszczególnych wartości - zmiennej losowej dyskretnej
• wartości w poszczególnych przedziałach - dla zmiennej
losowej ciągłej
39
Histogram znormalizowany
dla zmiennej losowej dyskretnej:
• podaje zbadaną doświadczalnie względną częstość
występowania poszczególnych wartości zmiennej losowej
• względna częstość to ułamek (<1) który podaje ile razy
wystąpiła dana wartość zm. losowej w stosunku do liczby
wszystkich pomiarów
40
20
Histogram znormalizowany
dla zmiennej losowej ciągłej:
• podaje zbadaną doświadczalnie względną częstość
występowania wartości zmiennej losowej w
przedziałach na jakie podzielono cały zakres.
• Względna częstość to ułamek (<1) który podaje ile
razy wystąpiły wartości zm. losowej ciągłej
mieszczące się w danym przedziale,
w stosunku do liczby wszystkich pomiarów.
41
Empiryczny rozkład prawdopodobieństwa
Jeśli liczba pomiarów była dostatecznie duża oraz jeśli
można założyć, że zjawiska będą w przyszłości
zachodziły z podobną częstością - możemy słupki
histogramu znormalizowanego traktować jako:
oszacowanie prawdopodobieństwa
• To założenie jest słuszne dla procesów stacjonarnych
- czyli takich, których parametry statystyczne
nie zmieniają się w czasie
• Histogram znormalizowany jest w takim przypadku
- otrzymanym w wyniku doświadczeń czyli
empirycznym - rozkładem prawdopodobieństwa
42
21
Od histogramu do krzywej ciągłej
Rozpatrzmy histogramy sporządzone dla zbioru N danych:
• Dla histogramu zwykłego:
suma wysokości słupków = liczbie danych N.
• Dla histogramu znormalizowanego:
suma wysokości słupków = N/N = 1
Chcąc otrzymać krzywą ciągłą trzeba zwiększać liczbę słupków
histogramu do nieskończoności,
ale wtedy ich wysokość zmaleje do zera
Jest to zgodne z faktem, że prawdopodobieństwo wystąpienia konkretnej
jednej wartości z nieskończenie wielu możliwych - jest równe zero
43
Histogram
znormalizowany
Suma wys. słupków=1
7 przedziałów
wysokość słupków maleje:
45 przedziałów
44
22
Od histogramu do krzywej ciągłej c.d.
- histogram skumulowany
Jak wykazano: histogramu zwykłego lub znormalizowanego
nie da się bezpośrednio zagęścić do krzywej ciągłej.
Można jednak tego dokonać
dla histogramu skumulowanego.
W histogramie skumulowanym wysokość i - tego słupka jest
sumą słupków histogramu znormalizowanego od 1 do i
45
Histogram
skumulowany
czyli
dystrybuanta
empiryczna
46
23
Dystrybuanta
czyli rozkład skumulowany (CDF)
(ang.: CDF - Cumulative Distribution Function)
Dystrybuanta F(x) to funkcja podająca prawdopodobieństwa
nie przekroczenia przez zmienną losową poszczególnych
wartości x
A więc dla dowolnego punktu [a, F(a)] na krzywej dystrybuanty:
rzędna F(a) tego punktu podaje prawdopodobieństwo, że
zmienne losowa nie przekroczy wartości a:
F(a) = p(x<a)
47
Histogram znormalizowany oraz SKUMULOWANY
- dystrybuanta empiryczna
48
24
Rozkład SKUMULOWANY czyli DYSTRYBUANTA
Dla każdego rozkładu dystrybuanta zmiennej losowej X zawsze:
• na osi poziomej zaczyna się w Xmin a kończy w Xmax
• na osi pionowej - gdzie wyrażane jest prawdopodobieństwo
- zaczyna się od zera a kończy na 1
bo z definicji:
• prawdopodobieństwo, że X<Xmin jest zerowe (zdarzenie
niemożliwe)
• prawdopodobieństwo, że X<Xmax jest równe 1 (zdarzenie
pewne)
49
Krzywe:
f(x) = gęstość prawdopodobieństwa oraz F(x) = dystrybuanta
- dla rozkładu normalnego
Funkcja f(x) gęstości
prawdopodobieństwa
(ang.: density) jest
pochodną dystrybuanty F(x)
Pole pod krzywą wyraża
prawdopodobieństwo.
=================================================
Dystrybuanta F(x) czyli rozkład
skumulowany
Pozwala odczytywać
prawdopodobieństwo na osi
rzędnych
[jest całką z funkcji gęstości
rozkładu
prawdopodobieństwa f(x)]
50
25
Funkcje do rozkładów w Mathcadzie
- mają nazwy rozpoczynające się od liter:
R - od random - generatory liczb pseudolosowych
D - od density - krzywe gęstości prawdopodobieństwa
P - od probability - dystrybuanty (rozkł. skumulowane)
51
Funkcje Mathcad’a
dla rozkładu normalnego
52
26
Rozkłady teoretyczne
Rozkłady teoretyczne to krzywe (funkcje) opisane wzorami,
które dopasowuje się do rozkładów doświadczalnych
(czyli histogramów znormalizowanych)
Najbardziej znany i najczęściej stosowany jest
ROZKŁAD NORMALNY wyrażony krzywą Gauss’a
Inne rozkłady używane w badaniach eksploatacyjnych to np.:
• Log-normalny
• Wykładniczy
• Weibull’a
• Raileigh’a
• Beta
• Poisson’a
• Gama
53
Rozkład normalny (gęstości prawdopodobieństwa)
Jednym z podstawowych rozkładów zmiennej losowej ciągłej jest
rozkład normalny. Jest on opisany symetryczną krzywą Gaussa.
W przedziale:
m ± 3σ
σ mieści się 99.73% wartości zmiennej losowej = Reguła trzech sigm
m ± 2σ
σ mieści się 95,45% wartości zmiennej losowej,
m ± σ mieści się 68,27% wartości zmiennej losowej.
54
27
Reguła trzech sigm
55
Od histogramu do rozkładu
Przykład 2 - obliczenia w Mathcadzie (1)
W ciągu dwu miesięcy rejestrowano godziny przyjazdu autobusu a
dokładniej ile minut po ósmej przyjechał autobus, który według
rozkładu powinien być 10 minut po ósmej. Chcemy wykreślić
HISTOGRAM czyli słupkowy wykres częstości przyjazdu dla
poszczególnych minut (po ósmej).Użyjemy do tego funkcji hist.
1) Najpierw z pliku dyskowego wczytamy do wektora t dane o
przyjazdach autobusu:
t := READPRN(„AUTOBUS.PRN”)
Elementy wektorów będziemy numerować od 1: ORIGIN := 1
Liczba wczytanych danych: N := length(t) N = 60
56
28
Od histogramu do rozkładu
Przykład 2 - obliczenia w Mathcadzie (2)
2) wyznaczamy minimalną i maksymalną daną:
tmin := min(t) tmin = 8 tmax := max(t) tmax = 16
3) ustalamy szerokość przedziału na 1 min: Dt := 1
w takim razie liczba przedziałów M będzie wynosić:
M := (tmax-tmin) / Dt M = 8
Histogram H poda liczbę wystąpień wartości zmiennej losowej t
w poszczególnych przedziałach zakresu (tmin .. tmax):
4) Wyznaczamy wektor T początków przedziałów:
i := 1 .. M+1 Ti := tmin + (i-1) · Dt
5) Wyznaczamy histogram przy pomocy funkcji hist:
H := hist(T, t)
57
Od histogramu do rozkładu
Przykład 2 - obliczenia w Mathcadzie (3)
58
29
Od histogramu do rozkładu c.d
Do doświadczalnego wykresu histogramu
znormalizowanego chcemy dopasować krzywą
rozkładu teoretycznego (np. krzywą Gauss’a)
Pozwoli nam to uprościć dalsze obliczenia i
sprowadzić działania na zmiennej losowej do
szacunkowych działań arytmetycznych na
parametrach tej krzywej
Na przykład korzystać z „reguły trzech sigm”
59
60
30
Który rozkład teoretyczny wybrać?
Do dyspozycji mamy wiele różnych wzorów
i krzywych określających rozkłady teoretyczne
np.:
•
•
•
•
•
•
•
równomierny
Wykładniczy
Weibull’a
Raileigh’a
Beta
Poisson’a
. . . . . . ..
61
Rozkład równomierny
W Mathcadzie:
punif(Xmin,Xmax)
dunif((Xmin,Xmax)
62
31
Rozkład normalny
63
Rozkład Gamma
64
32
Testowanie hipotez statystycznych
Hipotezy o zgodności danych statystycznych z jakimś
rozkładem prawdopodobieństwa nazywają się
hipotezami nieparametrycznymi (nie dotyczą
parametrów rozkładu)
Dla potwierdzenia (lub odrzucenia) takiej hipotezy
przeprowadza się testy zgodności.
Jednym z nich jest test Kołmogorowa-Smirnowa
porównujący skumulowany histogram danych
standaryzowanych ze standaryzowaną dystrybuantą
oczekiwanego rozkładu
65
Testowanie hipotez statystycznych c.d.
Hipotezy parametryczne dotyczą hipotez dotyczących
parametrów statystycznych jak: średnia, odchylenie
standardowe, wariancja, ...
Średnią z próby statystycznej łatwo wyliczyć ale z innej próby
wyjdzie nam inna średnia, więc dla różnych prób z danej
populacji, średnia staje się zmienną losową i trzeba np.
odpowiedzieć na pytanie:
” czy można przyjąć z 95% prawdopodobieństwa, że śrdnia
populacji mieści się w przedziale od X1 do X2?”
66
33
Kiedy spodziewać się rozkładu normalnego?
Gdy zmienna teoretycznie powinna mieć stałą wartość
ale wskutek zakłóceń czy błędów wykazuje losowy
rozrzut to kształt histogramu może być zbliżony do
krzywej Gauss'a.
Wtedy można założyć (z większym czy mniejszym
błędem), że jest to zmienna losowa o rozkładzie
normalnym.
Oczywiście dla histogramów wyraźnie
niesymetrycznych lub wykazujących wiele
maksimów założenie takie nie byłoby słuszne
i popełnilibyśmy wtedy błąd.
67
Testy normalności
• Dla danego zbioru danych doświadczalnych można
przeprowadzić testy normalności
stwierdzające czy rozrzut jest zgodny z rozkładem normalnym
np.:
• test Shapiro-Wilka i inne dostępne w programie STATISTICA
• Porównuje się na ogół rozkład skumulowany po jego
standaryzacji polegającej na odjęciu od danych wartości
średniej i podzieleniu ich przez odchylenie standardowe.
• Rozkład normalny standaryzowany ma średnią zero
i odchylenie standardowe jeden
68
34
Dopasowanie krzywej Gauss’a
przy założeniu normalności rozkładu
Wystarcza wyznaczenie dwu parametrów krzywej
Gauss’a:
• wartości średniej zbioru danych
(położenie maksimum krzywej)
• odchylenia standardowego (pierwiastka z wariancji)
- będącego miarą rozrzutu wokół średniej
69
Zastosowania rozkładów teoretycznych
A) Do wyznaczania (szacowania)
prawdopodobieństwa zjawisk na podstawie
przyjętych funkcji rozkładów
- są to operacje na zdeterminowanych liczbach i
funkcjach
B) Do symulacji zjawisk losowych przez
generowanie liczb losowych zgodnie z przyjętymi
rozkładami teoretycznymi
- metody Monte Carlo
70
35
Metody symulacyjne - Monte Carlo
Metody „Monte Carlo” to grupa metod
symulacyjnego rozwiązywania zagadnień
przez losowanie wartości zmiennych
losowych, według zadanych rozkładów.
Dwa przykłady podano dalej.
71
A) Obliczanie całki metodą Monte Carlo
Losując współrzędne punktów Xi, Yi, według rozkładów równomiernych,
w prostokącie ABCD, można oszacować wartość całki (jako pola pod
krzywą) według podanej proporcji:
72
36
Przykłady obliczeń z zastosowaniem
zmiennych losowych
W modelowaniu zagadnień mechanicznych ważnym problemem jest
szacowanie prawdopodobieństwa zajścia pewnych zjawisk, na
przykład zjawisk polegających na utracie stabilności utrzymywanej
dzięki równowadze sił czy momentów albo uzyskiwanej dzięki nie
przekraczaniu przez obciążenia dopuszczalnych granic n.p
maksymalnych naprężeń, minimalnej grubości filmu smarnego i t.p.
Zakładamy więc, że w najprostszych przypadkach rozpatrywać będziemy
dwie przeciwstawne wielkości fizyczne tego samego typu (siły,
momenty, naprężenia), które w modelu deterministycznym
przyjęlibyśmy jako stałe, natomiast przy dokładniejszym
rozpatrywaniu i zastosowaniu modelu stochastycznego, uznamy, że
mają one losowy rozrzut, symetryczny wokół określonej średniej i w
związku z tym każda z nich jest zmienną losową charakteryzowaną
rozkładem normalnym.
73
B) Wyznaczanie prawdopodobieństwa
na podstawie przyjętych rozkładów
74
37
Metoda I - symulacja przez losowanie:
Szukane prawdopodobieństwo PR, że siła pchania przekroczy
siłę tarcia możemy wyznaczyć metodą symulacji
stochastycznej, (Metoda Monte Carlo)
generując wartości pseudolosowe siły P oraz tarcia T według
rozkładów normalnych:
75
Metoda II - metod obliczeniowa
Zamiast badać kiedy T<P możemy badać różnicę zmiennych
losowych, czyli kiedy T-P<0. Wprowadzimy zmienną Z=T-P
Suma lub różnica NIEZALEŻNYCH zmiennych losowych o rozkładach
normalnych, to nowa zmienna, np.: Z, taka,
że jej średnia jest odpowiednio sumą lub różnicą średnich obu składników, a
odchylenie standardowe jest sumą geometryczną odchyleń standardowych
tych składników:
2
2
σZ = σT + σP
Zsr = Tsr - Psr
Tak więc interesuje nas prawdopodobieństwo: PR(Z<0)
PR = pnorm(0, Zsr , σZ ) = pnorm(0, Tsr − Psr, σT 2 + σP 2 )
Jak widać, zmienne losowe, wskutek wykazywanego rozrzutu, przyjmują
pewne cechy wektorowe. W szczególności, jeśli dwie porównywane
zmienne losowe są NIEZALEŻNE to w przestrzeni znajdują się na dwu
wzajemnie prostopadłych płaszczyznach. Dlatego nie możemy ich
porównywać w jednym układzie XY (jak na poprzednim rysunku)
76
38
Procesy stochastyczne
• Charakter zmiennej losowej
określony jest rozkładem
prawdopodobieństwa występowania
jej wartości
• Proces stochastyczny to przebieg
zmian tego rozkładu w funkcji czasu
albo innych zmiennych (np.:
położenia w przestrzeni)
• Proces stochastyczny jest więc
funkcją (najczęściej czasu), której
wartości są zmiennymi losowymi
• Przykładem procesu stochastycznego
mogą być przewidywane zmiany
oporów czy luzów w łożyskach w
funkcji czasu eksploatacji maszyny.
77
Procesy stochastyczne c.d.
W praktyce dziedziną jest najczęściej przedział czasowy (taki
proces stochastyczny nazywany jest szeregiem czasowym)
lub obszar przestrzeni (wtedy nazywany jest polem losowym).
Jako przykłady szeregów czasowych można podać: fluktuacje
giełdowe, sygnały, takie jak mowa, dźwięk i wideo, dane
medyczne takie jak EKG i EEG, ciśnienie krwi i temperatura
ciała, losowe ruchy takie jak ruchy Browna.
Przykładami pól losowych są statyczne obrazy, losowe
krajobrazy i układ składników w niejednorodnych materiałach.
78
39