wykres probabilistyczny

Transkrypt

wykres probabilistyczny
1. Co to są badania niezawodnościowe
i jak się je przeprowadza?
Badania niezawodnościowe
i statystyczna analiza ich
wyników
Jaki jest rozkład zmiennej losowej opisującej czas życia
elementu ?
1. Co to są badania niezawodnościowe i jak
się je przeprowadza?
Odpowiedź na pytanie wymaga zwykle przeprowadzenia
eksperymentu.
2. Metody prezentacji i opisu danych
pochodzących z eksperymentu
Pojęcia podstawowe i stosowana terminologia:
3. Sposoby wyznaczania rozkładu zmiennej
losowej na podstawie danych
z eksperymentu
• próba losowa - wybrane w pewien sposób niektóre
elementy populacji opisane przez wektor,
• populacja - zbiór wszystkich elementów danego rodzaju,
dr inż. Jacek Jarnicki
2
Przeprowadzanie badań niezawodnościowych:
T = T1 ,T2 ,...,Ti ,...,Tn
• pobranie próby losowej,
gdzie
• oczekiwanie i notowanie chwil uszkodzeń kolejnych
elementów, z jednoczesnym sprawdzaniem czy nie
jest spełnione kryterium zakończenia badania.
T - wektor losowy
Ti - zmienna losowa (czas życia i-tego elementu)
• badanie – sposób uzyskania wiedzy o elementach
z próby losowej, wynikiem badania jest
Kryteria zakończenia badania:
• uszkodzenie wszystkich n elementów wchodzących
w skład próby losowej (badanie pełne),
t1 ,t 2 ,..., ti ,..., tn
ti - realizacje zmiennych losowych Ti
• uszkodzenie zadanej liczby k (k<n) elementów,
• statystyka – funkcja wektora losowego T
• przekroczenie dopuszczalnego czasu badania T0 ,
S ( T ) = S ( T1 ,T2 ,...,Ti ,...,Tn )
• uszkodzenie zadanej liczby k elementów, lub
przekroczenie dopuszczalnego czasu badania T0 ,
dr inż. Jacek Jarnicki
3
dr inż. Jacek Jarnicki
4
1
2. Metody prezentacji i opisu danych
pochodzących z eksperymentu
Wynikiem badania niezawodnościowego jest zawsze zbiór
danych:
t1 ,t2 ,...,ti ,...,t k
Kłopoty z uzyskaniem zadowalająco licznych zbiorów
danych:
• tabela
• przyspieszone badania niezawodności
Ze względu na znaczne trudności z przeprowadzeniem
w realnym czasie eksperymentu w warunkach nominalnych,
wymusza się szybsze wystąpienie uszkodzeń przez
zwiększenie poziomu stresu a następnie w jakiś sposób,
odwzorowuje wyniki badań na warunki nominalne.
Dalej rozważane będzie jedynie badanie pełne.
dr inż. Jacek Jarnicki
numer
1
2
czas
t1
t2
...
i
...
n
ti
tn
• histogram
Rysunek prezentujący w sposób ilościowy przynależność
danych do poszczególnych zakresów badanej zmiennej.
5
dr inż. Jacek Jarnicki
Budowa histogramu:
6
40
30
1. Wyznaczenie zakresu rysowania
20
2. Podział zakresu rysowania na równe podprzedziały
10
• wyznaczenie dla każdego podprzedziału liczby
należących do niego danych (lub odpowiednich
częstości),
0
5
10
15
n =100, m = 5
• narysowanie odpowiedniego wykresu słupkowego.
5
15
4
Przykład 1:
10
Z rozkładu normalnego o parametrach µ = 10,
10, σ = 2
wylosowano n = 100 liczb. Jak narysować histogram ?
Jaki jest wpływ liczby podprzedziałów m na wygląd
histogramu?
dr inż. Jacek Jarnicki
7
3
2
5
1
0
0
5
10
15
n =100, m = 20
5
10
15
n =100, m = 100
dr inż. Jacek Jarnicki
8
2
Przykład 2:
• gęstość empiryczna
Wysokość słupka histogramu gęstości empirycznej jest
wyznaczana przez podzielenie wysokości słupka dla
danego podprzedziału, przez długość tego podprzedziału.
Z rozkładu normalnego o parametrach µ = 10,
10, σ = 2
wylosowano n1 = 10, n2 = 100 i n3 = 1000 liczb.
Jak wygląda dystrybuanta empiryczna dla poszczególnych
przypadków ?
• dystrybuanta empiryczna
1
N =10
0.8
Funkcja określona następująco:
0.6
0.4
t ≤ t1
 0
)

Fn ( t ) = k / n
 1

0.2
t k < t ≤ t k +1
t > tn
dr inż. Jacek Jarnicki
0
6
8
10
12
14
16
n1 = 10
9
dr inż. Jacek Jarnicki
10
Twierdzenie 1 (Gliwienki
(Gliwienki))
1
N =100
0.8
Niech
0.6
0.4
)
Dn = sup F (t ) − F (t )
t∈R
0.2
0
4
6
8
10
12
14
16
będzie odległością dystrybuanty empirycznej od
dystrybuanty F(t).
...,tn , pochodzą z
...,ti ...,t
F(t). Jeżeli t1 ,t2 ...,t
rozkładu o dystrybuancie F(t)
F(t) to
18
n2 = 100
1
N =1000
0.8
P ( lim D n = 0 ) = 1
0.6
n→ ∞
0.4
0.2
0
4
6
8
10
12
14
16
18
20
n3 = 1000
dr inż. Jacek Jarnicki
11
dr inż. Jacek Jarnicki
12
3
3. Sposoby wyznaczania rozkładu
zmiennej losowej na podstawie
danych z eksperymentu
Sposób postępowania:
Skonstruować statystykę
)
)
θ ( T ) = θ ( T1 ,T2 ,...,Ti ,...,Tn )
Sformułowanie zadania estymacji parametrycznej
zwana estymatorem punktowym,
punktowym, w taki sposób aby jej
wartość była bliska prawdziwej wartości parametru θ.
Niech T =T1 ,T2 ,...,T
,...,Tn będzie wektorem
opisującym próbę losową pobraną z jednego z rozkładów
rodziny parametrycznej
W jaki sposób uzyskać funkcję (statystykę) określającą
estymator ?
{Fθ : θ ∈ Θ }
przy czym wartość parametru (parametrów) θ
identyfikującego rozkład nie jest znana.
Jak ocenić jakość estymatora punktowego ?
Jak wykorzystać próbę losową dla wyciągnięcia wniosków
dotyczących nieznanego parametru θ ?
dr inż. Jacek Jarnicki
13
dr inż. Jacek Jarnicki
Ocena estymatorów i ich własności
Definicja 1
Jakość estymatora można próbować oceniać przy
pomocy wyrażenia (opisującego błąd) w postaci
Estymatory o obciążeniu równym 0 noszą nazwę
estymatorów nieobciążonych.
[
)
)
2
ζ ( θ ) = E (θ − θ )
]
Definicja 2
Jeżeli
Po kilku przekształceniach uzyskuje się
[
]
)
)
) 2
)
)
)
2
ζ ( θ ) = E (θ − E (θ )) + [E (θ ) − θ ] = Var (θ ) + b 2 (θ )
)
P(θ n − θ > ε ) → 0
n →∞
to estymator nazywamy zgodnym.
gdzie
)
Var (θ ) - wariancja estymatora
)
)
b(θ ) = E (θ ) − θ - obciążenie estymatora
Obliczanie estymatorów metodą największej
wiarogodności
Aby błąd ξ był mały wariancja powinna być możliwie mała
i obciążenie estymatora winno wynosić 0.
Metodę podał R. A. Fisher
dr inż. Jacek Jarnicki
14
15
dr inż. Jacek Jarnicki
16
4
Definicja 3
Jeżeli zmienna losowa ma gęstość f(θ
f(θ,t)
,t) i jeśli
T = T1,T2,…,Tn jest próbą z rozkładu tej zmiennej, to
łączna gęstość próby rozpatrywana jako funkcja parametru
θ na postać
n
L(θ ; t1 ,t2 ,...,ti ,...,tn ) = ∏ f (θ ,ti )
P[ f (θ0 ,T1 ) ... f (θ0 ,Tn ) > f (θ ,T1 ) ... f (θ ,Tn ) ] → 1
gdy n → ∞
Wniosek 1
)
Jako wartość parametru θ należy przyjąć wartość θ ,
która maksymalizuje funkcję wiarogodności.
i =1
i nosi nazwę funkcji wiarogodności.
Twierdzenie 2
Przykład 3
Niech T = T1 ,T2 ,…,T
,…,Tn będzie próbą z rozkładu o gęstości
f(θ
f(θ,t)
,t) oraz θ0 prawdziwą wartością poszukiwanego
Niech T=T1,T2,…,Tn będzie próbą z rozkładu normalnego
o parametrach θ =[μ
=[μ, σ2] . Przy pomocy
) metody
największej wiarogodności należy wyznaczyć θ .
parametru θ. Wówczas dla każdej ustalonej wartości
parametru θ ≠ θ 0 zachodzi
dr inż. Jacek Jarnicki
17
(
 1 n

exp−
( t − µ )2 
n
2 ∑ i
2
σ
i =1


2π σ )
µˆ =
1
1 n
n
n
( t − µ ) 2 − ln σ 2 − ln 2π
2 ∑ i
2σ i=1
2
2
Obliczenie pochodnych prowadzi do układu równań
σ̂ 2 =
1 n
∑ ( ti − t ) 2
n i =1
Komputerowe metody analizy wyników badań niezawodności
Sformułowanie zadania (przykałd
):
(przykałd):
∂L 1 n
=
∑ ( ti − µ ) = 0
∂µ σ 2 i =1
Badaniu pełnemu poddano 30 losowo wybranych
z pewnej populacji elementów.
Zarejestrowano następujące realizacje czasu życia:
∂L
1 n
n
=
( t − µ )2 − 2 = 0
2
4 ∑ i
∂σ
4σ i =1
2σ
dr inż. Jacek Jarnicki
1 n
∑ ti = t
n i =1
Można pokazać, że w wyznaczonym punkcie, funkcja
wiarogodności osiąga maksimum.
Po logarytmowaniu otrzymujemy
ln L (µ ,σ 2 ; t1 ,...,t n ) = −
18
rozwiązanie układu powyższego równań ma postać
Funkcja wiarogodności wygląda następująco:
L(µ ,σ 2 ; t 1 ,...,t n ) =
dr inż. Jacek Jarnicki
19
dr inż. Jacek Jarnicki
20
5
Nr
elementu
ti [h]
Nr
elementu
ti [h]
1
2
3
204.61
441.15
1056.17
16
17
18
4759.25
5655.06
6040.91
4
5
1276.72
1326.84
19
20
6272.11
6489.57
6
7
1761.45
1964.66
21
22
7000.66
8099.50
8
9
2009.24
2296.38
23
24
10
11
3047.52
3186.73
25
26
9931.35
10730.30
10753.05
12
13
3527.68
3644.66
27
28
14
15
4151.71
4386.44
29
30
Jaki jest rozkład zmiennej losowej opisującej czas życia
elementu ?
Uwaga generalna:
Nie istnieje jednoznaczna "automatyczna" procedura,
która bez podejmowania dodatkowych decyzji i bez
naruszenia formalizmu rozumowania matematycznego,
prowadzi do wyznaczenia poszukiwanego rozkładu.
Przykładowy tok postępowania:
• sporządzić dla zarejestrowanych danych histogram,
11734.75
12388.20
• przeanalizować wygląd histogramu i na podstawie jego
kształtu, próbować wyciągnąć jakieś wnioski co do typu
rozkładu,
13039.87
13770.20
17547.17
dr inż. Jacek Jarnicki
21
• dla wytypowanych na podstawie analizy histogramu
rozkładów prawdopodobieństwa sporządzić wykresy
probabilistyczne i na podstawie rozkładu danych na
wykresach podjąć decyzję o wyborze typu rozkładu,
dr inż. Jacek Jarnicki
22
Analiza danych przy pomocy narzędzi pakietu SAS
(dane pochodzą z pokazanej wcześniej tabeli)
1. Analiza histogramu
• dla wybranego rozkładu wyznaczyć parametry np.
metodą największej wiarogodności,
Niektóre stosowane obecnie narzędzia komputerowe:
• uniwersalne oprogramowanie matematyczne
(np. pakiet MATLAB),
MATLAB),
• specjalistyczne oprogramowanie do analizy danych
(np. system SAS firmy SAS Institute),
Institute),
dr inż. Jacek Jarnicki
23
dr inż. Jacek Jarnicki
24
6
Do dalszej analizy zostają wytypowane rozkłady:
normalny, Weibulla,
Weibulla, wykładniczy
2. Tworzenie wykresów probabilistycznych
Dla określonego typu rozkładu konstruuje się specyficznie
przeskalowany układ współrzędnych.
Jeśli dane pochodzą z tego właśnie rozkładu, to po
naniesieniu ich na wykres powinny rozłożyć się mniej więcej
wzdłuż linii prostej.
prostej .
Zgodnie z decyzja podjętą w kroku 1 dane naniesiono na
wykres dla
- rozkładu: normalnego,
- rozkładu Weibulla,
Weibulla,
- rozkładu wykładniczego,
dr inż. Jacek Jarnicki
25
dr inż. Jacek Jarnicki
26
dr inż. Jacek Jarnicki
27
dr inż. Jacek Jarnicki
28
7
3. Analiza wykresów probabilistycznych i wnioski
•
•
•
dr inż. Jacek Jarnicki
F( t ) = 1 − e
Wyznaczmy przy pomocy metody największej
wiarogodności estymatory parametrów λ i p wybranego
rozkładu, lecz nie musimy tego robić bo; Pakiet SAS przy
tworzeniu wykresów probabilistycznych oblicza zawsze
przy pomocy metody największej wiarogodności
odpowiednie parametry i drukuje je na wykresie.
Z wykresu dla rozkładu Weibulla odczytujemy więc
parametry rozkładu, wynoszą one:
Shape ( p ) = 1.2665
Scale ( σ ) = 6395.503
29
• Ostatecznie przyjmujemy, że rozkład czasu życia
badanego elementu opisany jest funkcją
t


−

 6395.503 
Stwierdzamy, że dla rozkładu Weibulla,
Weibulla, dane najlepiej
"układają się" wzdłuż linii prostej, wybieramy więc ten
rozkład.
dr inż. Jacek Jarnicki
30
2
1.2665
t ≥0
3
średni czas życia dla otrzymanego rozkładu wynosi
1
Tśr = E ( T ) = 5939 .2 h
Na wykresie dystrybuanty, wyniki obliczeń prezentują
się następująco:
1 - dystrybuanta empiryczna dla danych uzyskanych w wyniku
badania ,
2 - dystrybuanta obliczona jako wynik estymacji rozkładem Weibulla,
Weibulla,
3 - dystrybuanta rozkładu, z którego losowano dane, był to rozkład
wykładniczy z parametrem λ = 1/10000 (średni czas życia wynosił
10.000 h ).
dr inż. Jacek Jarnicki
31
dr inż. Jacek Jarnicki
32
8