wykres probabilistyczny
Transkrypt
wykres probabilistyczny
1. Co to są badania niezawodnościowe i jak się je przeprowadza? Badania niezawodnościowe i statystyczna analiza ich wyników Jaki jest rozkład zmiennej losowej opisującej czas życia elementu ? 1. Co to są badania niezawodnościowe i jak się je przeprowadza? Odpowiedź na pytanie wymaga zwykle przeprowadzenia eksperymentu. 2. Metody prezentacji i opisu danych pochodzących z eksperymentu Pojęcia podstawowe i stosowana terminologia: 3. Sposoby wyznaczania rozkładu zmiennej losowej na podstawie danych z eksperymentu • próba losowa - wybrane w pewien sposób niektóre elementy populacji opisane przez wektor, • populacja - zbiór wszystkich elementów danego rodzaju, dr inż. Jacek Jarnicki 2 Przeprowadzanie badań niezawodnościowych: T = T1 ,T2 ,...,Ti ,...,Tn • pobranie próby losowej, gdzie • oczekiwanie i notowanie chwil uszkodzeń kolejnych elementów, z jednoczesnym sprawdzaniem czy nie jest spełnione kryterium zakończenia badania. T - wektor losowy Ti - zmienna losowa (czas życia i-tego elementu) • badanie – sposób uzyskania wiedzy o elementach z próby losowej, wynikiem badania jest Kryteria zakończenia badania: • uszkodzenie wszystkich n elementów wchodzących w skład próby losowej (badanie pełne), t1 ,t 2 ,..., ti ,..., tn ti - realizacje zmiennych losowych Ti • uszkodzenie zadanej liczby k (k<n) elementów, • statystyka – funkcja wektora losowego T • przekroczenie dopuszczalnego czasu badania T0 , S ( T ) = S ( T1 ,T2 ,...,Ti ,...,Tn ) • uszkodzenie zadanej liczby k elementów, lub przekroczenie dopuszczalnego czasu badania T0 , dr inż. Jacek Jarnicki 3 dr inż. Jacek Jarnicki 4 1 2. Metody prezentacji i opisu danych pochodzących z eksperymentu Wynikiem badania niezawodnościowego jest zawsze zbiór danych: t1 ,t2 ,...,ti ,...,t k Kłopoty z uzyskaniem zadowalająco licznych zbiorów danych: • tabela • przyspieszone badania niezawodności Ze względu na znaczne trudności z przeprowadzeniem w realnym czasie eksperymentu w warunkach nominalnych, wymusza się szybsze wystąpienie uszkodzeń przez zwiększenie poziomu stresu a następnie w jakiś sposób, odwzorowuje wyniki badań na warunki nominalne. Dalej rozważane będzie jedynie badanie pełne. dr inż. Jacek Jarnicki numer 1 2 czas t1 t2 ... i ... n ti tn • histogram Rysunek prezentujący w sposób ilościowy przynależność danych do poszczególnych zakresów badanej zmiennej. 5 dr inż. Jacek Jarnicki Budowa histogramu: 6 40 30 1. Wyznaczenie zakresu rysowania 20 2. Podział zakresu rysowania na równe podprzedziały 10 • wyznaczenie dla każdego podprzedziału liczby należących do niego danych (lub odpowiednich częstości), 0 5 10 15 n =100, m = 5 • narysowanie odpowiedniego wykresu słupkowego. 5 15 4 Przykład 1: 10 Z rozkładu normalnego o parametrach µ = 10, 10, σ = 2 wylosowano n = 100 liczb. Jak narysować histogram ? Jaki jest wpływ liczby podprzedziałów m na wygląd histogramu? dr inż. Jacek Jarnicki 7 3 2 5 1 0 0 5 10 15 n =100, m = 20 5 10 15 n =100, m = 100 dr inż. Jacek Jarnicki 8 2 Przykład 2: • gęstość empiryczna Wysokość słupka histogramu gęstości empirycznej jest wyznaczana przez podzielenie wysokości słupka dla danego podprzedziału, przez długość tego podprzedziału. Z rozkładu normalnego o parametrach µ = 10, 10, σ = 2 wylosowano n1 = 10, n2 = 100 i n3 = 1000 liczb. Jak wygląda dystrybuanta empiryczna dla poszczególnych przypadków ? • dystrybuanta empiryczna 1 N =10 0.8 Funkcja określona następująco: 0.6 0.4 t ≤ t1 0 ) Fn ( t ) = k / n 1 0.2 t k < t ≤ t k +1 t > tn dr inż. Jacek Jarnicki 0 6 8 10 12 14 16 n1 = 10 9 dr inż. Jacek Jarnicki 10 Twierdzenie 1 (Gliwienki (Gliwienki)) 1 N =100 0.8 Niech 0.6 0.4 ) Dn = sup F (t ) − F (t ) t∈R 0.2 0 4 6 8 10 12 14 16 będzie odległością dystrybuanty empirycznej od dystrybuanty F(t). ...,tn , pochodzą z ...,ti ...,t F(t). Jeżeli t1 ,t2 ...,t rozkładu o dystrybuancie F(t) F(t) to 18 n2 = 100 1 N =1000 0.8 P ( lim D n = 0 ) = 1 0.6 n→ ∞ 0.4 0.2 0 4 6 8 10 12 14 16 18 20 n3 = 1000 dr inż. Jacek Jarnicki 11 dr inż. Jacek Jarnicki 12 3 3. Sposoby wyznaczania rozkładu zmiennej losowej na podstawie danych z eksperymentu Sposób postępowania: Skonstruować statystykę ) ) θ ( T ) = θ ( T1 ,T2 ,...,Ti ,...,Tn ) Sformułowanie zadania estymacji parametrycznej zwana estymatorem punktowym, punktowym, w taki sposób aby jej wartość była bliska prawdziwej wartości parametru θ. Niech T =T1 ,T2 ,...,T ,...,Tn będzie wektorem opisującym próbę losową pobraną z jednego z rozkładów rodziny parametrycznej W jaki sposób uzyskać funkcję (statystykę) określającą estymator ? {Fθ : θ ∈ Θ } przy czym wartość parametru (parametrów) θ identyfikującego rozkład nie jest znana. Jak ocenić jakość estymatora punktowego ? Jak wykorzystać próbę losową dla wyciągnięcia wniosków dotyczących nieznanego parametru θ ? dr inż. Jacek Jarnicki 13 dr inż. Jacek Jarnicki Ocena estymatorów i ich własności Definicja 1 Jakość estymatora można próbować oceniać przy pomocy wyrażenia (opisującego błąd) w postaci Estymatory o obciążeniu równym 0 noszą nazwę estymatorów nieobciążonych. [ ) ) 2 ζ ( θ ) = E (θ − θ ) ] Definicja 2 Jeżeli Po kilku przekształceniach uzyskuje się [ ] ) ) ) 2 ) ) ) 2 ζ ( θ ) = E (θ − E (θ )) + [E (θ ) − θ ] = Var (θ ) + b 2 (θ ) ) P(θ n − θ > ε ) → 0 n →∞ to estymator nazywamy zgodnym. gdzie ) Var (θ ) - wariancja estymatora ) ) b(θ ) = E (θ ) − θ - obciążenie estymatora Obliczanie estymatorów metodą największej wiarogodności Aby błąd ξ był mały wariancja powinna być możliwie mała i obciążenie estymatora winno wynosić 0. Metodę podał R. A. Fisher dr inż. Jacek Jarnicki 14 15 dr inż. Jacek Jarnicki 16 4 Definicja 3 Jeżeli zmienna losowa ma gęstość f(θ f(θ,t) ,t) i jeśli T = T1,T2,…,Tn jest próbą z rozkładu tej zmiennej, to łączna gęstość próby rozpatrywana jako funkcja parametru θ na postać n L(θ ; t1 ,t2 ,...,ti ,...,tn ) = ∏ f (θ ,ti ) P[ f (θ0 ,T1 ) ... f (θ0 ,Tn ) > f (θ ,T1 ) ... f (θ ,Tn ) ] → 1 gdy n → ∞ Wniosek 1 ) Jako wartość parametru θ należy przyjąć wartość θ , która maksymalizuje funkcję wiarogodności. i =1 i nosi nazwę funkcji wiarogodności. Twierdzenie 2 Przykład 3 Niech T = T1 ,T2 ,…,T ,…,Tn będzie próbą z rozkładu o gęstości f(θ f(θ,t) ,t) oraz θ0 prawdziwą wartością poszukiwanego Niech T=T1,T2,…,Tn będzie próbą z rozkładu normalnego o parametrach θ =[μ =[μ, σ2] . Przy pomocy ) metody największej wiarogodności należy wyznaczyć θ . parametru θ. Wówczas dla każdej ustalonej wartości parametru θ ≠ θ 0 zachodzi dr inż. Jacek Jarnicki 17 ( 1 n exp− ( t − µ )2 n 2 ∑ i 2 σ i =1 2π σ ) µˆ = 1 1 n n n ( t − µ ) 2 − ln σ 2 − ln 2π 2 ∑ i 2σ i=1 2 2 Obliczenie pochodnych prowadzi do układu równań σ̂ 2 = 1 n ∑ ( ti − t ) 2 n i =1 Komputerowe metody analizy wyników badań niezawodności Sformułowanie zadania (przykałd ): (przykałd): ∂L 1 n = ∑ ( ti − µ ) = 0 ∂µ σ 2 i =1 Badaniu pełnemu poddano 30 losowo wybranych z pewnej populacji elementów. Zarejestrowano następujące realizacje czasu życia: ∂L 1 n n = ( t − µ )2 − 2 = 0 2 4 ∑ i ∂σ 4σ i =1 2σ dr inż. Jacek Jarnicki 1 n ∑ ti = t n i =1 Można pokazać, że w wyznaczonym punkcie, funkcja wiarogodności osiąga maksimum. Po logarytmowaniu otrzymujemy ln L (µ ,σ 2 ; t1 ,...,t n ) = − 18 rozwiązanie układu powyższego równań ma postać Funkcja wiarogodności wygląda następująco: L(µ ,σ 2 ; t 1 ,...,t n ) = dr inż. Jacek Jarnicki 19 dr inż. Jacek Jarnicki 20 5 Nr elementu ti [h] Nr elementu ti [h] 1 2 3 204.61 441.15 1056.17 16 17 18 4759.25 5655.06 6040.91 4 5 1276.72 1326.84 19 20 6272.11 6489.57 6 7 1761.45 1964.66 21 22 7000.66 8099.50 8 9 2009.24 2296.38 23 24 10 11 3047.52 3186.73 25 26 9931.35 10730.30 10753.05 12 13 3527.68 3644.66 27 28 14 15 4151.71 4386.44 29 30 Jaki jest rozkład zmiennej losowej opisującej czas życia elementu ? Uwaga generalna: Nie istnieje jednoznaczna "automatyczna" procedura, która bez podejmowania dodatkowych decyzji i bez naruszenia formalizmu rozumowania matematycznego, prowadzi do wyznaczenia poszukiwanego rozkładu. Przykładowy tok postępowania: • sporządzić dla zarejestrowanych danych histogram, 11734.75 12388.20 • przeanalizować wygląd histogramu i na podstawie jego kształtu, próbować wyciągnąć jakieś wnioski co do typu rozkładu, 13039.87 13770.20 17547.17 dr inż. Jacek Jarnicki 21 • dla wytypowanych na podstawie analizy histogramu rozkładów prawdopodobieństwa sporządzić wykresy probabilistyczne i na podstawie rozkładu danych na wykresach podjąć decyzję o wyborze typu rozkładu, dr inż. Jacek Jarnicki 22 Analiza danych przy pomocy narzędzi pakietu SAS (dane pochodzą z pokazanej wcześniej tabeli) 1. Analiza histogramu • dla wybranego rozkładu wyznaczyć parametry np. metodą największej wiarogodności, Niektóre stosowane obecnie narzędzia komputerowe: • uniwersalne oprogramowanie matematyczne (np. pakiet MATLAB), MATLAB), • specjalistyczne oprogramowanie do analizy danych (np. system SAS firmy SAS Institute), Institute), dr inż. Jacek Jarnicki 23 dr inż. Jacek Jarnicki 24 6 Do dalszej analizy zostają wytypowane rozkłady: normalny, Weibulla, Weibulla, wykładniczy 2. Tworzenie wykresów probabilistycznych Dla określonego typu rozkładu konstruuje się specyficznie przeskalowany układ współrzędnych. Jeśli dane pochodzą z tego właśnie rozkładu, to po naniesieniu ich na wykres powinny rozłożyć się mniej więcej wzdłuż linii prostej. prostej . Zgodnie z decyzja podjętą w kroku 1 dane naniesiono na wykres dla - rozkładu: normalnego, - rozkładu Weibulla, Weibulla, - rozkładu wykładniczego, dr inż. Jacek Jarnicki 25 dr inż. Jacek Jarnicki 26 dr inż. Jacek Jarnicki 27 dr inż. Jacek Jarnicki 28 7 3. Analiza wykresów probabilistycznych i wnioski • • • dr inż. Jacek Jarnicki F( t ) = 1 − e Wyznaczmy przy pomocy metody największej wiarogodności estymatory parametrów λ i p wybranego rozkładu, lecz nie musimy tego robić bo; Pakiet SAS przy tworzeniu wykresów probabilistycznych oblicza zawsze przy pomocy metody największej wiarogodności odpowiednie parametry i drukuje je na wykresie. Z wykresu dla rozkładu Weibulla odczytujemy więc parametry rozkładu, wynoszą one: Shape ( p ) = 1.2665 Scale ( σ ) = 6395.503 29 • Ostatecznie przyjmujemy, że rozkład czasu życia badanego elementu opisany jest funkcją t − 6395.503 Stwierdzamy, że dla rozkładu Weibulla, Weibulla, dane najlepiej "układają się" wzdłuż linii prostej, wybieramy więc ten rozkład. dr inż. Jacek Jarnicki 30 2 1.2665 t ≥0 3 średni czas życia dla otrzymanego rozkładu wynosi 1 Tśr = E ( T ) = 5939 .2 h Na wykresie dystrybuanty, wyniki obliczeń prezentują się następująco: 1 - dystrybuanta empiryczna dla danych uzyskanych w wyniku badania , 2 - dystrybuanta obliczona jako wynik estymacji rozkładem Weibulla, Weibulla, 3 - dystrybuanta rozkładu, z którego losowano dane, był to rozkład wykładniczy z parametrem λ = 1/10000 (średni czas życia wynosił 10.000 h ). dr inż. Jacek Jarnicki 31 dr inż. Jacek Jarnicki 32 8