Zmienne losowe i ich parametry
Transkrypt
Zmienne losowe i ich parametry
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 515 [email protected] (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu • • • • • • • • • • • • • • • 1. Zmienne losowe i ich parametry 2. Dystrybuanta, wybrane rozkłady i ich parametry 3. Rozkład normalny, centralne tw. Graniczne, korzystanie z tablic 4. Przedziały ufności. Estymacja przedziałowa dla małych próbek 5. Przedziały ufności. Estymacja przedziałowa dla dużych próbek 6. Testowanie hipotez parametrycznych. Wybrane testy parametryczne dla małych i dużych próbek 7. Porównywanie dwóch populacji Porównywanie parametrów, porównywanie rozkładów 8. Testowanie hipotez nieparametrycznych. Test chi-kwadrat, test serii – zastosowania 9. Podstawy ekonometrii. Modele ekonomiczne 10. Założenia Gaussa-Markowa. Metoda najmniejszych kwadratów 11. Pakiety statystyczne. Weryfikacja modeli ekonometrycznych. 12. Przykłady modeli liniowych. 13. Przykłady modeli nieliniowych 14. Modele ekonometryczne wielorównaniowe. 15. Kolokwium zaliczeniowe Literatura: • • • • • • • • • • • A. Aczel: Statystyka w zarządzaniu, PWN, Warszawa, 2000. M. Fisz: Rachunek prawdopodobieństwa i statystyka matematyczna. Z. Hellwig: Elementy rachunku prawdopodobieństwa i statystyki matematycznej. J. Greń: Statystyka matematyczna. Modele i zadania. S. Ostasiewicz, Z. Rusnak, U. Siedlecka: Statystyka. M. Berenson, D. Levine: Basic business statistics. J. Kowal: Metody statystyczne w badaniach sondażowych rynku. J. Podgórski: Statystyka z komputerem (statgraphics). G. Krzykowski: Statystyczna analiza pomiarów (statgraphics). i wiele innych tego typu. H. Jasiulewicz, W. Kordecki: Rachunek prawdopodobieństwa i statystyka matematyczna. Przykłady i zadania. Oficyna Wydawnicza GiS, Wrocław, 2001 Pojęcia podstawowe: • Populacja generalna: zbiorowość elementów, z których będziemy dokonywać losowania i których cechy będą badane. Zazwyczaj cecha oznaczana jest podobnie jak zmienna losowa: X, Y, Z, W,... • Populacja generalna może być skończona (o niewielkiej lub znacznej liczbie elementów) lub nieskończona. • Populacja ma rozkład wyznaczony poprzez dystrybuantę F(x) jeżeli cecha X tej populacji ma rozkład o dystrybuancie F(x). Dystrybuanta ta nazywana jest dystrybuantą (rozkładem) teoretycznym. Przykład: średni wzrost sportowców Pan A Pani B Pan C Pan D Pan E 192 cm 165 cm 183 cm 170 cm 175 cm x2 x3 x4 x5 x1 Kolumna1 Statystyczny sportowiec X Średnia 177 Błąd standardowy 4,785394446 Mediana 175 Odchylenie standardowe 10,70046728 Wariancja próbki 114,5 Kurtoza -0,84205107 Skośność 0,514200293 Zakres 27 Minimum 165 Maksimum 192 Suma 885 Licznik 5 Wartości zaobserwowane: x1, x2, x3, x4 oraz x5 to realizacje tej samej zmiennej: X – statystyczny sportowiec X – statystyczny wzrost sportowca X1 X2 X3 X4 X5 x1 x2 x3 x4 x5 Pan A Pani B Pan C Pan D Pan E 192 cm 165 cm 183 cm 170 cm 175 cm Realizacje Próba prosta: • Zakładamy, że poszczególne elementy próby wybrane są w sposób niezależny. Taka próba nazywana jest próbą prostą. X ~ ( X 1 , X 2 ,..., X n ) ( x1 , x2 ,..., xn ) Realizacje zmiennych losowych • Każda ze zmiennych losowych X1,X2,...,Xn ma taki sam rozkład prawdopodobieństwa jak X (badana cecha) Średnia z próby – średnia z populacji Populacja: badana cecha X (wartość średnia) n 1 X = ∑ Xi n i =1 Średnia w populacji jest zmienną losową Próba: obserwowana wartość x (średnia z próby) 1 n x = ∑ xi n i =1 Średnia z próby jest liczbą (realizacją X) • Statystyka (w węższym sensie): dowolna funkcja n zmiennych losowych. • Statystyki są zatem zmiennymi losowymi i jako takie posiadają rozkłady prawdopodobieństwa: dokładne lub przybliżone. Parametry charakteryzujące próbkę Cechy statystyczne mierzalne ciągłe skokowe niemierzalne Geograficzne, Inne (płeć itp.) Operacje na obserwacjach: 1. Porządkowanie: Zbiór obserwacji x1 , x 2 ,..., x n porządkujemy zazwyczaj rosnąco: x j ≤ x j ≤ ... ≤ x j . Dla uproszczenia zakładamy, że x1 , x 2 ,..., x n jest 1 2 uporządkowana. n 1. Szereg rozdzielczy: Zbiorowość statystyczna podzielona na części (klasy) według określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z nich. Np. szereg rozdzielczy liczby usterek: Numer klasy i Liczba usterek xi Liczba wyrobów ni Wskaźnik struktury 1 2 3 4 5 0 1 2 3 4 30 8 6 4 2 0,60 0,16 0,12 0,08 0,04 ωi Szeregi budowane dla badanych cech z nielicznymi obserwacjami są zazwyczaj szeregami punktowymi (jak w przykładzie powyższym). Dla innych (z licznymi wartościami lub dla cech ciągłych) zazwyczaj są to szeregi rozdzielcze z przedziałami klasowymi: Np. szereg obserwacji temperatury w styczniu roku 2000: Numer klasy i temperatura xi Liczba dni ni 1 2 3 4 5 poniżej -5 od –5 do 0 od 0 do +5 od +5 do +10 powyżej +10 8 30 6 4 2 1. Dystrybuanta empiryczna: Def. Dystrybuantą empiryczną S n (x) nazywamy wyrażenie: 0 dla x ≤ x1 k S n ( x) = dla x k < x ≤ x k +1 , k = 1,2,..., n − 1 n 1 dla x > x n jeśli x1 < x 2 < ... < x n (oznacza to, że żadna z wartości obserwowanych nie powtórzyła się). Dla szeregów klasowych dystrybuanta empiryczna wyznaczana jest przez częstości skumulowane: Numer klasy Liczba usterek Liczba wyrobów Wskaźnik struktury Częstość skumulowana i xi ni ωi ωisk 1 2 3 4 5 0 1 2 3 4 30 8 6 4 2 0,60 0,16 0,12 0,08 0,04 0,60 0,76 0,88 0,96 1,00 Sposoby ustalania ilości klas: a) k ≈ n , b) k ≈ 1 + 3,322 log n . Prezentacja graficzna 1) Histogram rozkład liczby usterek ilość obserwacji 35 30 25 20 15 10 5 0 1 2 3 liczba usterek 4 5 1) Diagram diagram liczby usterek liczba obserwacji 35 30 25 20 15 10 5 0 1 2 3 liczba usterek 4 5 1) Np. wykres kołowy: klasy usterek 8% 4% 1 12% 2 3 16% 60% 4 5