Zmienne losowe i ich parametry

Transkrypt

Zmienne losowe i ich parametry
Statystyka matematyczna i
ekonometria
prof. dr hab. inż. Jacek Mercik
B4 pok. 515
[email protected] (tylko z konta studenckiego
z serwera PWr)
Konsultacje, kontakt itp.
Strona WWW
Elementy wykładu
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
1. Zmienne losowe i ich parametry
2. Dystrybuanta, wybrane rozkłady i ich parametry
3. Rozkład normalny, centralne tw. Graniczne, korzystanie z tablic
4. Przedziały ufności. Estymacja przedziałowa dla małych próbek
5. Przedziały ufności. Estymacja przedziałowa dla dużych próbek
6. Testowanie hipotez parametrycznych. Wybrane testy
parametryczne dla małych i dużych próbek
7. Porównywanie dwóch populacji Porównywanie parametrów,
porównywanie rozkładów
8. Testowanie hipotez nieparametrycznych. Test chi-kwadrat, test
serii – zastosowania
9. Podstawy ekonometrii. Modele ekonomiczne
10. Założenia Gaussa-Markowa. Metoda najmniejszych kwadratów
11. Pakiety statystyczne. Weryfikacja modeli ekonometrycznych.
12. Przykłady modeli liniowych.
13. Przykłady modeli nieliniowych
14. Modele ekonometryczne wielorównaniowe.
15. Kolokwium zaliczeniowe
Literatura:
•
•
•
•
•
•
•
•
•
•
•
A. Aczel: Statystyka w zarządzaniu, PWN, Warszawa, 2000.
M. Fisz: Rachunek prawdopodobieństwa i statystyka
matematyczna.
Z. Hellwig: Elementy rachunku prawdopodobieństwa i statystyki
matematycznej.
J. Greń: Statystyka matematyczna. Modele i zadania.
S. Ostasiewicz, Z. Rusnak, U. Siedlecka: Statystyka.
M. Berenson, D. Levine: Basic business statistics.
J. Kowal: Metody statystyczne w badaniach sondażowych rynku.
J. Podgórski: Statystyka z komputerem (statgraphics).
G. Krzykowski: Statystyczna analiza pomiarów (statgraphics).
i wiele innych tego typu.
H. Jasiulewicz, W. Kordecki: Rachunek prawdopodobieństwa
i statystyka matematyczna. Przykłady i zadania. Oficyna
Wydawnicza GiS, Wrocław, 2001
Pojęcia podstawowe:
• Populacja generalna: zbiorowość elementów, z
których będziemy dokonywać losowania i
których cechy będą badane. Zazwyczaj cecha
oznaczana jest podobnie jak zmienna losowa: X,
Y, Z, W,...
• Populacja generalna może być skończona (o
niewielkiej lub znacznej liczbie elementów) lub
nieskończona.
• Populacja ma rozkład wyznaczony poprzez
dystrybuantę F(x) jeżeli cecha X tej populacji ma
rozkład o dystrybuancie F(x). Dystrybuanta ta
nazywana jest dystrybuantą (rozkładem)
teoretycznym.
Przykład: średni wzrost sportowców
Pan A
Pani B
Pan C
Pan D
Pan E
192 cm
165 cm
183 cm
170 cm
175 cm
x2
x3
x4
x5
x1
Kolumna1
Statystyczny sportowiec
X
Średnia
177
Błąd standardowy
4,785394446
Mediana
175
Odchylenie standardowe
10,70046728
Wariancja próbki 114,5
Kurtoza
-0,84205107
Skośność 0,514200293
Zakres
27
Minimum
165
Maksimum
192
Suma
885
Licznik
5
Wartości zaobserwowane:
x1, x2, x3, x4 oraz x5 to
realizacje tej samej zmiennej:
X – statystyczny sportowiec
X – statystyczny wzrost sportowca
X1
X2
X3
X4
X5
x1
x2
x3
x4
x5
Pan A
Pani B
Pan C
Pan D
Pan E
192 cm
165 cm
183 cm
170 cm
175 cm
Realizacje
Próba prosta:
• Zakładamy, że poszczególne elementy próby
wybrane są w sposób niezależny. Taka próba
nazywana jest próbą prostą.
X ~ ( X 1 , X 2 ,..., X n )
( x1 , x2 ,..., xn )
Realizacje
zmiennych
losowych
• Każda ze zmiennych losowych X1,X2,...,Xn ma
taki sam rozkład prawdopodobieństwa jak X
(badana cecha)
Średnia z próby – średnia z populacji
Populacja: badana cecha X
(wartość średnia)
n
1
X = ∑ Xi
n i =1
Średnia w populacji jest zmienną
losową
Próba: obserwowana wartość x
(średnia z próby)
1 n
x = ∑ xi
n i =1
Średnia z próby jest liczbą
(realizacją X)
• Statystyka (w węższym sensie): dowolna
funkcja n zmiennych losowych.
• Statystyki są zatem zmiennymi losowymi i
jako takie posiadają rozkłady
prawdopodobieństwa: dokładne lub
przybliżone.
Parametry charakteryzujące próbkę
Cechy statystyczne
mierzalne
ciągłe
skokowe
niemierzalne
Geograficzne,
Inne (płeć itp.)
Operacje na obserwacjach:
1. Porządkowanie:
Zbiór obserwacji x1 , x 2 ,..., x n porządkujemy zazwyczaj rosnąco:
x j ≤ x j ≤ ... ≤ x j . Dla uproszczenia zakładamy, że x1 , x 2 ,..., x n jest
1
2
uporządkowana.
n
1. Szereg rozdzielczy:
Zbiorowość statystyczna podzielona na części (klasy) według określonej
cechy jakościowej lub ilościowej z podaniem liczebności każdej z nich.
Np. szereg rozdzielczy liczby usterek:
Numer klasy
i
Liczba usterek
xi
Liczba wyrobów
ni
Wskaźnik struktury
1
2
3
4
5
0
1
2
3
4
30
8
6
4
2
0,60
0,16
0,12
0,08
0,04
ωi
Szeregi budowane dla badanych cech z nielicznymi obserwacjami są
zazwyczaj szeregami punktowymi (jak w przykładzie powyższym).
Dla innych (z licznymi wartościami lub dla cech ciągłych) zazwyczaj są
to szeregi rozdzielcze z przedziałami klasowymi:
Np. szereg obserwacji temperatury w styczniu roku 2000:
Numer klasy
i
temperatura
xi
Liczba dni
ni
1
2
3
4
5
poniżej -5
od –5 do 0
od 0 do +5
od +5 do +10
powyżej +10
8
30
6
4
2
1. Dystrybuanta empiryczna:
Def. Dystrybuantą empiryczną S n (x) nazywamy wyrażenie:
0 dla x ≤ x1
k

S n ( x) =  dla x k < x ≤ x k +1 , k = 1,2,..., n − 1
n
1 dla x > x n
jeśli x1 < x 2 < ... < x n (oznacza to, że żadna z wartości obserwowanych
nie powtórzyła się).
Dla szeregów klasowych dystrybuanta empiryczna wyznaczana jest przez
częstości skumulowane:
Numer klasy
Liczba usterek
Liczba wyrobów
Wskaźnik
struktury
Częstość
skumulowana
i
xi
ni
ωi
ωisk
1
2
3
4
5
0
1
2
3
4
30
8
6
4
2
0,60
0,16
0,12
0,08
0,04
0,60
0,76
0,88
0,96
1,00
Sposoby ustalania ilości klas:
a) k ≈ n ,
b) k ≈ 1 + 3,322 log n .
Prezentacja graficzna
1) Histogram
rozkład liczby usterek
ilość obserwacji
35
30
25
20
15
10
5
0
1
2
3
liczba usterek
4
5
1) Diagram
diagram liczby usterek
liczba obserwacji
35
30
25
20
15
10
5
0
1
2
3
liczba usterek
4
5
1) Np. wykres kołowy:
klasy usterek
8%
4%
1
12%
2
3
16%
60%
4
5