xx 0 - E-SGH

Transkrypt

xx 0 - E-SGH
Do rozwiązania samodzielnego
Przykład #1.
Z badania warunków i jakości Ŝycia Polaków „Diagnoza Społeczna 2007” (zrealizowanego w
marcu 2007 roku na próbie 12,6 tys. indywidualnych respondentów z ponad 5,5 tys.
gospodarstw domowych ) wylosowano próbę losową 1400 osób.
PoniŜsze zestawienia prezentują uzyskane informacje dla osób badanych i ich statusie
zawodowym oraz poziomie wykształcenia, a takŜe statusie zawodowym i poziomie
dochodów (w zł /na osobę w gospodarstwie domowym).
Tabl.1 Osoby badane według statusu zawodowego oraz poziomu wykształcenia
WyŜsze Średnie
Zasadnicze
Gimnazjalne i
zawodowe
poniŜej
Bezrobotni
10
30
35
25
Pracujący
200
285
245
70
Bierni
40
130
100
230
zawodowo
Ogółem
250
445
380
325
Ogółem
100
800
500
1400
Tabl.2. Osoby badane według statusu zawodowego oraz poziomu dochodów w
gospodarstwie domowym (w zł)
A) liczebności ni
B) częstości wi
Dochody
Bezrobotni Pracujący
Ogółem
Dochody
Bezrobotni
Bierni
Pracujący Bierni
Ogółem
x0i − x1i
zawodowo
x0i − x1i
zawodowo
0-300
15
49
117 181
0-300
0,15
0,06
0,23
0,13
300-600
37
209
173 419
300-600
0,37
0,26
0,35
0,30
600-900
25
250
128 403
600-900
0,25
0,31
0,26
0,29
900-1200
15
167
57 239
9001200
0,15
0,21
0,11
0,17
1200-1500
6
83
19 108
0,06
0,10
0,04
0,08
1500-1800
2
42
6 50
0,02
0,05
0,01
0,04
100
800
500 1400
12001500
15001800
Razem
1,00
1,00
1,00
1
Razem
/Uwaga ogólna do poleceń dla studentów: wszystkie wyniki końcowe naleŜy zinterpretować./
Korzystając z podanych informacji oraz dodatkowych obliczeń proszę:
1. Przedstaw za pomocą szeregu rozdzielczego oraz na wykresie :
a) strukturę wykształcenia osób bezrobotnych
b) strukturę dochodów w gospodarstwach domowych osób bezrobotnych i ogółu
badanych
a) Bezrobotni
Bezrobotni
ni
gimnazjalne
zasadnicze zawodowe
wi
25
35
0,25
0,35
1
30
10
średnie
wyŜsze
Razem
100
0,3
0,1
1,00
+ wykres słupkowy (moŜna powiedzieć, nie koniecznie rysować- idea jest taka aby studenci
widzieli róŜnice miedzy wykresami dla cech mierzalnych i niemierzalnych)
b)
Bezrobotni
x0i-x1i
ni
wi
n(x1i)
Fn(x1i)
0-300
15
0,15
15
0,15
300-600
37
0,37
52
0,52
600-900
25
0,25
77
0,77
900-1200
15
0,15
92
0,92
1200-1500
6
0,06
98
0,98
1500-1800
2
0,02
100
1
100
1
x
x
suma
Ogółem
x0i-x1i
ni
wi
n(x1i)
Fn(x1i)
0-300
181
0,13
181
0,13
300-600
419
0,30
600
0,43
600-900
403
0,29
1003
0,72
900-1200
239
0,17
1242
0,89
1200-1500
108
0,08
1350
0,96
1500-1800
50
0,04
1400
1
suma
1400
1
x
x
2.
a) Czy jest moŜliwe wyznaczenie miary tendencji centralnej dla poziomu wykształcenia
osób bezrobotnych?
b) Wyznacz miary tendencji centralnej dla dochodów osób bezrobotnych/ (dla ogółu
naleŜy policzyć średnią)
Jedną z miar pozycyjnych wyznaczyć takŜe graficznie.
2
c) Korzystając z wyznaczonych miar porównać poziom dochodów w gospodarstwach
domowych osób bezrobotnych oraz osób biernych zawodowo wiedząc, ze dla osób
biernych zawodowo uzyskano: x = 574 zł; me = 531,4; Q1= 326,1; Q3= 796,1zł.
a)
Dla cechy jakościowej do= zasadnicze zawodowe
b) i c)
Średnie:
Bezrobotni: x = 1/100*64800=648
Bierni: x = 1/500*286800=574
Ogółem: x = 1/1400*997 200=712,3
Kwartale:
Bezrobotni: me=300+[0,5-0,15]*300/0,37= 583,8
Bierni: me=300+[0,5-0,23]*300/0,35=531,4
Bezrobotni: Q1=300+[0,25-0,15]*300/0,37=381,1 , Q3=600+[0,75-0,52]*300/0,25=876
Bierni: Q1=300+[0,25-0,23]*300/0,35=313,8, Q3=600+[0,75-0,58]*300/0,26= 796,1,
3.
a) Oceń zróŜnicowanie dochodów w grupie osób bezrobotnych.
b) Porównaj zróŜnicowanie dochodów osób bezrobotnych oraz biernych zawodowo
wykorzystując miary klasyczne. Obliczona wartość odchylenia standardowego osób biernych
zawodowo była równa 343,7 zł.
c) Podaj standaryzowany poziom dochodów osoby bezrobotnej, której dochody (na os. w
gospodarstwie domowym) wynosiły 720 zł.
Rozw.
a) Wariancje i odchylenia standardowe i ćwiartkowe:
Bezrobotni: s2= [54810000-(64800)2/100]/99=129490,9, s=359,85
Odchylenie ćwiartkowe: Q=247,45
Bierni: s2= [223470000-(286800)2/500]/499=118159,4, s=343,7
Odchylenie ćwiartkowe: Q=241,15,
b) Współczynnik zmienności:
Bezrobotni: v=359,85/648=0,56, v poz.= 247,45/583,8=0,429
Bierni: v=343,7/574= 0,6 v poz.=241,15/531,4=0,454
c) z= (720-648)/359,89= 0,2 (dochody wyŜsze od średniej dla osób bezrobotnych –objętych
badaniem- o 0,2 odchylenia standardowego)
3
4. Wiedząc, Ŝe
∑ (x − x ) n = 14020952256 ocenić występowanie asymetrii w rozkładzie
3
i
i
dochodów osób biernych zawodowo
Bierni: A=[1/499*14020952256]/[343,7*343,7*343,7]= 0,69
Zajęcia #4.
Twierdzenia graniczne
Twierdzenie Lindberga – Levy’iego
1. Przyjmując, Ŝe średni poziom dochodów osób biernych zawodowo (w zł na os. w gosp.
domowym) wynosi 574 zł z odchyleniem standardowym 343,7 zł. Oblicz:
a) Jakie jest prawdopodobieństwo tego, Ŝe wśród losowo wybranych 200 osób biernych
zawodowo, łączna suma ich dochodów jest mniejsza niŜ 100 000?
X k – dochody
Ex=574
Dx=343,7
n=200
Tn = ∑Xk, Tn~N(nEx; Dx *√(n)) --> Tn~N(200*574, 343,7*√200)
P(Tn<100 000) = P(Z< ((100 000 – 114 800)/4860,65)= P(Z<-3)=1-F(3)=10,9987=0,0013
b) Jakie jest prawdopodobieństwo, Ŝe wśród losowo wybranych 100 osób biernych
zawodowo, średni dochód będzie w przedziale <600;650> zł?
Vn – średni dochód
Ex=574
Dx=343,7
n=100
Vn= (∑Xk)/n ~N(Ex, Dx/√(n)) V100~N(574;343,7/√100)
P(600<V100<650)=P(Z<(650-574)/34,37)-P(Z<(600-574)/34,37)=F(2,2)-F(0,75)=0,98610,7734=0,2127
/Twierdzenie Moivre’a-Laplace’a/
1. Zakładając, Ŝe wśród ogółu osób pracujących osoby z wykształceniem wyŜszym
stanowią 25% wyznaczyć prawdopodobieństwo, Ŝe w losowej próbie 300 pracujących,
udział osób z wykształceniem wyŜszym wyniesie co najmniej 30%.
p=0,25
n=300
W – odsetek pracujących z wyŜszym wykształceniem
W~N(p, √(p(1-p)/n)=N(0,25, 0,025)
P(W>=0,3)= 1-P(W<0,3)= 1-P(Z<(0,3-0,25)/0,025)= 1-P(Z<2)=1-0,9772=0,0228
2. Zakładając, Ŝe wśród ogółu osób z wykształceniem zasadniczym zawodowym 26%
stanowiły osoby bierne zawodowo wyznaczyć:
Jakie jest prawdopodobieństwo, Ŝe w losowej próbie 400 osób z wykształceniem
zasadniczym zawodowym liczba biernych zawodowo nie przekroczy 100 osób?
p=0,26
n=400
4
X400– liczba biernych zawodowo z wykształceniem zasadniczym zawodowym w próbie
X400~N(np, √(np(1-p)=N(104; 8,77)
P(Xn < 100 )= P(Z<(100-104/8,77)= F(-0,456)=1-F(0,465)=1-0,6772=0,3228
Zajęcia #5 Estymacja przedziałowa
Średnia:
x =~N(m, σ/√n)
Z=( x -m)/ σ*√n -->N(0,1)
α=0,05
µα=1,96
P( x - µα* σ/√n<m< x + µα* σ/√n=1- α (w przybliŜeniu)
d= µα* σ /√(n) –max błąd szacunku
Zakładamy, Ŝe σ=s z próby
1. Wykorzystując dane uzyskane z próby wylosowanej z badania ‘Diagnoza Społeczna 2007’
(tabl. 2 oraz wyniki uzyskane w zad.1 i zad 2.) przeprowadź następujące procedury
wnioskowania o populacji osób populacji osób bezrobotnych i dochodach w ich
gospodarstwach domowych (w zł na osobę w gospodarstwie domowym)
a) Podaj punktową ocenę średniego poziomu dochodów w gospodarstwach domowych
osób pracujących zawodowo. Określ błąd standardowy tego szacunku.
b) Dokonaj estymacji przedziałowej dla średniego poziomu dochodów w
gospodarstwach domowych osób pracujących zawodowo. Przyjąć współczynnik
ufności na poziomie 0,95 oraz określ standardowy błąd szacunku.
c) Jak zmieni się precyzja tego oszacowania jeśli przyjmie się poziom ufności 1- α=
=0,99 ?
a).
Bezrobotni: x = 1/100*64800=648
d= σ /√(n)=359,85/√(100)=35,9
b)
bezrobotni: x =648, s=359,85, n=100
P(648-1,96*359,85/10)<m<648+1,96*(359,85/10)=1- α przedział ufności (577,47718,53)
d= 1,96*359,85/√(100)=70,5
c)
Bezrobotni:
α=0,01
µα=2,58
P(648-2,58*359,85/10)<m<648+2,58*(359,85/10)=1- α przedział ufności (555,2 740,8)
d1= 2,58*359,85/√(100)=92,8
d/d1=1,96/2,58=0,759 max błąd szacunku spadł o 24,1%, wzrosła precyzja oszacowania
o 24,1%.
Frakcja:
5
p^ = frakcja w próbie
p – frakcja w populacji
P(p^- µα* √(p^(1-p^)/n)<p< (p^+ µα* √(p^(1-p^)/n)=1- α (w przybliŜeniu)
d= µα√( p^(1-p^)/n) – max błąd szacunku
2. Wykorzystując dane uzyskane z próby wylosowanej z badania ‘Diagnoza Społeczna
2007’ (tabl. 1 oraz wyniki uzyskane w zad.1 i zad 2.)
a) Podaj punktową ocenę frakcji osób pracujących zawodowo w populacji osób z
wykształceniem zasadniczym zawodowym. Określ błąd standardowy tego
szacunku.
b) Dokonaj estymacji przedziałowej dla udziału osób udziału pracujących
zawodowo w populacji osób z wykształceniem zasadniczym zawodowi. Przyjąć
współczynnik ufności na poziomie 0,95.
c) Jaka powinna być co najmniej liczebność próby wykształceniem zasadniczym
zawodowym aby precyzja oszacowania z pktu 2b)wzrosła trzykrotnie?
a) frakcja osób z pracujących wśród osób z wykształceniem zasadniczym zawodowym
p=245/380=0,64
dstand =√( p^(1-p^)/n)= √( 0,64*0,36/380)=0,024
b) przedział ufności dla udziału pracujących wśród osób z wykształceniem zasadniczym
zawodowym
α=0,05
µα=1,96
n=380
p^=245/380=0,64
P(0,64- 1,96* √(0,36*0,64/380)<p< 0,64+ 1,96* √(0,36*0,64/380)=1- α przedział
ufności (0,59-0,69)
d=1,96*√(0,64*0,36/380)=0,05
c) Aby precyzja oszacowania wzrosła trzykrotnie, to max błąd szacunku musi spaść 3
krotnie.
n 2=9n1=9*380=3420
Zajęcia #6 Weryfikacja hipotez parametrycznych
Średnia
1. Czy na podstawie wyników z tej próby moŜna przyjąć, iŜ średnia dochodów w
gospodarstwach domowych osób bezrobotnych w 2007 roku w Polsce była niŜsza niŜ 600
zł ? Przyjąć prawdopodobieństwo popełnienia błędu I-go rodzaju na poziomie 0,05.
Ho=średni dochód bezrobotnych wynosi 600 PLN
Ho: µ=600, H1:µ>600
x = ~N(µ, σ/√n) N(0,1)
n=100
x =648
6
S=359,85
α=0,05
Z=(( x =-µ)/ s)*√n=((648-600)/359,85)* √100= 1,33
P(Z>= z2 ) =α
z2 =1,64
α
α
Brak podstaw do odrzucenia Ho, iŜ średnia dla dochodów w gospodarstwach domowych
osób bezrobotnych zawodowo w 2007 roku w Polsce wynosi 600 zł. - nie ma podstaw
statystycznych do przyjęcia, ze średnia była wyŜsza od 600 zł.
RóŜnica średnich
2. Czy na podstawie wyników badania moŜna uznać, iŜ średnie dochody w
gospodarstwach domowych osób bezrobotnych i biernych zawodowo są na takim samym
poziomie? Przyjąć poziom istotności α=0,01.
Ho: µ1=µ2, średni dochodów wśród bezrobotnych jest równa średniemu dochodowi
wśród biernych
H1: : µ1 >µ2
α=0,01
x 1=648, n1=100, S1=359,85
x 2 = 574, n2=500, S2=343,7
Z= ( x 1- x 2 /( √(S1^2/n1+ S2^2/n2)=(648 -574)/
/(√(359,85*359,85/100+343,7*343,7/500)= 74/39,13=1,89
z2α = 2,33
Brak podstaw do odrzucenia Ho, brak podstaw do przyjęcia H1, iŜ średnia dla
dochodów w gospodarstwach domowych osób bezrobotnych jest wyŜsza niŜ osób biernych
zawodowo.
Frakcja
3. Wyznacz krytyczny poziom istotności dla weryfikacji hipotezy, iŜ w populacji
pracujących zawodowo osoby o wykształceniu co najwyŜej zasadniczym zawodowym
stanowiły w 2007 roku jeszcze połowę ogółu zatrudnionych. Co oznacza uzyskany
wynik?
Ho: p=0,5
H1: p<>0,5
p^=245+70/800=0,39
po=0,5
n=800
Z=(p^- p0)/ √(p0(1-p0)/n)= -0,11/0,017=-6,22
P( z ≤ -6,22 ) = F(-6,22) = 0,000
Ho odrzucamy na kaŜdym poziomie istotności
RóŜnica frakcji
4. a). Sprawdź przypuszczenie, Ŝe frakcja osób o dochodach powyŜej 1200 zł na osobę w
gospodarstwie domowym jest wyŜsza w populacji
osób bezrobotnych niŜ biernych
zawodowo. Przyjąć α=0,01.
b) Czy zmiana poziomu istotności moŜe mieć wpływ na decyzje weryfikacyjną?
a. Ho: udział osób o najwyŜszych dochodach wśród bezrobotnych = udziałowi osób o
najwyŜszych dochodach wśród biernych zawodowo
Ho: p1 = p2
7
H1: p1 ≠ p2
p1=0,08 , n1=100, X1=8
p2=0,05 n2=500, X2=25
α=0,01
Z=(p1-p2)/ √(( p~(1-p~)(1/n1)+ 1/n2))), gdzie
p~=(x1+x2)/(n1+n2)=(8+25)/(100+500)=0,055
Z=(0,08-0,05)/(0,055*0,945*(1/100+1/500))= 48,2
zα =2,58
Ho odrzucamy na kaŜdym poziomie istotności
b) P( z ≤ 48,2 ) = F(48,2) = 0,000
Ho odrzucamy na kaŜdym poziomie istotności. Zmiana poziomu istotności nie ma
wpływu na decyzje weryfikacyjną
Zajęcia #7 Weryfikacja hipotez nieparametrycznych: test zgodności chi-kwadrat
1. Korzystając z wyników uzyskanych w próbie na poziomie istotności α=0,01 zweryfikować
hipotezę o zgodności z rozkładem normalnym dochodów w populacji osób bezrobotnych.
Jako oszacowania dla parametrów rozkładu normalnego przyjąć wartości uzyskane w próbie.
χ2 = ∑((ni-npi) 2/npi)
ni – liczebność przedziałów
pi – prawdopodobieństwo, Ŝe dochód znajdzie się w i-tym przedziale, przy załoŜeniu
prawdziwości H0
n=100
Przyjmujemy jako oszacowania dla parametrów rozkładu normalnego µ i σ wartości z
próby Xsr i S: µ ∼= Xsr=648; σ∼=S=359,85
pi:
0-300: P(X<300)= P(Z<(300-648)/359,85)= P(Z<-0,97)=F(-0,97)= 1-0,8340=0,166
300-600: P(300<X<600)= P((300-648)/359,85<Z<(600-648)/359,85)= P(Z<-0,13)-P(Z<0,97)=1-P(Z<0,13)-(1-P(Z<0,97)= P(Z<0,97)-P(Z<0,13)= 0,8340-0,5517=0,2823
600-900: P(600<X<900)= P((600-648)/359,85<Z<(900-648)/359,85)= P(Z<0,7)-P(Z<0,13)=P(Z<0,7)-(1-P(Z<0,13)=P(Z<0,7)+P(Z<0,13)-1=0,7580+0,5517-1=0,3097
900-1200: P(900<X<1200)= P((900-648)/359,85<Z<(1200-648)/359,85)=P(Z<1,53)P(Z<0,7)=0,93699-0,7580=0,17899
1200-1500: P(1200<X<1500)= P((1200-648)/359,85<Z<(1500-648)/359,85)=P(Z<2,37)P(Z<1,53)=0,991106-0,93699=0,054116
1500-1800: P(1500<X<1800)= P((1500-648)/359,85<Z<(1800-648)/359,85)= P(Z<3,2)P(Z<2,37)= 0,9993129-0,991106=0,008
1800- ∞ : P(1800<X< ∞ )= P((1800-648)/359,85<Z< ∞ ) = F( ∞ ) – F(3,2) = 1 –
0,9993129=0,0007
bezrobotni
ni
pi
n
n*pi
ni-npi
(ni-npi)^2/npi
8
15
0-300
0,166
0,2823
0,3097
0,17899
100
100
100
100
16,6
28,23
30,97
17,899
-1,6
8,77
-5,97
-2,899
0,154216867
2,724509387
1,150820149
0,469534667
0,054116
100
5,4116
1,7184
0,47008701
0,008
100
0,8
0,0007
100 0,999806
100
0,07
300-600
600-900
900-1200
1200-1500
37
25
15
6
1500-1800
2
1800-
∞
SZma
0
4,96916808
Uwaga: Liczebność teoretyczna n6 + n7 teoret jest mniejsza od 5 czyli przedziały trzy
ostatnie łączymy i liczba przedziałów 5.
Ho:F(x) ∈ Fo(x)
H1:F(x) ∉ Fo(x)
α=0,01
v= 5 -2-1=2
χ2= 4,97<9,210 Brak podstaw do odrzucenia Ho
9