xx 0 - E-SGH
Transkrypt
xx 0 - E-SGH
Do rozwiązania samodzielnego Przykład #1. Z badania warunków i jakości Ŝycia Polaków „Diagnoza Społeczna 2007” (zrealizowanego w marcu 2007 roku na próbie 12,6 tys. indywidualnych respondentów z ponad 5,5 tys. gospodarstw domowych ) wylosowano próbę losową 1400 osób. PoniŜsze zestawienia prezentują uzyskane informacje dla osób badanych i ich statusie zawodowym oraz poziomie wykształcenia, a takŜe statusie zawodowym i poziomie dochodów (w zł /na osobę w gospodarstwie domowym). Tabl.1 Osoby badane według statusu zawodowego oraz poziomu wykształcenia WyŜsze Średnie Zasadnicze Gimnazjalne i zawodowe poniŜej Bezrobotni 10 30 35 25 Pracujący 200 285 245 70 Bierni 40 130 100 230 zawodowo Ogółem 250 445 380 325 Ogółem 100 800 500 1400 Tabl.2. Osoby badane według statusu zawodowego oraz poziomu dochodów w gospodarstwie domowym (w zł) A) liczebności ni B) częstości wi Dochody Bezrobotni Pracujący Ogółem Dochody Bezrobotni Bierni Pracujący Bierni Ogółem x0i − x1i zawodowo x0i − x1i zawodowo 0-300 15 49 117 181 0-300 0,15 0,06 0,23 0,13 300-600 37 209 173 419 300-600 0,37 0,26 0,35 0,30 600-900 25 250 128 403 600-900 0,25 0,31 0,26 0,29 900-1200 15 167 57 239 9001200 0,15 0,21 0,11 0,17 1200-1500 6 83 19 108 0,06 0,10 0,04 0,08 1500-1800 2 42 6 50 0,02 0,05 0,01 0,04 100 800 500 1400 12001500 15001800 Razem 1,00 1,00 1,00 1 Razem /Uwaga ogólna do poleceń dla studentów: wszystkie wyniki końcowe naleŜy zinterpretować./ Korzystając z podanych informacji oraz dodatkowych obliczeń proszę: 1. Przedstaw za pomocą szeregu rozdzielczego oraz na wykresie : a) strukturę wykształcenia osób bezrobotnych b) strukturę dochodów w gospodarstwach domowych osób bezrobotnych i ogółu badanych a) Bezrobotni Bezrobotni ni gimnazjalne zasadnicze zawodowe wi 25 35 0,25 0,35 1 30 10 średnie wyŜsze Razem 100 0,3 0,1 1,00 + wykres słupkowy (moŜna powiedzieć, nie koniecznie rysować- idea jest taka aby studenci widzieli róŜnice miedzy wykresami dla cech mierzalnych i niemierzalnych) b) Bezrobotni x0i-x1i ni wi n(x1i) Fn(x1i) 0-300 15 0,15 15 0,15 300-600 37 0,37 52 0,52 600-900 25 0,25 77 0,77 900-1200 15 0,15 92 0,92 1200-1500 6 0,06 98 0,98 1500-1800 2 0,02 100 1 100 1 x x suma Ogółem x0i-x1i ni wi n(x1i) Fn(x1i) 0-300 181 0,13 181 0,13 300-600 419 0,30 600 0,43 600-900 403 0,29 1003 0,72 900-1200 239 0,17 1242 0,89 1200-1500 108 0,08 1350 0,96 1500-1800 50 0,04 1400 1 suma 1400 1 x x 2. a) Czy jest moŜliwe wyznaczenie miary tendencji centralnej dla poziomu wykształcenia osób bezrobotnych? b) Wyznacz miary tendencji centralnej dla dochodów osób bezrobotnych/ (dla ogółu naleŜy policzyć średnią) Jedną z miar pozycyjnych wyznaczyć takŜe graficznie. 2 c) Korzystając z wyznaczonych miar porównać poziom dochodów w gospodarstwach domowych osób bezrobotnych oraz osób biernych zawodowo wiedząc, ze dla osób biernych zawodowo uzyskano: x = 574 zł; me = 531,4; Q1= 326,1; Q3= 796,1zł. a) Dla cechy jakościowej do= zasadnicze zawodowe b) i c) Średnie: Bezrobotni: x = 1/100*64800=648 Bierni: x = 1/500*286800=574 Ogółem: x = 1/1400*997 200=712,3 Kwartale: Bezrobotni: me=300+[0,5-0,15]*300/0,37= 583,8 Bierni: me=300+[0,5-0,23]*300/0,35=531,4 Bezrobotni: Q1=300+[0,25-0,15]*300/0,37=381,1 , Q3=600+[0,75-0,52]*300/0,25=876 Bierni: Q1=300+[0,25-0,23]*300/0,35=313,8, Q3=600+[0,75-0,58]*300/0,26= 796,1, 3. a) Oceń zróŜnicowanie dochodów w grupie osób bezrobotnych. b) Porównaj zróŜnicowanie dochodów osób bezrobotnych oraz biernych zawodowo wykorzystując miary klasyczne. Obliczona wartość odchylenia standardowego osób biernych zawodowo była równa 343,7 zł. c) Podaj standaryzowany poziom dochodów osoby bezrobotnej, której dochody (na os. w gospodarstwie domowym) wynosiły 720 zł. Rozw. a) Wariancje i odchylenia standardowe i ćwiartkowe: Bezrobotni: s2= [54810000-(64800)2/100]/99=129490,9, s=359,85 Odchylenie ćwiartkowe: Q=247,45 Bierni: s2= [223470000-(286800)2/500]/499=118159,4, s=343,7 Odchylenie ćwiartkowe: Q=241,15, b) Współczynnik zmienności: Bezrobotni: v=359,85/648=0,56, v poz.= 247,45/583,8=0,429 Bierni: v=343,7/574= 0,6 v poz.=241,15/531,4=0,454 c) z= (720-648)/359,89= 0,2 (dochody wyŜsze od średniej dla osób bezrobotnych –objętych badaniem- o 0,2 odchylenia standardowego) 3 4. Wiedząc, Ŝe ∑ (x − x ) n = 14020952256 ocenić występowanie asymetrii w rozkładzie 3 i i dochodów osób biernych zawodowo Bierni: A=[1/499*14020952256]/[343,7*343,7*343,7]= 0,69 Zajęcia #4. Twierdzenia graniczne Twierdzenie Lindberga – Levy’iego 1. Przyjmując, Ŝe średni poziom dochodów osób biernych zawodowo (w zł na os. w gosp. domowym) wynosi 574 zł z odchyleniem standardowym 343,7 zł. Oblicz: a) Jakie jest prawdopodobieństwo tego, Ŝe wśród losowo wybranych 200 osób biernych zawodowo, łączna suma ich dochodów jest mniejsza niŜ 100 000? X k – dochody Ex=574 Dx=343,7 n=200 Tn = ∑Xk, Tn~N(nEx; Dx *√(n)) --> Tn~N(200*574, 343,7*√200) P(Tn<100 000) = P(Z< ((100 000 – 114 800)/4860,65)= P(Z<-3)=1-F(3)=10,9987=0,0013 b) Jakie jest prawdopodobieństwo, Ŝe wśród losowo wybranych 100 osób biernych zawodowo, średni dochód będzie w przedziale <600;650> zł? Vn – średni dochód Ex=574 Dx=343,7 n=100 Vn= (∑Xk)/n ~N(Ex, Dx/√(n)) V100~N(574;343,7/√100) P(600<V100<650)=P(Z<(650-574)/34,37)-P(Z<(600-574)/34,37)=F(2,2)-F(0,75)=0,98610,7734=0,2127 /Twierdzenie Moivre’a-Laplace’a/ 1. Zakładając, Ŝe wśród ogółu osób pracujących osoby z wykształceniem wyŜszym stanowią 25% wyznaczyć prawdopodobieństwo, Ŝe w losowej próbie 300 pracujących, udział osób z wykształceniem wyŜszym wyniesie co najmniej 30%. p=0,25 n=300 W – odsetek pracujących z wyŜszym wykształceniem W~N(p, √(p(1-p)/n)=N(0,25, 0,025) P(W>=0,3)= 1-P(W<0,3)= 1-P(Z<(0,3-0,25)/0,025)= 1-P(Z<2)=1-0,9772=0,0228 2. Zakładając, Ŝe wśród ogółu osób z wykształceniem zasadniczym zawodowym 26% stanowiły osoby bierne zawodowo wyznaczyć: Jakie jest prawdopodobieństwo, Ŝe w losowej próbie 400 osób z wykształceniem zasadniczym zawodowym liczba biernych zawodowo nie przekroczy 100 osób? p=0,26 n=400 4 X400– liczba biernych zawodowo z wykształceniem zasadniczym zawodowym w próbie X400~N(np, √(np(1-p)=N(104; 8,77) P(Xn < 100 )= P(Z<(100-104/8,77)= F(-0,456)=1-F(0,465)=1-0,6772=0,3228 Zajęcia #5 Estymacja przedziałowa Średnia: x =~N(m, σ/√n) Z=( x -m)/ σ*√n -->N(0,1) α=0,05 µα=1,96 P( x - µα* σ/√n<m< x + µα* σ/√n=1- α (w przybliŜeniu) d= µα* σ /√(n) –max błąd szacunku Zakładamy, Ŝe σ=s z próby 1. Wykorzystując dane uzyskane z próby wylosowanej z badania ‘Diagnoza Społeczna 2007’ (tabl. 2 oraz wyniki uzyskane w zad.1 i zad 2.) przeprowadź następujące procedury wnioskowania o populacji osób populacji osób bezrobotnych i dochodach w ich gospodarstwach domowych (w zł na osobę w gospodarstwie domowym) a) Podaj punktową ocenę średniego poziomu dochodów w gospodarstwach domowych osób pracujących zawodowo. Określ błąd standardowy tego szacunku. b) Dokonaj estymacji przedziałowej dla średniego poziomu dochodów w gospodarstwach domowych osób pracujących zawodowo. Przyjąć współczynnik ufności na poziomie 0,95 oraz określ standardowy błąd szacunku. c) Jak zmieni się precyzja tego oszacowania jeśli przyjmie się poziom ufności 1- α= =0,99 ? a). Bezrobotni: x = 1/100*64800=648 d= σ /√(n)=359,85/√(100)=35,9 b) bezrobotni: x =648, s=359,85, n=100 P(648-1,96*359,85/10)<m<648+1,96*(359,85/10)=1- α przedział ufności (577,47718,53) d= 1,96*359,85/√(100)=70,5 c) Bezrobotni: α=0,01 µα=2,58 P(648-2,58*359,85/10)<m<648+2,58*(359,85/10)=1- α przedział ufności (555,2 740,8) d1= 2,58*359,85/√(100)=92,8 d/d1=1,96/2,58=0,759 max błąd szacunku spadł o 24,1%, wzrosła precyzja oszacowania o 24,1%. Frakcja: 5 p^ = frakcja w próbie p – frakcja w populacji P(p^- µα* √(p^(1-p^)/n)<p< (p^+ µα* √(p^(1-p^)/n)=1- α (w przybliŜeniu) d= µα√( p^(1-p^)/n) – max błąd szacunku 2. Wykorzystując dane uzyskane z próby wylosowanej z badania ‘Diagnoza Społeczna 2007’ (tabl. 1 oraz wyniki uzyskane w zad.1 i zad 2.) a) Podaj punktową ocenę frakcji osób pracujących zawodowo w populacji osób z wykształceniem zasadniczym zawodowym. Określ błąd standardowy tego szacunku. b) Dokonaj estymacji przedziałowej dla udziału osób udziału pracujących zawodowo w populacji osób z wykształceniem zasadniczym zawodowi. Przyjąć współczynnik ufności na poziomie 0,95. c) Jaka powinna być co najmniej liczebność próby wykształceniem zasadniczym zawodowym aby precyzja oszacowania z pktu 2b)wzrosła trzykrotnie? a) frakcja osób z pracujących wśród osób z wykształceniem zasadniczym zawodowym p=245/380=0,64 dstand =√( p^(1-p^)/n)= √( 0,64*0,36/380)=0,024 b) przedział ufności dla udziału pracujących wśród osób z wykształceniem zasadniczym zawodowym α=0,05 µα=1,96 n=380 p^=245/380=0,64 P(0,64- 1,96* √(0,36*0,64/380)<p< 0,64+ 1,96* √(0,36*0,64/380)=1- α przedział ufności (0,59-0,69) d=1,96*√(0,64*0,36/380)=0,05 c) Aby precyzja oszacowania wzrosła trzykrotnie, to max błąd szacunku musi spaść 3 krotnie. n 2=9n1=9*380=3420 Zajęcia #6 Weryfikacja hipotez parametrycznych Średnia 1. Czy na podstawie wyników z tej próby moŜna przyjąć, iŜ średnia dochodów w gospodarstwach domowych osób bezrobotnych w 2007 roku w Polsce była niŜsza niŜ 600 zł ? Przyjąć prawdopodobieństwo popełnienia błędu I-go rodzaju na poziomie 0,05. Ho=średni dochód bezrobotnych wynosi 600 PLN Ho: µ=600, H1:µ>600 x = ~N(µ, σ/√n) N(0,1) n=100 x =648 6 S=359,85 α=0,05 Z=(( x =-µ)/ s)*√n=((648-600)/359,85)* √100= 1,33 P(Z>= z2 ) =α z2 =1,64 α α Brak podstaw do odrzucenia Ho, iŜ średnia dla dochodów w gospodarstwach domowych osób bezrobotnych zawodowo w 2007 roku w Polsce wynosi 600 zł. - nie ma podstaw statystycznych do przyjęcia, ze średnia była wyŜsza od 600 zł. RóŜnica średnich 2. Czy na podstawie wyników badania moŜna uznać, iŜ średnie dochody w gospodarstwach domowych osób bezrobotnych i biernych zawodowo są na takim samym poziomie? Przyjąć poziom istotności α=0,01. Ho: µ1=µ2, średni dochodów wśród bezrobotnych jest równa średniemu dochodowi wśród biernych H1: : µ1 >µ2 α=0,01 x 1=648, n1=100, S1=359,85 x 2 = 574, n2=500, S2=343,7 Z= ( x 1- x 2 /( √(S1^2/n1+ S2^2/n2)=(648 -574)/ /(√(359,85*359,85/100+343,7*343,7/500)= 74/39,13=1,89 z2α = 2,33 Brak podstaw do odrzucenia Ho, brak podstaw do przyjęcia H1, iŜ średnia dla dochodów w gospodarstwach domowych osób bezrobotnych jest wyŜsza niŜ osób biernych zawodowo. Frakcja 3. Wyznacz krytyczny poziom istotności dla weryfikacji hipotezy, iŜ w populacji pracujących zawodowo osoby o wykształceniu co najwyŜej zasadniczym zawodowym stanowiły w 2007 roku jeszcze połowę ogółu zatrudnionych. Co oznacza uzyskany wynik? Ho: p=0,5 H1: p<>0,5 p^=245+70/800=0,39 po=0,5 n=800 Z=(p^- p0)/ √(p0(1-p0)/n)= -0,11/0,017=-6,22 P( z ≤ -6,22 ) = F(-6,22) = 0,000 Ho odrzucamy na kaŜdym poziomie istotności RóŜnica frakcji 4. a). Sprawdź przypuszczenie, Ŝe frakcja osób o dochodach powyŜej 1200 zł na osobę w gospodarstwie domowym jest wyŜsza w populacji osób bezrobotnych niŜ biernych zawodowo. Przyjąć α=0,01. b) Czy zmiana poziomu istotności moŜe mieć wpływ na decyzje weryfikacyjną? a. Ho: udział osób o najwyŜszych dochodach wśród bezrobotnych = udziałowi osób o najwyŜszych dochodach wśród biernych zawodowo Ho: p1 = p2 7 H1: p1 ≠ p2 p1=0,08 , n1=100, X1=8 p2=0,05 n2=500, X2=25 α=0,01 Z=(p1-p2)/ √(( p~(1-p~)(1/n1)+ 1/n2))), gdzie p~=(x1+x2)/(n1+n2)=(8+25)/(100+500)=0,055 Z=(0,08-0,05)/(0,055*0,945*(1/100+1/500))= 48,2 zα =2,58 Ho odrzucamy na kaŜdym poziomie istotności b) P( z ≤ 48,2 ) = F(48,2) = 0,000 Ho odrzucamy na kaŜdym poziomie istotności. Zmiana poziomu istotności nie ma wpływu na decyzje weryfikacyjną Zajęcia #7 Weryfikacja hipotez nieparametrycznych: test zgodności chi-kwadrat 1. Korzystając z wyników uzyskanych w próbie na poziomie istotności α=0,01 zweryfikować hipotezę o zgodności z rozkładem normalnym dochodów w populacji osób bezrobotnych. Jako oszacowania dla parametrów rozkładu normalnego przyjąć wartości uzyskane w próbie. χ2 = ∑((ni-npi) 2/npi) ni – liczebność przedziałów pi – prawdopodobieństwo, Ŝe dochód znajdzie się w i-tym przedziale, przy załoŜeniu prawdziwości H0 n=100 Przyjmujemy jako oszacowania dla parametrów rozkładu normalnego µ i σ wartości z próby Xsr i S: µ ∼= Xsr=648; σ∼=S=359,85 pi: 0-300: P(X<300)= P(Z<(300-648)/359,85)= P(Z<-0,97)=F(-0,97)= 1-0,8340=0,166 300-600: P(300<X<600)= P((300-648)/359,85<Z<(600-648)/359,85)= P(Z<-0,13)-P(Z<0,97)=1-P(Z<0,13)-(1-P(Z<0,97)= P(Z<0,97)-P(Z<0,13)= 0,8340-0,5517=0,2823 600-900: P(600<X<900)= P((600-648)/359,85<Z<(900-648)/359,85)= P(Z<0,7)-P(Z<0,13)=P(Z<0,7)-(1-P(Z<0,13)=P(Z<0,7)+P(Z<0,13)-1=0,7580+0,5517-1=0,3097 900-1200: P(900<X<1200)= P((900-648)/359,85<Z<(1200-648)/359,85)=P(Z<1,53)P(Z<0,7)=0,93699-0,7580=0,17899 1200-1500: P(1200<X<1500)= P((1200-648)/359,85<Z<(1500-648)/359,85)=P(Z<2,37)P(Z<1,53)=0,991106-0,93699=0,054116 1500-1800: P(1500<X<1800)= P((1500-648)/359,85<Z<(1800-648)/359,85)= P(Z<3,2)P(Z<2,37)= 0,9993129-0,991106=0,008 1800- ∞ : P(1800<X< ∞ )= P((1800-648)/359,85<Z< ∞ ) = F( ∞ ) – F(3,2) = 1 – 0,9993129=0,0007 bezrobotni ni pi n n*pi ni-npi (ni-npi)^2/npi 8 15 0-300 0,166 0,2823 0,3097 0,17899 100 100 100 100 16,6 28,23 30,97 17,899 -1,6 8,77 -5,97 -2,899 0,154216867 2,724509387 1,150820149 0,469534667 0,054116 100 5,4116 1,7184 0,47008701 0,008 100 0,8 0,0007 100 0,999806 100 0,07 300-600 600-900 900-1200 1200-1500 37 25 15 6 1500-1800 2 1800- ∞ SZma 0 4,96916808 Uwaga: Liczebność teoretyczna n6 + n7 teoret jest mniejsza od 5 czyli przedziały trzy ostatnie łączymy i liczba przedziałów 5. Ho:F(x) ∈ Fo(x) H1:F(x) ∉ Fo(x) α=0,01 v= 5 -2-1=2 χ2= 4,97<9,210 Brak podstaw do odrzucenia Ho 9