nx - E-SGH
Transkrypt
nx - E-SGH
Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, naleŜy przyjąć poziom istotności 0,01 i współczynnik ufności 0,99 Zadanie 1 PoniŜsze zestawienie przedstawia dane pochodzące z Badania BudŜetów Gospodarstw Domowych GUS dotyczące miesięcznych wydatków na towary i usługi konsumpcyjne (w tys. zł) w 2008 r. dla próby 900 gospodarstw domowych obejmującej trzy grupy społeczno-ekonomiczne: pracowników, rolników i pracujących na rachunek własny. Wydatki konsumpcyjne (Xoi - X1i> tys.zł Grupa społeczno-ekonomiczna pracownicy rolnicy 0-2 2-3 3-4 4-5 5-6 6-8 Razem 160 215 130 70 50 65 690 25 40 20 8 5 12 110 pracujący na rachunek własny 10 15 20 20 8 27 100 Dodatkowo obliczono: pracownicy ∑ x& i ⋅ ni Odchylenia standardowe (formuła nieobciąŜona) Trzeci moment centralny rolnicy prac. na r-ek własny 2197,5 342,5 440,5 1,79 3,90 1,80 5,08 1,95 -0,37 Wykorzystując podane informacje oraz dokonując stosownych obliczeń (z dokładnością do dwóch miejsc po przecinku) proszę: a) Naszkicować histogram przedstawiający strukturę wydatków konsumpcyjnych w grupie gospodarstw domowych pracujących na rachunek własny [2] b) Czy prawdą jest, Ŝe kwartyl pierwszy dla wydatków konsumpcyjnych w grupie gospodarstw domowych pracowników nie przekracza 2 tys. zł? (Odpowiedź uzasadnić bez obliczania wartości kwartyla) [1] c) Na podstawie klasycznej miary asymetrii ocenić siłę i kierunek asymetrii rozkładu wydatków konsumpcyjnych w grupie gospodarstw domowych pracowników [1]. d) Przyjmując, Ŝe średnia i odchylenie standardowe w populacji jest na poziomie uzyskanym w próbie, obliczyć prawdopodobieństwo tego, Ŝe suma wydatków konsumpcyjnych ze 100 elementowej próby gospodarstw domowych pracujących na rachunek własny będzie większa niŜ 450 tys.zł. [3] e) Dokonać estymacji punktowej i przedziałowej frakcji gospodarstw domowych w grupie pracowników, których wydatki konsumpcyjne zawierają się w przedziale (2 tys.zł; 3 tys.zł> [3]. 8 f) Sformułowano hipotezę zerową, Ŝe średni poziom wydatków konsumpcyjnych w populacji gospodarstw domowych pracowników wynosi 3,3 tys. zł (przy hipotezie alternatywnej, Ŝe jest niŜszy niŜ 3,3 tys.zł). Hipotezę weryfikowano na podstawie wyników uzyskanych w tym badaniu. Wyznacz najniŜszy poziom istotności, przy którym nastąpi odrzucenie hipotezy zerowej. [3] g) Ocenić siłę zaleŜności pomiędzy poziomem wydatków na konsumpcję a przynaleŜnością do grupy społeczno-ekonomicznej w badanej próbie gospodarstw domowych wiedząc, Ŝe obliczona wartość statystyki chi-kwadrat dla analizowanej próby wyniosła 50,315. [1] Zadanie 2 W poniŜszej tablicy przedstawiono wpływy ze sprzedaŜy cegły pełnej w firmie handlowej w poszczególnych kwartałach lat 2006-2009 Lata 2006 roczna wartość sprzedaŜy cegły (w tys zł) 107 2007 111 2008 118 2009 125 Razem 461 kwartały I II III IV I II III IV I II III IV I II III IV x kwartalna wartość sprzedaŜy cegły (w tys zł) 23 27 32 25 24 28 34 25 27 30 35 26 29 31 37 28 461 8 a) Wyznacz średnie ruchome scentrowane dla trzeciego i czwartego kwartału 2006 r. [1] b) Wiedząc, Ŝe względne wskaźniki okresowości (oczyszczone) dla I, II i III kwartału wynosiły odpowiednio 0,92, 1,01 i 1,19 wyznacz i zinterpretuj wskaźnik dla kwartału IV. [1] c) Wyznacz i zinterpretuj średnie roczne tempo zmian sprzedaŜy w latach 2007-2009. [1] d) Dodatkowo wiadomo, Ŝe firma sprzedawała bloczki betonowe, uzyskując z tego tytułu w latach 2008 i 2009 odpowiednio wpływy 200 tys zł oraz 195 tys zł. W 2009 r. cegła podroŜała o 15%, a cena bloczków spadła o 5%. Oceń, korzystając z formuły Paaschego, o ile zmieniła się łączna wartość sprzedaŜy wyłącznie na skutek zmiany cen obu produktów. [3] 8 Zadanie 3 Na podstawie danych o zuŜyciu nawozów mineralnych i plonach pszenicy dla wybranych 8 krajów wyznacz i zinterpretuj współczynnik korelacji rang. [3] Kraj Argentyna Australia Kanada Hiszpania Polska Wielka Brytania Francja Niemcy ZuŜycie nawozów mineralnych (w kg/ha) 4,1 5,1 38,7 71,5 93,6 106,3 134,3 152,9 Plony pszenicy (q/ha) 25,4 17 26,2 33 42,8 78,9 75,8 81,7 Zadanie 4 Na podstawie danych o współczynniku dzietności (Y) i współczynniku zatrudnienia kobiet w wieku 25-44 lata (X) dla 17 krajów UE w 2000r. sporządzono następujący wykres: 8 Ponadto wyznaczono: 17 ∑ (x i =1 i 17 ∑ (x i =1 i − x ) 2 = 1407 x = 71,2 y = 1,58 17 17 ∑(y i =1 − x )( y i − y ) = 27,4 − y ) = 0,93 2 i ∑e i =1 2 i = 0,39 a) Czy na podstawie zamieszczonego wykresu moŜna uznać, Ŝe w próbie 17 badanych krajów kraje o wysokim współczynniku zatrudnienia kobiet w wieku 25-44 lata charakteryzują się niskim współczynnikiem dzietności? [1] b) O ile wzrośnie przeciętny współczynnik dzietności, jeśli współczynnik zatrudnienia kobiet w wieku 25-44 lata wzrośnie o jednostkę? [2] c) Czy oszacowanie współczynnika regresji w modelu regresji współczynnika dzietności względem współczynnika zatrudnienia kobiet w wieku 25-44 lata jest statystycznie istotne? [3] 8 d) W jakim stopniu współczynnik zatrudnienia kobiet w wieku 25-44 lata objaśniał zmienność współczynnika dzietności w krajach UE w 2000r? [2] 5. Zadanie testowe (9 pkt) NaleŜy zaznaczyć (otoczyć kółkiem) właściwą odpowiedź T-tak lub N-nie. Punktacja poszczególnych pytań: 1pkt – odpowiedź poprawna; 0pkt – brak odpowiedzi; -1pkt – odpowiedź niepoprawna. Jeśli całkowita suma punktów z części testowej będzie ujemna, jako wynik części testowej zostanie przyjęte 0 pkt. 1. W próbie losowej jest moŜliwe aby: a/ Wartości obciąŜonego i nieobciąŜonego estymatora wariancji pewnej zmiennej wynosiły, odpowiednio, 1,1 oraz 1. T N b/ Pozycyjny wskaźnik asymetrii wynosił zero, zaś klasyczny wskaźnik asymetrii był większy od zera. T N c/ Współczynnik zbieŜności Cramera (V) był równy zero, podczas gdy jego wartość w populacji T N generalnej jest większa od zera. 2. Współczynnik determinacji liniowej w modelu regresji wynosi 0,81. Oznacza to, Ŝe: a/ Współczynnik korelacji liniowej w tej samej próbie wynosi 0,9. T N b/ Wzrost wartości zmiennej objaśniającej powoduje wzrost przeciętnej wartości zmiennej objaśnianej. T N c/ Dopasowanie modelu do danych jest niezadowalające. T N 3. Indeks(y) cen Laspeyresa: a/ MoŜe być obliczony na podstawie indeksu ilości Paaschego i indeksu wartości. T N b/ Przyjmowały wartości w poszczególnych latach okresu 2005-2009: 131%, 125%, 118%, 106% (były to indeksy łańcuchowe); oznacza to, Ŝe przeciętny poziom cen stale obniŜał się. T N c/ Nie moŜe przyjmować wartości ujemnych. T N 8