korelacjairegresja
Transkrypt
korelacjairegresja
Analiza korelacji i regresji Zestaw II Analiza korelacji i regresji Zad. 1 Pewien zakład produkcyjny zatrudnia 5 pracowników fizycznych. Ich wydajność pracy (Y – w szt./h) oraz miesięczne wynagrodzenie (X – w tys. zł) przedstawia poniższa tabela: Pracownik A B C D E y 12 14 14 10 16 x 0,9 1,1 1 0,7 1,3 a) Proszę sporządzić wykres rozrzutu wynagrodzenia względem wydajności; b) Proszę ocenić siłę i kierunek zależności badanych cech. Zad. 2 Przeciętna wydajność pracy 100 pracowników zakładu W wynosi 10 szt./h, a przeciętny staż pracy kształtuje się na poziomie 20 miesięcy. Ponadto wiadomo, że klasyczne współczynniki zmienności obu cech są takie same i wynoszą 50%, a kowariancja między nimi jest równa 45. Proszę ocenić siłę i kierunek zależności obu cech . Zad. 3 Zmienna objaśniająca Y oraz zmienna kandydująca do roli objaśniających X 1 , X 2 , X 3 przyjmują następujące wartości: Yt 8 7 10 11 14 X1t 1 2 3 4 5 X2t 10 12 16 20 22 X3t 1,6 2,0 1,5 0,8 1,1 Wyznaczyć współczynniki korelacji między zmiennymi. dr inż. Aleksandra Czupryna-Nowak 1 Analiza korelacji i regresji Zestaw II Zad. 4 Badano w 20 firmach produkujących ten sam wyrób : X - produkcję w tys. sztuk, Y koszt tej produkcji w mln zł. Dane zestawiono w tablicy korelacyjnej otrzymując : y x 1 2 3 1 2 3 3 1 1 6 3 1 5 W jakim stopniu koszt całkowity jest kształtowany przez poziom produkcji. Ile sztuk badanego wyrobu można wyprodukować za 5 mln zł? Zad. 5 Sprawdzić czy istnieje zależność liniowa pomiędzy liczbą samochodów zarejestrowanych w pewnych województwach, a liczbą wypadków drogowych i znaleźć funkcję regresji. Lb. samochodów Lb. wypadków 29 110 23 70 16 96 20 83 8 40 27 100 12 65 10 55 Zad. 6 Z populacji pobrano 11 elementów. Na każdym z nich dokonano pomiaru cechy X i Y. Otrzymano następujące wyniki: 1 2 3 4 5 6 7 8 9 10 X 2 2 3 3 4 4 5 5 6 6 Y 10 15 9 10 12 18 16 11 16 20 Oblicz współczynnik korelacji, sprawdź jego istotność, wyznacz równanie regresji, przedstaw na wykresie punkty empiryczne i linię regresji. Omów wyniki Zad. 7 W pięciu tyskich restauracjach liczba sprzedanych placków po węgiersku (X), cena takiego placka (Y) oraz liczba gości (Z)w dniu 19.03.2004 kształtowała się jak niżej: restauracja X Y Z I II III IV V 16 18 10 12 13 10 11 16 16 17 100 90 70 70 80 a) Jak silnie i w jakim kierunku liczba gości wpływa na liczbę sprzedanych placków? b) Jak silnie i w jakim kierunku cena placka wpływa na liczbę sprzedanych placków? c) Jak silnie liczba gości w restauracji wpływa na liczbę sprzedanych placków, jeśli wyeliminuje się wpływ ceny placka? d) Jak silnie cena placka wpływa na liczbę sprzedanych placków, jeśli wyeliminuje się wpływ liczby gości w restauracji? e) Jak silny jest łączny wpływ ceny placka i liczby gości na ilość sprzedanych porcji? dr inż. Aleksandra Czupryna-Nowak 2 Analiza korelacji i regresji Zestaw II Zad. 8 49% wydatków na cele kulturalne jest wyjaśniane liczbą dzieci w rodzinie i jest to zależność o nachyleniu ujemnym. Z kolei 64% tych wydatków jest wyjaśniane dochodem w rodzinie na osobę i ta zależność ma charakter dodatni. Natomiast 36% dochodów na osobę jest wyjaśniane liczbą dzieci w rodzinie i jest to zależność o nachyleniu ujemnym. a) Proszę ocenić siłę i kierunek wpływu liczby dzieci na wydatki na cele kulturalne, jeśli wyeliminuje się wpływ dochodów na osobę. b) Proszę ocenić siłę i kierunek wpływu wpływ dochodów na osobę na wydatki na cele kulturalne, jeśli wyeliminuje się liczby dzieci. c) Proszę ocenić siłę łącznego wpływu dochodu na osobę oraz liczby dzieci na wydatki na cele kulturalne. Zad. 9 200 pracowników pewnej tyskiej firmy zbadano ze względu na miejsce zamieszkania (Zabrze czy inne miasto?) oraz częstotliwość spóźnień do pracy (rzadko czy często?). Okazało się, że spośród pracowników zamieszkałych w Zabrzu rzadko spóźnia się do pracy 110 osób, a często 10 osób. Natomiast wśród pracowników dojeżdżających z innych miast rzadko spóźnia się 30 osób, a często 50. Jak silnie częstotliwość spóźnień zależy od miejsca zamieszkania? Zad. 10 W lipcu pewnego roku na studia zaoczne we WSH złożyło dokumenty 180 osób. Spośród kandydatów, którzy złożyli dokumenty na Socjologię, 61 osób deklaruje się jako umysły humanistyczne, a 3 – jako ścisłe. Na pozostałych kierunkach proporcje te kształtują się następująco: Administracja: 50 umysłów humanistycznych i 4 ścisłe, Zarządzanie i Marketing: 20 humanistycznych i 25 ścisłych, Informatyka i Ekonometria: 16 ścisłych. Jak silnie predyspozycje studenta wpływają na wybór kierunku? Zad. 11 Wśród 27 osób deklarujących lewicowe poglądy polityczne 12 było w 2004 r. zadowolonych z rządu premiera B., 10 niezadowolonych, a 5 osób nie miało zdania. Wśród 26 osób o poglądach prawicowych zadowolona była 1 osoba, niezadowolonych 23, a 2 nie miały zdania. Wśród 21 osób o poglądach centrowych zadowolonych było 15 osób, niezadowolonych 5, a 1 osoba nie miała zdania. Natomiast wśród 26 osób nieinteresujących się polityką zadowolona była1 osoba, niezadowolonych 5, a 20 nie miało zdania. Jak silnie preferencje polityczne wpływały na zadowolenie z rządu premiera B.? Zad. 12 Na podstawie danych dotyczących dochodów 100 losowo wybranych firm ( x w mln zł) oraz wydatków tych firm na cele charytatywne ( y w mln zł) uzyskano następujące informacje: x =40,12; ∑ y i = 340 cxy = 3,5; sx = 3,57; ∑ ( yˆi − y ) 2 = 96,66; ∑ ( yi − yˆi) 2 = 47,34; a) Zapisać funkcję regresji liniowej wydatków na cele charytatywne względem dochodów firm, zinterpretować jej parametry. b) Ocenić stopień dopasowania modelu do danych empirycznych. dr inż. Aleksandra Czupryna-Nowak 3 Analiza korelacji i regresji Zestaw II Zad. 13 Na podstawie 23-elementowej próby obliczono następujące wartości: cov( X ; Y ) = 55; S X2 = 70; S y2 = 95; x = 15; ∑y i = −250 Czy zależność liniową między zmiennymi X i Y (mierzoną współczynnikiem korelacji liniowej Pearsona) można uznać za statystycznie istotną? Zad. 14 Na podstawie poniższych danych wyznaczyć teoretyczne równania regresji dla zmiennych x i y oraz zależności odwrotnej: rxy = 0,81 a1 = 90 x = 2700 y = 18 Zad. 15 Przeprowadzono wśród 80 kandydatów na pilotów obserwacje dotyczące czasu reakcji na dwa bodźce A (zmienna X) i B (zmienna Y). Otrzymano, że średni czas reakcji na bodziec A wyniósł 4,8 s., a na bodziec B 14,5. Kowariancja pomiędzy zmiennymi wyniosła 2,06 sekundy2. Odchylenie standardowe dla bodźca B wynosi 2,2 sekundy, a współczynnik korelacji pomiędzy bodźcami wyniósł 0,72. Jakiego czasu reakcji na bodziec B będzie można oczekiwać od kandydata który zareagował na bodziec A po 11 sekundach? Zad. 16 Zbadano 10 mieszkań o powierzchni 65m2 pod względem liczby zamieszkałych osób oraz zużycia wody. Otrzymano następujące wyniki: i Liczba osób (xi) Zużycie wody w m3 (yi) 1 3 2 7 3 2 4 6 5 1 6 5 7 4 8 3 9 2 10 1 12 20 10 18 8 15 14 11 9 5 Na podstawie powyższych danych oblicz i zinterpretuj: współczynnik korelacji, współczynnik determinacji i współczynnik indeterminacji, parametry liniowej funkcji regresji opisującej zależność zużycia wody od liczby osób zamieszkującej mieszkanie. Zbadaj dobroć dopasowania danych empirycznych do otrzymanej funkcji regresji Zad. 17 Roczna liczba osób przekraczających granicę na przejściu w K. oraz roczna ilość skonfiskowanego tym osobom alkoholu przedstawiała się w latach 1994 – 2001 następująco: rok liczba osób na przejściu (mln) 1994 6 1995 4 ilość skonfiskowanego alkoholu (tys. l) 21 16 1996 1997 5 8 17 23 1998 1999 10 4 26 16 2000 4 2001 7 19 22 Proszę sporządzić wykres rozrzutu ilości skonfiskowanego alkoholu względem liczby osób przekraczających granicę oraz ocenić siłę i kierunek zależności obu cech dr inż. Aleksandra Czupryna-Nowak 4 Analiza korelacji i regresji Zestaw II Zad. 18 U 5 studentów całkowite koszty studiowania na I roku (w tys. zł), odległość miejsca zamieszkania od uczelni (w km) i liczba egzaminów poprawkowych kształtują się następująco: koszty studiów (X) odległość od uczelni (Y) liczba poprawek (Z) 3,2 50 0 2,8 10 0 3,6 20 2 2,9 0 1 3 20 0 a) Jak silnie liczba poprawek wpływa na koszty studiowania? b) Jak silnie odległość od uczelni wpływa na koszty studiowania? Zad. 19 Oceniając dopasowanie równania regresji wydajności robotników pewnego zakładu (w szt./h) ich stażu pracy (w latach) otrzymano następujące składniki resztowe: 1 2 -4 1 -3 -2 0 3 1 0 -1 2 Co można powiedzieć o dopasowaniu tego równania, jeśli przeciętny poziom wydajności wynosił 40 szt./h z klasycznym współczynnikiem zmienności 25%? Zad. 20 Badając dzienny popyt na piwo (Y – w litrach) oraz jego cenę (X – w zł) w 100 katowickich pubach otrzymano następujące równania regresji: y* = -16x + 180 x* = -0,04y + 9. a) Jakiego popytu można się spodziewać przy cenie 4,50 zł? b) Jaką cenę należy ustalić, chcąc sprzedawać 80 litrów piwa? c) Co można powiedzieć o sile i kierunku zależności między ceną piwa a popytem na nie? d) Jaki jest przeciętny poziom badanych cech? Zad. 21 Badając współzależność płac brutto (w tys. zł) i wydajności pracy (w szt./godz.) 100 robotników pewnego zakładu pracy uzyskano następujące wyniki: y = 10 odchyle nie standar dowe S(x) = 0,5 klasyczny współcz. zmienności S(y)= Vz (y) = 60% kowa riancj a Vz (x) = współcz. korelacji rxy= cov(x,y) = 2,7 płaca bruto (tys. zł) x = 1,6 wydajność (szt./h) średnia parametry równań regresji a1 = a0 = b1 = b0 = Współ. zbieżności odchylenie standardo we reszt współcz. zmienności resztowej ϕ2= Su(x)= Vu(y)= Su(x)= Vu(x)= a) Obliczyć i zinterpretować brakujące miary. b) Jakiego wynagrodzenia może się spodziewać robotnik pracujący z wydajnością 8 szt./godz. ? c) Jakiej wydajności należy oczekiwać od robotnika zarabiającego 1500 zł? dr inż. Aleksandra Czupryna-Nowak 5 Analiza korelacji i regresji Zestaw II Zad. 22 Sprzedaż dzienna X pewnego artykułu w tys szt i jego cena Y w zł, w 5 sklepach pewnej miejscowości kształtowała się następująco : X Y 1 17 2 12 4 11 4 5 5 5 Jaka jest siła tej zależności i ile będzie można sprzedać sztuk tego artykułu w cenie 6 zł Zad. 23 Dla 35 sklepów tej samej branży oszacowano funkcję regresji kosztów handlowych y względem miesięcznych obrotów sklepowych x i otrzymano następującą postać : Y = -0,04 x + 10,43 , Wiadomo ponadto, że y = 6,2% x= 105,7 mln zł, Vx= 21%, Vy=23%. Wykorzystując powyższe dane oblicz współczynnik korelacji tych zmiennych i go zinterpretuj. Zad. 24 Na podstawie obserwacji zmiennych Z i V obliczono: 22 ∑ (z i=1 i − z )(v i − v ) = 30 , 22 ∑ (z − z ) = 100 , 2 i i=1 22 ∑ (v i=1 − v ) = 60 , 2 i 22 ∑z i = 440 , i=1 22 ∑v i = 220 i=1 oblicz współczynnik korelacji. Zad. 25 Jednostkowy koszt produkcji oraz wielkość produkcji pewnego dobra (w tys. sztuk) w konkurujących ze sobą pięciu firmach przedstawiono w zestawieniu: Wielkość produkcji 23 30 41 45 50 Jednostkowy koszt produkcji 50 38 34 30 28 Wyznacz i zinterpretuj współczynnik korelacji liniowej Pearsona. Zad. 26 Fabryka mebli analizując kwartalną sprzedaż (w mln zł) oraz wydatki na reklamę (w tys. zł) uzyskała następujące informacje: Kwartalne wydatki na reklamę (w tys. zł) Wielkość sprzedaży kwartalnej (w mln zł) 1,8 2,3 2,6 2,4 2,8 3,0 3,4 3,2 3,6 3,8 26 31 28 30 34 38 41 44 40 43 a) narysuj korelacyjny diagram rozrzutu, dr inż. Aleksandra Czupryna-Nowak 6 Analiza korelacji i regresji b) c) d) e) Zestaw II oblicz współczynnik korelacji liniowej Pearsona, wyznacz rachunkowo i graficznie obydwa równania regresji, oceń stopień dopasowania funkcji regresji do danych empirycznych, oszacuj wielkość sprzedaży kwartalnej, jeśli wydatki na reklamę będą kształtowały się na poziomie 4 tys. zł. Zad. 27 Pewne biuro nieruchomości w Poznaniu jest zainteresowane zbadaniem zależności pomiędzy powierzchnią sprzedawanych przez nich mieszkań (w m 2 ) a ich ceną rynkową (w tys. zł). Uzyskany materiał empiryczny przedstawia poniższy szereg statystyczny: Powierzchnia (w m 2 ) Cena (w tys. zł) 80 70 64 50 64 47 42 42 57 31 31 a) b) c) d) e) 170 165 100 87 85 82 78 68 95 58 43 narysuj korelacyjny diagram rozrzutu, oblicz współczynnik korelacji liniowej Pearsona, wyznacz rachunkowo i graficznie obydwa równania regresji, oceń stopień dopasowania funkcji regresji do danych empirycznych, Nowy klient chce sprzedać mieszkanie o powierzchni 76 m 2 . Oszacuj cenę rynkową tego mieszkania. Zad. 28 W banku Z zbadano zależność między stażem pracy zatrudnionych pracowników w latach (X) a wysokością ich zarobków w zł (Y). Uzyskano następujące informacje: przeciętny staż pracy wynosił 5 lat, przeciętny zarobek 1200 zł. Współczynnik zmienności stażu pracy wynosił 20%. Współczynnik zmienności płac – 30%. Z kolei współczynnik korelacji pomiędzy stażem pracy a wysokością płac 0,75. Na podstawie tych informacji: a) wyznacz rachunkowo teoretyczne linie regresji, b) oszacuj wysokość płacy dla dziesięcioletniego stażu pracy, c) czy prawdą jest, ze staż pracy w 90% kształtuje zmienność zarobków zatrudnionych pracowników? dr inż. Aleksandra Czupryna-Nowak 7 Analiza korelacji i regresji Zestaw II Zad. 29 Badanie działalności handlowej dostarczyły min. następujących informacji o powierzchni i wielkości utargu: Powierzchnia (w m kw.) Dzienny utarg (w tys. zł) 20 30 35 40 45 65 75 80 90 100 3,5 4,8 4,5 3,0 5,0 4,1 6,5 8,8 9,0 10,8 a) wyznacz parametry teoretycznej funkcji regresji liniowej w zależności od powierzchni oraz odchylenie standardowe reszt modelu, b) sklep ma powierzchnię 120 m kw. Na podstawie wyznaczonego równania regresji oszacuj możliwy utarg tego sklepu. c) Sklep uzyskał dzienny w wysokości 7 tys. zł. Określ powierzchnię sklepu. d) Współczynnik korelacji między liczbą sprzedawców a utargiem wynosi 0,7. Która z cech w większym stopniu wyjaśnia wielkość utargu: liczba sprzedawców czy powierzchnia sklepu? Zad. 30 W zakładach odzieżowych przeprowadzono badania w celu ustalenia zależności między długością serii produkcji w tys. sztuk (X) a jednostkowym kosztem produkcji wyrobu w zł (Y). W rezultacie otrzymano następujące teoretyczne równania regresji: yˆ = 5160 − 270 xi xˆ = 1,7 − 0,003 yi a) podaj interpretację współczynników regresji, b) co można powiedzieć o kierunku i sile zależności między tymi cechami? c) W jakim procencie zmienna X wyjaśnia zmienną Y? d) Jaki jest teoretyczny poziom kosztu jednostkowego przy serii o długości 10 tys. sztuk? Zad. 31 Spółka zajmująca się sprzedaż różnego rodzaju kserokopiarek chce ustalić wpływ wydatków na reklamę własnego produktu (w tys. zł) na wielkość sprzedaży (w mln zł). W tym celu zebrano informacje dotyczące ostatnich pięciu lat (dane roczne): 5 ∑x i =1 i = 132 , 5 ∑x i =1 2 i = 3502 , 5 ∑y i =1 i = 96 5 ∑y i =1 2 i = 1870 , 5 ∑x y i =1 i i = 2553 . Na podstawie tych informacji: a) oblicz współczynnik korelacji liniowej Pearsona, b) wyznacz rachunkowo i graficznie obydwa równania regresji, c) oszacuj „dobroć” dopasowania równania regresji opisującego zależność sprzedaży kserokopiarek od wydatków ponoszonych na reklamę w tym przedsiębiorstwie, d) oszacuj wartość sprzedaży przyjmując, że wydatki na reklamę wynoszą 30 tys. zł rocznie. dr inż. Aleksandra Czupryna-Nowak 8 Analiza korelacji i regresji Zestaw II Zad. 32 Właściciel autokomisu na terenie Wielkopolski w celu zbadania jak kształtują się ceny rynkowe samochodu Honda Civic, wybrał losowo 10 ofert sprzedaży z województwa wielkopolskiego zamieszczonych w codziennej prasie. Dane dotyczące ceny samochodu w tys. zł (Y), wieku samochodu w latach ( X 1 ) oraz przebiegu w tys. km ( X 2 ) przedstawiono w tablicy: Cena 12 22 15 35 21 25 28 33 36 43 Wiek 10 6 8 4 8 7 5 6 3 1 Przebieg 180 65 120 50 150 70 100 70 50 15 a) oblicz współczynniki korelacji prostej oraz cząstkowej, b) oblicz współczynnik korelacji wielorakiej, c) w jakim stopniu zmienność wieku samochodu oraz jego przebiegu determinuje zmiany jego ceny rynkowej? d) Wyznacz równanie regresji wielorakiej, e) Oceń czy model jest dopuszczalny, f) Oszacuj cenę rynkową 4-letniej Hondy Civic o przebiegu 50 tys. km. Zad. 33 Zbadano 30 rodzin zamieszkałych w Poznaniu ze względu na: miesięczne wydatki na artykuły żywnościowe na 1 osobę w tys. zł (Y), miesięczne dochody na 1 osobę w tys. zł ( X 1 ) oraz liczbę osób wchodzącą w skład rodziny ( X 2 ). Na podstawie uzyskanych danych oszacowano następujące równanie regresji: yˆ = 0,09 + 0,250 x1 − 0,005 x2 oraz współczynnik korelacji wielorakiej wynoszący 0,996. Korzystając z tych wyników: a) podaj interpretacje współczynników występujących w tym modelu, b) oblicz i zinterpretuj współczynnik determinacji, c) oszacuj ile przeciętnie wydaje na artykuły żywnościowe 5-osobowa rodzina, której miesięczny dochód na osobę wynosi 800 zł? Zad. 34 Zbiorowość pracowników pewnego przedsiębiorstwa zbadano ze względu na następujące cechy: wynagrodzenie (Y), staż pracy ( X 1 ) i wydajność pracy ( X 2 ) i uzyskano następujące wyniki: ryx1 = 0,965 , ryx2 = 0,900 oraz rx1x2 = 0,936 . Na podstawie tych wyników: a) oblicz i zinterpretuj współczynniki korelacji cząstkowej, b) oblicz i zinterpretuj współczynnik korelacji wielorakiej, c) wyznacz macierz współczynników korelacji. dr inż. Aleksandra Czupryna-Nowak 9 Analiza korelacji i regresji Zestaw II Zad. 35 Wyniki egzaminów końcowych ze statystyki i matematyki uzyskane przez grupę 10 studentów Politechniki Śląskiej w roku akademickim 2003/2004 były następujące: matematyka Db +db nd nd dst db bdb statystyka Db bdb +dst nd dst +dst db +dst db bdb +db +db db Oblicz siłę współzależności między ocenami uzyskanymi z obydwu przedmiotów wykorzystując współczynnik korelacji rang Spearmana. Zad. 36 Poniższe dane są losową próbą dochodów konsumentów i ich wydatków na pewne dobra luksusowe: Dochód (w tys. zł/rok) 23 17 34 56 49 31 28 80 65 40 26 Wydatki na dobra luksusowe (zł/miesiąc) 10 50 120 225 90 60 55 340 170 25 80 Oblicz i zinterpretuj współczynnik korelacji ran Spearmana. Zad. 37 Inwestor w oparciu o 30 obserwacji badał zależność ceny akcji y od ceny akcji x . Ustalił: - cena akcji x różniła się średnio o 4 zł w porównaniu z ceną średnią wynoszącą 20 zł. - średnia cena akcji y wynosiła 60 zł z odchyleniem standardowym 10 zł. - kowariancja obu zmiennych wynosiła: -36. a) oszacuj i zinterpretuj parametry liniowego modelu regresji b) oblicz i zinterpretuj współczynnik korelacji liniowej i współczynnik determinacji. Zad. 38 W analizie liniowej regresji tygodniowego czasu poświęcanego na naukę ( y – godz.) względem czasu oglądania telewizji (x- godz.) dla 80 uczniów otrzymano: cyx = -1,32; x = 18; y = 14; sx =2; sy = 1,7; se =1,6. a) Oszacować parametry strukturalne funkcji regresji. b) Czy współczynnik regresji jest istotnie ujemny ( przyjąć poziom istotności 0,05 ). c) Podać teoretyczny czas nauki osoby, której czas oglądania telewizji wynosi 20 godz. oraz błąd tej prognozy. Zad. 39 Pewien analityk bada współzależność zmian cen dwóch walut. W oparciu o 30 obserwacji zbudował następujący model regresji liniowej opisujący zależność ceny waluty y od ceny waluty x: ŷ i = 5 xi – 200 R2 = 29,16% [1,467] [ 8] a) Przeprowadź ocenę jakości tego modelu z punktu widzenia kryteriów możliwych do zastosowania przy podanych informacjach. Przyjąć poziom istotności 0,01 przy weryfikacji stosownej hipotezy. b) Ile wynosi krytyczny poziom istotności przy weryfikacji hipotezy o istotności współczynnika regresji? c) Przy jakim poziomie nastąpi zmiana decyzji? dr inż. Aleksandra Czupryna-Nowak 10 Analiza korelacji i regresji Zestaw II Zad. 40 Docent J. twierdzi, że zwiększenie opodatkowania najbogatszych obniża stopę bezrobocia. W celu empirycznego potwierdzenia tej tezy oszacował poniższy model regresji liniowej, posługując się danymi z 12 krajów: y$ i = -0.1 xi + 12; gdzie yi jest stopą bezrobocia w i-tym kraju, a xi stopą opodatkowania najbogatszych (obie wielkości w procentach). Odchylenie standardowe reszt modelu wynosi 1.2 a wariancja cechy y: 2. Czy powyższa teoria jest dobrze dopasowana do rzeczywistości? Zad. 41 Estymując model regresji liniowej uzależniającego liczbę dzieci urodzonych przez kobiety (cecha y, w tys.) od liczby kobiet w wieku 20-24 lata (cecha x, w tys.) na podstawie danych przekrojowych (województwa, 1995) otrzymano następujące wyniki: x = 58, 7tys.; y = 3, 2tys.; S ( x ) = 42 , 7tys.; S ( y ) = 1, 9 tys.; rxy = 0, 97 Zapisz oszacowany model, podając interpretację parametrów oraz wyznaczyć przewidywaną liczbę urodzeń dla 100 tys. kobiet w wieku 20-24 lata. Co można powiedzieć o dopasowaniu modelu do danych empirycznych? Zad. 42 Dla losowo wybranych 10 dni lipca oszacowano liniową funkcję regresji wielkości zamówień na napoje chłodzące (y – tys.litrów) względem temperatury (x – st.Celsjusza) Otrzymano: Σxi = 237; Σyi = 865; Σxi yi = 22806; Σxi2 =5999 a) Oszacować i zinterpretować parametry strukturalne tej funkcji regresji. b) Obliczyć teoretyczną wielkość zamówienia w dniu, w którym temperatura wynosi 22 stopni. Czy teoretyczna wielkość zamówienia różni się od wartości rzeczywistej wynoszącej 65 tys. litrów? Czym jest ta różnica? Zad. 43 Na podstawie danych dla 58 spółek oszacowano liniowy model regresji średnich wartości rynkowych (mln.zł.) spółek rynku równoległego względem ich wartości księgowych (mln. zł): ŷ i = 0,64 xi + 12,78 Znane są ponadto: standardowy błąd współczynnika regresji = 0,17, suma kwadratów odchyleń nie wyjaśnianych regresją ( suma kwadratów reszt) = 47 916 suma kwadratów odchyleń wyjaśnianych regresją = 111 833. Wyznaczyć i zinterpretować współczynnik determinacji. Zad. 44 Na podstawie danych dotyczących dochodów 100 losowo wybranych firm ( x w mln zł) oraz wydatków tych firm na cele charytatywne ( y w mln zł) uzyskano następujące informacje: x =40,12; ∑ y i = 340 cxy = 3,5; sx = 3,57; ∑ ( yˆi − y ) 2 = 96,66; ∑ ( yi − yˆi) 2 = 47,34; c) Zapisać funkcję regresji liniowej wydatków na cele charytatywne względem dochodów firm, zinterpretować jej parametry. d) Ocenić stopień dopasowania modelu do danych empirycznych. dr inż. Aleksandra Czupryna-Nowak 11 Analiza korelacji i regresji Zestaw II Zad. 45 Dla oszacowania funkcji regresji zysków (y – w tys. zł.) względem wysokości zbiorów pewnego produktu rolnego (x – w kwintalach) wykorzystano dane dla 5 firm ogrodniczych i obliczono: sx = 1,58 i sy =1. x y 2 4 3 4 4 5 5 6 6 6 a) Która z czterech podanych wartości kowariancji jest poprawna i dlaczego: 1,5; -1,5; 2; -2. b) O ile zmieni się wielkość zysku jeśli wysokość zbiorów wzrośnie o jednostkę? c) W jakim stopniu o zróżnicowaniu zysków decyduje zmienność wysokości zbiorów. Zad. 46 Analiza związku między opłatami za dojazd z centrum miasta na lotnisko (y- zł) oraz czasem dojazdu (x-min) dla 20 losowo wybranych portów lotniczych dostarczyła m.in. następujących danych: * średni czas dojazdu na lotnisko wynosił 30 min., a średnia opłata – 60 zł; * wariancja czasu dojazdu była równa 55,5 min2, wariancja opłat za dojazd – 137,1 zł2. * współczynnik korelacji liniowej wynosił 0,7; * suma kwadratów składników resztowych wynosiła 1398,42 (zł)2. a) określ i zinterpretuj parametry liniowej funkcji regresji opłat za dojazd na lotnisko względem czasu dojazdu; b) oceń wpływ zmiennych nie uwzględnionych w analizie na różnice w wielkości opłat za dojazd na lotnisko. Literatura: 1. Ostasiewicz S., Rusnak Z., Siedlecka U., Statystyka. Elementy teorii i zadania, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego, Wrocław 2003. 2. Sobczyk M., Statystyka. Podstawy teoretyczne, przykłady, zadania, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin 2000. 3. Balcerowicz-Szkutnik M., Szkutnik W., Podstawy statystyki w przykładach i zadaniach. Część I – statystyka opisowa, ŚWSZ, Katowice 2006. dr inż. Aleksandra Czupryna-Nowak 12