Analiza korelacji i regresji dwóch zmiennych losowych 1. Badano
Transkrypt
Analiza korelacji i regresji dwóch zmiennych losowych 1. Badano
Analiza korelacji i regresji dwóch zmiennych losowych 1. Badano zależność między ilością godzin przebywania samolotu w powietrzu („nalot” lotniczy) a ilością wypadków. Na podstawie zebranych danych z pewnego okresu czasu zbadać czy taka zależność istnieje, a jeżeli istnieje, to opisać ją za pomocą liniowej funkcji regresji. „nalot” wypadki 167 167 135 129 155 118 118 134 159 120 141 109 130 92 131 129 141 138 135 132 145 138 147 135 128 111 137 123 138 99 2. Zbadano w dziesięciu wylosowanych zakładach przemysłowych wielkość zaplanowanego i wykonanego funduszu na akcję socjalną. Zbadać, czy istnieje zależność między badanymi cechami. Jeżeli taka zależność istnieje, to opisać ją za pomocą liniowej funkcji regresji. planowany wykonany 3.60 4.65 3.56 4.59 5.20 1.86 3.06 5.13 1.84 3.02 1.36 2.46 3.93 1.35 2.43 3.89 5.80 6.35 5.72 6.26 3. Istnieje podejrzenie że ludzie dzielą się na humanistów i matematyków tzn. jeśli ktoś jest dobry z przedmiotów humanistycznych to z matematyką może już mieć problemy. Wylosowano ośmiu uczniów z czwartej klasy liceum i obliczono dla nich średnie z ocen semestralnych z języka polskiego i z matematyki: 3.4 2.9 4.6 4.4 J. polski Matematyka 4.3 3.6 3.8 3.3 3.2 3.8 4.7 3.5 3.6 3.9 4.6 3.1 Interesuje nas, czy oceny uczniów potwierdzają wspomniane twierdzenie. Jeśli tak to proszę wyznaczyć równanie regresji. Jaki jest przewidywana średnia ocena z matematyki dla ucznia którego średnia z języka polskiego wynosi 5.0? 4. Poniższe dane z dziesięciu poletek dotyczą efektywności nawożenia łąk azotem (w kg siana na 1 kg N) w zależności od poziomu nawożenia azotem: x̄ = 40, ȳ = 16, X x2i = 20200, X yi2 = 2564.625, X xi yi = 6295. Zbadać, czy istnieje zależność między cechami. Wyznaczyć liniową funkcję zależności przeciętnej efektywności nawożenia łąk azotem od poziomu nawożenia. 5. Poniższe dane dotyczą ciężaru owoców (Y ) pewnej rośliny oraz ilości zastosowanego pewnego preparatu (X) na dziesięciu poletkach: x̄ = 3.9, ȳ = 3.6, X x2i = 152.82, X yi2 = 131.22, X xi yi = 141.21. Zbadać, czy istnieje zależność między cechami. Wyznaczyć liniową funkcję zależności przeciętnego ciężaru owoców od ilości zastosowanego preparatu. 6. Zbadać, czy istnieje korelacja między wielkością produkcji X pewnego artykułu (w mln metrów), a zużyciem Y pary technologicznej (w tys. ton). Dane pochodzą z dziesięciu wylosowanych zakładów. xi yi 1.5 4.5 3.0 7.0 2.0 7.5 3.5 6.5 1.5 6.5 4.5 7.5 2.5 5.5 4.0 4.5 4.5 5.5 3.0 5.0 Jeżeli zależność istnieje, to opisać ją za pomocą liniowej funkcji regresji. W Z W SE Ekonometria zadania 2.1 7. W pewnym gospodarstwie wiejskim badano w ciągu dziesięciu kolejnych lat przeciętne dzienne spożycie ziemniaków w kg (X) i wielkość spożycia artykułów zbożowych w kg (Y ) przypadającą na jednego członka rodziny. Zbadać, czy istnieje zależność między cechami X oraz Y . Jeżeli zależność istnieje, to opisać ją za pomocą liniowej funkcji regresji. xi yi 0.70 0.50 0.60 0.80 0.85 0.70 0.50 0.40 0.55 0.65 0.75 0.60 0.90 0.30 1.00 0.75 0.20 0.55 0.50 0.70 8. Na podstawie poniższych danych zbadać, czy istnieje zależność między zawartością tłuszczu (X) i białka (Y ) w mleku krów. 10 X xi = 38.6, i=1 10 X x2i = 150.16, i=1 10 X yi = 36.2, i=1 10 X yi2 = 131.74, i=1 10 X xi yi = 140.34 i=1 Jeżeli tak, to opisać ilościowo tę zależność. 9. Na podstawie poniższych danych zbadać, czy istnieje zależność między grubością włókna lnu (X) i grubością łodygi (Y ). 8 X i=1 xi = 83.5, 8 X x2i = 1269.25, i=1 8 X i=1 yi = 8.74, 8 X i=1 yi2 = 18.5454, 8 X xi yi = 145.780 i=1 Jeżeli tak, to opisać ilościowo tę zależność. 10. Spośród studentów pewnego wydziału wylosowano niezależnie dziesięciu studentów IV roku i otrzymano dla nich następujące średnie oceny uzyskane na I roku oraz na IV roku. Zbadać, czy istnieje zależność między wynikami studiów na I i na IV roku. Jeżeli taka zależność istnieje, to opisać ją za pomocą liniowej funkcji regresji. I rok 3.5 4.0 3.8 4.6 3.9 3.0 3.5 3.9 4.5 4.1 IV rok 4.2 3.9 3.8 4.5 4.2 3.4 3.8 3.9 4.6 4.0 W Z W SE Ekonometria zadania 2.2 Analiza korelacji i regresji trzech zmiennych losowych 11. Zanotowano średnie oceny dziesięciu Studentów pewnego kierunku studiów jakie uzyskali na maturze (X1 ), egzaminie wstępnym (X2 ) oraz czwartym roku studiów (X3 ). Otrzymano następujące wyniki: x̄1 = 3.5 P 2 x = 211.07 P 1i x1i x2i = 215.20 x̄2 = 3.6 P 2 x = 220.19 P 2i x1i x3i = 227.38 x̄3 = 3.8 P 2 x = 245.76 P 3i x2i x3i = 232.56 Przeprowadzić analizę korelacji badanych zmiennych. 12. Wylosowano sto średniej klasy mieszkań. Każde mieszkanie scharakteryzowano ze względu na cenę jednego metra kwadratowego (X1 ), odległość od pasów szybkiego ruchu (X2 ) oraz odległość od najbliższego centrum handlowego (X3 ). Otrzymano następujące wyniki: x̄1 = 826.06 x̄2 = 3.06 x̄3 = 9.94 varx1 = 815803.20 varx2 = 208.80 varx3 = 854.82 cov(x1 , x2 ) = −8093.18 cov(x1 , x3 ) = −14189.81 cov(x2 , x3 ) = −7.82 Przeprowadzić analizę korelacji badanych zmiennych. 13. O czterdziestu czterech krajach, określanych jako rozwijające się, zebrano dane dotyczące średniego poziomu zmian wielkości produktu krajowego brutto w skali roku (X1 ), średniego rocznego udziału inwestycji zagranicznych w produkcie krajowym brutto (X2 ) oraz średniego rocznego udziału inwestycji krajowych w produkcie krajowym brutto (X3 ). Na podstawie zebranych danych otrzymano: x̄1 = 4.047 x̄2 = 0.306 x̄3 = 21.181 varx1 = 251.782 varx2 = 4.576 varx3 = 2130.87 cov(x1 , x2 ) = 12.220 cov(x1 , x3 ) = −123.195 cov(x2 , x3 ) = 25.726 Przeprowadzić analizę korelacji badanych zmiennych. 14. Badano sprawność systemu dostaw piwa. Obserwowano czas (X1 ), wielkość (X2 ) oraz moment (X3 ) rozpoczęcia dostawy. Zebrano próbę o liczności 50 i otrzymano wyniki: x̄1 = 116.50 x̄2 = 208.16 x̄3 = 9.50 varx1 = 88540.55 varx2 = 222240.48 varx3 = 608.50 cov(x1 , x2 ) = 109580.66 cov(x1 , x3 ) = 2244.00 cov(x2 , x3 ) = 3070.00 Przeprowadzić analizę korelacji badanych zmiennych. 15. Wylosowano 60 prywatnych szkół średnich. O każdej szkole zebrano informacje z pięciu lat. Każdą szkołę scharakteryzowano pod względem udziału uczniów, którzy dostali się na państwowe studia wyższe (X1 ), średniego udziału pieniędzy, które szkoła przeznaczyła bezpośrednio na edukację (X2 ) oraz procentu uczniów ostatnich klas, których średnia z przedmiotów ścisłych przewyższała o 30% średnią krajową (X3 ). Na podstawie zebranych informacji otrzymano: x̄1 = 45.01 x̄2 = 48.63 x̄3 = 20.01 varx1 = 12060.98 varx2 = 8161.56 varx3 = 4749.86 cov(x1 , x2 ) = 593.82 cov(x1 , x3 ) = 7156.35 cov(x2 , x3 ) = −10.98 Przeprowadzić analizę korelacji badanych zmiennych. 16. Wyniki ogólnopolskiego konkursu maszynopisania dostarczyły informacji o średniej liczbie błędów na stronie popełnionych przez maszynistki zależnie od czasu pisania tego samego tekstu i ich wieku. Podane zestawienie uwzględnia odpowiednie informacje dla piętnastu wylosowanych maszynistek: wiek 26 30 22 28 32 25 27 28 24 21 24 33 25 20 37 czas 8.3 7.3 9.4 7.8 6.8 8.7 8.0 7.8 8.9 9.5 8.9 6.7 8.7 10.0 5.6 błędy 6.48 3.56 4.94 3.69 5.67 9.18 5.29 2.74 4.72 8.49 5.87 5.66 5.86 6.00 5.53 Zbadać istnienie zależności między liczbą popełnianych błędów a czasem pisania i wiekiem maszynistki. Opisać tę zależność za pomocą liniowej funkcji regresji. W Z W SE Ekonometria zadania 2.3 17. Przypuszcza się, że miesięczne wydatki Y na zakup artykułów nieżywnościowych uzależnione są od wielkości dochodów X1 oraz wysokości X2 wydatków na zakup artykułów żywnościowych. Przeprowadzono odpowiednie badania 50 gospodarstw domowych i otrzymano wyniki: x̄1 = 5 P 2 x = 1270.30 P 1i x1i x2i = 640.00 x̄2 = 2.5 P 2 x = 362.50 P 2i x1i yi = 370.00 ȳ = 1.5 P 2 y = 132.50 P i x2i yi = 157.50 Przeprowadzić na tej podstawie analizę regresji wydatków na artykuły nieżywnościowe od pozostałych zmiennych. 18. Do produkcji pewnego artykułu stosowane są dwa komponenty X1 oraz X2 . Mierzona za pomocą pewnej cechy ilościowej Y jakość wyrobu uzależniona jest od ilości użytych komponentów. W wyniku zbadania czterdziestu próbek wyrobu produkowanego z różnymi ilościami obu składników otrzymano: x̄ = 27.00 P1 2 x = 34382.00 P 1i x1i x2i = 10151.00 x̄ = 8.00 P2 2 x = 3017.00 P 2i x1i yi = 7024.25 ȳ = 5.54 P 2 y = 1464.75 P i x2i yi = 2088.53 Przeprowadzić analizę regresji jakości wyrobu od ilości użytych składników. 19. W produkcji pewnego artykułu analizowano zysk Y ze sprzedaży w zależności od wielkości produkcji. xi 10 12 13 16 17 19 21 22 23 26 29 36 yi 280.69 308.27 321.92 349.63 358.22 357.10 356.95 356.99 348.90 321.60 278.10 113.60 Przyjmując, że funkcja regresji opisująca zysk przedsiębiorstwa w zależności od wielkości produkcji ma postać y = β0 + β1 x + β2 x2 przeprowadzić analizę regresji. Czy istnieje produkcja maksymalizująca zysk? 20. Analizowano, jak wynik Studenta z egzaminu (Y ) zależy od liczby kartkówek przeprowadzonych na ćwiczeniach (X1 ) oraz od procentu opuszczonych przez Studenta ćwiczeń (X2 ). Na podstawie próby o liczności 60 otrzymano: ȳ = 54 x̄1 = 5 x̄2 = 11 vary = 46602.57 varx1 = 114.18 varx2 = 57773.33 cov(y, x1 ) = 1527.43 cov(y, x2 ) = −12282.84 cov(x1 , x2 ) = −55.33 Przeprowadzić analizę regresji wyniku egzaminu od pozostałych zmiennych. W Z W SE Ekonometria zadania 2.4 Programowanie liniowe 21. Produkt A zawiera około 1000 kalorii, 25 gramów protein oraz 25 mg witaminy C na jednostkę. Produkt B zawiera około 2000 kalorii, 100 gramów protein oraz 20 mg witaminy C na jednostkę. Minimalne zapotrzebowanie konsumenta na środki odżywcze wynosi: 3000 kalorii, 100 gramów protein i 50 mg witaminy C. Cena rynkowa produktu A wynosi 20 za jednostkę, zaś produktu B 50. Znaleźć najtańszą dietę. 22. W pewnym zakładzie produkcyjnym wytwarza się dwa rodzaje produktów A i B. Do wyprodukowania produktów A i B potrzebne są surowce X i Y . Surowca X zakład może sprowadzić co najwyżej 15 jednostek, natomiast surowca Y co najwyżej 12 jednostek. Na jednostkę produktu A potrzeba 0.5 jednostki surowca X oraz 0.3 surowca Y . Na jednostkę produktu B potrzeba 0.3 jednostki surowca X i 0.4 surowca Y . Zysk ze sprzedaży jednostki wyprodukowanego produktu A wynosi 800, natomiast z jednostki produktu B wynosi 700. W jakich ilościach należy sprowadzać surowce X i Y , by zapewnić największy zysk? 23. Zakład mleczarski skupuje dziennie 5000 kg mleka o zawartości tłuszczu 3.5%. Dzienna zdolność produkcyjna zakładu wynosi 2000 kg mleka spożywczego i 400 kg masła. Zużycie plazmy na 1 kg produktu wynosi: dla mleka spożywczego 0.98 kg, dla masła 3.44 kg. Zużycie tłuszczu na 1 kg produktu wynosi: dla mleka spożywczego 0.03 kg, dla masła 0.85 kg. Zysk ze sprzedaży jednego kilograma poszczególnych produktów wynosi: dla dla mleka spożywczego 9.2 a dla masła 15. W jakich ilościach należy wytwarzać poszczególne produkty, by zysk ze sprzedaży był największy? 24. Aby zdrowo wyglądać pies musi miesięcznie zjeść przynajmniej 100g składnika S1 , 200g składnika S2 i nie więcej jak 300g składnika S3 . Na rynku dostępne są dwie karmy, gdzie porcja karmy K1 zawiera 10g składnika S1 , 1g składnika S2 i 10g składnika S3 . Natomiast karma K2 zawiera 1g składnika S1 , 10g składnika S2 i 10g składnika S3 . Porcja karmy K1 kosztuje 5 zł, natomiast porcja karmy K2 8 zł. W jakich porcjach zmieszać karmy aby pies dostał składników ile potrzeba a koszt był jak najmniejszy. 25. Piekarnia produkuje dwa rodzaje bułek (B1 , B2 ), które odpowiednio kosztują 1 i 3 złote. Na wypiek bułki pierwszej B1 potrzeba 1 dkg mąki, 1 dkg cukru i 0.1 rodzynek. Na wypiek bułki drugiej B2 potrzeba 2 dkg mąki, 1 dkg cukru i 1 dkg rodzynek. Przy czym w magazynie piekarni dostępne jest tylko 4.5 dkg mąki, 4 dkg cukru i 1 dkg rodzynek. Nasze zadanie polega na ustaleniu ile i jakich bułek powinniśmy upiec aby otrzymać największy zysk, biorąc pod uwagę ograniczone zapasy składników. 26. Mieszanka paszowa składa się z dwóch produktów P1 i P2 . Mieszanka musi dostarczyć składników odżywczych S1 , S2 i S3 w ilości nie mniejszej niż określone w tabeli minimum. Cena produktu P1 wynosi 6 zł, P2 9 zł za kilogram. Dobrać skład mieszanki tak, by jej koszt był najniższy. Zawartości poszczególnych składników w kilogramie produktu podane są poniżej. S1 S2 S3 P1 3 8 12 P2 9 4 3 min 27 32 36 27. Przedsiębiorstwo produkuje dwa wyroby używając do tego trzech rodzajów surowców s1 , s2 , s3 , których zasoby wynoszą odpowiednio: 80, 100, 48 jednostek. Należy ułożyć plan produkcji zapewniający maksymalny zysk, jeżeli zysk jednostkowy z poszczególnych wyrobów wynosi odpowiednio 15 i 9 złotych. Zużycie jednostkowe surowców w produkcji podaje tabelka. I II S1 3 2 S2 2 3 S3 2 1 W Z W SE Ekonometria zadania 2.5 28. Przedsiębiorstwo produkuje dwa wyroby używając do tego trzech rodzajów surowców s1 , s2 , s3 , których zasoby wynoszą odpowiednio: 150, 120, 190 jednostek. Należy ułożyć plan produkcji zapewniający maksymalny zysk, jeżeli zysk jednostkowy z poszczególnych wyrobów wynosi odpowiednio 18 i 5 złotych. Zużycie jednostkowe surowców w produkcji podaje tabelka. I II S1 1 5 S2 2 2 S3 4 1 29. Produkty A, B służące jako pasza dla trzody chlewnej zawierają dwa składniki odżywcze M1 i M2 , które należy dostarczyć zwierzętom w ilościach co najmniej odpowiednio 45 i 20 jednostek. Produkty te zawierają jednak składnik M3 , którego ilość w spożywanej paszy powyżej 20 jednostek może być szkodliwa. Zawartość poszczególnych składników w produktach A, B oraz ceny jednostkowe produktów podane są w tabelce. Należy ułożyć optymalny plan żywienia zwierząt. M1 M2 M3 ceny A 3 1 2 20 B 3 2 1 25 30. Farmer ma 45 akrowe gospodarstwo, w którym zamierza uprawiać pszenicę i kukurydzę. Może on sprzedać co najwyżej 140 ton pszenicy po 30$ za tonę i 120 ton kukurydzy po 50$ za tonę. Każdy obsiany akr daje 5 ton pszenicy lub 4 tony kukurydzy. Zebranie z jednego akra pszenicy wymaga sześciu godzin a kukurydzy dziesięciu godzin pracy farmera. Farmer może wynająć do 350 roboczogodzin po 10$ za godzinę. Jak struktura zasiewów maksymalizuje zysk farmera. W Z W SE Ekonometria zadania 2.6