Analiza korelacji i regresji dwóch zmiennych losowych 1. Badano

Transkrypt

Analiza korelacji i regresji dwóch zmiennych losowych 1. Badano
Analiza korelacji i regresji dwóch zmiennych losowych
1. Badano zależność między ilością godzin przebywania samolotu w powietrzu („nalot” lotniczy) a ilością
wypadków. Na podstawie zebranych danych z pewnego okresu czasu zbadać czy taka zależność istnieje,
a jeżeli istnieje, to opisać ją za pomocą liniowej funkcji regresji.
„nalot”
wypadki
167 167
135 129
155
118
118
134
159
120
141
109
130
92
131
129
141
138
135
132
145
138
147
135
128
111
137
123
138
99
2. Zbadano w dziesięciu wylosowanych zakładach przemysłowych wielkość zaplanowanego i wykonanego
funduszu na akcję socjalną. Zbadać, czy istnieje zależność między badanymi cechami. Jeżeli taka zależność
istnieje, to opisać ją za pomocą liniowej funkcji regresji.
planowany
wykonany
3.60 4.65
3.56 4.59
5.20 1.86 3.06
5.13 1.84 3.02
1.36 2.46 3.93
1.35 2.43 3.89
5.80 6.35
5.72 6.26
3. Istnieje podejrzenie że ludzie dzielą się na humanistów i matematyków tzn. jeśli ktoś jest dobry z przedmiotów humanistycznych to z matematyką może już mieć problemy. Wylosowano ośmiu uczniów z czwartej
klasy liceum i obliczono dla nich średnie z ocen semestralnych z języka polskiego i z matematyki:
3.4 2.9
4.6 4.4
J. polski
Matematyka
4.3
3.6
3.8 3.3
3.2 3.8
4.7
3.5
3.6 3.9
4.6 3.1
Interesuje nas, czy oceny uczniów potwierdzają wspomniane twierdzenie. Jeśli tak to proszę wyznaczyć
równanie regresji. Jaki jest przewidywana średnia ocena z matematyki dla ucznia którego średnia z języka
polskiego wynosi 5.0?
4. Poniższe dane z dziesięciu poletek dotyczą efektywności nawożenia łąk azotem (w kg siana na 1 kg N) w
zależności od poziomu nawożenia azotem:
x̄ = 40,
ȳ = 16,
X
x2i = 20200,
X
yi2 = 2564.625,
X
xi yi = 6295.
Zbadać, czy istnieje zależność między cechami. Wyznaczyć liniową funkcję zależności przeciętnej efektywności
nawożenia łąk azotem od poziomu nawożenia.
5. Poniższe dane dotyczą ciężaru owoców (Y ) pewnej rośliny oraz ilości zastosowanego pewnego preparatu
(X) na dziesięciu poletkach:
x̄ = 3.9,
ȳ = 3.6,
X
x2i = 152.82,
X
yi2 = 131.22,
X
xi yi = 141.21.
Zbadać, czy istnieje zależność między cechami. Wyznaczyć liniową funkcję zależności przeciętnego ciężaru
owoców od ilości zastosowanego preparatu.
6. Zbadać, czy istnieje korelacja między wielkością produkcji X pewnego artykułu (w mln metrów), a zużyciem Y pary technologicznej (w tys. ton). Dane pochodzą z dziesięciu wylosowanych zakładów.
xi
yi
1.5
4.5
3.0
7.0
2.0
7.5
3.5
6.5
1.5
6.5
4.5
7.5
2.5
5.5
4.0
4.5
4.5
5.5
3.0
5.0
Jeżeli zależność istnieje, to opisać ją za pomocą liniowej funkcji regresji.
W Z W SE Ekonometria zadania 2.1
7. W pewnym gospodarstwie wiejskim badano w ciągu dziesięciu kolejnych lat przeciętne dzienne spożycie
ziemniaków w kg (X) i wielkość spożycia artykułów zbożowych w kg (Y ) przypadającą na jednego członka
rodziny. Zbadać, czy istnieje zależność między cechami X oraz Y . Jeżeli zależność istnieje, to opisać ją za
pomocą liniowej funkcji regresji.
xi
yi
0.70
0.50
0.60 0.80 0.85
0.70 0.50 0.40
0.55 0.65
0.75 0.60
0.90
0.30
1.00 0.75
0.20 0.55
0.50
0.70
8. Na podstawie poniższych danych zbadać, czy istnieje zależność między zawartością tłuszczu (X) i białka
(Y ) w mleku krów.
10
X
xi = 38.6,
i=1
10
X
x2i = 150.16,
i=1
10
X
yi = 36.2,
i=1
10
X
yi2 = 131.74,
i=1
10
X
xi yi = 140.34
i=1
Jeżeli tak, to opisać ilościowo tę zależność.
9. Na podstawie poniższych danych zbadać, czy istnieje zależność między grubością włókna lnu (X) i grubością łodygi (Y ).
8
X
i=1
xi = 83.5,
8
X
x2i = 1269.25,
i=1
8
X
i=1
yi = 8.74,
8
X
i=1
yi2 = 18.5454,
8
X
xi yi = 145.780
i=1
Jeżeli tak, to opisać ilościowo tę zależność.
10. Spośród studentów pewnego wydziału wylosowano niezależnie dziesięciu studentów IV roku i otrzymano
dla nich następujące średnie oceny uzyskane na I roku oraz na IV roku. Zbadać, czy istnieje zależność między
wynikami studiów na I i na IV roku. Jeżeli taka zależność istnieje, to opisać ją za pomocą liniowej funkcji
regresji.
I rok
3.5 4.0 3.8 4.6 3.9 3.0 3.5 3.9 4.5 4.1
IV rok
4.2 3.9 3.8 4.5 4.2 3.4 3.8 3.9 4.6 4.0
W Z W SE Ekonometria zadania 2.2
Analiza korelacji i regresji trzech zmiennych losowych
11. Zanotowano średnie oceny dziesięciu Studentów pewnego kierunku studiów jakie uzyskali na maturze
(X1 ), egzaminie wstępnym (X2 ) oraz czwartym roku studiów (X3 ). Otrzymano następujące wyniki:
x̄1 = 3.5
P 2
x = 211.07
P 1i
x1i x2i = 215.20
x̄2 = 3.6
P 2
x = 220.19
P 2i
x1i x3i = 227.38
x̄3 = 3.8
P 2
x = 245.76
P 3i
x2i x3i = 232.56
Przeprowadzić analizę korelacji badanych zmiennych.
12. Wylosowano sto średniej klasy mieszkań. Każde mieszkanie scharakteryzowano ze względu na cenę jednego metra kwadratowego (X1 ), odległość od pasów szybkiego ruchu (X2 ) oraz odległość od najbliższego
centrum handlowego (X3 ). Otrzymano następujące wyniki:
x̄1 = 826.06
x̄2 = 3.06
x̄3 = 9.94
varx1 = 815803.20
varx2 = 208.80
varx3 = 854.82
cov(x1 , x2 ) = −8093.18 cov(x1 , x3 ) = −14189.81 cov(x2 , x3 ) = −7.82
Przeprowadzić analizę korelacji badanych zmiennych.
13. O czterdziestu czterech krajach, określanych jako rozwijające się, zebrano dane dotyczące średniego
poziomu zmian wielkości produktu krajowego brutto w skali roku (X1 ), średniego rocznego udziału inwestycji
zagranicznych w produkcie krajowym brutto (X2 ) oraz średniego rocznego udziału inwestycji krajowych w
produkcie krajowym brutto (X3 ). Na podstawie zebranych danych otrzymano:
x̄1 = 4.047
x̄2 = 0.306
x̄3 = 21.181
varx1 = 251.782
varx2 = 4.576
varx3 = 2130.87
cov(x1 , x2 ) = 12.220 cov(x1 , x3 ) = −123.195 cov(x2 , x3 ) = 25.726
Przeprowadzić analizę korelacji badanych zmiennych.
14. Badano sprawność systemu dostaw piwa. Obserwowano czas (X1 ), wielkość (X2 ) oraz moment (X3 )
rozpoczęcia dostawy. Zebrano próbę o liczności 50 i otrzymano wyniki:
x̄1 = 116.50
x̄2 = 208.16
x̄3 = 9.50
varx1 = 88540.55
varx2 = 222240.48
varx3 = 608.50
cov(x1 , x2 ) = 109580.66 cov(x1 , x3 ) = 2244.00 cov(x2 , x3 ) = 3070.00
Przeprowadzić analizę korelacji badanych zmiennych.
15. Wylosowano 60 prywatnych szkół średnich. O każdej szkole zebrano informacje z pięciu lat. Każdą
szkołę scharakteryzowano pod względem udziału uczniów, którzy dostali się na państwowe studia wyższe
(X1 ), średniego udziału pieniędzy, które szkoła przeznaczyła bezpośrednio na edukację (X2 ) oraz procentu
uczniów ostatnich klas, których średnia z przedmiotów ścisłych przewyższała o 30% średnią krajową (X3 ).
Na podstawie zebranych informacji otrzymano:
x̄1 = 45.01
x̄2 = 48.63
x̄3 = 20.01
varx1 = 12060.98
varx2 = 8161.56
varx3 = 4749.86
cov(x1 , x2 ) = 593.82 cov(x1 , x3 ) = 7156.35 cov(x2 , x3 ) = −10.98
Przeprowadzić analizę korelacji badanych zmiennych.
16. Wyniki ogólnopolskiego konkursu maszynopisania dostarczyły informacji o średniej liczbie błędów na
stronie popełnionych przez maszynistki zależnie od czasu pisania tego samego tekstu i ich wieku. Podane
zestawienie uwzględnia odpowiednie informacje dla piętnastu wylosowanych maszynistek:
wiek
26
30
22
28
32
25
27
28
24
21
24
33
25
20
37
czas
8.3
7.3
9.4
7.8
6.8
8.7
8.0
7.8
8.9
9.5
8.9
6.7
8.7
10.0
5.6
błędy
6.48
3.56
4.94
3.69
5.67
9.18
5.29
2.74
4.72
8.49
5.87
5.66
5.86
6.00
5.53
Zbadać istnienie zależności między liczbą popełnianych błędów a czasem pisania i wiekiem maszynistki.
Opisać tę zależność za pomocą liniowej funkcji regresji.
W Z W SE Ekonometria zadania 2.3
17. Przypuszcza się, że miesięczne wydatki Y na zakup artykułów nieżywnościowych uzależnione są od
wielkości dochodów X1 oraz wysokości X2 wydatków na zakup artykułów żywnościowych. Przeprowadzono
odpowiednie badania 50 gospodarstw domowych i otrzymano wyniki:
x̄1 = 5
P 2
x = 1270.30
P 1i
x1i x2i = 640.00
x̄2 = 2.5
P 2
x = 362.50
P 2i
x1i yi = 370.00
ȳ = 1.5
P 2
y = 132.50
P i
x2i yi = 157.50
Przeprowadzić na tej podstawie analizę regresji wydatków na artykuły nieżywnościowe od pozostałych zmiennych.
18. Do produkcji pewnego artykułu stosowane są dwa komponenty X1 oraz X2 . Mierzona za pomocą pewnej
cechy ilościowej Y jakość wyrobu uzależniona jest od ilości użytych komponentów. W wyniku zbadania
czterdziestu próbek wyrobu produkowanego z różnymi ilościami obu składników otrzymano:
x̄ = 27.00
P1 2
x = 34382.00
P 1i
x1i x2i = 10151.00
x̄ = 8.00
P2 2
x = 3017.00
P 2i
x1i yi = 7024.25
ȳ = 5.54
P 2
y = 1464.75
P i
x2i yi = 2088.53
Przeprowadzić analizę regresji jakości wyrobu od ilości użytych składników.
19. W produkcji pewnego artykułu analizowano zysk Y ze sprzedaży w zależności od wielkości produkcji.
xi
10
12
13
16
17
19
21
22
23
26
29
36
yi
280.69
308.27
321.92
349.63
358.22
357.10
356.95
356.99
348.90
321.60
278.10
113.60
Przyjmując, że funkcja regresji opisująca zysk przedsiębiorstwa w zależności od wielkości produkcji ma postać
y = β0 + β1 x + β2 x2 przeprowadzić analizę regresji. Czy istnieje produkcja maksymalizująca zysk?
20. Analizowano, jak wynik Studenta z egzaminu (Y ) zależy od liczby kartkówek przeprowadzonych na
ćwiczeniach (X1 ) oraz od procentu opuszczonych przez Studenta ćwiczeń (X2 ). Na podstawie próby o liczności
60 otrzymano:
ȳ = 54
x̄1 = 5
x̄2 = 11
vary = 46602.57
varx1 = 114.18
varx2 = 57773.33
cov(y, x1 ) = 1527.43 cov(y, x2 ) = −12282.84 cov(x1 , x2 ) = −55.33
Przeprowadzić analizę regresji wyniku egzaminu od pozostałych zmiennych.
W Z W SE Ekonometria zadania 2.4
Programowanie liniowe
21. Produkt A zawiera około 1000 kalorii, 25 gramów protein oraz 25 mg witaminy C na jednostkę. Produkt
B zawiera około 2000 kalorii, 100 gramów protein oraz 20 mg witaminy C na jednostkę. Minimalne zapotrzebowanie konsumenta na środki odżywcze wynosi: 3000 kalorii, 100 gramów protein i 50 mg witaminy C.
Cena rynkowa produktu A wynosi 20 za jednostkę, zaś produktu B 50. Znaleźć najtańszą dietę.
22. W pewnym zakładzie produkcyjnym wytwarza się dwa rodzaje produktów A i B. Do wyprodukowania
produktów A i B potrzebne są surowce X i Y . Surowca X zakład może sprowadzić co najwyżej 15 jednostek,
natomiast surowca Y co najwyżej 12 jednostek. Na jednostkę produktu A potrzeba 0.5 jednostki surowca X
oraz 0.3 surowca Y . Na jednostkę produktu B potrzeba 0.3 jednostki surowca X i 0.4 surowca Y . Zysk ze
sprzedaży jednostki wyprodukowanego produktu A wynosi 800, natomiast z jednostki produktu B wynosi
700. W jakich ilościach należy sprowadzać surowce X i Y , by zapewnić największy zysk?
23. Zakład mleczarski skupuje dziennie 5000 kg mleka o zawartości tłuszczu 3.5%. Dzienna zdolność produkcyjna zakładu wynosi 2000 kg mleka spożywczego i 400 kg masła. Zużycie plazmy na 1 kg produktu wynosi:
dla mleka spożywczego 0.98 kg, dla masła 3.44 kg. Zużycie tłuszczu na 1 kg produktu wynosi: dla mleka
spożywczego 0.03 kg, dla masła 0.85 kg. Zysk ze sprzedaży jednego kilograma poszczególnych produktów
wynosi: dla dla mleka spożywczego 9.2 a dla masła 15. W jakich ilościach należy wytwarzać poszczególne
produkty, by zysk ze sprzedaży był największy?
24. Aby zdrowo wyglądać pies musi miesięcznie zjeść przynajmniej 100g składnika S1 , 200g składnika S2
i nie więcej jak 300g składnika S3 . Na rynku dostępne są dwie karmy, gdzie porcja karmy K1 zawiera 10g
składnika S1 , 1g składnika S2 i 10g składnika S3 . Natomiast karma K2 zawiera 1g składnika S1 , 10g składnika
S2 i 10g składnika S3 . Porcja karmy K1 kosztuje 5 zł, natomiast porcja karmy K2 8 zł. W jakich porcjach
zmieszać karmy aby pies dostał składników ile potrzeba a koszt był jak najmniejszy.
25. Piekarnia produkuje dwa rodzaje bułek (B1 , B2 ), które odpowiednio kosztują 1 i 3 złote. Na wypiek
bułki pierwszej B1 potrzeba 1 dkg mąki, 1 dkg cukru i 0.1 rodzynek. Na wypiek bułki drugiej B2 potrzeba 2
dkg mąki, 1 dkg cukru i 1 dkg rodzynek. Przy czym w magazynie piekarni dostępne jest tylko 4.5 dkg mąki,
4 dkg cukru i 1 dkg rodzynek. Nasze zadanie polega na ustaleniu ile i jakich bułek powinniśmy upiec aby
otrzymać największy zysk, biorąc pod uwagę ograniczone zapasy składników.
26. Mieszanka paszowa składa się z dwóch produktów P1 i P2 . Mieszanka musi dostarczyć składników
odżywczych S1 , S2 i S3 w ilości nie mniejszej niż określone w tabeli minimum. Cena produktu P1 wynosi 6
zł, P2 9 zł za kilogram. Dobrać skład mieszanki tak, by jej koszt był najniższy. Zawartości poszczególnych
składników w kilogramie produktu podane są poniżej.
S1
S2
S3
P1
3
8
12
P2
9
4
3
min
27
32
36
27. Przedsiębiorstwo produkuje dwa wyroby używając do tego trzech rodzajów surowców s1 , s2 , s3 , których
zasoby wynoszą odpowiednio: 80, 100, 48 jednostek. Należy ułożyć plan produkcji zapewniający maksymalny zysk, jeżeli zysk jednostkowy z poszczególnych wyrobów wynosi odpowiednio 15 i 9 złotych. Zużycie
jednostkowe surowców w produkcji podaje tabelka.
I
II
S1
3
2
S2
2
3
S3
2
1
W Z W SE Ekonometria zadania 2.5
28. Przedsiębiorstwo produkuje dwa wyroby używając do tego trzech rodzajów surowców s1 , s2 , s3 , których
zasoby wynoszą odpowiednio: 150, 120, 190 jednostek. Należy ułożyć plan produkcji zapewniający maksymalny zysk, jeżeli zysk jednostkowy z poszczególnych wyrobów wynosi odpowiednio 18 i 5 złotych. Zużycie
jednostkowe surowców w produkcji podaje tabelka.
I
II
S1
1
5
S2
2
2
S3
4
1
29. Produkty A, B służące jako pasza dla trzody chlewnej zawierają dwa składniki odżywcze M1 i M2 ,
które należy dostarczyć zwierzętom w ilościach co najmniej odpowiednio 45 i 20 jednostek. Produkty te
zawierają jednak składnik M3 , którego ilość w spożywanej paszy powyżej 20 jednostek może być szkodliwa.
Zawartość poszczególnych składników w produktach A, B oraz ceny jednostkowe produktów podane są w
tabelce. Należy ułożyć optymalny plan żywienia zwierząt.
M1
M2
M3
ceny
A
3
1
2
20
B
3
2
1
25
30. Farmer ma 45 akrowe gospodarstwo, w którym zamierza uprawiać pszenicę i kukurydzę. Może on sprzedać
co najwyżej 140 ton pszenicy po 30$ za tonę i 120 ton kukurydzy po 50$ za tonę. Każdy obsiany akr daje
5 ton pszenicy lub 4 tony kukurydzy. Zebranie z jednego akra pszenicy wymaga sześciu godzin a kukurydzy
dziesięciu godzin pracy farmera. Farmer może wynająć do 350 roboczogodzin po 10$ za godzinę. Jak struktura
zasiewów maksymalizuje zysk farmera.
W Z W SE Ekonometria zadania 2.6