korelacjairegresja

Transkrypt

korelacjairegresja
Analiza korelacji i regresji
Zestaw II
Analiza korelacji i regresji
Zad. 1
Pewien zakład produkcyjny zatrudnia 5 pracowników fizycznych. Ich wydajność pracy (Y –
w szt./h) oraz miesięczne wynagrodzenie (X – w tys. zł) przedstawia poniższa tabela:
Pracownik
A
B
C
D
E
y
12
14
14
10
16
x
0,9
1,1
1
0,7
1,3
a) Proszę sporządzić wykres rozrzutu wynagrodzenia względem wydajności;
b) Proszę ocenić siłę i kierunek zależności badanych cech.
Zad. 2
Przeciętna wydajność pracy 100 pracowników zakładu W wynosi 10 szt./h, a przeciętny staż
pracy kształtuje się na poziomie 20 miesięcy. Ponadto wiadomo, że klasyczne współczynniki
zmienności obu cech są takie same i wynoszą 50%, a kowariancja między nimi jest równa 45.
Proszę ocenić siłę i kierunek zależności obu cech .
Zad. 3
Zmienna objaśniająca Y oraz zmienna kandydująca do roli objaśniających X 1 , X 2 , X 3
przyjmują następujące wartości:
Yt
8
7
10
11
14
X1t
1
2
3
4
5
X2t
10
12
16
20
22
X3t
1,6
2,0
1,5
0,8
1,1
Wyznaczyć współczynniki korelacji między zmiennymi.
dr inż. Aleksandra Czupryna-Nowak
1
Analiza korelacji i regresji
Zestaw II
Zad. 4
Badano w 20 firmach produkujących ten sam wyrób : X - produkcję w tys. sztuk, Y koszt tej produkcji
w mln zł. Dane zestawiono w tablicy korelacyjnej otrzymując :
y
x
1
2
3
1
2
3
3
1
1
6
3
1
5
W jakim stopniu koszt całkowity jest kształtowany przez poziom produkcji. Ile sztuk badanego
wyrobu można wyprodukować za 5 mln zł?
Zad. 5
Sprawdzić czy istnieje zależność liniowa pomiędzy liczbą samochodów zarejestrowanych
w pewnych województwach, a liczbą wypadków drogowych i znaleźć funkcję regresji.
Lb. samochodów
Lb. wypadków
29
110
23
70
16
96
20
83
8
40
27
100
12
65
10
55
Zad. 6
Z populacji pobrano 11 elementów. Na każdym z nich dokonano pomiaru cechy X i Y.
Otrzymano następujące wyniki:
1 2 3 4 5 6 7 8 9 10
X 2 2 3 3 4 4 5 5 6 6
Y 10 15 9 10 12 18 16 11 16 20
Oblicz współczynnik korelacji, sprawdź jego istotność, wyznacz równanie regresji, przedstaw
na wykresie punkty empiryczne i linię regresji. Omów wyniki
Zad. 7
W pięciu tyskich restauracjach liczba sprzedanych placków po węgiersku (X), cena takiego
placka (Y) oraz liczba gości (Z)w dniu 19.03.2004 kształtowała się jak niżej:
restauracja
X
Y
Z
I
II
III
IV
V
16
18
10
12
13
10
11
16
16
17
100
90
70
70
80
a) Jak silnie i w jakim kierunku liczba gości wpływa na liczbę sprzedanych placków?
b) Jak silnie i w jakim kierunku cena placka wpływa na liczbę sprzedanych placków?
c) Jak silnie liczba gości w restauracji wpływa na liczbę sprzedanych placków, jeśli
wyeliminuje się wpływ ceny placka?
d) Jak silnie cena placka wpływa na liczbę sprzedanych placków, jeśli wyeliminuje się
wpływ liczby gości w restauracji?
e) Jak silny jest łączny wpływ ceny placka i liczby gości na ilość sprzedanych porcji?
dr inż. Aleksandra Czupryna-Nowak
2
Analiza korelacji i regresji
Zestaw II
Zad. 8
49% wydatków na cele kulturalne jest wyjaśniane liczbą dzieci w rodzinie i jest to zależność
o nachyleniu ujemnym. Z kolei 64% tych wydatków jest wyjaśniane dochodem w rodzinie na
osobę i ta zależność ma charakter dodatni. Natomiast 36% dochodów na osobę jest
wyjaśniane liczbą dzieci w rodzinie i jest to zależność o nachyleniu ujemnym.
a) Proszę ocenić siłę i kierunek wpływu liczby dzieci na wydatki na cele kulturalne, jeśli
wyeliminuje się wpływ dochodów na osobę.
b) Proszę ocenić siłę i kierunek wpływu wpływ dochodów na osobę na wydatki na cele
kulturalne, jeśli wyeliminuje się liczby dzieci.
c) Proszę ocenić siłę łącznego wpływu dochodu na osobę oraz liczby dzieci na wydatki na
cele kulturalne.
Zad. 9
200 pracowników pewnej tyskiej firmy zbadano ze względu na miejsce zamieszkania (Zabrze
czy inne miasto?) oraz częstotliwość spóźnień do pracy (rzadko czy często?). Okazało się, że
spośród pracowników zamieszkałych w Zabrzu rzadko spóźnia się do pracy 110 osób, a
często 10 osób. Natomiast wśród pracowników dojeżdżających z innych miast rzadko spóźnia
się 30 osób, a często 50. Jak silnie częstotliwość spóźnień zależy od miejsca zamieszkania?
Zad. 10
W lipcu pewnego roku na studia zaoczne we WSH złożyło dokumenty 180 osób. Spośród
kandydatów, którzy złożyli dokumenty na Socjologię, 61 osób deklaruje się jako umysły
humanistyczne, a 3 – jako ścisłe. Na pozostałych kierunkach proporcje te kształtują się
następująco: Administracja: 50 umysłów humanistycznych i 4 ścisłe, Zarządzanie i
Marketing: 20 humanistycznych i 25 ścisłych, Informatyka i Ekonometria: 16 ścisłych. Jak
silnie predyspozycje studenta wpływają na wybór kierunku?
Zad. 11
Wśród 27 osób deklarujących lewicowe poglądy polityczne 12 było w 2004 r. zadowolonych
z rządu premiera B., 10 niezadowolonych, a 5 osób nie miało zdania. Wśród 26 osób o
poglądach prawicowych zadowolona była 1 osoba, niezadowolonych 23, a 2 nie miały zdania.
Wśród 21 osób o poglądach centrowych zadowolonych było 15 osób, niezadowolonych 5, a 1
osoba nie miała zdania. Natomiast wśród 26 osób nieinteresujących się polityką zadowolona
była1 osoba, niezadowolonych 5, a 20 nie miało zdania. Jak silnie preferencje polityczne
wpływały na zadowolenie z rządu premiera B.?
Zad. 12
Na podstawie danych dotyczących dochodów 100 losowo wybranych firm ( x w mln zł) oraz
wydatków tych firm na cele charytatywne ( y w mln zł) uzyskano następujące informacje:
x =40,12;
∑ y i = 340 cxy = 3,5; sx = 3,57; ∑ ( yˆi − y ) 2 = 96,66; ∑ ( yi − yˆi) 2 =
47,34;
a) Zapisać funkcję regresji liniowej wydatków na cele charytatywne względem
dochodów firm, zinterpretować jej parametry.
b) Ocenić stopień dopasowania modelu do danych empirycznych.
dr inż. Aleksandra Czupryna-Nowak
3
Analiza korelacji i regresji
Zestaw II
Zad. 13
Na podstawie 23-elementowej próby obliczono następujące wartości:
cov( X ; Y ) = 55; S X2 = 70; S y2 = 95; x = 15;
∑y
i
= −250
Czy zależność liniową między zmiennymi X i Y (mierzoną współczynnikiem korelacji
liniowej Pearsona) można uznać za statystycznie istotną?
Zad. 14
Na podstawie poniższych danych wyznaczyć teoretyczne równania regresji dla zmiennych x i
y oraz zależności odwrotnej: rxy = 0,81 a1 = 90 x = 2700 y = 18
Zad. 15
Przeprowadzono wśród 80 kandydatów na pilotów obserwacje dotyczące czasu reakcji na
dwa bodźce A (zmienna X) i B (zmienna Y). Otrzymano, że średni czas reakcji na bodziec A
wyniósł 4,8 s., a na bodziec B 14,5. Kowariancja pomiędzy zmiennymi wyniosła 2,06
sekundy2. Odchylenie standardowe dla bodźca B wynosi 2,2 sekundy, a współczynnik
korelacji pomiędzy bodźcami wyniósł 0,72. Jakiego czasu reakcji na bodziec B będzie można
oczekiwać od kandydata który zareagował na bodziec A po 11 sekundach?
Zad. 16
Zbadano 10 mieszkań o powierzchni 65m2 pod względem liczby zamieszkałych osób oraz
zużycia wody. Otrzymano następujące wyniki:
i
Liczba osób (xi)
Zużycie wody w
m3 (yi)
1
3
2
7
3
2
4
6
5
1
6
5
7
4
8
3
9
2
10
1
12
20
10
18
8
15
14
11
9
5
Na podstawie powyższych danych oblicz i zinterpretuj: współczynnik korelacji, współczynnik
determinacji i współczynnik indeterminacji, parametry liniowej funkcji regresji opisującej
zależność zużycia wody od liczby osób zamieszkującej mieszkanie. Zbadaj dobroć
dopasowania danych empirycznych do otrzymanej funkcji regresji
Zad. 17
Roczna liczba osób przekraczających granicę na przejściu w K. oraz roczna ilość
skonfiskowanego tym osobom alkoholu przedstawiała się w latach 1994 – 2001 następująco:
rok
liczba osób na przejściu (mln)
1994
6
1995
4
ilość skonfiskowanego alkoholu (tys. l)
21
16
1996 1997
5
8
17
23
1998 1999
10
4
26
16
2000
4
2001
7
19
22
Proszę sporządzić wykres rozrzutu ilości skonfiskowanego alkoholu względem liczby osób
przekraczających granicę oraz ocenić siłę i kierunek zależności obu cech
dr inż. Aleksandra Czupryna-Nowak
4
Analiza korelacji i regresji
Zestaw II
Zad. 18
U 5 studentów całkowite koszty studiowania na I roku (w tys. zł), odległość miejsca
zamieszkania od uczelni (w km) i liczba egzaminów poprawkowych kształtują się
następująco:
koszty studiów (X)
odległość od uczelni (Y)
liczba poprawek (Z)
3,2
50
0
2,8
10
0
3,6
20
2
2,9
0
1
3
20
0
a) Jak silnie liczba poprawek wpływa na koszty studiowania?
b) Jak silnie odległość od uczelni wpływa na koszty studiowania?
Zad. 19
Oceniając dopasowanie równania regresji wydajności robotników pewnego zakładu (w szt./h)
ich stażu pracy (w latach) otrzymano następujące składniki resztowe:
1
2
-4
1
-3
-2
0
3
1
0
-1
2
Co można powiedzieć o dopasowaniu tego równania, jeśli przeciętny poziom wydajności
wynosił 40 szt./h z klasycznym współczynnikiem zmienności 25%?
Zad. 20
Badając dzienny popyt na piwo (Y – w litrach) oraz jego cenę (X – w zł) w 100 katowickich
pubach otrzymano następujące równania regresji:
y* = -16x + 180
x* = -0,04y + 9.
a) Jakiego popytu można się spodziewać przy cenie 4,50 zł?
b) Jaką cenę należy ustalić, chcąc sprzedawać 80 litrów piwa?
c) Co można powiedzieć o sile i kierunku zależności między ceną piwa a popytem na nie?
d) Jaki jest przeciętny poziom badanych cech?
Zad. 21
Badając współzależność płac brutto (w tys. zł) i wydajności pracy (w szt./godz.) 100
robotników pewnego zakładu pracy uzyskano następujące wyniki:
y = 10
odchyle
nie
standar
dowe
S(x) =
0,5
klasyczny
współcz.
zmienności
S(y)=
Vz (y) =
60%
kowa
riancj
a
Vz (x) =
współcz.
korelacji
rxy=
cov(x,y) = 2,7
płaca bruto
(tys. zł)
x = 1,6
wydajność
(szt./h)
średnia
parametry
równań
regresji
a1 =
a0 =
b1 =
b0
=
Współ.
zbieżności
odchylenie
standardo
we reszt
współcz.
zmienności
resztowej
ϕ2=
Su(x)=
Vu(y)=
Su(x)=
Vu(x)=
a) Obliczyć i zinterpretować brakujące miary.
b) Jakiego wynagrodzenia może się spodziewać robotnik pracujący z wydajnością 8
szt./godz. ?
c) Jakiej wydajności należy oczekiwać od robotnika zarabiającego 1500 zł?
dr inż. Aleksandra Czupryna-Nowak
5
Analiza korelacji i regresji
Zestaw II
Zad. 22
Sprzedaż dzienna X pewnego artykułu w tys szt i jego cena Y w zł, w 5 sklepach pewnej
miejscowości kształtowała się następująco :
X
Y
1
17
2
12
4
11
4
5
5
5
Jaka jest siła tej zależności i ile będzie można sprzedać sztuk tego artykułu w cenie 6 zł
Zad. 23
Dla 35 sklepów tej samej branży oszacowano funkcję regresji kosztów handlowych y
względem miesięcznych obrotów sklepowych x i otrzymano następującą postać :
Y = -0,04 x + 10,43 ,
Wiadomo ponadto, że y = 6,2% x= 105,7 mln zł, Vx= 21%, Vy=23%. Wykorzystując
powyższe dane oblicz współczynnik korelacji tych zmiennych i go zinterpretuj.
Zad. 24
Na podstawie obserwacji zmiennych Z i V obliczono:
22
∑ (z
i=1
i
− z )(v i − v ) = 30 ,
22
∑ (z
− z ) = 100 ,
2
i
i=1
22
∑ (v
i=1
− v ) = 60 ,
2
i
22
∑z
i
= 440 ,
i=1
22
∑v
i
= 220
i=1
oblicz współczynnik korelacji.
Zad. 25
Jednostkowy koszt produkcji oraz wielkość produkcji pewnego dobra (w tys. sztuk)
w konkurujących ze sobą pięciu firmach przedstawiono w zestawieniu:
Wielkość produkcji
23
30
41
45
50
Jednostkowy koszt produkcji
50
38
34
30
28
Wyznacz i zinterpretuj współczynnik korelacji liniowej Pearsona.
Zad. 26
Fabryka mebli analizując kwartalną sprzedaż (w mln zł) oraz wydatki na reklamę (w tys. zł)
uzyskała następujące informacje:
Kwartalne wydatki na
reklamę (w tys. zł)
Wielkość sprzedaży
kwartalnej (w mln zł)
1,8
2,3
2,6
2,4
2,8
3,0
3,4
3,2
3,6
3,8
26
31
28
30
34
38
41
44
40
43
a) narysuj korelacyjny diagram rozrzutu,
dr inż. Aleksandra Czupryna-Nowak
6
Analiza korelacji i regresji
b)
c)
d)
e)
Zestaw II
oblicz współczynnik korelacji liniowej Pearsona,
wyznacz rachunkowo i graficznie obydwa równania regresji,
oceń stopień dopasowania funkcji regresji do danych empirycznych,
oszacuj wielkość sprzedaży kwartalnej, jeśli wydatki na reklamę będą kształtowały się
na poziomie 4 tys. zł.
Zad. 27
Pewne biuro nieruchomości w Poznaniu jest zainteresowane zbadaniem zależności pomiędzy
powierzchnią sprzedawanych przez nich mieszkań (w m 2 ) a ich ceną rynkową (w tys. zł).
Uzyskany materiał empiryczny przedstawia poniższy szereg statystyczny:
Powierzchnia (w m 2 ) Cena (w tys. zł)
80
70
64
50
64
47
42
42
57
31
31
a)
b)
c)
d)
e)
170
165
100
87
85
82
78
68
95
58
43
narysuj korelacyjny diagram rozrzutu,
oblicz współczynnik korelacji liniowej Pearsona,
wyznacz rachunkowo i graficznie obydwa równania regresji,
oceń stopień dopasowania funkcji regresji do danych empirycznych,
Nowy klient chce sprzedać mieszkanie o powierzchni 76 m 2 . Oszacuj cenę rynkową tego
mieszkania.
Zad. 28
W banku Z zbadano zależność między stażem pracy zatrudnionych pracowników w latach
(X) a wysokością ich zarobków w zł (Y). Uzyskano następujące informacje: przeciętny staż
pracy wynosił 5 lat, przeciętny zarobek 1200 zł. Współczynnik zmienności stażu pracy
wynosił 20%. Współczynnik zmienności płac – 30%. Z kolei współczynnik korelacji
pomiędzy stażem pracy a wysokością płac 0,75.
Na podstawie tych informacji:
a) wyznacz rachunkowo teoretyczne linie regresji,
b) oszacuj wysokość płacy dla dziesięcioletniego stażu pracy,
c) czy prawdą jest, ze staż pracy w 90% kształtuje zmienność zarobków zatrudnionych
pracowników?
dr inż. Aleksandra Czupryna-Nowak
7
Analiza korelacji i regresji
Zestaw II
Zad. 29
Badanie działalności handlowej dostarczyły min. następujących informacji o powierzchni
i wielkości utargu:
Powierzchnia (w m kw.)
Dzienny utarg (w tys. zł)
20
30
35
40
45
65
75
80
90
100
3,5
4,8
4,5
3,0
5,0
4,1
6,5
8,8
9,0
10,8
a) wyznacz parametry teoretycznej funkcji regresji liniowej w zależności od powierzchni
oraz odchylenie standardowe reszt modelu,
b) sklep ma powierzchnię 120 m kw. Na podstawie wyznaczonego równania regresji
oszacuj możliwy utarg tego sklepu.
c) Sklep uzyskał dzienny w wysokości 7 tys. zł. Określ powierzchnię sklepu.
d) Współczynnik korelacji między liczbą sprzedawców a utargiem wynosi 0,7. Która
z cech w większym stopniu wyjaśnia wielkość utargu: liczba sprzedawców czy
powierzchnia sklepu?
Zad. 30
W zakładach odzieżowych przeprowadzono badania w celu ustalenia zależności między
długością serii produkcji w tys. sztuk (X) a jednostkowym kosztem produkcji wyrobu w zł
(Y). W rezultacie otrzymano następujące teoretyczne równania regresji:
yˆ = 5160 − 270 xi
xˆ = 1,7 − 0,003 yi
a) podaj interpretację współczynników regresji,
b) co można powiedzieć o kierunku i sile zależności między tymi cechami?
c) W jakim procencie zmienna X wyjaśnia zmienną Y?
d) Jaki jest teoretyczny poziom kosztu jednostkowego przy serii o długości 10 tys. sztuk?
Zad. 31
Spółka zajmująca się sprzedaż różnego rodzaju kserokopiarek chce ustalić wpływ wydatków
na reklamę własnego produktu (w tys. zł) na wielkość sprzedaży (w mln zł). W tym celu
zebrano informacje dotyczące ostatnich pięciu lat (dane roczne):
5
∑x
i =1
i
= 132 ,
5
∑x
i =1
2
i
= 3502 ,
5
∑y
i =1
i
= 96
5
∑y
i =1
2
i
= 1870 ,
5
∑x y
i =1
i
i
= 2553 .
Na podstawie tych informacji:
a) oblicz współczynnik korelacji liniowej Pearsona,
b) wyznacz rachunkowo i graficznie obydwa równania regresji,
c) oszacuj „dobroć” dopasowania równania regresji opisującego zależność sprzedaży
kserokopiarek od wydatków ponoszonych na reklamę w tym przedsiębiorstwie,
d) oszacuj wartość sprzedaży przyjmując, że wydatki na reklamę wynoszą 30 tys. zł rocznie.
dr inż. Aleksandra Czupryna-Nowak
8
Analiza korelacji i regresji
Zestaw II
Zad. 32
Właściciel autokomisu na terenie Wielkopolski w celu zbadania jak kształtują się ceny
rynkowe samochodu Honda Civic, wybrał losowo 10 ofert sprzedaży z województwa
wielkopolskiego zamieszczonych w codziennej prasie. Dane dotyczące ceny samochodu w
tys. zł (Y), wieku samochodu w latach ( X 1 ) oraz przebiegu w tys. km ( X 2 ) przedstawiono w
tablicy:
Cena
12
22
15
35
21
25
28
33
36
43
Wiek
10
6
8
4
8
7
5
6
3
1
Przebieg
180
65
120
50
150
70
100
70
50
15
a) oblicz współczynniki korelacji prostej oraz cząstkowej,
b) oblicz współczynnik korelacji wielorakiej,
c) w jakim stopniu zmienność wieku samochodu oraz jego przebiegu determinuje
zmiany jego ceny rynkowej?
d) Wyznacz równanie regresji wielorakiej,
e) Oceń czy model jest dopuszczalny,
f) Oszacuj cenę rynkową 4-letniej Hondy Civic o przebiegu 50 tys. km.
Zad. 33
Zbadano 30 rodzin zamieszkałych w Poznaniu ze względu na: miesięczne wydatki na
artykuły żywnościowe na 1 osobę w tys. zł (Y), miesięczne dochody na 1 osobę w tys. zł
( X 1 ) oraz liczbę osób wchodzącą w skład rodziny ( X 2 ). Na podstawie uzyskanych danych
oszacowano następujące równanie regresji: yˆ = 0,09 + 0,250 x1 − 0,005 x2 oraz współczynnik
korelacji wielorakiej wynoszący 0,996. Korzystając z tych wyników:
a) podaj interpretacje współczynników występujących w tym modelu,
b) oblicz i zinterpretuj współczynnik determinacji,
c) oszacuj ile przeciętnie wydaje na artykuły żywnościowe 5-osobowa rodzina, której
miesięczny dochód na osobę wynosi 800 zł?
Zad. 34
Zbiorowość pracowników pewnego przedsiębiorstwa zbadano ze względu na następujące
cechy: wynagrodzenie (Y), staż pracy ( X 1 ) i wydajność pracy ( X 2 ) i uzyskano następujące
wyniki: ryx1 = 0,965 , ryx2 = 0,900 oraz rx1x2 = 0,936 . Na podstawie tych wyników:
a) oblicz i zinterpretuj współczynniki korelacji cząstkowej,
b) oblicz i zinterpretuj współczynnik korelacji wielorakiej,
c) wyznacz macierz współczynników korelacji.
dr inż. Aleksandra Czupryna-Nowak
9
Analiza korelacji i regresji
Zestaw II
Zad. 35
Wyniki egzaminów końcowych ze statystyki i matematyki uzyskane przez grupę 10
studentów Politechniki Śląskiej w roku akademickim 2003/2004 były następujące:
matematyka
Db
+db
nd
nd
dst
db
bdb
statystyka
Db
bdb
+dst nd
dst
+dst db
+dst db
bdb
+db
+db
db
Oblicz siłę współzależności między ocenami uzyskanymi z obydwu przedmiotów
wykorzystując współczynnik korelacji rang Spearmana.
Zad. 36
Poniższe dane są losową próbą dochodów konsumentów i ich wydatków na pewne dobra
luksusowe:
Dochód (w tys. zł/rok)
23
17
34
56
49
31
28
80
65
40
26
Wydatki na dobra
luksusowe (zł/miesiąc)
10
50
120 225 90
60
55
340 170 25
80
Oblicz i zinterpretuj współczynnik korelacji ran Spearmana.
Zad. 37
Inwestor w oparciu o 30 obserwacji badał zależność ceny akcji y od ceny akcji x . Ustalił:
- cena akcji x różniła się średnio o 4 zł w porównaniu z ceną średnią wynoszącą 20 zł.
- średnia cena akcji y wynosiła 60 zł z odchyleniem standardowym 10 zł.
- kowariancja obu zmiennych wynosiła: -36.
a) oszacuj i zinterpretuj parametry liniowego modelu regresji
b) oblicz i zinterpretuj współczynnik korelacji liniowej i współczynnik determinacji.
Zad. 38
W analizie liniowej regresji tygodniowego czasu poświęcanego na naukę ( y – godz.)
względem czasu oglądania telewizji (x- godz.) dla 80 uczniów otrzymano: cyx = -1,32; x =
18; y = 14; sx =2; sy = 1,7; se =1,6.
a) Oszacować parametry strukturalne funkcji regresji.
b) Czy współczynnik regresji jest istotnie ujemny ( przyjąć poziom istotności 0,05 ).
c) Podać teoretyczny czas nauki osoby, której czas oglądania telewizji wynosi 20 godz. oraz
błąd tej prognozy.
Zad. 39
Pewien analityk bada współzależność zmian cen dwóch walut. W oparciu o 30 obserwacji
zbudował następujący model regresji liniowej opisujący zależność ceny waluty y od ceny
waluty x:
ŷ i = 5 xi – 200
R2 = 29,16%
[1,467] [ 8]
a) Przeprowadź ocenę jakości tego modelu z punktu widzenia kryteriów możliwych do
zastosowania przy podanych informacjach. Przyjąć poziom istotności 0,01 przy
weryfikacji stosownej hipotezy.
b) Ile wynosi krytyczny poziom istotności przy weryfikacji hipotezy o istotności
współczynnika regresji?
c) Przy jakim poziomie nastąpi zmiana decyzji?
dr inż. Aleksandra Czupryna-Nowak
10
Analiza korelacji i regresji
Zestaw II
Zad. 40
Docent J. twierdzi, że zwiększenie opodatkowania najbogatszych obniża stopę bezrobocia. W
celu empirycznego potwierdzenia tej tezy oszacował poniższy model regresji liniowej,
posługując się danymi z 12 krajów:
y$ i = -0.1 xi + 12; gdzie yi jest stopą bezrobocia w i-tym kraju, a xi stopą opodatkowania
najbogatszych (obie wielkości w procentach). Odchylenie standardowe reszt modelu wynosi
1.2 a wariancja cechy y: 2. Czy powyższa teoria jest dobrze dopasowana do rzeczywistości?
Zad. 41
Estymując model regresji liniowej uzależniającego liczbę dzieci urodzonych przez kobiety
(cecha y, w tys.) od liczby kobiet w wieku 20-24 lata (cecha x, w tys.) na podstawie danych
przekrojowych (województwa, 1995) otrzymano następujące wyniki:
x = 58, 7tys.; y = 3, 2tys.; S ( x ) = 42 , 7tys.; S ( y ) = 1, 9 tys.; rxy = 0, 97
Zapisz oszacowany model, podając interpretację parametrów oraz wyznaczyć przewidywaną
liczbę urodzeń dla 100 tys. kobiet w wieku 20-24 lata. Co można powiedzieć o dopasowaniu
modelu do danych empirycznych?
Zad. 42
Dla losowo wybranych 10 dni lipca oszacowano liniową funkcję regresji wielkości
zamówień na napoje chłodzące (y – tys.litrów) względem temperatury (x – st.Celsjusza)
Otrzymano:
Σxi = 237; Σyi = 865; Σxi yi = 22806; Σxi2 =5999
a) Oszacować i zinterpretować parametry strukturalne tej funkcji regresji.
b) Obliczyć teoretyczną wielkość zamówienia w dniu, w którym temperatura wynosi 22
stopni. Czy teoretyczna wielkość zamówienia różni się od wartości rzeczywistej wynoszącej
65 tys. litrów? Czym jest ta różnica?
Zad. 43
Na podstawie danych dla 58 spółek oszacowano liniowy model regresji średnich wartości
rynkowych (mln.zł.) spółek rynku równoległego względem ich wartości księgowych (mln.
zł):
ŷ i = 0,64 xi + 12,78
Znane są ponadto: standardowy błąd współczynnika regresji = 0,17,
suma kwadratów odchyleń nie wyjaśnianych regresją ( suma kwadratów reszt) = 47 916
suma kwadratów odchyleń wyjaśnianych regresją = 111 833.
Wyznaczyć i zinterpretować współczynnik determinacji.
Zad. 44
Na podstawie danych dotyczących dochodów 100 losowo wybranych firm ( x w mln zł) oraz
wydatków tych firm na cele charytatywne ( y w mln zł) uzyskano następujące informacje:
x =40,12;
∑ y i = 340 cxy = 3,5; sx = 3,57; ∑ ( yˆi − y ) 2 = 96,66; ∑ ( yi − yˆi) 2 =
47,34;
c) Zapisać funkcję regresji liniowej wydatków na cele charytatywne względem
dochodów firm, zinterpretować jej parametry.
d) Ocenić stopień dopasowania modelu do danych empirycznych.
dr inż. Aleksandra Czupryna-Nowak
11
Analiza korelacji i regresji
Zestaw II
Zad. 45
Dla oszacowania funkcji regresji zysków (y – w tys. zł.) względem wysokości zbiorów
pewnego produktu rolnego (x – w kwintalach) wykorzystano dane dla 5 firm ogrodniczych i
obliczono: sx = 1,58 i sy =1.
x
y
2
4
3
4
4
5
5
6
6
6
a) Która z czterech podanych wartości kowariancji jest poprawna i dlaczego: 1,5; -1,5; 2; -2.
b) O ile zmieni się wielkość zysku jeśli wysokość zbiorów wzrośnie o jednostkę?
c) W jakim stopniu o zróżnicowaniu zysków decyduje zmienność wysokości zbiorów.
Zad. 46
Analiza związku między opłatami za dojazd z centrum miasta na lotnisko (y- zł) oraz czasem
dojazdu (x-min) dla 20 losowo wybranych portów lotniczych dostarczyła m.in. następujących
danych:
* średni czas dojazdu na lotnisko wynosił 30 min., a średnia opłata – 60 zł;
* wariancja czasu dojazdu była równa 55,5 min2, wariancja opłat za dojazd – 137,1 zł2.
* współczynnik korelacji liniowej wynosił 0,7;
* suma kwadratów składników resztowych wynosiła 1398,42 (zł)2.
a) określ i zinterpretuj parametry liniowej funkcji regresji opłat za dojazd na lotnisko
względem czasu dojazdu;
b) oceń wpływ zmiennych nie uwzględnionych w analizie na różnice w wielkości opłat
za dojazd na lotnisko.
Literatura:
1. Ostasiewicz S., Rusnak Z., Siedlecka U., Statystyka. Elementy teorii i zadania,
Wydawnictwo Akademii Ekonomicznej im. Oskara Langego, Wrocław 2003.
2. Sobczyk M., Statystyka. Podstawy teoretyczne, przykłady, zadania, Wydawnictwo
Uniwersytetu Marii Curie-Skłodowskiej, Lublin 2000.
3. Balcerowicz-Szkutnik M., Szkutnik W., Podstawy statystyki w przykładach i zadaniach.
Część I – statystyka opisowa, ŚWSZ, Katowice 2006.
dr inż. Aleksandra Czupryna-Nowak
12