Statystyka ćwiczenia nr 11-12 mgr Sylwia Timoszuk Model - E-SGH
Transkrypt
Statystyka ćwiczenia nr 11-12 mgr Sylwia Timoszuk Model - E-SGH
Statystyka ćwiczenia nr 11-12 mgr Sylwia Timoszuk Model regresji liniowej Zad. 1. Na giełdzie zanotowano ceny i wiek kilku oferowanych do sprzedaży samochodów marki Fiat Uno: Wiek (w latach) 2 3 5 5 7 8 Cena (w tys. zł) 22 18 20 16 15 11 1) Sporządź wykres rozrzutu punktów empirycznych i oceń na jego podstawie, czy uzasadnione jest przypuszczenie o liniowej regresji ceny używanego Fiata Uno względem jego wieku. 2) Dopasuj metodą najmniejszych kwadratów prostą regresji ceny względem wieku samochodu. 3) Oblicz błędy standardowe ocen parametrów liniowych wyznaczonej funkcji regresji. 4) Zbadaj istotność ocen parametrów funkcji regresji liniowej. 5) Oceń stopień dopasowania modelu regresji do danych empirycznych. 6) Jaka jest przewidywana cena samochodu 6-letniego? Zad. 2. Dane dotyczące wydatków na reklamę (X w tys. zł) oraz osiąganych zysków ze sprzedaży (Y w tys. zł) w pewnym przedsiębiorstwie posłużyły do oszacowania metodą najmniejszych kwadratów, parametrów liniowego modelu regresji. Dla 15 obserwacji uzyskano następujące równanie: = , + , , standardowy błędy szacunku współczynnika regresji i wyrazu wolnego wyniosły odpowiednio: , tys. zł i , . a) Proszę podać interpretację oszacowanych parametrów modelu oraz standardowych błędów szacunku. b) Czy dla poziomu istotności 0,05 uznamy współczynnik regresji za istotny? Zad. 3. (egz.) Posługując się danymi uzyskanymi z próby losowej 27 studentów oszacowano model regresji liniowej oceny uzyskanej na egzaminie (Y) względem liczby nieobecności na wykładzie (X): = −0,2 + 3,9 + . Odchylenie standardowe uzyskanych ocen wyniosło 0,7, wariancja liczby nieobecności była równa 9, zaś odchylenie standardowe reszt wyniosło 0,36. 1) Zinterpretuj parametry funkcji regresji. 2) Oceń dopasowanie modelu do danych empirycznych. 3) Podaj prognozę punktową (bez wyznaczania błędu standardowego) oceny uzyskanej przez osobę, która miała 2 nieobecności na wykładzie. 4) Zweryfikuj hipotezę o istotności współczynnika regresji (na poziomie istotności 0,05). Odp. 2) = 0,75 ; ! " = 0,1 ; % $ % & – nie ma informacji w zadaniu potrzebnych do obliczenia + tej wartości; 3) '()* = 3,5 ; 4) ,-./ = −10; odrzucamy 01 . Zadania opracowane z wykorzystaniem materiałów dr Anity Abramowskiej-Kmon Statystyka ćwiczenia nr 11-12 mgr Sylwia Timoszuk Model regresji liniowej Zad. 4. Na podstawie danych dotyczących czasu trwania ciąży (cecha X w tygodniach) oraz masy noworodka (cecha Y w gramach) dla 1000 obserwacji uzyskano następujące informacje: 1000 ∑y x = 40,12; i = 3401000 ; c xy = 1591,95; i =1 s ( x ) = 3,57; 1000 1000 ∑ ( yˆ i − y ) 2 = 199137214; ∑(y i =1 i =1 i − yˆ i ) 2 = 243389929 a) Proszę zbadać, czy zależność liniową między masą noworodka oraz czasem trwania ciąży można uznać za istotną? b) O ile gramów zmieniała się średnia waga noworodka wraz ze wzrostem czasu trwania ciąży o jeden tydzień? Odp. a) 2 = 124,91; ,-./ = 28,52; 5 = 〈1,66; +∞〉, odrzucamy 01 ; b) o 124,91. Zad. 5*. (zadanie dodatkowe – na trend liniowy) Na podstawie liczby urodzeń (w tys.) w Polsce w latach 1990–2004 oszacowano liniową funkcję trendu: yˆ t = −15,3t + 551,9 + et , gdzie t = 1, 2, ..., n. Wiedząc, że: ∑ (t − t ) 2 ∑t = 120 , ∑ ( y t − yˆ t ) 2 = 4215,3 , ∑ ( yˆ t − y ) 2 = 65315,8 oraz = 280 proszę: a) Obliczyć i zinterpretować współczynnik determinacji liniowej. b) Podać przewidywaną liczbę urodzeń w Polsce na rok bieżący oraz standardowy błąd tej prognozy. + (+ Odp. a) = 0,94 ; b) ; = 27 (rok 2016); '(<* = = 138,8; >?'<* = @ = 27,63. Zad. 6. Analizując zmienność liczby zawieranych umów handlowych w zależności od liczby pracowników zatrudnianych w działach dystrybucji uzyskano następujący ciąg reszt w modelu regresji liniowej: 0, 0, 1, 1, -1, -1, -1, 1, 1, 1, 1, -1, -1, 0, 1, -1, -1, 1, -1, 1, -1. Proszę określić przeciętny błąd szacunku liczby zawieranych umów handlowych względem liczby pracowników zatrudnianych w działach dystrybucji. Odp.: s(e) = 0,97. Zad. 7. Na podstawie 7 obserwacji oszacowano liniowy model zużycia surowca (Y w tonach) względem wielkości produkcji (X w tys. szt.) uzyskując: = 15 ̅ = 4; + 120, B = ∑=*BD E − ̅ = 28; F = 180; >D E = 44; >D E = 10,2. 1. Czy oszacowane współczynniki w modelu regresji są istotne? 2. Wyznaczyć wielkość zużycia surowca przy wielkości produkcji 7 tys. szt. oraz dokładność tej prognozy. Odp.: a) >D2 E = 0,73; >?GH @ =4,83; ," = 20,5 ; ,&% = 24,8; b) wartość prognozowana: 225 ton. Zadania opracowane z wykorzystaniem materiałów dr Anity Abramowskiej-Kmon