Zadanie 1. W pliku romanse.gdt znajdują się dane - E-SGH

Transkrypt

Zadanie 1. W pliku romanse.gdt znajdują się dane - E-SGH
Zadanie 1.
W pliku romanse.gdt znajdują się dane dotyczące romansów w próbie 601 Amerykanów. Wykonaj
poniższe polecenia.
a) Oszacuj za pomocą modelu logitowego parametry następującego modelu:
𝑝𝑖
ln⁡(
) ⁡ = ⁡ 𝛽0 + 𝛽1 𝑎𝑔𝑒𝑖 + ⁡ 𝛽2 𝑦𝑟𝑠𝑚𝑎𝑟𝑟𝑖 + 𝛽3 𝑘𝑖𝑑𝑠𝑖 + 𝛽4 𝑣𝑟𝑦𝑟𝑒𝑙𝑖 + 𝛽5 𝑠𝑚𝑒𝑟𝑒𝑙𝑖 + 𝛽6 𝑠𝑙𝑔ℎ𝑡𝑟𝑒𝑙𝑖
1 − 𝑝𝑖
+ ⁡ 𝛽7 𝑛𝑜𝑡𝑟𝑒𝑙𝑖 + 𝛽8 𝑚𝑎𝑙𝑒𝑖 + 𝛽9 𝑒𝑑𝑢𝑐𝑖 + 𝛽4 𝑣𝑟𝑦ℎ𝑎𝑝𝑖 + 𝛽5 ℎ𝑎𝑝𝑎𝑣𝑔𝑖 + 𝛽6 𝑎𝑣𝑔𝑚𝑎𝑟𝑟𝑖
+ ⁡ 𝛽7 𝑢𝑛ℎ𝑎𝑝𝑝𝑖 + ⁡ 𝜀𝑖
b) Co jest zmienną zależną modelu?
c) Wskaż, które zmienne istotnie statystycznie oddziałują na skłonność do wdawania się w romanse
na poziomie istotności α=0,05.
d) Oblicz zmiany ilorazu szans wywołane jednostkową zmianą wartości zmiennych 𝑎𝑔𝑒 oraz 𝑣𝑟𝑦𝑟𝑒𝑙.
e) Zinterpretuj wartości efektów krańcowych dla średnich wartości zmiennych objaśniających dla
zmiennych 𝑎𝑔𝑒 oraz 𝑣𝑟𝑦𝑟𝑒𝑙.
f) Ile wynosi prawdopodobieństwo wdania się w romans 30-letniej kobiety, która uczyła się w sumie
12 lat, ma za sobą dwa lata małżeństwa, w którym jest ponad przeciętnie szczęśliwa, posiada dziecko i
jest tylko trochę religijna?
Zadanie 2.
Co wpływa na rozwój krótkowzroczności u młodych? Oszacuj klasyczną metodą najmniejszych
kwadratów model, w którym zmienną objaśnianą będzie zmienna zero-jedynkowa krótkowzroczności
(myopic), a regresorami wszystkie zmienne w pliku od spheq do dadmy. Tak oszacowany model będzie
stanowił liniowy model prawdopodobieństwa. Wartość teoretyczna zmiennej objaśnianej będzie
stanowiła prawdopodobieństwo bycia osobą krótkowzroczną. Wykorzystaj wszystkie zmienne ze
zbioru danych krotkowzrocznosc.gdt prócz id oraz studyyear.
a) Czy na liście zmiennych objaśniających oszacowanego modelu dostrzegasz zmienną diopterhr?
b) Zbadaj współliniowość zmiennych. Jeśli wskaźnik inflacji wariancji w którymkolwiek przypadku
przekracza 10, wyklucz regresor o największej wartości wskaźnika i oszacuj ponownie cały model,
sprawdzając, czy problem współliniowości wciąż występuje. W razie potrzeby powtórz procedurę.
c) Zbadaj heteroskedastyczność. Określ minimum i maksimum wartości teoretycznych zmiennej
objaśnianej.
d) Oszacuj model regresji logistycznej. Oceń istotność statystyczną zmiennych na poziomie istotności
α=0,05. Zinterpretuj oszacowanie współczynnika regresji przy zmiennej sporthr.
1

Podobne dokumenty