ZAJĘCIA X

Transkrypt

ZAJĘCIA X
ZAJĘCIA X
ANALIZA REGRESJI
(STATISTICA)
Zadanie 1
Pewien zakład produkcyjny zatrudnia 5 pracowników fizycznych. Ich wydajność pracy przedstawia poniższa
tabela:
Wydajność (szt./h)
12
14
14
10
Wynagrodzenie (tys. PLN)
0.9 1.12 1.08 0.7
16
12
1.3 0.95
13
1
13
15
14
1.05 1.2
1.1
Dla powyższych danych:
• Sporządzić wykres rozrzutu wynagrodzenia względem wydajności.
• Ocenić siłę i kierunek zależności badanych cech
Statystyki podstawowe i tabele → Macierze korelacji → Podstawowe → Korelacje
• Oszacować i omówić parametry równania regresji
Regresja wieloraka → Podsumowanie: Wyniki regresji
• Sporządzić wykres prostej regresji wraz z 95% przedziałem ufności
Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Wykr. Rozrzutu →
Korelacja dwóch zmiennych
• Ocenić dopasowanie do danych empirycznych
Regresja wieloraka → Podstawowe → Podsumowanie: Wyniki regresji
• Jakiego wynagrodzenia może się spodziewać robotnik pracujący z wydajnością
Karta Reszty, założenia, predykcja → Predykcja zmiennej zależnej
• Jakiej
18 sztuk/h?
wydajności można oczekiwać od robotnika zarabiającego 850 zł miesięcznie?
• Wyznaczyć wartości reszt
Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Podstawowe →
Podsumowanie: Reszty i przewidywane
• Zweryfikować założenie o zgodności reszt z rozkładem normalnym
Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Podstawowe → Wykres
normalności reszt; Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt →
Reszty → Histogram reszt; Test Shapiro – Wilka (zapisanie reszt, statystyki opisowe → normalność)
Zadanie 2
Plik wiek.sta zawiera dane o wieku i wzroście w 28-osobowej próbie wybranej losowo z populacji dzieci i
młodzieży. Zebrane dane nie są kompletne.
Dla każdej opcji sposobu postępowania z danymi brakującymi
Regresja wieloraka → Opcja Usuwanie BD:
• Wyznaczyć średnią, odchylenie standardowe oraz macierz korelacji.
Regresja wieloraka → Podstawowe → Podsumowanie: wyniki regresji → OK → Więcej → Statystyki
opisowe → Macierz → Macierz korelacji
• Oszacować równanie prostej regresji.
Regresja wieloraka → Podstawowe → Podsumowanie: wyniki regresji
• Podać
jakość modelu.
Jak zmieniają się powyższe wartości i dlaczego?
Sposób przeprowadzenia analizy w przypadku występowania braków danych:
Usuwanie przypadkami – do analizy brane są tylko przypadki, które mają kompletne dane dla wszystkich
zmiennych.
Usuwanie parami – przy obliczaniu macierzy korelacji są usuwane tylko te przypadki, w których dla danej pary
zmiennych brakuje co najmniej jednej wartości.
Zastępowanie przez średnie – braki danych zastępowane są przez wartości średnich odpowiednich zmiennych.
Zadanie 3
W pliku ciśnienie.sta zebrano informacje dotyczące wieku i ciśnienia skurczowego krwi 30 pacjentów.
• Sporządzić wykres rozrzutu.
• Oszacować
• Jak
równanie prostej i sporządzić wykres prostej regresji.
dobrze model wyjaśnia zmienność ciśnienia rozkurczowego krwi?
• Na podstawie wyników analizy reszt zlokalizować obserwację odstającą
Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Podstawowe → Wykres
normalności reszt;
Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Reszty → Wykres reszt
wg przypadków (Typ reszty: Reszty surowe)
• Jak
zmienią się parametry prostej regresji oraz jakość modelu po usunięciu przypadku odstającego?
(Zamieścić równanie prostej regresji, jej wykres wraz 95% przedziałami ufności z oraz podać jakoś modelu).
Odpowiedź należy uzasadnić.
Zadanie 4
Zebrano informacje o wieku, wzroście (w cm) oraz wadze (w kg) dzieci z objawami niedożywienia i
umieszczono w pliku dzieci.sta.
• Sporządzić trójwymiarowy wykres rozrzutu.
Wykresy XYZ 3W → Wykresy powierzchniowe, Dopasowanie Liniowe, Zaznaczona opcja Pokaż punkty
danych
• Sporządzić
wykresy rozrzutu dla poszczególnych par zmiennej zależnej i zmiennej niezależnej (wiek~waga,
wzrost~waga).
• Oszacować
parametry modelu regresji liniowej.
• Wyznaczyć
prognozę wagi dla 13-letniego dziecka o wzroście 165 cm.
• Jaki
procent zmienności wagi wyjaśniają poszczególne zmienne modelu? Jaka byłaby zależność pomiędzy
wzrostem a wagą dzieci, gdyby pominąć różnice w wieku?
Regresja wieloraka → Więcej → Korelacje cząstkowe

Podobne dokumenty