ZAJĘCIA X
Transkrypt
ZAJĘCIA X
ZAJĘCIA X ANALIZA REGRESJI (STATISTICA) Zadanie 1 Pewien zakład produkcyjny zatrudnia 5 pracowników fizycznych. Ich wydajność pracy przedstawia poniższa tabela: Wydajność (szt./h) 12 14 14 10 Wynagrodzenie (tys. PLN) 0.9 1.12 1.08 0.7 16 12 1.3 0.95 13 1 13 15 14 1.05 1.2 1.1 Dla powyższych danych: • Sporządzić wykres rozrzutu wynagrodzenia względem wydajności. • Ocenić siłę i kierunek zależności badanych cech Statystyki podstawowe i tabele → Macierze korelacji → Podstawowe → Korelacje • Oszacować i omówić parametry równania regresji Regresja wieloraka → Podsumowanie: Wyniki regresji • Sporządzić wykres prostej regresji wraz z 95% przedziałem ufności Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Wykr. Rozrzutu → Korelacja dwóch zmiennych • Ocenić dopasowanie do danych empirycznych Regresja wieloraka → Podstawowe → Podsumowanie: Wyniki regresji • Jakiego wynagrodzenia może się spodziewać robotnik pracujący z wydajnością Karta Reszty, założenia, predykcja → Predykcja zmiennej zależnej • Jakiej 18 sztuk/h? wydajności można oczekiwać od robotnika zarabiającego 850 zł miesięcznie? • Wyznaczyć wartości reszt Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Podstawowe → Podsumowanie: Reszty i przewidywane • Zweryfikować założenie o zgodności reszt z rozkładem normalnym Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Podstawowe → Wykres normalności reszt; Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Reszty → Histogram reszt; Test Shapiro – Wilka (zapisanie reszt, statystyki opisowe → normalność) Zadanie 2 Plik wiek.sta zawiera dane o wieku i wzroście w 28-osobowej próbie wybranej losowo z populacji dzieci i młodzieży. Zebrane dane nie są kompletne. Dla każdej opcji sposobu postępowania z danymi brakującymi Regresja wieloraka → Opcja Usuwanie BD: • Wyznaczyć średnią, odchylenie standardowe oraz macierz korelacji. Regresja wieloraka → Podstawowe → Podsumowanie: wyniki regresji → OK → Więcej → Statystyki opisowe → Macierz → Macierz korelacji • Oszacować równanie prostej regresji. Regresja wieloraka → Podstawowe → Podsumowanie: wyniki regresji • Podać jakość modelu. Jak zmieniają się powyższe wartości i dlaczego? Sposób przeprowadzenia analizy w przypadku występowania braków danych: Usuwanie przypadkami – do analizy brane są tylko przypadki, które mają kompletne dane dla wszystkich zmiennych. Usuwanie parami – przy obliczaniu macierzy korelacji są usuwane tylko te przypadki, w których dla danej pary zmiennych brakuje co najmniej jednej wartości. Zastępowanie przez średnie – braki danych zastępowane są przez wartości średnich odpowiednich zmiennych. Zadanie 3 W pliku ciśnienie.sta zebrano informacje dotyczące wieku i ciśnienia skurczowego krwi 30 pacjentów. • Sporządzić wykres rozrzutu. • Oszacować • Jak równanie prostej i sporządzić wykres prostej regresji. dobrze model wyjaśnia zmienność ciśnienia rozkurczowego krwi? • Na podstawie wyników analizy reszt zlokalizować obserwację odstającą Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Podstawowe → Wykres normalności reszt; Regresja wieloraka → Reszty, założenia, predykcja → Wykonaj analizę reszt → Reszty → Wykres reszt wg przypadków (Typ reszty: Reszty surowe) • Jak zmienią się parametry prostej regresji oraz jakość modelu po usunięciu przypadku odstającego? (Zamieścić równanie prostej regresji, jej wykres wraz 95% przedziałami ufności z oraz podać jakoś modelu). Odpowiedź należy uzasadnić. Zadanie 4 Zebrano informacje o wieku, wzroście (w cm) oraz wadze (w kg) dzieci z objawami niedożywienia i umieszczono w pliku dzieci.sta. • Sporządzić trójwymiarowy wykres rozrzutu. Wykresy XYZ 3W → Wykresy powierzchniowe, Dopasowanie Liniowe, Zaznaczona opcja Pokaż punkty danych • Sporządzić wykresy rozrzutu dla poszczególnych par zmiennej zależnej i zmiennej niezależnej (wiek~waga, wzrost~waga). • Oszacować parametry modelu regresji liniowej. • Wyznaczyć prognozę wagi dla 13-letniego dziecka o wzroście 165 cm. • Jaki procent zmienności wagi wyjaśniają poszczególne zmienne modelu? Jaka byłaby zależność pomiędzy wzrostem a wagą dzieci, gdyby pominąć różnice w wieku? Regresja wieloraka → Więcej → Korelacje cząstkowe