ZAJĘCIA IV
Transkrypt
ZAJĘCIA IV
ZAJĘCIA IV STATYSTYKA OPISOWA (STATISTICA) Zad. 1 Wygenerować próbki 100-elementowe (1) z rozkładu normalnego, średnia=10, odchylenie standardowe=1 • wyznaczyć wartości funkcji gęstości prawdopodobieństwa • sporządzić wykresy: ➢ zależności funkcji gęstości prawdopodobieństwa od wartości próbki ➢ histogram (sposób wyświetlania: skumulowany, typ dopasowania: normalny, zaznaczona opcja: liczności skumulowane względne) z liczbą przedziałów: 5, 10, 20. Funkcje: rndnormal, normal Określanie formuły dla zmiennej: Dane → Specyfikacja zmiennej (2) losowo wybrane liczby z przedziału <dolna_granica, gorna_granica> • wyznaczyć wartości funkcji gęstości prawdopodobieństwa rozkładu χ-kwadrat, dla liczby stopni swobody 2, 5, 10 • sporządzić wykresy: ➢ zależności funkcji gęstości prawdopodobieństwa od wygenerowanej próbki ➢ histogram (sposób wyświetlania: skumulowany, typ dopasowania: normalny, zaznaczona opcja: liczności skumulowane względne) z liczbą przedziałów: 5, 10, 20. Funkcje: rnd, chi2 (3) losowo wybrane liczby z przedziału <dolna_granica, gorna_granica> • wyznaczyć wartości funkcji gęstości prawdopodobieństwa rozkładu Poissona, dla λ=4, 10, 20, • sporządzić wykres rozrzutu (funkcja gęstości, próbka) Funkcje: poisson Zad. 2 (zbiór danych „pracownicy”) Korzystając z pliku danych utworzonego do zadania nr 3 z zajęć nr 3 (statystyka opisowa, R) dla zmiennej pensja wyznaczyć: statystyka->statystyki podstawowe i tabele->tabele liczności • • • • tabele liczności (liczba przedziałów: 4, 8, 12) histogramy odpowiadające przedziałom liczności wartości p-value dla testów normalności wykresy ramka-wąsy typów: mediana/kwartyle/rozstęp, średnia/błąd std./odch. std. statystyka-> statystyki podstawowe i tabele-> statystyki opisowe • • • medianę, modę, odchylenie standardowe, rozstęp, współczynnik skośności, kurtozę, dolny i górny kwartyl skategoryzowany wykres ramka-wąsy ze zmiennymi grupującymi: płeć, stanowisko (dla dwóch najliczniejszych stanowisk) skategoryzowany wykres średnich (poziom ufności 0.9) ze zmiennymi grupującymi: płeć, stanowisko (dla dwóch najliczniejszych stanowisk) statystyka->statystyki podstawowe i tabele->tabele wielodzielcze • tabelę wielodzielczą dla zmiennych grupujących płeć i stanowisko (wybrane dwa najliczniejsze stanowiska – określenie kodów grupujących użytkownika) Joanna Gościk, Anna Łupińska-Dubicka, Magdalena Topczewska Zad. 3 (zbiór danych „pracownicy”) Stworzyć nową zmienną pensja_ranga, która zawierała będzie rangę pensji pracownika wyznaczaną na następujących zasadach: nowa zmienna, dane->przekoduj 1 gdy pensja należy do przedziału (0; 1000> 2 gdy pensja należy do przedziału (1000; 2000> ... n gdy pensja należy do przedziału (max-1000; max> uwaga: w ostatnim przedziale musi zawierać się pensja maksymalna Sporządzić wykres rozrzutu zmiennej pensja_ranga względem zmiennej stanowisko oraz sporządzić histogram nowej zmiennej. Przeprowadzić testy normalności dla nowej zmiennej i porównać wyniki z tymi, otrzymanymi dla zmiennej pensja. Sprawozdanie powinno zawierać: 1. Sposoby wywołania funkcji. Wykorzystywane formuły. 2. Otrzymane wyniki liczbowe oraz wykresy. Wykresy powinny być odpowiednio sfomatowane. 3. Zbiór danych „pracownicy”. 4. Wnioski (analiza wykresów i wyników liczbowych). NASTĘPNE ZAJĘCIA: teoria estymacji Joanna Gościk, Anna Łupińska-Dubicka, Magdalena Topczewska