ZAJĘCIA IV

Transkrypt

ZAJĘCIA IV
ZAJĘCIA IV
STATYSTYKA OPISOWA (STATISTICA)
Zad. 1
Wygenerować próbki 100-elementowe
(1) z rozkładu normalnego, średnia=10, odchylenie standardowe=1
•
wyznaczyć wartości funkcji gęstości prawdopodobieństwa
•
sporządzić wykresy:
➢ zależności funkcji gęstości prawdopodobieństwa od wartości próbki
➢ histogram (sposób wyświetlania: skumulowany, typ dopasowania: normalny, zaznaczona opcja:
liczności skumulowane względne) z liczbą przedziałów: 5, 10, 20.
Funkcje: rndnormal, normal
Określanie formuły dla zmiennej: Dane → Specyfikacja zmiennej
(2) losowo wybrane liczby z przedziału <dolna_granica, gorna_granica>
•
wyznaczyć wartości funkcji gęstości prawdopodobieństwa rozkładu χ-kwadrat, dla liczby stopni
swobody 2, 5, 10
•
sporządzić wykresy:
➢ zależności funkcji gęstości prawdopodobieństwa od wygenerowanej próbki
➢ histogram (sposób wyświetlania: skumulowany, typ dopasowania: normalny, zaznaczona opcja:
liczności skumulowane względne) z liczbą przedziałów: 5, 10, 20.
Funkcje: rnd, chi2
(3) losowo wybrane liczby z przedziału <dolna_granica, gorna_granica>
•
wyznaczyć wartości funkcji gęstości prawdopodobieństwa rozkładu Poissona, dla λ=4, 10, 20,
•
sporządzić wykres rozrzutu (funkcja gęstości, próbka)
Funkcje: poisson
Zad. 2 (zbiór danych „pracownicy”)
Korzystając z pliku danych utworzonego do zadania nr 3 z zajęć nr 3 (statystyka opisowa, R) dla zmiennej
pensja wyznaczyć:
statystyka->statystyki podstawowe i tabele->tabele liczności
•
•
•
•
tabele liczności (liczba przedziałów: 4, 8, 12)
histogramy odpowiadające przedziałom liczności
wartości p-value dla testów normalności
wykresy ramka-wąsy typów: mediana/kwartyle/rozstęp, średnia/błąd std./odch. std.
statystyka-> statystyki podstawowe i tabele-> statystyki opisowe
•
•
•
medianę, modę, odchylenie standardowe, rozstęp, współczynnik skośności, kurtozę, dolny i górny
kwartyl
skategoryzowany wykres ramka-wąsy ze zmiennymi grupującymi: płeć, stanowisko (dla dwóch
najliczniejszych stanowisk)
skategoryzowany wykres średnich (poziom ufności 0.9) ze zmiennymi grupującymi: płeć, stanowisko
(dla dwóch najliczniejszych stanowisk)
statystyka->statystyki podstawowe i tabele->tabele wielodzielcze
•
tabelę wielodzielczą dla zmiennych grupujących płeć i stanowisko (wybrane dwa najliczniejsze
stanowiska – określenie kodów grupujących użytkownika)
Joanna Gościk, Anna Łupińska-Dubicka, Magdalena Topczewska
Zad. 3 (zbiór danych „pracownicy”)
Stworzyć nową zmienną pensja_ranga, która zawierała będzie rangę pensji pracownika wyznaczaną na
następujących zasadach:
nowa zmienna, dane->przekoduj
1 gdy pensja należy do przedziału (0; 1000>
2 gdy pensja należy do przedziału (1000; 2000>
...
n gdy pensja należy do przedziału (max-1000; max>
uwaga: w ostatnim przedziale musi zawierać się pensja maksymalna
Sporządzić wykres rozrzutu zmiennej pensja_ranga względem zmiennej stanowisko oraz sporządzić
histogram nowej zmiennej. Przeprowadzić testy normalności dla nowej zmiennej i porównać wyniki z tymi,
otrzymanymi dla zmiennej pensja.
Sprawozdanie powinno zawierać:
1. Sposoby wywołania funkcji. Wykorzystywane formuły.
2. Otrzymane wyniki liczbowe oraz wykresy. Wykresy powinny być odpowiednio sfomatowane.
3. Zbiór danych „pracownicy”.
4. Wnioski (analiza wykresów i wyników liczbowych).
NASTĘPNE ZAJĘCIA: teoria estymacji
Joanna Gościk, Anna Łupińska-Dubicka, Magdalena Topczewska