1. Dana jest niekompletna macierz danych surowych zawierająca

Transkrypt

1. Dana jest niekompletna macierz danych surowych zawierająca
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy)
1. Dana jest niekompletna macierz danych surowych zawierająca informację o zmiennych X i Y
oraz rozkłady zmiennych X i Y. Uzupełnij macierz tak, aby zmienne X i Y miały w tej populacji
taki rozkład, jak przedstawiają tabelki.
Nr
kolejny
obiektu
X
Y
1
2
3
4
5
6
7
8
9
10
50
60
1
0
xi
45
50
60
0
1
0
RAZEM
50
60
60
50
50
Rozkład X
P(X=xi)
0,2
0,4
0,4
1,0
Rozkład Y
yi
0
1
2
RAZEM
P(Y=yi)
0,3
0,5
0,2
1,0
1
1
2. Dana jest macierz zawierająca informację o zmiennej X – rok urodzenia respondenta. Dodaj do
macierzy zmienną Y – wiek respondenta, a następnie oblicz średni wiek osób biorących udział w
tym badaniu.
Nr
kolejny
resp.
X
1
2
3
4
5
6
7
8
9
10
1944
1954
1944
1954
1974
1984
1984
1974
1954
1974
Y
3. Średni wzrost uczniów pewnej klasy wynosi 152 cm, a mediana wzrostu – 151 cm.
a. Jakiego wzrostu powinien być nowy uczeń przyjmowany do tej klasy, aby nie zmienił się
średni wzrostu uczniów w klasie?
b. Jakiego wzrostu powinien być nowy uczeń, aby nie zmieniła się mediana wzrostu uczniów
w klasie? Rozważ wszystkie przypadki.
4. Dany jest niekompletny rozkład zmiennej X. Uzupełnij ten rozkład w taki sposób, aby błąd
modalnej był maksymalny.
xi
1
2
3
4
P(X=xi)
0,2
1
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy)
5. Dane są następujące parametry zmiennej X – liczba opuszczonych dni pracy: Mo(X)=1;
Me(X)=2; E(X)=1,5; b(X)=0,7; d(X)=0,8; D2(X)=1,1. Za opuszczone dni pracy pracodawca
zmniejsza pracownikom wynagrodzenie według następującej reguły:
- osoby, które opuściły co najwyżej 1 dzień otrzymują pełne wynagrodzenie (nic nie tracą);
- osoby, które opuściły 2 dni tracą po 30 zł za każdy dzień;
- osoby, które opuściły 3 dni i więcej – tracą po 25 zł za każdy dzień.
Ile będą wynosiły te same parametry (tj. modalna, mediana, średnia, błąd modalnej, odchylenie
przeciętne i wariancja) zmiennej Y „utracone dochody? Odpowiedzi należy uzasadnić poprzez
podanie odpowiednich obliczeń. Jeśli któregoś parametru nie da się wyznaczyć – należy to
wyraźnie napisać.
6. W 15-osobowej zbiorowości zmienna X przyjmuje wszystkie wartości ze zbioru {0;1;2}.
a. Jakie mogą być maksymalne wartości średniej i wariancji tej zmiennej?
b. Podaj przykładowe rozkłady zmiennej X, dla których średnia i wariancja przyjmują
maksymalne wartości.
c. Czy możliwe jest aby jednocześnie średnia i wariancja były maksymalne? Uzasadnij
odpowiedź.
7. Zmienna X przyjmuje w pewnej zbiorowości jedynie dwie wartości – 0 i 1. Odchylenie
przeciętne od mediany tej zmiennej wynosi 0,3. Ile wynoszą błąd modalnej i wariancja tej
zmiennej?
8. Zmienna X przyjmuje w 50-osobowej zbiorowości wszystkie wartości ze zbioru {1;2;3;4;5}.
Podaj taki przykładowy rozkład tej zmiennej, aby różnica między średnią a medianą była ujemna, a
wartość bezwzględna tej różnicy możliwie największa.
9. Dany jest rozkład zmiennej X. Podaj rozkłady następujących funkcji zmiennej X:
a. W=2X-1;
b. Y=(X-1)2;
c. V=|X-1|
xi
0
1
2
3
P(X=xi)
0,3
0,2
0,4
0,1
10. W pewnej zbiorowości określone są zmienne X i Y. O każdym z niżej podanych zapisów
powiedz, czy określa on stałą, czy zmienną:
a. E(X|Y)
b. Me(X|Y=1)
c. D2(Y|X=2)
d. D2(Y)
11. Zbadano 10 par małżeńskich. Średnia zarobków żon wynosiła 1000 zł., a wariancja 400 zł2.
Wiadomo, że w tej zbiorowości każdy mąż zarabia o 20% więcej od swojej żony. Wyznacz średnią
i wariancję różnicy dochodów męża i żony.
2
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy)
12. Dana jest rodzina rozkładów warunkowych zmiennych X i Y oraz brzegowy rozkład zmiennej
Y. Wyznacz rozkład łączny liczebności tych zmiennych przy założeniu, że badana zbiorowość
liczyła 100 osób.
X\Y
0
1
2
3
razem
1
0,3
0,1
0,1
0,5
1,0
2
0,2
0,4
0,2
0,2
1,0
yi
1
2
razem
P(Y=yi)
0,7
0,3
1,0
13. O każdym z wymienionych niżej zdań wypowiedz się, czy jest ono prawdziwe,m czy też nie.
− Zmienna statystyczna to funkcja, której argumentami są jednostki obserwacji
− Zmienna statystyczna to odwzorowanie przyporządkowujące elementom badanej populacji
liczby naturalne
− Zmienna statystyczna to funkcja określona na zbiorze liczb rzeczywistych
− Zmienna statystyczna to funkcja, której jedną z wartości jest modalna tej zmiennej
14. Zmienna przyjmuje z jednakowymi częstościami cztery wartości. Czy dla innych rozkładów
zmiennej przyjmującej te same cztery wartości
− modalnych mogłoby być więcej (tak, czy nie?)
− wariancja mogłaby być większa (tak, czy nie?)
− błąd modalnej mógłby być większy (tak, czy nie?)
− entropia mogłaby być większa (tak, czy nie?)
15. W pewnej grupie liczącej 25 osób średnia, mediana i modalna wieku były równe po 22 lata, a
odchylenie standardowe - 2 lata. Do grupy dołączyło pięć osób - jedna mająca 18 lat, dwie po 22
lata i 2 po 24 lata. Czy wynika z tego, że
− średnia wzrosła (tak, czy nie?)
− modalna nie zmieniła się (tak, czy nie?)
− odchylenie standardowe wzrosło (tak, czy nie?)
− mediana wzrosła (tak, czy nie?)
16. W pewnym zakładzie pracuje 2 razy więcej mężczyzn niż kobiet. Średnia wysokość dodatku
rodzinnego pobieranego przez kobiety wynosi 350 zł, a przez mężczyzn – 300 zł. Jaka jest średnia
wysokość tego dodatku w całym zakładzie? Ile wynosiłaby ta średnia dla całego zakładu, gdyby z
zakładu zwolniono połowę kobiet, a średnia wysokość dodatku rodzinnego w grupie pozostałych
kobiet była na początkowym poziomie?
17. W Ministerstwie Powszechnej Szczęśliwości są dwa departamenty o identycznej strukturze
i identycznej liczbie pracowników: Departament Uciech Cielesnych (DUC) oraz Departament
Rozkoszy Duchowych (DRD). W DUC średnie zarobki wynoszą 500 sybarytów, mediana 482
sybaryty, wariancja 2500 sybarytów kwadratowych, a odchylenie przeciętne od mediany – 30
sybarytów. W DRD każdy pracownik zarabia o 40% więcej niż jego odpowiednik z DUC.
Oszacuj najdokładniej jak potrafisz średnią, medianę, wariancję i odchylenie przeciętne od mediany
zarobków całego Ministerstwa Powszechnej Szczęśliwości.
3
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy)
TRANSLACJE
1. Zbadano 100-osobową grupę studentów. Niech X – rok studiów, Y – liczba niezdanych
egzaminów; Z – płeć (0 – kobieta, 1 –mężczyzna).
A. Objaśnij osobie nieznającej statystyki, co oznaczają poniższe zapisy:
− P(Y=2|X>1) > P(Y=2|X=1)
− E(Z|X=1) < E(Z|X=4)
− P[Z=0|Y>E(Y)] > P[Z=0]
B. Zapisz używając symboli statystycznych:
− W grupie osób, które nie zdały tylko jednego egzaminu najliczniejszy jest trzeci rok
studiów
− Nieco ponad połowa mężczyzn nie zdała co najwyżej jednego egzaminu i
jednocześnie ponad połowa mężczyzn nie zdała co najmniej jednego egzaminu.
− Na piątym roku studiów kobiety są liczniejsze niż mężczyźni.
2. W pewnej zbiorowości określono 2 zmienne: X – płeć (0 – mężczyzna; 1 – kobieta) oraz Y –
wykształcenie (1 – podstawowe; 2 – średnie; 3 – wyższe).
A. Zinterpretuj podane niżej zapisy symboliczne, to znaczy napisz, czym charakteryzuje się
zbiorowość, w której zachodzi podana relacja.
−
−
−
−
P(X=1 & Y=1)=0,1
P(Y=3)=P(Y=3|X=0)
E(X|Y<2)<E(X|Y≥2)
Mo(X|Y=3)>Mo(X|Y≤2)
B. Zapisz symbolicznie następujące zdania:
− Osoby z wykształceniem co najmniej średnim stanowią 50% badanej populacji
− 30% kobiet ma wykształcenie podstawowe
− W grupie mężczyzn częściej zdarzają się osoby ze średnim wykształceniem niż
wśród kobiet osoby z wykształceniem podstawowym;
− Mężczyzn mających wyższe wykształcenie było w tej zbiorowości więcej niż kobiet
ze średnim wykształceniem
3. Zbadano grupę studentów. Niech X oznacza rok studiów, a Y – płeć (0 – kobieta, 1 –
mężczyzna). Zapisz używając symboli statystycznych:
1.
2.
3.
4.
Najliczniejszy jest trzeci rok studiów.
Na trzecim roku kobiety stanowią większość.
Połowa mężczyzn studiuje na drugim roku.
Udział mężczyzn wśród studentów czwartego roku jest dwukrotnie mniejszy niż wśród
studentów pierwszego roku.
4
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy)
4. W zbiorowości czytelniczek prasy kobiecej określono następujące zmienne:
X – ile różnych gazet („tytułów”) kupuje regularnie
Y – ulubiony dział (1-życie gwiazd; 2-moda; 3-horoskopy; 4-porady intymne; 5-przepisy
kulinarne)
Z- czy ogląda seriale w TV (0-nie; 1-tak)
W – wykształcenie
Poniżej przytoczone zostały stwierdzenia dotyczące badanej zbiorowości oraz propozycje zapisów
symbolicznych tych stwierdzeń. O każdym z podanych zapisów symbolicznych wypowiedz się, czy
jest on poprawny. W odpowiednią kratkę tabeli wpisz T (tak) lub N (nie).
a. „Czytelniczki z wykształceniem przynajmniej średnim rzadziej oglądają seriale w TV, niż
czytelniczki z wykształceniem podstawowym”.
E (Z | W=2 ∨ W=3) < E (Z | W=1)
E (Z | W≥2) > E(Z)
P(Z=1 | W≥2) < P(Z=0 | W≥2)
P(W=2 ∨ W=3 | Z=1) < P (W=1 | Z=1)
b. Większość czytelniczek, które najbardziej lubią horoskopy i kupują regularnie więcej niż 2
tytuły, ma wykształcenie średnie.
P (W=2 | Y=3 ∧ X>2) > 0,5
Me (W | Y=3 ∧ X>2) = 2
P (Y ≠ 3 | X>2 ∧ W=2) < 0,5
P (W=2 | Y=3 ∧ X>2) > P(W=2 | Y≠3 ∧ X≤2)
Dopasuj zdania do podanych zapisów symbolicznych. Przy każdym zdaniu wpisz T (tak) lub N
(nie) w zależności od tego, czy odpowiada ono czy też nie podanemu zapisowi symbolicznemu>
P (Y=1 | W=3) = P (Y=5 | W=1)
Wśród czytelniczek z wyższym wykształceniem, najbardziej zainteresowane życiem gwiazd zdarzają
się tak samo często, jak osoby z wykształceniem podstawowym wśród czytelniczek
zainteresowanych przepisami kulinarnymi.
Tak samo często zdarzają się czytelniczki z wyższym wykształceniem najbardziej zainteresowane
życiem gwiazd, co czytelniczki z wykształceniem podstawowym, dla których najciekawsze są
przepisy kulinarne.
Wśród czytelniczek z wyższym wykształceniem, najbardziej zainteresowane życiem gwiazd zdarzają
się tak samo często, jak zainteresowane przepisami kulinarnymi wśród czytelniczek z
wykształceniem podstawowym.
Wśród czytelniczek najbardziej zainteresowanych życiem gwiazd, osoby z wyższym wykształceniem
zdarzają się tak samo często, jak osoby z wykształceniem podstawowym wśród czytelniczek
zainteresowanych przepisami kulinarnymi.
5
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy)
E (Z | W=3 ∧ X > 1) > 0,5
Większość czytelniczek z wyższym wykształceniem, kupujących regularnie więcej niż jeden tytuł,
ogląda seriale.
Wśród osób oglądających seriale, ponad połowa ma wykształcenie wyższe i kupuje regularnie więcej
niż jeden tytuł.
Ponad połowę tej zbiorowości stanowią osoby z wyższym wykształceniem, kupujące regularnie
więcej niż jeden tytuł i oglądające seriale.
Jest więcej czytelniczek oglądających seriale, wśród osób z wyższym wykształceniem, które kupują
regularnie więcej niż jeden tytuł, niż wśród osób z wykształceniem najwyżej średnim, kupujących
regularnie tylko jedną gazetę.
5. Zbadano 100 par małżeńskich. Określono zmienne: X – wiek męża, Y – wiek żony oraz Z –
posiadanie dzieci (2 – nie ma dzieci, 4 – są dzieci).
1. Objaśnij osobie nieznającej statystyki, co oznaczają następujące zapisy.
a. D2(X – Y)=0
b. Me(Z|X<27)<Me(Z|X>27)
2. Zapisz używając symboli statystycznych
a. Najmłodszy mąż jest starszy od najmłodszej żony;
b. Większość małżeństw, w których żona jest starsza od męża nie ma dzieci.
6