1. Dana jest niekompletna macierz danych surowych zawierająca
Transkrypt
1. Dana jest niekompletna macierz danych surowych zawierająca
Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy) 1. Dana jest niekompletna macierz danych surowych zawierająca informację o zmiennych X i Y oraz rozkłady zmiennych X i Y. Uzupełnij macierz tak, aby zmienne X i Y miały w tej populacji taki rozkład, jak przedstawiają tabelki. Nr kolejny obiektu X Y 1 2 3 4 5 6 7 8 9 10 50 60 1 0 xi 45 50 60 0 1 0 RAZEM 50 60 60 50 50 Rozkład X P(X=xi) 0,2 0,4 0,4 1,0 Rozkład Y yi 0 1 2 RAZEM P(Y=yi) 0,3 0,5 0,2 1,0 1 1 2. Dana jest macierz zawierająca informację o zmiennej X – rok urodzenia respondenta. Dodaj do macierzy zmienną Y – wiek respondenta, a następnie oblicz średni wiek osób biorących udział w tym badaniu. Nr kolejny resp. X 1 2 3 4 5 6 7 8 9 10 1944 1954 1944 1954 1974 1984 1984 1974 1954 1974 Y 3. Średni wzrost uczniów pewnej klasy wynosi 152 cm, a mediana wzrostu – 151 cm. a. Jakiego wzrostu powinien być nowy uczeń przyjmowany do tej klasy, aby nie zmienił się średni wzrostu uczniów w klasie? b. Jakiego wzrostu powinien być nowy uczeń, aby nie zmieniła się mediana wzrostu uczniów w klasie? Rozważ wszystkie przypadki. 4. Dany jest niekompletny rozkład zmiennej X. Uzupełnij ten rozkład w taki sposób, aby błąd modalnej był maksymalny. xi 1 2 3 4 P(X=xi) 0,2 1 Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy) 5. Dane są następujące parametry zmiennej X – liczba opuszczonych dni pracy: Mo(X)=1; Me(X)=2; E(X)=1,5; b(X)=0,7; d(X)=0,8; D2(X)=1,1. Za opuszczone dni pracy pracodawca zmniejsza pracownikom wynagrodzenie według następującej reguły: - osoby, które opuściły co najwyżej 1 dzień otrzymują pełne wynagrodzenie (nic nie tracą); - osoby, które opuściły 2 dni tracą po 30 zł za każdy dzień; - osoby, które opuściły 3 dni i więcej – tracą po 25 zł za każdy dzień. Ile będą wynosiły te same parametry (tj. modalna, mediana, średnia, błąd modalnej, odchylenie przeciętne i wariancja) zmiennej Y „utracone dochody? Odpowiedzi należy uzasadnić poprzez podanie odpowiednich obliczeń. Jeśli któregoś parametru nie da się wyznaczyć – należy to wyraźnie napisać. 6. W 15-osobowej zbiorowości zmienna X przyjmuje wszystkie wartości ze zbioru {0;1;2}. a. Jakie mogą być maksymalne wartości średniej i wariancji tej zmiennej? b. Podaj przykładowe rozkłady zmiennej X, dla których średnia i wariancja przyjmują maksymalne wartości. c. Czy możliwe jest aby jednocześnie średnia i wariancja były maksymalne? Uzasadnij odpowiedź. 7. Zmienna X przyjmuje w pewnej zbiorowości jedynie dwie wartości – 0 i 1. Odchylenie przeciętne od mediany tej zmiennej wynosi 0,3. Ile wynoszą błąd modalnej i wariancja tej zmiennej? 8. Zmienna X przyjmuje w 50-osobowej zbiorowości wszystkie wartości ze zbioru {1;2;3;4;5}. Podaj taki przykładowy rozkład tej zmiennej, aby różnica między średnią a medianą była ujemna, a wartość bezwzględna tej różnicy możliwie największa. 9. Dany jest rozkład zmiennej X. Podaj rozkłady następujących funkcji zmiennej X: a. W=2X-1; b. Y=(X-1)2; c. V=|X-1| xi 0 1 2 3 P(X=xi) 0,3 0,2 0,4 0,1 10. W pewnej zbiorowości określone są zmienne X i Y. O każdym z niżej podanych zapisów powiedz, czy określa on stałą, czy zmienną: a. E(X|Y) b. Me(X|Y=1) c. D2(Y|X=2) d. D2(Y) 11. Zbadano 10 par małżeńskich. Średnia zarobków żon wynosiła 1000 zł., a wariancja 400 zł2. Wiadomo, że w tej zbiorowości każdy mąż zarabia o 20% więcej od swojej żony. Wyznacz średnią i wariancję różnicy dochodów męża i żony. 2 Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy) 12. Dana jest rodzina rozkładów warunkowych zmiennych X i Y oraz brzegowy rozkład zmiennej Y. Wyznacz rozkład łączny liczebności tych zmiennych przy założeniu, że badana zbiorowość liczyła 100 osób. X\Y 0 1 2 3 razem 1 0,3 0,1 0,1 0,5 1,0 2 0,2 0,4 0,2 0,2 1,0 yi 1 2 razem P(Y=yi) 0,7 0,3 1,0 13. O każdym z wymienionych niżej zdań wypowiedz się, czy jest ono prawdziwe,m czy też nie. − Zmienna statystyczna to funkcja, której argumentami są jednostki obserwacji − Zmienna statystyczna to odwzorowanie przyporządkowujące elementom badanej populacji liczby naturalne − Zmienna statystyczna to funkcja określona na zbiorze liczb rzeczywistych − Zmienna statystyczna to funkcja, której jedną z wartości jest modalna tej zmiennej 14. Zmienna przyjmuje z jednakowymi częstościami cztery wartości. Czy dla innych rozkładów zmiennej przyjmującej te same cztery wartości − modalnych mogłoby być więcej (tak, czy nie?) − wariancja mogłaby być większa (tak, czy nie?) − błąd modalnej mógłby być większy (tak, czy nie?) − entropia mogłaby być większa (tak, czy nie?) 15. W pewnej grupie liczącej 25 osób średnia, mediana i modalna wieku były równe po 22 lata, a odchylenie standardowe - 2 lata. Do grupy dołączyło pięć osób - jedna mająca 18 lat, dwie po 22 lata i 2 po 24 lata. Czy wynika z tego, że − średnia wzrosła (tak, czy nie?) − modalna nie zmieniła się (tak, czy nie?) − odchylenie standardowe wzrosło (tak, czy nie?) − mediana wzrosła (tak, czy nie?) 16. W pewnym zakładzie pracuje 2 razy więcej mężczyzn niż kobiet. Średnia wysokość dodatku rodzinnego pobieranego przez kobiety wynosi 350 zł, a przez mężczyzn – 300 zł. Jaka jest średnia wysokość tego dodatku w całym zakładzie? Ile wynosiłaby ta średnia dla całego zakładu, gdyby z zakładu zwolniono połowę kobiet, a średnia wysokość dodatku rodzinnego w grupie pozostałych kobiet była na początkowym poziomie? 17. W Ministerstwie Powszechnej Szczęśliwości są dwa departamenty o identycznej strukturze i identycznej liczbie pracowników: Departament Uciech Cielesnych (DUC) oraz Departament Rozkoszy Duchowych (DRD). W DUC średnie zarobki wynoszą 500 sybarytów, mediana 482 sybaryty, wariancja 2500 sybarytów kwadratowych, a odchylenie przeciętne od mediany – 30 sybarytów. W DRD każdy pracownik zarabia o 40% więcej niż jego odpowiednik z DUC. Oszacuj najdokładniej jak potrafisz średnią, medianę, wariancję i odchylenie przeciętne od mediany zarobków całego Ministerstwa Powszechnej Szczęśliwości. 3 Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy) TRANSLACJE 1. Zbadano 100-osobową grupę studentów. Niech X – rok studiów, Y – liczba niezdanych egzaminów; Z – płeć (0 – kobieta, 1 –mężczyzna). A. Objaśnij osobie nieznającej statystyki, co oznaczają poniższe zapisy: − P(Y=2|X>1) > P(Y=2|X=1) − E(Z|X=1) < E(Z|X=4) − P[Z=0|Y>E(Y)] > P[Z=0] B. Zapisz używając symboli statystycznych: − W grupie osób, które nie zdały tylko jednego egzaminu najliczniejszy jest trzeci rok studiów − Nieco ponad połowa mężczyzn nie zdała co najwyżej jednego egzaminu i jednocześnie ponad połowa mężczyzn nie zdała co najmniej jednego egzaminu. − Na piątym roku studiów kobiety są liczniejsze niż mężczyźni. 2. W pewnej zbiorowości określono 2 zmienne: X – płeć (0 – mężczyzna; 1 – kobieta) oraz Y – wykształcenie (1 – podstawowe; 2 – średnie; 3 – wyższe). A. Zinterpretuj podane niżej zapisy symboliczne, to znaczy napisz, czym charakteryzuje się zbiorowość, w której zachodzi podana relacja. − − − − P(X=1 & Y=1)=0,1 P(Y=3)=P(Y=3|X=0) E(X|Y<2)<E(X|Y≥2) Mo(X|Y=3)>Mo(X|Y≤2) B. Zapisz symbolicznie następujące zdania: − Osoby z wykształceniem co najmniej średnim stanowią 50% badanej populacji − 30% kobiet ma wykształcenie podstawowe − W grupie mężczyzn częściej zdarzają się osoby ze średnim wykształceniem niż wśród kobiet osoby z wykształceniem podstawowym; − Mężczyzn mających wyższe wykształcenie było w tej zbiorowości więcej niż kobiet ze średnim wykształceniem 3. Zbadano grupę studentów. Niech X oznacza rok studiów, a Y – płeć (0 – kobieta, 1 – mężczyzna). Zapisz używając symboli statystycznych: 1. 2. 3. 4. Najliczniejszy jest trzeci rok studiów. Na trzecim roku kobiety stanowią większość. Połowa mężczyzn studiuje na drugim roku. Udział mężczyzn wśród studentów czwartego roku jest dwukrotnie mniejszy niż wśród studentów pierwszego roku. 4 Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy) 4. W zbiorowości czytelniczek prasy kobiecej określono następujące zmienne: X – ile różnych gazet („tytułów”) kupuje regularnie Y – ulubiony dział (1-życie gwiazd; 2-moda; 3-horoskopy; 4-porady intymne; 5-przepisy kulinarne) Z- czy ogląda seriale w TV (0-nie; 1-tak) W – wykształcenie Poniżej przytoczone zostały stwierdzenia dotyczące badanej zbiorowości oraz propozycje zapisów symbolicznych tych stwierdzeń. O każdym z podanych zapisów symbolicznych wypowiedz się, czy jest on poprawny. W odpowiednią kratkę tabeli wpisz T (tak) lub N (nie). a. „Czytelniczki z wykształceniem przynajmniej średnim rzadziej oglądają seriale w TV, niż czytelniczki z wykształceniem podstawowym”. E (Z | W=2 ∨ W=3) < E (Z | W=1) E (Z | W≥2) > E(Z) P(Z=1 | W≥2) < P(Z=0 | W≥2) P(W=2 ∨ W=3 | Z=1) < P (W=1 | Z=1) b. Większość czytelniczek, które najbardziej lubią horoskopy i kupują regularnie więcej niż 2 tytuły, ma wykształcenie średnie. P (W=2 | Y=3 ∧ X>2) > 0,5 Me (W | Y=3 ∧ X>2) = 2 P (Y ≠ 3 | X>2 ∧ W=2) < 0,5 P (W=2 | Y=3 ∧ X>2) > P(W=2 | Y≠3 ∧ X≤2) Dopasuj zdania do podanych zapisów symbolicznych. Przy każdym zdaniu wpisz T (tak) lub N (nie) w zależności od tego, czy odpowiada ono czy też nie podanemu zapisowi symbolicznemu> P (Y=1 | W=3) = P (Y=5 | W=1) Wśród czytelniczek z wyższym wykształceniem, najbardziej zainteresowane życiem gwiazd zdarzają się tak samo często, jak osoby z wykształceniem podstawowym wśród czytelniczek zainteresowanych przepisami kulinarnymi. Tak samo często zdarzają się czytelniczki z wyższym wykształceniem najbardziej zainteresowane życiem gwiazd, co czytelniczki z wykształceniem podstawowym, dla których najciekawsze są przepisy kulinarne. Wśród czytelniczek z wyższym wykształceniem, najbardziej zainteresowane życiem gwiazd zdarzają się tak samo często, jak zainteresowane przepisami kulinarnymi wśród czytelniczek z wykształceniem podstawowym. Wśród czytelniczek najbardziej zainteresowanych życiem gwiazd, osoby z wyższym wykształceniem zdarzają się tak samo często, jak osoby z wykształceniem podstawowym wśród czytelniczek zainteresowanych przepisami kulinarnymi. 5 Joanna Konieczna – Repetytorium ze statystyki opisowej (materiał roboczy) E (Z | W=3 ∧ X > 1) > 0,5 Większość czytelniczek z wyższym wykształceniem, kupujących regularnie więcej niż jeden tytuł, ogląda seriale. Wśród osób oglądających seriale, ponad połowa ma wykształcenie wyższe i kupuje regularnie więcej niż jeden tytuł. Ponad połowę tej zbiorowości stanowią osoby z wyższym wykształceniem, kupujące regularnie więcej niż jeden tytuł i oglądające seriale. Jest więcej czytelniczek oglądających seriale, wśród osób z wyższym wykształceniem, które kupują regularnie więcej niż jeden tytuł, niż wśród osób z wykształceniem najwyżej średnim, kupujących regularnie tylko jedną gazetę. 5. Zbadano 100 par małżeńskich. Określono zmienne: X – wiek męża, Y – wiek żony oraz Z – posiadanie dzieci (2 – nie ma dzieci, 4 – są dzieci). 1. Objaśnij osobie nieznającej statystyki, co oznaczają następujące zapisy. a. D2(X – Y)=0 b. Me(Z|X<27)<Me(Z|X>27) 2. Zapisz używając symboli statystycznych a. Najmłodszy mąż jest starszy od najmłodszej żony; b. Większość małżeństw, w których żona jest starsza od męża nie ma dzieci. 6