tym adresem - Uniwersytet Ekonomiczny w Katowicach

Transkrypt

tym adresem - Uniwersytet Ekonomiczny w Katowicach
Uniwersytet Ekonomiczny w Katowicach
Wydział Finansów i Ubezpieczeń, Kierunek: Finanse i Rachunkowość
Zestaw zadań przygotowujących1
do egzaminu ze Statystyki2
Egzaminatorzy: dr Joanna Trzęsiok, dr Michał Trzęsiok
e–mail: [email protected]
e–mail: [email protected]
Termin egzaminu: 6 lutego 2017 r. Czas pisania: około 90 minut gr. 201–214 FL
Terminy konsultacji: proszę sprawdzić na stronie Katedry Analiz Gospodarczych i Finansowych, czyli tutaj
3
Poniżej prezentujemy obszerną listę zadań przygotowujących do egzaminu ze statystyki (dla grup 201–214FL). Zadań na
egzaminie oczywiście będzie mniej niż w tym zestawie. Będą różne zestawy zadań. Ten zestaw ma Państwu dać pewne
wyobrażenie dotyczącego tego, jakiego typu zadania mogą się pojawić. Zadania na egzaminie będą podobne do tych z tego
zestawu (będą oczywiście inne, ale tego samego typu). Na egzaminie zadania mają bardzo ograniczoną część obliczeniową,
ponieważ nie musimy już sprawdzać, czy potraficie Państwo liczyć elementy potrzebne w statystyce – zrobiliśmy to bardzo
dokładnie na zaliczeniu z ćwiczeń. Do egzaminu podchodzą wyłącznie osoby z pozytywną oceną z zaliczenia.
Oceniane będą tylko informacje zapisane na podpisanej kartce papieru, którą otrzymacie i będziecie Państwo oddawać
po upływie wskazanego czasu. Preferujemy, byście dokładali własne podpisane kartki tylko wtedy, kiedy już naprawdę nie
potraficie się zmieścić na przekazanych kartkach. Należy więc najpierw wykorzystać wszystkie wolne miejsca na przekazanych kartkach z zadaniami. Punkty zdobywa się przede wszystkim za poprawne komentarze, wnioski, interpretacje. Ostatnie
dwa lub trzy zadania to pytania dotyczące treści wykładowych. Zadania będą różnie punktowane w zależności od nakładu
pracy potrzebnego do rozwiązania. Żeby zaliczyć egzamin trzeba zdobyć co najmniej 50% sumy punktów z egzaminu.
W czasie egzaminu można korzystać z: kalkulatora, zestawu wzorów dostarczonego przez egzaminatora, zatwierdzonych przez egzaminatora i wydrukowanych we własnym zakresie tablic rozkładu normalnego i Studenta.
Każda grupa ma swoje przyzwyczajenia dotyczące oznaczeń i tablic, z których korzysta, więc przedstawiciel każdej grupy
może do egzaminatora napisać maila, do którego dołączy tablice, z których dana grupa chce korzystać na egzaminie.
Konieczne jest zatwierdzenie tablic przez egzaminatora przed egzaminem (najpóźniej do soboty 4.02. do 23:59) – zawsze
odpowiadamy z informacją, czy zatwierdzamy materiały do wykorzystania.
Stosowanie nieuczciwych praktyk w trakcie egzaminu powoduje natychmiastowe zakończenie pisania egzaminu i utratę
danego terminu egzaminu (ocenę „ndst”).
Przypominamy (choć jest to napisane na stronie katedry oraz w harmonogramie sesji), że egzamin odbędzie się
6.02.2017 r. w Auli CNTI w czterech turach: o 900 dla grup 201–204FL, o 1100 dla grup 205–207FL, o 1300 dla grup
208–211FL oraz o 1500 dla grup 212–214FL.
Na stronie katedry znajdziecie Państwo terminy naszych konsultacji w sesji. Gdyby ktoś miał pytania przed egzaminem
– serdecznie zapraszamy!
Powodzenia!
Joanna i Michał Trzęsiok
Zadanie 1. Na jakiej skali (wg Stevensa) mierzone są następujące cechy:
a) wielkość przedsiębiorstwa (kategorie: „mikro”, „małe”, „średnie” i „duże”),
b) PKB per capita w USD,
1
Ten zestaw jest sponsorowany przez LATEX’owy symbol [\Biohazard]:
2
h
Zestaw dostępny pod adresem: http://web2.ue.katowice.pl/trzesiok/EgzaminStatZestawPrzygotowujacy.pdf
3
Gdyby wskazane terminy komuś z Państwa nie odpowiadały, to zachęcam do indywidualnego umawiania się na konsultacje!
1
c) marka obuwia sportowego.
Zadanie 2. Zarząd pewnej firmy informatycznej zbadał zrealizowane przez firmę zlecenia ze względu na
ich wartość [w tys. zł]. Obliczono następujące wartości statystyk opisowych: średnia równa 123, odchylenie standardowe równe 83, klasyczny współczynnik asymetrii równy −0, 9. Dokonaj opisu statystycznego
(zinterpretuj te wyniki).
Zadanie 3. GUS zbadał strukturę pracowników w Polsce ze względu na wysokość wynagrodzenia [w zł].
Obliczono następujące wartości statystyk opisowych: mediana równa 3 300, odchylenie ćwiartkowe równe
1 600, współczynnik asymetrii Pearsona równy 1,3. Dokonaj opisu statystycznego (zinterpretuj te wyniki).
Zadanie 4. Narysuj odpowiedni wykres dla danych z poniższego szeregu. Ponadto sprawdź, czy osoba, która otrzymała ocenę „4” kwalifikuje się do grupy wybrańców, którym oferuje się ciekawy wyjazd
szkoleniowy, jeśli wyjechać może nie więcej niż 10% najlepszych studentów z tej grupy osób. Odpowiedź
uzasadnić.
Niech xi – ocena z egzaminu, ni – liczba studentów;
xi
ni
2
10
3
20
4
12
5
8
Zadanie 5. Narysuj odpowiedni wykres dla danych z poniższego szeregu. Ponadto wskaż, w którym
przedziale znajduje się dominanta.
Niech xi – roczne wydobycie ropy naftowej [w dziesiątkach mln ton], ni – liczba państw;
xi
ni
6 − 8, 9
2
9 − 11, 9
4
12 − 17, 9
7
Zadanie 6. Jakiej miary użyjesz do opisania położenia oraz rozproszenia dla danych w szeregu:
10, 14, 15, 15, 18, 20, 20, 23, 24, 68, 137. Odpowiedź uzasadnij.
Zadanie 7. Paweł i Gaweł porównują wyniki spalania swoich samochodów, które systematycznie wyliczają
po każdym tankowaniu do pełna. Paweł jeździ tak, że jego auto spala przeciętnie 5,5 l/100 km z odchyleniem standardowym ±2 l/100 km. Natomiast auto Gawła spala przeciętnie 9 l/100 km z odchyleniem
standardowym ±2, 5 l/100 km. Wyniki którego z chłopaków charakteryzują się większym zróżnicowaniem?
Odpowiedź uzasadnij.
Zadanie 8. Związek pomiędzy średnią liczbą lat edukacji (x) w danym kraju a jego PKB per capita (y)
jest w przybliżeniu liniowy. Kowariancja dla tych zmiennych jest równa cov(x, y) = 4 200 a odchylenia
standardowe s(x) = 1, 5 oraz s(y) = 8 000, odpowiednio. Oblicz odpowiednią miarę korelacji. Określ
kierunek i siłę zależności korelacyjnej a ponadto zinterpretuj otrzymaną wielkość (tzn. opisz co możemy
na tej podstawie wnioskować o badanych zmiennych).
2
Zadanie 9. Pewien baca rzeźbi podobne do siebie stylistycznie, artystyczne figurki, które następnie sprzedaje przez Internet. Próbując rozpoznać popyt baca wystawia figurki w różnych miesiącach z różnymi
cenami. Poniżej zestawiono cenę figurki z liczbą sprzedanych figurek w takiej cenie. Na podstawie poniższych danych wyznaczono prostą regresji dla zależności popytu na figurki (y) od ich ceny (x) i jest ona
postaci: y(x) = −3, 4x + 12.
a) Zinterpretuj współczynnik kierunkowy tej linii regresji
b) Wyznacz prognozę popytu na figurki przy cenie x̂ = 2 tys. zł
c) Oblicz i zinterpretuj odchylenie standardowe reszt
Niech xi – cena figurki w tys. zł, yi – liczba sprzedanych figurek;
xi
yi
1
9
1,7
7
2,3
2
3
3
Zadanie 10. Zbadano średnią cenę ropy (oleju napędowego) na pewnej stacji paliw w okolicach Rybnika
w latach 2014–2016. W roku 2014 była równa 5,35 zł, w kolejnym roku 5,02 zł, a następnie 4,32 zł.
a) Jak zmieniła się średnia cena ropy na tej stacji w roku 2016 w porównaniu do 2014?
b) Oblicz i zinterpretuj średnie tempo zmian cen ropy.
c) Na podstawie indeksu średniego wyznacz prognozę średniej ceny ropy na tej stacji na rok 2017.
Zadanie 11. Kierownik hurtowni materiałów budowlanych cieszy się bo z podsumowania roku wyszło, że
wartość sprzedanych towarów (wszystkich razem) w 2015 r. była równa 4 500 tys. zł i wzrosła w stosunku
do roku poprzedniego o 19%. Okazało się jednak, że gdyby przeliczyć jaka byłaby teoretycznie wartość
produktów sprzedanych w 2015 r. po cenach z roku 2014, to wychodzi 3 600 tys zł.
a) Co można powiedzieć na temat zmian cen towarów budowlanych w tej hurtowni? Obliczyć i zinterpretować odpowiedni indeks zmian.
b) Co można powiedzieć na temat zmian sprzedaży (ilości sprzedawanych towarów budowlanych) w tej
hurtowni? Obliczyć i zinterpretować odpowiedni indeks zmian.
c) Jak w związku z tym można zdekomponować zaobserwowany 19 procentowy wzrost wartości sprzedaży?
Zadanie 12. Maturzystka Helena wybierając się na studia w Akademii Muzycznej przeprowadziła badania rynku wynajmu mieszkań w Katowicach. W losowo dobranej próbie znalazło się 25 ofert wynajmu
mieszkań. Helena obliczyła, że w próbie średnia cena wynajmu metra kwadratowego mieszkania to 31 zł
z odchyleniem standardowym (nieobciążonym) równym 4 zł. Zakładając, że badana zmienna ma rozkład
normalny i przyjmując poziom ufności równy 0,95 zbudować przedział ufności dla przeciętnej ceny wynajmu
metra kwadratowego mieszkania w Katowicach. Zapisać stosowną interpretację zbudowanego przedziału
ufności.
3
Zadanie 13. Agata z miasta Schaby chcąc otworzyć bar wegetariański „Złoty kociołek” zrobiła rozpoznanie rynku. Na losowo dobranej próbie mieszkańców przeprowadziła ankietę, pytając czy rozważyliby
odwiedzenie restauracji wegetariańskiej. Wyniki przedstawia poniższa tabela.
Charakterystyka osoby
Liczba osób
kobiety odpowiadające „TAK” na zadane pytanie
63
kobiety odpowiadające „NIE” na zadane pytanie
28
mężczyźni odpowiadający „TAK” na zadane pytanie
39
mężczyźni odpowiadający „NIE” na zadane pytanie
50
Na poziomie ufności 0, 9 należy oszacować przedziałowo odsetek mieszkańców, którzy są chętni odwiedzić restaurację wegetariańską (bez względu na płeć). Zapisać odpowiedź do zadania.
Zadanie 14. „Binge drinking” to angielski termin oznaczający zwyczaj imprezowania przez (na ogół
młodych) ludzi połączony z intensywnym piciem alkoholu z intencją, by w krótkim czasie doprowadzić
organizm do stanu zatrucia alkoholowego (zaniki pamięci i zdolności koncentracji, trudności z utrzymywaniem równowagi i z mową aż do utraty świadomości). Losowo dobraną grupę młodych ludzi z Anglii
i z Niemiec zbadano ze względu na liczbę piw, które wypija dana osoba w czasie jednej sesji binge drinking
(liczba piw „do zjazdu”). Zbadano próbę 75 Anglików, dla których średnia jest równa x̄1 = 5, 4, wariancja
(nieobciążona) Sˆ2 = 2, 28. W próbie 76 Niemców średnia jest równa x̄ = 6, 1, wariancja (nieobciążona)
2
1
Sˆ22 = 1, 93. Na poziomie istotności α = 0, 01 zbadać, czy przeciętna liczba piw wypitych w czasie jednego
binge drinking w Anglii różni się od tej wielkości w Niemczech. Uwaga! Sprawdzono w przypadku tego
zadania, że rozkład zmiennej w grupach jest normalny i że wariancje w grupach są równe.
Zadanie 15. Porównano wielkość napiwków pozostawianych w kawiarniach przez losowo wybranych mieszkańców Krakowa i Poznania. Na poziomie istotności α = 0, 05 weryfikowano hipotezę zerową, że średni
napiwek krakusa nie różni się od średniego napiwku poznaniaka (względem hipotezy alternatywnej, że się
różni). Na podstawie próby otrzymano wyniki:
X Krak = 1, 8 zł;
X P ozn = 2 zł;
t = −1, 03;
tα = 2, 64;
Jaką decyzję należy podjąć względem H0 ? Odpowiedź uzasadnić.
Zadanie 16. (to zadanie nie dotyczy grup 201–207FL, w których nie omówiono testu χ2 )
Dane dotyczą losowo wybranej grupy studentów, którzy pisali test sprawdzający podstawową wiedzę ze statystyki po ukończeniu kursu statystyki. Test można był oceniany zero–jedynkowo (zaliczony/niezaliczony). Studenci mieli ćwiczenia ze statystyki prowadzone na jeden z trzech sposobów:
a) tradycyjnie tzn. licząc wszystko ręcznie z wykorzystaniem kalkulatora,
b) w pracowni komputerowej licząc wszystko w Excelu, wykorzystując własne obliczenia a nie wbudowane funkcje statystyczne,
c) w pracowni komputerowej korzystając z gotowych modułów specjalnego programu do obliczeń statystycznych.
Dane są następujące: wśród studentów z grup pracujących bez komputera 38 osób zaliczyło test wiedzy
i 21 os. nie zaliczyło. W drugiej grupie osób, które uczyły się statystyki korzystając z Excela były 42 os.,
4
które zaliczyły i 19 os., które nie zaliczyły. W grupie korzystającej z gotowego oprogramowania do obliczeń
statystycznych 19 os. zaliczyło a 23 os. nie zaliczyło testu wiedzy podstawowej ze statystyki.
Zbadaj na poziomie istotności α = 0, 05, wykorzystując odpowiedni test niezależności, czy studenci
z różnych typów grup ćwiczeniowych różnią się pod względem wyników testu wiedzy ze statystyki.
[Uwaga: potrzebna do tego zadania wartość krytyczna odczytana z tablic rozkładu χ2 z dwoma stopniami swobody jest równa χ20,05 = 5, 991]
Przykładowe pytania dotyczące treści wykładowych (chodzi o udzielenie krótkich, niekoniecznie
w 100% precyzyjnych odpowiedzi):
Zadanie 17. Czym się różni analiza korelacji od analizy regresji?
Zadanie 18. Czym są reszty modelu regresji?
Zadanie 19. Podaj przykład (najlepiej prosty) danych, dla których nie należy obliczać średniej arytmetycznej. Uzasadnij krótko wybór.
Zadanie 20. Przedstaw krótko istotę wnioskowania statystycznego (wnioskowania na podstawie próby
losowej)
Zadanie 21. Przedstaw dowolną definicję prawdopodobieństwa
Zadanie 22. Czym jest dystrybuanta zmiennej losowej X i dla jakich liczb jest określona?
Zadanie 23. Przyjmijmy, że potrzebujemy prawostronny obszar krytyczny o polu 0, 05 w rozkładzie
normalnym. Opisz jakie elementy trzeba wykorzystać, żeby go wyznaczyć.
Zadanie 24. Skąd wziąć (z jakich tablic skorzystać) wartość krytyczną dla rozkładu Studenta z liczbą
stopni swobody równą 1540, skoro takiej liczby stopni swobody nie ma w tablicach statystycznych (zakładamy brak dostępu do programów komputerowych, które wyliczają takie wartości, tzn. odpowiedź „użyć
Excela” mnie nie satysfakcjonuje!). Uzasadnij odpowiedź.
Zadanie 25. Przyjmijmy, że czas spędzany przez Polaków na korzystanie z Internetu poprzez komputery
stacjonarne i laptopy [wyrażony w godzinach na dobę] ma rozkład normalny N (4, 9; 2). Jaka jest wartość
odchylenia standardowego w tym rozkładzie. Zinterpretuj tę wielkość.
Zadanie 26. Pewien młodociany informatyk–pasjonat napisał swój własny program do identyfikacji spamu (niechcianych maili). Jego program poprawnie podejmuje decyzję w 80 przypadkach na 100. Jakiego
rozkładu należałoby użyć do opisu zmiennej zliczającej (przy zadanej liczbie maili przychodzących), ile
maili poprawnie trafiło do folderu spam?
Zadanie 27. Kiedy dla zmiennych losowych X i Y zachodzi następująca równość dla wartości oczekiwanych: E(X · Y ) = E(X) · E(Y )?
Zadanie 28. Czy dzietność kobiet można próbować opisać rozkładem normalnym? Odpowiedź uzasadnij.
Zadanie 29. Krótko scharakteryzuj (słownie, niekoniecznie w pełni precyzyjnie) co oznacza, że estymator
jest nieobciążony.
5
Zadanie 30. Co oznacza, że rozpatrywany estymator jest obciążony i jego obciążenie jest ujemne?
Zadanie 31. Przedstaw ideę estymacji przedziałowej.
Zadanie 32. Podaj nieobciążony estymator wskaźnika struktury (frakcji) w populacji.
Zadanie 33. Niech dana będzie zmienna losowa X o rozkładzie normalnym X ∼ N (m, σ). Na czym
polega standaryzacja zmiennej X i jaki jest rozkład tej zmiennej po standaryzacji?
Zadanie 34. Czym jest błąd drugiego rodzaju w zagadnieniu weryfikacji hipotez statystycznych? [wyjaśnij
lub zilustruj na dowolnym przykładzie]
Zadanie 35. Kto jest Twoim ulubionym wykładowcą? Uzasadnij (tu odpowiedź nie musi być krótka)
dlaczego dr Trzęsiok.
Zadanie 36. Wskaż słabe strony wykładu ze statystyki i co Twoim zdaniem warto byłoby poprawić lub
ulepszyć w sposobie przekazywania wiedzy z jednego z Twoich ulubionych przedmiotów. Zastanów się
jednak dobrze, czy aby na pewno chcesz tu coś wpisać i co.
c 2017 Joanna i Michał Trzęsiok
Copyright Powodzenia!
Joanna i Michał Trzęsiok
6

Podobne dokumenty