tym adresem - Uniwersytet Ekonomiczny w Katowicach
Transkrypt
tym adresem - Uniwersytet Ekonomiczny w Katowicach
Uniwersytet Ekonomiczny w Katowicach Wydział Finansów i Ubezpieczeń, Kierunek: Finanse i Rachunkowość Zestaw zadań przygotowujących1 do egzaminu ze Statystyki2 Egzaminatorzy: dr Joanna Trzęsiok, dr Michał Trzęsiok e–mail: [email protected] e–mail: [email protected] Termin egzaminu: 6 lutego 2017 r. Czas pisania: około 90 minut gr. 201–214 FL Terminy konsultacji: proszę sprawdzić na stronie Katedry Analiz Gospodarczych i Finansowych, czyli tutaj 3 Poniżej prezentujemy obszerną listę zadań przygotowujących do egzaminu ze statystyki (dla grup 201–214FL). Zadań na egzaminie oczywiście będzie mniej niż w tym zestawie. Będą różne zestawy zadań. Ten zestaw ma Państwu dać pewne wyobrażenie dotyczącego tego, jakiego typu zadania mogą się pojawić. Zadania na egzaminie będą podobne do tych z tego zestawu (będą oczywiście inne, ale tego samego typu). Na egzaminie zadania mają bardzo ograniczoną część obliczeniową, ponieważ nie musimy już sprawdzać, czy potraficie Państwo liczyć elementy potrzebne w statystyce – zrobiliśmy to bardzo dokładnie na zaliczeniu z ćwiczeń. Do egzaminu podchodzą wyłącznie osoby z pozytywną oceną z zaliczenia. Oceniane będą tylko informacje zapisane na podpisanej kartce papieru, którą otrzymacie i będziecie Państwo oddawać po upływie wskazanego czasu. Preferujemy, byście dokładali własne podpisane kartki tylko wtedy, kiedy już naprawdę nie potraficie się zmieścić na przekazanych kartkach. Należy więc najpierw wykorzystać wszystkie wolne miejsca na przekazanych kartkach z zadaniami. Punkty zdobywa się przede wszystkim za poprawne komentarze, wnioski, interpretacje. Ostatnie dwa lub trzy zadania to pytania dotyczące treści wykładowych. Zadania będą różnie punktowane w zależności od nakładu pracy potrzebnego do rozwiązania. Żeby zaliczyć egzamin trzeba zdobyć co najmniej 50% sumy punktów z egzaminu. W czasie egzaminu można korzystać z: kalkulatora, zestawu wzorów dostarczonego przez egzaminatora, zatwierdzonych przez egzaminatora i wydrukowanych we własnym zakresie tablic rozkładu normalnego i Studenta. Każda grupa ma swoje przyzwyczajenia dotyczące oznaczeń i tablic, z których korzysta, więc przedstawiciel każdej grupy może do egzaminatora napisać maila, do którego dołączy tablice, z których dana grupa chce korzystać na egzaminie. Konieczne jest zatwierdzenie tablic przez egzaminatora przed egzaminem (najpóźniej do soboty 4.02. do 23:59) – zawsze odpowiadamy z informacją, czy zatwierdzamy materiały do wykorzystania. Stosowanie nieuczciwych praktyk w trakcie egzaminu powoduje natychmiastowe zakończenie pisania egzaminu i utratę danego terminu egzaminu (ocenę „ndst”). Przypominamy (choć jest to napisane na stronie katedry oraz w harmonogramie sesji), że egzamin odbędzie się 6.02.2017 r. w Auli CNTI w czterech turach: o 900 dla grup 201–204FL, o 1100 dla grup 205–207FL, o 1300 dla grup 208–211FL oraz o 1500 dla grup 212–214FL. Na stronie katedry znajdziecie Państwo terminy naszych konsultacji w sesji. Gdyby ktoś miał pytania przed egzaminem – serdecznie zapraszamy! Powodzenia! Joanna i Michał Trzęsiok Zadanie 1. Na jakiej skali (wg Stevensa) mierzone są następujące cechy: a) wielkość przedsiębiorstwa (kategorie: „mikro”, „małe”, „średnie” i „duże”), b) PKB per capita w USD, 1 Ten zestaw jest sponsorowany przez LATEX’owy symbol [\Biohazard]: 2 h Zestaw dostępny pod adresem: http://web2.ue.katowice.pl/trzesiok/EgzaminStatZestawPrzygotowujacy.pdf 3 Gdyby wskazane terminy komuś z Państwa nie odpowiadały, to zachęcam do indywidualnego umawiania się na konsultacje! 1 c) marka obuwia sportowego. Zadanie 2. Zarząd pewnej firmy informatycznej zbadał zrealizowane przez firmę zlecenia ze względu na ich wartość [w tys. zł]. Obliczono następujące wartości statystyk opisowych: średnia równa 123, odchylenie standardowe równe 83, klasyczny współczynnik asymetrii równy −0, 9. Dokonaj opisu statystycznego (zinterpretuj te wyniki). Zadanie 3. GUS zbadał strukturę pracowników w Polsce ze względu na wysokość wynagrodzenia [w zł]. Obliczono następujące wartości statystyk opisowych: mediana równa 3 300, odchylenie ćwiartkowe równe 1 600, współczynnik asymetrii Pearsona równy 1,3. Dokonaj opisu statystycznego (zinterpretuj te wyniki). Zadanie 4. Narysuj odpowiedni wykres dla danych z poniższego szeregu. Ponadto sprawdź, czy osoba, która otrzymała ocenę „4” kwalifikuje się do grupy wybrańców, którym oferuje się ciekawy wyjazd szkoleniowy, jeśli wyjechać może nie więcej niż 10% najlepszych studentów z tej grupy osób. Odpowiedź uzasadnić. Niech xi – ocena z egzaminu, ni – liczba studentów; xi ni 2 10 3 20 4 12 5 8 Zadanie 5. Narysuj odpowiedni wykres dla danych z poniższego szeregu. Ponadto wskaż, w którym przedziale znajduje się dominanta. Niech xi – roczne wydobycie ropy naftowej [w dziesiątkach mln ton], ni – liczba państw; xi ni 6 − 8, 9 2 9 − 11, 9 4 12 − 17, 9 7 Zadanie 6. Jakiej miary użyjesz do opisania położenia oraz rozproszenia dla danych w szeregu: 10, 14, 15, 15, 18, 20, 20, 23, 24, 68, 137. Odpowiedź uzasadnij. Zadanie 7. Paweł i Gaweł porównują wyniki spalania swoich samochodów, które systematycznie wyliczają po każdym tankowaniu do pełna. Paweł jeździ tak, że jego auto spala przeciętnie 5,5 l/100 km z odchyleniem standardowym ±2 l/100 km. Natomiast auto Gawła spala przeciętnie 9 l/100 km z odchyleniem standardowym ±2, 5 l/100 km. Wyniki którego z chłopaków charakteryzują się większym zróżnicowaniem? Odpowiedź uzasadnij. Zadanie 8. Związek pomiędzy średnią liczbą lat edukacji (x) w danym kraju a jego PKB per capita (y) jest w przybliżeniu liniowy. Kowariancja dla tych zmiennych jest równa cov(x, y) = 4 200 a odchylenia standardowe s(x) = 1, 5 oraz s(y) = 8 000, odpowiednio. Oblicz odpowiednią miarę korelacji. Określ kierunek i siłę zależności korelacyjnej a ponadto zinterpretuj otrzymaną wielkość (tzn. opisz co możemy na tej podstawie wnioskować o badanych zmiennych). 2 Zadanie 9. Pewien baca rzeźbi podobne do siebie stylistycznie, artystyczne figurki, które następnie sprzedaje przez Internet. Próbując rozpoznać popyt baca wystawia figurki w różnych miesiącach z różnymi cenami. Poniżej zestawiono cenę figurki z liczbą sprzedanych figurek w takiej cenie. Na podstawie poniższych danych wyznaczono prostą regresji dla zależności popytu na figurki (y) od ich ceny (x) i jest ona postaci: y(x) = −3, 4x + 12. a) Zinterpretuj współczynnik kierunkowy tej linii regresji b) Wyznacz prognozę popytu na figurki przy cenie x̂ = 2 tys. zł c) Oblicz i zinterpretuj odchylenie standardowe reszt Niech xi – cena figurki w tys. zł, yi – liczba sprzedanych figurek; xi yi 1 9 1,7 7 2,3 2 3 3 Zadanie 10. Zbadano średnią cenę ropy (oleju napędowego) na pewnej stacji paliw w okolicach Rybnika w latach 2014–2016. W roku 2014 była równa 5,35 zł, w kolejnym roku 5,02 zł, a następnie 4,32 zł. a) Jak zmieniła się średnia cena ropy na tej stacji w roku 2016 w porównaniu do 2014? b) Oblicz i zinterpretuj średnie tempo zmian cen ropy. c) Na podstawie indeksu średniego wyznacz prognozę średniej ceny ropy na tej stacji na rok 2017. Zadanie 11. Kierownik hurtowni materiałów budowlanych cieszy się bo z podsumowania roku wyszło, że wartość sprzedanych towarów (wszystkich razem) w 2015 r. była równa 4 500 tys. zł i wzrosła w stosunku do roku poprzedniego o 19%. Okazało się jednak, że gdyby przeliczyć jaka byłaby teoretycznie wartość produktów sprzedanych w 2015 r. po cenach z roku 2014, to wychodzi 3 600 tys zł. a) Co można powiedzieć na temat zmian cen towarów budowlanych w tej hurtowni? Obliczyć i zinterpretować odpowiedni indeks zmian. b) Co można powiedzieć na temat zmian sprzedaży (ilości sprzedawanych towarów budowlanych) w tej hurtowni? Obliczyć i zinterpretować odpowiedni indeks zmian. c) Jak w związku z tym można zdekomponować zaobserwowany 19 procentowy wzrost wartości sprzedaży? Zadanie 12. Maturzystka Helena wybierając się na studia w Akademii Muzycznej przeprowadziła badania rynku wynajmu mieszkań w Katowicach. W losowo dobranej próbie znalazło się 25 ofert wynajmu mieszkań. Helena obliczyła, że w próbie średnia cena wynajmu metra kwadratowego mieszkania to 31 zł z odchyleniem standardowym (nieobciążonym) równym 4 zł. Zakładając, że badana zmienna ma rozkład normalny i przyjmując poziom ufności równy 0,95 zbudować przedział ufności dla przeciętnej ceny wynajmu metra kwadratowego mieszkania w Katowicach. Zapisać stosowną interpretację zbudowanego przedziału ufności. 3 Zadanie 13. Agata z miasta Schaby chcąc otworzyć bar wegetariański „Złoty kociołek” zrobiła rozpoznanie rynku. Na losowo dobranej próbie mieszkańców przeprowadziła ankietę, pytając czy rozważyliby odwiedzenie restauracji wegetariańskiej. Wyniki przedstawia poniższa tabela. Charakterystyka osoby Liczba osób kobiety odpowiadające „TAK” na zadane pytanie 63 kobiety odpowiadające „NIE” na zadane pytanie 28 mężczyźni odpowiadający „TAK” na zadane pytanie 39 mężczyźni odpowiadający „NIE” na zadane pytanie 50 Na poziomie ufności 0, 9 należy oszacować przedziałowo odsetek mieszkańców, którzy są chętni odwiedzić restaurację wegetariańską (bez względu na płeć). Zapisać odpowiedź do zadania. Zadanie 14. „Binge drinking” to angielski termin oznaczający zwyczaj imprezowania przez (na ogół młodych) ludzi połączony z intensywnym piciem alkoholu z intencją, by w krótkim czasie doprowadzić organizm do stanu zatrucia alkoholowego (zaniki pamięci i zdolności koncentracji, trudności z utrzymywaniem równowagi i z mową aż do utraty świadomości). Losowo dobraną grupę młodych ludzi z Anglii i z Niemiec zbadano ze względu na liczbę piw, które wypija dana osoba w czasie jednej sesji binge drinking (liczba piw „do zjazdu”). Zbadano próbę 75 Anglików, dla których średnia jest równa x̄1 = 5, 4, wariancja (nieobciążona) Sˆ2 = 2, 28. W próbie 76 Niemców średnia jest równa x̄ = 6, 1, wariancja (nieobciążona) 2 1 Sˆ22 = 1, 93. Na poziomie istotności α = 0, 01 zbadać, czy przeciętna liczba piw wypitych w czasie jednego binge drinking w Anglii różni się od tej wielkości w Niemczech. Uwaga! Sprawdzono w przypadku tego zadania, że rozkład zmiennej w grupach jest normalny i że wariancje w grupach są równe. Zadanie 15. Porównano wielkość napiwków pozostawianych w kawiarniach przez losowo wybranych mieszkańców Krakowa i Poznania. Na poziomie istotności α = 0, 05 weryfikowano hipotezę zerową, że średni napiwek krakusa nie różni się od średniego napiwku poznaniaka (względem hipotezy alternatywnej, że się różni). Na podstawie próby otrzymano wyniki: X Krak = 1, 8 zł; X P ozn = 2 zł; t = −1, 03; tα = 2, 64; Jaką decyzję należy podjąć względem H0 ? Odpowiedź uzasadnić. Zadanie 16. (to zadanie nie dotyczy grup 201–207FL, w których nie omówiono testu χ2 ) Dane dotyczą losowo wybranej grupy studentów, którzy pisali test sprawdzający podstawową wiedzę ze statystyki po ukończeniu kursu statystyki. Test można był oceniany zero–jedynkowo (zaliczony/niezaliczony). Studenci mieli ćwiczenia ze statystyki prowadzone na jeden z trzech sposobów: a) tradycyjnie tzn. licząc wszystko ręcznie z wykorzystaniem kalkulatora, b) w pracowni komputerowej licząc wszystko w Excelu, wykorzystując własne obliczenia a nie wbudowane funkcje statystyczne, c) w pracowni komputerowej korzystając z gotowych modułów specjalnego programu do obliczeń statystycznych. Dane są następujące: wśród studentów z grup pracujących bez komputera 38 osób zaliczyło test wiedzy i 21 os. nie zaliczyło. W drugiej grupie osób, które uczyły się statystyki korzystając z Excela były 42 os., 4 które zaliczyły i 19 os., które nie zaliczyły. W grupie korzystającej z gotowego oprogramowania do obliczeń statystycznych 19 os. zaliczyło a 23 os. nie zaliczyło testu wiedzy podstawowej ze statystyki. Zbadaj na poziomie istotności α = 0, 05, wykorzystując odpowiedni test niezależności, czy studenci z różnych typów grup ćwiczeniowych różnią się pod względem wyników testu wiedzy ze statystyki. [Uwaga: potrzebna do tego zadania wartość krytyczna odczytana z tablic rozkładu χ2 z dwoma stopniami swobody jest równa χ20,05 = 5, 991] Przykładowe pytania dotyczące treści wykładowych (chodzi o udzielenie krótkich, niekoniecznie w 100% precyzyjnych odpowiedzi): Zadanie 17. Czym się różni analiza korelacji od analizy regresji? Zadanie 18. Czym są reszty modelu regresji? Zadanie 19. Podaj przykład (najlepiej prosty) danych, dla których nie należy obliczać średniej arytmetycznej. Uzasadnij krótko wybór. Zadanie 20. Przedstaw krótko istotę wnioskowania statystycznego (wnioskowania na podstawie próby losowej) Zadanie 21. Przedstaw dowolną definicję prawdopodobieństwa Zadanie 22. Czym jest dystrybuanta zmiennej losowej X i dla jakich liczb jest określona? Zadanie 23. Przyjmijmy, że potrzebujemy prawostronny obszar krytyczny o polu 0, 05 w rozkładzie normalnym. Opisz jakie elementy trzeba wykorzystać, żeby go wyznaczyć. Zadanie 24. Skąd wziąć (z jakich tablic skorzystać) wartość krytyczną dla rozkładu Studenta z liczbą stopni swobody równą 1540, skoro takiej liczby stopni swobody nie ma w tablicach statystycznych (zakładamy brak dostępu do programów komputerowych, które wyliczają takie wartości, tzn. odpowiedź „użyć Excela” mnie nie satysfakcjonuje!). Uzasadnij odpowiedź. Zadanie 25. Przyjmijmy, że czas spędzany przez Polaków na korzystanie z Internetu poprzez komputery stacjonarne i laptopy [wyrażony w godzinach na dobę] ma rozkład normalny N (4, 9; 2). Jaka jest wartość odchylenia standardowego w tym rozkładzie. Zinterpretuj tę wielkość. Zadanie 26. Pewien młodociany informatyk–pasjonat napisał swój własny program do identyfikacji spamu (niechcianych maili). Jego program poprawnie podejmuje decyzję w 80 przypadkach na 100. Jakiego rozkładu należałoby użyć do opisu zmiennej zliczającej (przy zadanej liczbie maili przychodzących), ile maili poprawnie trafiło do folderu spam? Zadanie 27. Kiedy dla zmiennych losowych X i Y zachodzi następująca równość dla wartości oczekiwanych: E(X · Y ) = E(X) · E(Y )? Zadanie 28. Czy dzietność kobiet można próbować opisać rozkładem normalnym? Odpowiedź uzasadnij. Zadanie 29. Krótko scharakteryzuj (słownie, niekoniecznie w pełni precyzyjnie) co oznacza, że estymator jest nieobciążony. 5 Zadanie 30. Co oznacza, że rozpatrywany estymator jest obciążony i jego obciążenie jest ujemne? Zadanie 31. Przedstaw ideę estymacji przedziałowej. Zadanie 32. Podaj nieobciążony estymator wskaźnika struktury (frakcji) w populacji. Zadanie 33. Niech dana będzie zmienna losowa X o rozkładzie normalnym X ∼ N (m, σ). Na czym polega standaryzacja zmiennej X i jaki jest rozkład tej zmiennej po standaryzacji? Zadanie 34. Czym jest błąd drugiego rodzaju w zagadnieniu weryfikacji hipotez statystycznych? [wyjaśnij lub zilustruj na dowolnym przykładzie] Zadanie 35. Kto jest Twoim ulubionym wykładowcą? Uzasadnij (tu odpowiedź nie musi być krótka) dlaczego dr Trzęsiok. Zadanie 36. Wskaż słabe strony wykładu ze statystyki i co Twoim zdaniem warto byłoby poprawić lub ulepszyć w sposobie przekazywania wiedzy z jednego z Twoich ulubionych przedmiotów. Zastanów się jednak dobrze, czy aby na pewno chcesz tu coś wpisać i co. c 2017 Joanna i Michał Trzęsiok Copyright Powodzenia! Joanna i Michał Trzęsiok 6