pobierz - pzme.zarz.agh.edu.pl
Transkrypt
pobierz - pzme.zarz.agh.edu.pl
RPiSM – zajęcia 6 i 7 Zadanie 1 Błędem pierwszego rodzaju nazywamy sytuację, w której test statystyczny odrzuca hipotezę zerową pomimo jej prawdziwości. Prawdopodobieństwo popełnienia tego błędu jesteśmy w stanie narzucić przed przeprowadzeniem testu – określa go poziom istotności (α). Wygenerować 1000 prób o liczebności 15 z rozkładu N(10,5). Dla każdej z próby przeprowadzić test jednej średniej (H0: m=10, H1 m≠10). W ilu przypadkach H0 będzie odrzucona, jeśli poziom istotności ustalimy na 5% (1% lub 10%)? Zadanie 2 Błędem drugiego rodzaju nazywamy sytuację, w której test statystyczny nie odrzuca hipotezy zerowej, która w rzeczywistości jest fałszywa. O jakości rozważanego testu mówi moc testu, która właśnie informuje nas o tym, jak często jest popełniany błąd drugiego rodzaju. Na przykładzie trzech testów normalności: test chi-kwadrat, test Kołomogorowa-Smirnowa i test Shapiro-Wilka, wymyśleć prostą procedurę intuicyjnie odpowiadającą na pytanie o moc w/w testów. Test jednego parametru Zadanie 3 W pewnej firmie zastanawiano się, czy przeciętny PH przejeżdża rocznie więcej niż 50 000 km. W celu zweryfikowania tej hipotezy zebrano dane dotyczące 8 samochodów służbowych (założono, że rozkład jest normalny) i uzyskano: 53 021, 47 532, 61 252, 41 714, 74 086, 59 456, 53 012 i 50 726. Czy przypuszczenia analityka okazały się słuszne? Zadanie 4 Dwóch informatyków w firmie X zastanawia się, czy jest prawdą przeczytana przez nich informacja, że przynajmniej 40% wezwań do naprawienia sprzętu IT w ich firmie jest wynikiem niedouczenia personelu. Analizując notatki z ostatnich 3 miesięcy zauważyli, że w tym czasie zgłoszenia 84, z których 40 było bezpodstawnych. Czy przeczytana przez nich informacja jest zgodna z sytuacją w ich firmie? Zadanie 5 W trakcie przygotowania się do egzaminu z rachunku prawdopodobieństwa, student dotarł do obiegowych opinii, że przeciętny wynik z egzaminu jest na poziomie 50%. Nie dowierzając tym informacjom zebrał dane od przypadkowo spotkanych 32 kolegów z wyższych lat. Okazało się, że w tej próbie średnia wynosiła 43%, a odchylenie standardowe (z próby) wynosiło 25%. Czy w świetle tego badania pogłoski można uznać za wiarygodne. Zadanie 6 Pracujący w kawiarni student IiE przeczytał, że ekspres do kawy parzy kawę o objętości opisanej rozkładem (200ml, 5ml). Nie dowierzając tym danym przeprowadził eksperyment i zmierzył objętość 11 nalewanych kaw. Uzyskał następujące pomiary: 182, 190, 203, 180, 187, 205, 196, 183, 195, 200, 194. Czy jego badanie potwierdziło dane z instrukcji obsługi? Zadanie 7 Pewna maszyna pakuje sól do torebek. W celu zbadania prawidłowości tego procesu zważono 38 torebek z cukrem. W wyniku tych ważeń uzyskano następujące wyniki: śr. waga torebki = 0.89 kg, a odch. st. = 0.14. Na poziomie istotności 0.01 zweryfikować hipotezę, że maszyna sypie przeciętnie 1 kg soli. Jaką hipotezę alternatywną należy przyjąć? Dlaczego? Zadanie 8 Wiadomo, że cena litra benzyny E95 na stacjach benzynowych w Krakowie rozkład normalny o odchyleniu standardowym 8 gr. Pewien student jadący na zajęcia statystyki zauważył, że ceny benzyny w mijanych przez niego stacjach były następujące: 4.68, 4.72, 4.80, 4,79, 4.71 i zastanawiał się, czy jest prawdą, że przeciętna cena litra benzyny w Krakowie wynosi 4.70 zł (taką informację usłyszał w lokalnym radio). Odpowiedzieć na powyższe pytanie przy założeniu, że α = 1%. Zadanie 9 Producent pewnego smartfonu twierdzi, że czas pracy telefonu (podczas rozmowy 3G) na jednym ładowaniu baterii wynosi co najmniej 30h. Przebadano losową próbę 100 smarftonów i uzyskano średni czas pracy 28h i 20 minut przy odchyleniu standardowym 7h i 25 minut. Na poziomie istotności α = 1% sprawdzić, czy producent mówi prawdę. Test dwóch parametrów Zadanie 10 Dwie partie polityczne postanowiły sprawdzić, jak Polacy oceniają prace rządu dot. zwalczania smogu. Poniżej uzyskane wyniki: Partia rządowa: Partia opozycyjna: 49 (dobrze) 128 (źle) 73 (dobrze) 112 (źle) Czy na poziomie istotności 5% można powiedzieć, że oba badania przyniosły takie same rezultaty? Zadanie 11 Dwóch czołowych skoczków narciarskich spierało się, który z nich jest lepszy. Zdecydowali się poddać próbie polegającej na oddaniu po 5 skoków. Uzyskano wyniki: Skoczek A: 132m, 141m, 136.5m, 142m, 138m Skoczek B: 128m, 137m, 140m, 132m, 131m. Jakie musimy nałożyć założenia do zweryfikowania postawionej przez skoczków hipotezy? Jakie będą wyniki, jeśli założymy poziom istotności 1%? Zadanie 12 Dwóch konstruktorów chciało sprawdzić dokładność stworzonych przez siebie maszyn do napełniania tuszem drukarek. Postanowili sprawdzić to na próbie po 7 pojemników. Uzyskali następujące informacje Maszyna A: 48 ml, 49 ml, 46 ml, 49 ml, 51 ml, 50 ml, 48 ml Maszyna B: 51 ml, 46 ml, 47 ml, 50 ml, 53 ml, 51 ml, 54 ml Przyjmując poziom istotności 10% zweryfikować hipotezę o równości wariancji? Co będą oznaczały wyniki? Zadanie 13 Istnieje powszechna opinia mówiąca o tym, że panowie lepiej od kobiet zdają egzamin z RPiSM. W związku tym prowadzący przedmiot zebrał średnie wyniki egzaminu z ostatnich 6 lat: kobiety: mężczyźni: 3.4, 2.9, 3.5, 3.1, 3.6, 3.5 3.2, 2.7, 3.3, 3.6, 3.4, 3.2 Zweryfikować postawioną hipotezę przy założeniu, że α = 5%. Zadanie 14 Wysunięto hipotezę mówiącą o tym, że studenci AGH palą papierosy częściej niż studenci UJ. Do jej zweryfikowania przebadano grupę studentów obu uczelni i uzyskano następujące wyniki: AGH: palący: 34 osoby, niepalący: 49 osób UJ: palący: 17 osób, niepalący: 35 osób Jakie będą wyniki, jeśli przyjmiemy α = 10%? Zadanie 15 Student pewnego inżynierskiego kierunku na AGH uzyskał następujące średnie ocen kolokwiów z matematyki i statystyki: , Przy obliczaniu średnich uwzględniono wszystkie stopnie uzyskane przez niego w trakcie ostatniego roku akademickiego. Liczby tych stopni były następujące: Czy na poziomie istotności 5% można powiedzieć, że wartości średnie ocen uzyskanych z obu przedmiotów są jednakowe? Proszę założyć, że obie rozważane populacje mają rozkład normalny, a ich teoretyczne odchylenia standardowe są równe. test zgodności chi-kwadrat Pearsona Zadanie 16 W literaturze przedmiotu mówi się o tym, że liczba strzelonych bramek w meczu jest dobrze opisana rozkładem Poissona. Poniżej przedstawiono dane dotyczące liczby strzelonych bramek przez cztery wybrane drużyny z ligi angielskiej w ciągu ostatnich 10 sezonów. Czy na poziomie istotności 5% można powiedzieć, że te dane są dobrze opisane rozkładem Poissona? drużyna/bramki Everton Hull Man City Southampton 0 35 38 32 22 1 61 35 51 29 2 72 23 47 30 3 37 5 43 9 4 9 0 27 11 5 2 0 9 0 6 1 2 7 1 7 1 0 2 0 8 0 0 0 1 Zadanie 17 Wykładowca AGH postanowił sprawdzić, czy wyniki egzaminu ze statystyki mają rozkład normalny. W tym celu stworzył poniższą tabelę i zebrał wyniki studentów z ostatniego roku. Do jakich doszedł wniosków? 0.0% 12.5% 25.0% 37.5% 50.0% 62.5% 75.0% 87.5% drużyna/bramki 12.5% 25% 37.5% 50% 62.5% 75.0% 87.5% 100% Everton 4 7 21 36 26 14 5 2 Zadanie 18 Prowadzący ćwiczenia zarzeka się, że w ich trakcie wybiera do odpowiedzi losowo. Niedowierzający student postanowił notować, kogo ów prowadzący pyta. W tym celu każdemu uczestnikowi kursu przyporządkował numery od 1 do 10 i uzyskał wyniki przedstawione w tabeli: Osoba N 1 12 2 11 3 12 4 14 5 7 6 8 7 6 8 12 9 10 10 8 Czy, przyjmując poziom istotności α = 1%, student miał słuszne przypuszczenia? Zadanie 19 Pewna maszyna losująca podobna do ruletki ma dokładnie cztery równe pola: dwa czerwone, jedno białe i jedno czarne. Uruchomiono ją 100 razy i zaobserowowano, że 60 razy wypadło pole czerwone, 29 razy pole białe i tylko 11 razy pole czarne. Zweryfikuj hipotezę, że owa maszyna jest „uczciwa”. Przyjąć założenie, że poziom istotności wynosi 0.1. Zadanie 20 W badaniach warunków życia mieszkańców pewnego miasta zebrano m. in. informacje o wysokości dochodów przypadających na 1 członka gospodarstwa domowego. Dla losowej próby 200 gospodarstw uzyskano następujące wyniki badań: DOCHÓD NA 1 OS. 250 – 450 450 – 650 650 – 850 850 - 1050 1050 - 1250 1250 - 1450 GOSPODARSTWA 5 25 80 70 15 5 Test niezależności chi-kwadrat Zadanie 21 Przeprowadzono badanie, na ile wyniki na studiach (z matematyki) zależą od rodzaju ukończonej szkoły średniej. Czy na poziomie istotności 5% można powiedzieć, że ukończona szkoła średnia determinuje postępy na studiach? Wysokie Przeciętne niskie LO (mat) 36 21 17 LO 26 27 16 Technikum 10 15 7 Inne 8 5 5 Zadanie 22 Pewien wykładowca WZ AGH chciał sprawdzić, czy istnieje zależność między kierunkiem, na którym prowadzi zajęcia i terminem, w którym jego studenci zdają egzamin. Przeprowadził on krótką analizę wyników z ubiegłych kilku lat i uzyskał następujące informacje: 1 termin 27 21 IiE ZiIP 2 termin 16 30 3 termin 8 15 Brak 7 36 Czy na poziomie istotności α = 1% jest on w stanie stwierdzić, że wyniki na obu kierunkach istotnie się różnią? Zadanie 23 W tabeli zawarto wyniki badań koloru oczu oraz koloru włosów wśród mężczyzn. Zbadać, czy dla poziomu istotności rozważane cechy można uznać za niezależne? Niebieskie Zielone Piwne Szare Blondyn 22 41 33 31 Szatyn 26 30 34 17 Brunet 18 15 27 14 Rudy 6 5 8 5 Zadanie 24 W badaniach efektywności szkolenia zawodowego pracowników bezpośrednio produkcyjnych w pewnym przedsiębiorstwie dla losowo wybranej próby 60 pracowników dokonano pomiaru ich wydajności pracy (w szt./zmianę) przed i po przejściu szkolenia. Uzyskano następujące dane: WYDAJNOŚĆ PRACY W SZT./ZMIANĘ 10 – 14 14 - 18 18 - 22 22 - 26 LICZBA PRACOWNIKÓW przed szkoleniem po szkoleniu 28 5 18 20 12 25 2 10 Zweryfikować hipotezę, iż szkolenie zawodowe istotnie ma wpływ wydajność pracy pracowników. (To zadanie można rozwiązać także – a nawet rozsądniej jest to zrobić w ten sposób – za pomocą testu dwóch średnich. W jaki sposób?) Analiza wariancji Zadanie 25 W pewnej szkole podstawowej przeprowadzono badanie dotyczące wyników testu kompetencji po SP. Uzyskano następujące wyniki: kl. 6a: 32, 37, 26, 28, 17, 23, 18, 33, 26, 15 kl. 6b: 22, 29, 36, 18, 31, 33, 19, 20, 26, 34 kl. 6c: 35, 38, 24, 22, 19, 26, 15, 35, 24, 29 Czy na poziomie istotności α = 5% można powiedzieć o tym, że klasy osiągnęły taki sam przeciętny wynik? Zadanie 26 Pan Robert zastanawiał się, gdzie aplikować o pracę w poszukiwaniu wysokich zarobków. W tym celu przeprowadził rozeznanie, które przyniosło następujące wyniki: Firma A: 5400, 3800, 4250, 3900, Firma B: 3950, 4300, 6000, 4500, 4800. Firma C: 3650, 4300, 4700, 4000, 4600. Czy na założonym przez niego 5% poziomie istotności można twierdzić, że jest firma, która płaci najlepiej? Zadanie 27 Czterej statystyce i grzybiarze zarazem sprzeczali się, który najskuteczniej szuka grzybów. Do wiarygodnej odpowiedzi na postawione przez pytanie, postanowili wykorzystać ANOVĘ (przy 1% poziomie istotności). W kolejnych trzech tygodniach 10 razy wybrali się na grzybobranie i zebrali następującą liczbę prawdziwków: A 12 21 19 30 25 21 11 23 11 25 Co się okazało? B 15 26 18 20 24 23 25 8 18 14 C 18 18 18 11 12 17 22 11 17 18 D 13 13 18 7 16 6 20 11 14 18 Zadanie 28 W Instytucie Ziemniaka przeprowadzono badanie plonów ziemniaka w zależności od odmian rośliny i rodzaju stosowanego nawozu. Uzyskane plony zamieszczono w tabeli: Odmiana A B C Nawóz 1 1.9 2.5 1.7 Nawóz 2 2.2 1.9 1.9 Nawóz 3 2.6 2.3 2.2 Nawóz 4 1.8 2.6 2.0 Przeprowadzić (dwukrotnie) ANOVĘ, by zbadać oddzielny wpływ odmiany ziemniaka i rodzaju stosowanego nawozu na uzyskane plony. Przyjąć α = 5%. (dla zainteresowanych: Jakie byłyby wyniki, gdyby tę analizę przeprowadzić w postaci dwuczynnikowej ANOVY? Co oznacza pojęcie „efektu interakcji”? Zadania inne Zadanie 29 (Własności rozkładów) Zmienna losowa X przyjmuje tylko trzy wartości: 0, 1 i 2. Wiadomo, że oraz . Na podstawie tych informacji należy wyznaczyć rozkład zmiennej X. Zadanie 30 (Test serii) W badaniach wyników studiowania osiąganych przez studentów pewnej uczelni z ich populacji wylosowano próbę 25 studentów, dla której ustalono następujące średnie z całego toku studiów: 3,11; 4,05; 3,75; 3,33; 4,25; 3,15; 3,96; 4,02; 2,99; 3,28; 3,65; 4,12; 3,48; 3,73; 3,26; 2,87; 4,54; 3,24; 4,15; 3,66; 3,74; 4,28; 3,90; 3,45; 4,67. Na poziomie istotności 0,10 zweryfikować hipotezę, że dobór próby był losowy. Zadanie 31 (Test zgodności Kołmogorowa) Jak sprawdzić, czy prawdziwe jest założenie o normalności rozkładu w zadaniu 20. Zadanie 32 (Test jednej średniej) Zebrano informacje dla grupy kierowców, którzy w okresie ostatnich 8 lat na terenie miasta „K” spowodowali wypadek drogowy znajdując się pod wpływem alkoholu. Uzyskano następujące zestawienie: POZIOM ALKOHOLU (‰) 0,40 – 1,0 1,0 – 1,6 1,6 – 2,2 2,2 – 2,8 KIEROWCY 15 120 180 85 Zakładając, że badana populacja ma charakter rozkładu normalnego przy poziomie istotności 0,05 zweryfikować hipotezę, że średnie stężenie alkoholu we krwi w całej populacji nietrzeźwych kierowców, którzy spowodowali wypadek drogowy, jest większe od 2,3 promila.