pobierz - pzme.zarz.agh.edu.pl

Transkrypt

pobierz - pzme.zarz.agh.edu.pl
RPiSM – zajęcia 6 i 7
Zadanie 1
Błędem pierwszego rodzaju nazywamy sytuację, w której test statystyczny odrzuca hipotezę zerową
pomimo jej prawdziwości. Prawdopodobieństwo popełnienia tego błędu jesteśmy w stanie narzucić
przed przeprowadzeniem testu – określa go poziom istotności (α).
Wygenerować 1000 prób o liczebności 15 z rozkładu N(10,5). Dla każdej z próby przeprowadzić test
jednej średniej (H0: m=10, H1 m≠10). W ilu przypadkach H0 będzie odrzucona, jeśli poziom istotności
ustalimy na 5% (1% lub 10%)?
Zadanie 2
Błędem drugiego rodzaju nazywamy sytuację, w której test statystyczny nie odrzuca hipotezy
zerowej, która w rzeczywistości jest fałszywa. O jakości rozważanego testu mówi moc testu, która
właśnie informuje nas o tym, jak często jest popełniany błąd drugiego rodzaju. Na przykładzie trzech
testów normalności: test chi-kwadrat, test Kołomogorowa-Smirnowa i test Shapiro-Wilka, wymyśleć
prostą procedurę intuicyjnie odpowiadającą na pytanie o moc w/w testów.
Test jednego parametru
Zadanie 3
W pewnej firmie zastanawiano się, czy przeciętny PH przejeżdża rocznie więcej niż 50 000 km. W celu
zweryfikowania tej hipotezy zebrano dane dotyczące 8 samochodów służbowych (założono, że
rozkład jest normalny) i uzyskano: 53 021, 47 532, 61 252, 41 714, 74 086, 59 456, 53 012 i 50 726.
Czy przypuszczenia analityka okazały się słuszne?
Zadanie 4
Dwóch informatyków w firmie X zastanawia się, czy jest prawdą przeczytana przez nich informacja, że
przynajmniej 40% wezwań do naprawienia sprzętu IT w ich firmie jest wynikiem niedouczenia
personelu. Analizując notatki z ostatnich 3 miesięcy zauważyli, że w tym czasie zgłoszenia 84,
z których 40 było bezpodstawnych. Czy przeczytana przez nich informacja jest zgodna z sytuacją w ich
firmie?
Zadanie 5
W trakcie przygotowania się do egzaminu z rachunku prawdopodobieństwa, student dotarł do
obiegowych opinii, że przeciętny wynik z egzaminu jest na poziomie 50%. Nie dowierzając tym
informacjom zebrał dane od przypadkowo spotkanych 32 kolegów z wyższych lat. Okazało się, że
w tej próbie średnia wynosiła 43%, a odchylenie standardowe (z próby) wynosiło 25%. Czy w świetle
tego badania pogłoski można uznać za wiarygodne.
Zadanie 6
Pracujący w kawiarni student IiE przeczytał, że ekspres do kawy parzy kawę o objętości opisanej
rozkładem (200ml, 5ml). Nie dowierzając tym danym przeprowadził eksperyment i zmierzył objętość
11 nalewanych kaw. Uzyskał następujące pomiary: 182, 190, 203, 180, 187, 205, 196, 183, 195, 200,
194. Czy jego badanie potwierdziło dane z instrukcji obsługi?
Zadanie 7
Pewna maszyna pakuje sól do torebek. W celu zbadania prawidłowości tego procesu zważono 38
torebek z cukrem. W wyniku tych ważeń uzyskano następujące wyniki: śr. waga torebki = 0.89 kg,
a odch. st. = 0.14. Na poziomie istotności 0.01 zweryfikować hipotezę, że maszyna sypie przeciętnie
1 kg soli. Jaką hipotezę alternatywną należy przyjąć? Dlaczego?
Zadanie 8
Wiadomo, że cena litra benzyny E95 na stacjach benzynowych w Krakowie rozkład normalny
o odchyleniu standardowym 8 gr. Pewien student jadący na zajęcia statystyki zauważył, że ceny
benzyny w mijanych przez niego stacjach były następujące: 4.68, 4.72, 4.80, 4,79, 4.71 i zastanawiał
się, czy jest prawdą, że przeciętna cena litra benzyny w Krakowie wynosi 4.70 zł (taką informację
usłyszał w lokalnym radio). Odpowiedzieć na powyższe pytanie przy założeniu, że α = 1%.
Zadanie 9
Producent pewnego smartfonu twierdzi, że czas pracy telefonu (podczas rozmowy 3G) na jednym
ładowaniu baterii wynosi co najmniej 30h. Przebadano losową próbę 100 smarftonów i uzyskano
średni czas pracy 28h i 20 minut przy odchyleniu standardowym 7h i 25 minut. Na poziomie
istotności α = 1% sprawdzić, czy producent mówi prawdę.
Test dwóch parametrów
Zadanie 10
Dwie partie polityczne postanowiły sprawdzić, jak Polacy oceniają prace rządu dot. zwalczania smogu.
Poniżej uzyskane wyniki:

Partia rządowa:

Partia opozycyjna: 49 (dobrze) 128 (źle)
73 (dobrze) 112 (źle)
Czy na poziomie istotności 5% można powiedzieć, że oba badania przyniosły takie same rezultaty?
Zadanie 11
Dwóch czołowych skoczków narciarskich spierało się, który z nich jest lepszy. Zdecydowali się poddać
próbie polegającej na oddaniu po 5 skoków. Uzyskano wyniki:

Skoczek A:
132m, 141m, 136.5m, 142m, 138m

Skoczek B:
128m, 137m, 140m, 132m, 131m.
Jakie musimy nałożyć założenia do zweryfikowania postawionej przez skoczków hipotezy? Jakie będą
wyniki, jeśli założymy poziom istotności 1%?
Zadanie 12
Dwóch konstruktorów chciało sprawdzić dokładność stworzonych przez siebie maszyn do
napełniania tuszem drukarek. Postanowili sprawdzić to na próbie po 7 pojemników. Uzyskali
następujące informacje

Maszyna A:
48 ml, 49 ml, 46 ml, 49 ml, 51 ml, 50 ml, 48 ml

Maszyna B:
51 ml, 46 ml, 47 ml, 50 ml, 53 ml, 51 ml, 54 ml
Przyjmując poziom istotności 10% zweryfikować hipotezę o równości wariancji? Co będą oznaczały
wyniki?
Zadanie 13
Istnieje powszechna opinia mówiąca o tym, że panowie lepiej od kobiet zdają egzamin z RPiSM.
W związku tym prowadzący przedmiot zebrał średnie wyniki egzaminu z ostatnich 6 lat:

kobiety:

mężczyźni: 3.4, 2.9, 3.5, 3.1, 3.6, 3.5
3.2, 2.7, 3.3, 3.6, 3.4, 3.2
Zweryfikować postawioną hipotezę przy założeniu, że α = 5%.
Zadanie 14
Wysunięto hipotezę mówiącą o tym, że studenci AGH palą papierosy częściej niż studenci UJ. Do jej
zweryfikowania przebadano grupę studentów obu uczelni i uzyskano następujące wyniki:

AGH:
palący:
34 osoby,
niepalący: 49 osób

UJ:
palący:
17 osób,
niepalący: 35 osób
Jakie będą wyniki, jeśli przyjmiemy α = 10%?
Zadanie 15
Student pewnego inżynierskiego kierunku na AGH uzyskał następujące średnie ocen kolokwiów
z matematyki i statystyki:
,
Przy obliczaniu średnich uwzględniono
wszystkie stopnie uzyskane przez niego w trakcie ostatniego roku akademickiego. Liczby tych stopni
były następujące:
Czy na poziomie istotności 5% można powiedzieć, że wartości
średnie ocen uzyskanych z obu przedmiotów są jednakowe? Proszę założyć, że obie rozważane
populacje mają rozkład normalny, a ich teoretyczne odchylenia standardowe są równe.
test zgodności chi-kwadrat Pearsona
Zadanie 16
W literaturze przedmiotu mówi się o tym, że liczba strzelonych bramek w meczu jest dobrze opisana
rozkładem Poissona. Poniżej przedstawiono dane dotyczące liczby strzelonych bramek przez cztery
wybrane drużyny z ligi angielskiej w ciągu ostatnich 10 sezonów. Czy na poziomie istotności 5%
można powiedzieć, że te dane są dobrze opisane rozkładem Poissona?
drużyna/bramki
Everton
Hull
Man City
Southampton
0
35
38
32
22
1
61
35
51
29
2
72
23
47
30
3
37
5
43
9
4
9
0
27
11
5
2
0
9
0
6
1
2
7
1
7
1
0
2
0
8
0
0
0
1
Zadanie 17
Wykładowca AGH postanowił sprawdzić, czy wyniki egzaminu ze statystyki mają rozkład normalny.
W tym celu stworzył poniższą tabelę i zebrał wyniki studentów z ostatniego roku. Do jakich doszedł
wniosków?
0.0% 12.5% 25.0% 37.5% 50.0% 62.5% 75.0% 87.5%
drużyna/bramki
12.5% 25% 37.5% 50% 62.5% 75.0% 87.5% 100%
Everton
4
7
21
36
26
14
5
2
Zadanie 18
Prowadzący ćwiczenia zarzeka się, że w ich trakcie wybiera do odpowiedzi losowo. Niedowierzający
student postanowił notować, kogo ów prowadzący pyta. W tym celu każdemu uczestnikowi kursu
przyporządkował numery od 1 do 10 i uzyskał wyniki przedstawione w tabeli:
Osoba
N
1
12
2
11
3
12
4
14
5
7
6
8
7
6
8
12
9
10
10
8
Czy, przyjmując poziom istotności α = 1%, student miał słuszne przypuszczenia?
Zadanie 19
Pewna maszyna losująca podobna do ruletki ma dokładnie cztery równe pola: dwa czerwone, jedno
białe i jedno czarne. Uruchomiono ją 100 razy i zaobserowowano, że 60 razy wypadło pole czerwone,
29 razy pole białe i tylko 11 razy pole czarne. Zweryfikuj hipotezę, że owa maszyna jest „uczciwa”.
Przyjąć założenie, że poziom istotności
wynosi 0.1.
Zadanie 20
W badaniach warunków życia mieszkańców pewnego miasta zebrano m. in. informacje o wysokości
dochodów przypadających na 1 członka gospodarstwa domowego. Dla losowej próby 200
gospodarstw uzyskano następujące wyniki badań:
DOCHÓD NA 1 OS.
250 – 450
450 – 650
650 – 850
850 - 1050
1050 - 1250
1250 - 1450
GOSPODARSTWA
5
25
80
70
15
5
Test niezależności chi-kwadrat
Zadanie 21
Przeprowadzono badanie, na ile wyniki na studiach (z matematyki) zależą od rodzaju ukończonej
szkoły średniej. Czy na poziomie istotności 5% można powiedzieć, że ukończona szkoła średnia
determinuje postępy na studiach?
Wysokie
Przeciętne
niskie
LO (mat)
36
21
17
LO
26
27
16
Technikum
10
15
7
Inne
8
5
5
Zadanie 22
Pewien wykładowca WZ AGH chciał sprawdzić, czy istnieje zależność między kierunkiem, na którym
prowadzi zajęcia i terminem, w którym jego studenci zdają egzamin. Przeprowadził on krótką analizę
wyników z ubiegłych kilku lat i uzyskał następujące informacje:
1 termin
27
21
IiE
ZiIP
2 termin
16
30
3 termin
8
15
Brak
7
36
Czy na poziomie istotności α = 1% jest on w stanie stwierdzić, że wyniki na obu kierunkach istotnie
się różnią?
Zadanie 23
W tabeli zawarto wyniki badań koloru oczu oraz koloru włosów wśród mężczyzn. Zbadać, czy dla
poziomu istotności
rozważane cechy można uznać za niezależne?
Niebieskie
Zielone
Piwne
Szare
Blondyn
22
41
33
31
Szatyn
26
30
34
17
Brunet
18
15
27
14
Rudy
6
5
8
5
Zadanie 24
W badaniach efektywności szkolenia zawodowego pracowników bezpośrednio produkcyjnych w
pewnym przedsiębiorstwie dla losowo wybranej próby 60 pracowników dokonano pomiaru ich
wydajności pracy (w szt./zmianę) przed i po przejściu szkolenia. Uzyskano następujące dane:
WYDAJNOŚĆ PRACY
W SZT./ZMIANĘ
10 – 14
14 - 18
18 - 22
22 - 26
LICZBA PRACOWNIKÓW
przed szkoleniem
po szkoleniu
28
5
18
20
12
25
2
10
Zweryfikować hipotezę, iż szkolenie zawodowe istotnie ma wpływ wydajność pracy pracowników.
(To zadanie można rozwiązać także – a nawet rozsądniej jest to zrobić w ten sposób – za pomocą testu
dwóch średnich. W jaki sposób?)
Analiza wariancji
Zadanie 25
W pewnej szkole podstawowej przeprowadzono badanie dotyczące wyników testu kompetencji po SP.
Uzyskano następujące wyniki:
kl. 6a:
32, 37, 26, 28, 17, 23, 18, 33, 26, 15
kl. 6b:
22, 29, 36, 18, 31, 33, 19, 20, 26, 34
kl. 6c:
35, 38, 24, 22, 19, 26, 15, 35, 24, 29
Czy na poziomie istotności α = 5% można powiedzieć o tym, że klasy osiągnęły taki sam przeciętny
wynik?
Zadanie 26
Pan Robert zastanawiał się, gdzie aplikować o pracę w poszukiwaniu wysokich zarobków. W tym celu
przeprowadził rozeznanie, które przyniosło następujące wyniki:
Firma A:
5400, 3800, 4250, 3900,
Firma B:
3950, 4300, 6000, 4500, 4800.
Firma C:
3650, 4300, 4700, 4000, 4600.
Czy na założonym przez niego 5% poziomie istotności można twierdzić, że jest firma, która płaci
najlepiej?
Zadanie 27
Czterej statystyce i grzybiarze zarazem sprzeczali się, który najskuteczniej szuka grzybów. Do
wiarygodnej odpowiedzi na postawione przez pytanie, postanowili wykorzystać ANOVĘ (przy 1%
poziomie istotności). W kolejnych trzech tygodniach 10 razy wybrali się na grzybobranie i zebrali
następującą liczbę prawdziwków:
A
12
21
19
30
25
21
11
23
11
25
Co się okazało?
B
15
26
18
20
24
23
25
8
18
14
C
18
18
18
11
12
17
22
11
17
18
D
13
13
18
7
16
6
20
11
14
18
Zadanie 28
W Instytucie Ziemniaka przeprowadzono badanie plonów ziemniaka w zależności od odmian rośliny
i rodzaju stosowanego nawozu. Uzyskane plony zamieszczono w tabeli:
Odmiana
A
B
C
Nawóz 1
1.9
2.5
1.7
Nawóz 2
2.2
1.9
1.9
Nawóz 3
2.6
2.3
2.2
Nawóz 4
1.8
2.6
2.0
Przeprowadzić (dwukrotnie) ANOVĘ, by zbadać oddzielny wpływ odmiany ziemniaka i rodzaju
stosowanego nawozu na uzyskane plony. Przyjąć α = 5%. (dla zainteresowanych: Jakie byłyby wyniki,
gdyby tę analizę przeprowadzić w postaci dwuczynnikowej ANOVY? Co oznacza pojęcie „efektu
interakcji”?
Zadania inne
Zadanie 29
(Własności rozkładów) Zmienna losowa X przyjmuje tylko trzy wartości: 0, 1 i 2. Wiadomo, że
oraz
. Na podstawie tych informacji należy wyznaczyć rozkład zmiennej X.
Zadanie 30
(Test serii) W badaniach wyników studiowania osiąganych przez studentów pewnej uczelni z ich
populacji wylosowano próbę 25 studentów, dla której ustalono następujące średnie z całego toku
studiów: 3,11; 4,05; 3,75; 3,33; 4,25; 3,15; 3,96; 4,02; 2,99; 3,28; 3,65; 4,12; 3,48; 3,73; 3,26; 2,87;
4,54; 3,24; 4,15; 3,66; 3,74; 4,28; 3,90; 3,45; 4,67. Na poziomie istotności 0,10 zweryfikować hipotezę,
że dobór próby był losowy.
Zadanie 31
(Test zgodności Kołmogorowa) Jak sprawdzić, czy prawdziwe jest założenie o normalności rozkładu
w zadaniu 20.
Zadanie 32
(Test jednej średniej) Zebrano informacje dla grupy kierowców, którzy w okresie ostatnich 8 lat na
terenie miasta „K” spowodowali wypadek drogowy znajdując się pod wpływem alkoholu. Uzyskano
następujące zestawienie:
POZIOM ALKOHOLU (‰)
0,40 – 1,0
1,0 – 1,6
1,6 – 2,2
2,2 – 2,8
KIEROWCY
15
120
180
85
Zakładając, że badana populacja ma charakter rozkładu normalnego przy poziomie istotności
0,05 zweryfikować hipotezę, że średnie stężenie alkoholu we krwi w całej populacji nietrzeźwych
kierowców, którzy spowodowali wypadek drogowy, jest większe od 2,3 promila.