Rozwiązania - Niezależne Ogólnopolskie Mistrzostwa w Analizie
Transkrypt
Rozwiązania - Niezależne Ogólnopolskie Mistrzostwa w Analizie
IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych Wrocław 24 maja 2014, kwalifikacje Grupa wiekowa 2 Zadanie KA2: Audyt krupierów Zadanie polegało na skorzystaniu z testu t-Studenta dla dwóch prób niezależnych o identycznej wariancji, jednakże zamiast prób podane były statystyki: n1 - liczba obserwacji w grupie 1 s1 - suma obserwacji w grupie 1 k1 - suma kwadratów obserwacji w grupie 1 n2 - liczba obserwacji w grupie 2 s2 - suma obserwacji w grupie 2 k2 - suma kwadratów obserwacji w grupie 2 Wykorzystujac ˛ te oznaczenia, statystyka testowa to: t ← (s1/n1 − s2/n2)/sqrt(k1 − s12 /n1 + k2 − s22 /n2) ∗ sqrt(n1 ∗ n2 ∗ (n1 + n2 − 2)/(n1 + n2)) Moduł wartość tej statystyki porównujemy z kwantylem rzedu ˛ 1 − 0.05/2 rozkładu t-Studenta o n1 + n2 − 2 stopniach swobody. IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych Wrocław 24 maja 2014, kwalifikacje Grupa wiekowa 2 Zadanie KC2: C zas przebywania w kasynie Właściciel kasyna, znajac ˛ prawdopodobieństwo p wyrzucenia orła, chciałby oszacować, ile średnio czasu gracz spedzi ˛ w kasynie. Przyjmujemy, że gracz wyjdzie z kasyna, jeżeli straci cały swój majatek ˛ k albo powiekszy ˛ swój kapitał do N. Oznaczenia: Xi - zmiana kapitału w i-tej rudzie gry. P(Xi = 1) = 1 − P(Xi = −1) = p EXi = 2p − 1 pk (N) - prawdopodobieństwo, że gracz zaczynajacy ˛ z kapitałem k powiekszy ˛ go do N. Można pokazać, że: pk (N) = k ( 1−p p ) −1 N ( 1−p p ) −1 dla p! = 0.5 oraz pk (N) = k/N dla p = 0.5. τ - moment wyjścia z kasyna. S - łaczna ˛ zmiana kapitału do momentu wyjścia - przyjmuje tylko dwie wartości, bo gracz wychodzi po przegraniu k lub wzbogaceniu sie˛ do N nomadionów. P(S = N − k) = 1 − P(S = −k) = pk (N). ES = (N − k) ∗ pk (N) − k ∗ (1 − pk (N)) = N ∗ pk (N) − k. Z tożsamości Walda: ES = Eτ ∗ EX1 . Stad ˛ mamy rozwiazanie: ˛ Eτ = ES/EX1 (o ile EX1 ! = 0, co mamy dla p = 0.5, wtedy gra może trwać w nieskończoność). PSEUDOKOD 1. Wczytaj: N, k, p. 2. Jeżeli k == 0, to pkN := 0, w innym razie jeżeli k == N, to pkN := 1, w innym razie jeżeli p == 0.5, to pkN := k/N, w innym razie pkN := (((1 − p)/p)k − 1)/(((1 − p)/p)N − 1). 3. EX := 2 ∗ p − 1 4. ES := N ∗ pkN − k. 5. Jeżeli p == 0.5, to Eczas ← Inf, w przeciwnym razie Eczas ← ES/EX. 6. Wypisz dEczase. IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych Wrocław 24 maja 2014, kwalifikacje Grupa wiekowa 2 Z adanie KN2: NOKE Należało odpowiedzieć na pytanie czy wartość wygranej jest zależna od liczby nomadów stojacych ˛ przed nomadokratem w kolejce w danej kolekturze. Zadanie to można było rozwiazać ˛ korzystaj ˛ ac ˛ z testu zwiazku ˛ miedzy ˛ powiazanymi ˛ próbkami przy użyciu korelacji Kendalla. PSEUDOKOD 1. Wczytaj: ˛ w kolejce przed nomadokratem linia2 - dokładna kwota wygranych linia1 - liczba osób stojacych nomadionów. 2. Oblicz: test ← test na korelacje˛ pomiedzy ˛ linia1 i linia2 p ← p-wartość otrzymana po zastosowaniu testu 3. Jeśli: p 6 0.05 zwróć 1 4. W przeciwnym przypadku: zwróć 0 IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych Wrocław 24 maja 2014, kwalifikacje Grupa wiekowa 2 Z adanie KP 2: P ierwsza wygrana W zadaniu czasy pierwszych wygranych na n automatach opisane sa˛ rozkładem wykładniczym o średniej θ, czyli gestości ˛ postaci f(x|θ) = 1/θ ∗ exp(−x/θ) k najmniejszych obserwacji spośród n jest znanych (x1 , ..., xk ), wobec tego funkcja wiarygodności jest postaci: L(θ, x1 , . . . , xk ) = f(x1 |θ) ∗ ... ∗ f(xk |θ) ∗ P(X > max(x))( n − k) = 1/θk ∗ exp(−sum(x)/θ − (n − k) ∗ max(x)/θ) pochodna logarytmu wiarygodności to: −k/θ + sum(x)/θ2 + (n − k) ∗ max(x)/θ2 przyrównujac ˛ do zera otrzymujemy estymator średniej: mean(x) + (n − k)/k ∗ max(x) w szczególności, jeśli n = k, to θ = mean(x), natomiast jeśli k = 1, to n ∗ x1. W zadaniu nie było to jedyne akceptowalne rozwiazanie, ˛ sprawdzarka przyjmowała wszystkie odpowiedzi mieszczace ˛ sie˛ w kwantylach (q0.025 , q0.975 ) rozkładu estymatora NW, wyliczonymi metoda˛ Monte Carlo. IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych Wrocław 24 maja 2014, kwalifikacje Grupa wiekowa 2 Z adanie KS 2: S prawiedliwa gra Doświadczenie wykonywane jest zgodnie z schematem Bernoulliego z prawdopodobieństwem 1/P sukcesu w pojedyńczym doświadczeniu. Wygrana osoby, która jeden raz wzieła ˛ udział w grze, jest zmienna˛ losowa˛ W przyjmujac ˛ a˛ wartości −m, a1 , . . . , ak , . . . .Gra jest gra˛ sprawiedliwa˛ gdy wartość przecietna ˛ wygranej jest równa zero: EW = 0. Wartość oczekiwana tak określonej zmiennej losowej wyraża sie˛ wzorem: EW = −mq + q ∞ X ak−1 pk−1 = q(−m + k=2 Stad: ˛ EW = 0 ⇔ m = ap ), gdy 0 < ap < 1 1 − ap ap 1 − ap Psudokod jest zatem nastepuj ˛ acy: ˛ PSEUDOKOD 1. Wczytaj: P - liczba ścian kości a - liczba nomadionów (podnoszona jest do odpowiedniej potegi ˛ zależnej od ilości rzutów kostka˛ i od porażki) 2. Podstaw: p = 1/P 3. Oblicz: m = m = a ∗ p/(1.0 − a ∗ p)(wartość oczekiwana) 4. Zwróć: m