Rozwiązania - Niezależne Ogólnopolskie Mistrzostwa w Analizie

Transkrypt

Rozwiązania - Niezależne Ogólnopolskie Mistrzostwa w Analizie
IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych
Wrocław 24 maja 2014, kwalifikacje
Grupa wiekowa 2
Zadanie KA2: Audyt krupierów
Zadanie polegało na skorzystaniu z testu t-Studenta dla dwóch prób niezależnych o identycznej wariancji,
jednakże zamiast prób podane były statystyki:
n1 - liczba obserwacji w grupie 1 s1 - suma obserwacji w grupie 1 k1 - suma kwadratów obserwacji w grupie
1 n2 - liczba obserwacji w grupie 2 s2 - suma obserwacji w grupie 2 k2 - suma kwadratów obserwacji
w grupie 2
Wykorzystujac
˛ te oznaczenia, statystyka testowa to:
t ← (s1/n1 − s2/n2)/sqrt(k1 − s12 /n1 + k2 − s22 /n2) ∗ sqrt(n1 ∗ n2 ∗ (n1 + n2 − 2)/(n1 + n2))
Moduł wartość tej statystyki porównujemy z kwantylem rzedu
˛ 1 − 0.05/2 rozkładu t-Studenta o n1 + n2 − 2
stopniach swobody.
IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych
Wrocław 24 maja 2014, kwalifikacje
Grupa wiekowa 2
Zadanie KC2: C zas przebywania w kasynie
Właściciel kasyna, znajac
˛ prawdopodobieństwo p wyrzucenia orła, chciałby oszacować, ile średnio czasu
gracz spedzi
˛
w kasynie. Przyjmujemy, że gracz wyjdzie z kasyna, jeżeli straci cały swój majatek
˛
k albo
powiekszy
˛
swój kapitał do N.
Oznaczenia:
Xi - zmiana kapitału w i-tej rudzie gry.
P(Xi = 1) = 1 − P(Xi = −1) = p
EXi = 2p − 1
pk (N) - prawdopodobieństwo, że gracz zaczynajacy
˛ z kapitałem k powiekszy
˛
go do N. Można pokazać, że:
pk (N) =
k
( 1−p
p ) −1
N
( 1−p
p ) −1
dla p! = 0.5 oraz pk (N) = k/N dla p = 0.5. τ - moment wyjścia z kasyna. S - łaczna
˛
zmiana kapitału do
momentu wyjścia - przyjmuje tylko dwie wartości, bo gracz wychodzi po przegraniu k lub wzbogaceniu sie˛
do N nomadionów.
P(S = N − k) = 1 − P(S = −k) = pk (N).
ES = (N − k) ∗ pk (N) − k ∗ (1 − pk (N)) = N ∗ pk (N) − k.
Z tożsamości Walda:
ES = Eτ ∗ EX1 .
Stad
˛ mamy rozwiazanie:
˛
Eτ = ES/EX1 (o ile EX1 ! = 0, co mamy dla p = 0.5, wtedy gra może trwać w
nieskończoność).
PSEUDOKOD
1. Wczytaj: N, k, p.
2. Jeżeli k == 0, to pkN := 0, w innym razie
jeżeli k == N, to pkN := 1, w innym razie
jeżeli p == 0.5, to pkN := k/N, w innym razie
pkN := (((1 − p)/p)k − 1)/(((1 − p)/p)N − 1).
3. EX := 2 ∗ p − 1
4. ES := N ∗ pkN − k.
5. Jeżeli p == 0.5, to Eczas ← Inf, w przeciwnym razie Eczas ← ES/EX.
6. Wypisz dEczase.
IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych
Wrocław 24 maja 2014, kwalifikacje
Grupa wiekowa 2
Z adanie KN2: NOKE
Należało odpowiedzieć na pytanie czy wartość wygranej jest zależna od liczby nomadów stojacych
˛
przed
nomadokratem w kolejce w danej kolekturze.
Zadanie to można było rozwiazać
˛
korzystaj
˛ ac
˛ z testu zwiazku
˛
miedzy
˛
powiazanymi
˛
próbkami przy
użyciu korelacji Kendalla.
PSEUDOKOD
1. Wczytaj:
˛
w kolejce przed nomadokratem linia2 - dokładna kwota wygranych
linia1 - liczba osób stojacych
nomadionów.
2. Oblicz:
test ← test na korelacje˛ pomiedzy
˛
linia1 i linia2
p ← p-wartość otrzymana po zastosowaniu testu
3. Jeśli: p 6 0.05
zwróć 1
4. W przeciwnym przypadku:
zwróć 0
IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych
Wrocław 24 maja 2014, kwalifikacje
Grupa wiekowa 2
Z adanie KP 2: P ierwsza wygrana
W zadaniu czasy pierwszych wygranych na n automatach opisane sa˛ rozkładem wykładniczym o średniej
θ, czyli gestości
˛
postaci
f(x|θ) = 1/θ ∗ exp(−x/θ)
k najmniejszych obserwacji spośród n jest znanych (x1 , ..., xk ), wobec tego funkcja wiarygodności jest
postaci:
L(θ, x1 , . . . , xk ) = f(x1 |θ) ∗ ... ∗ f(xk |θ) ∗ P(X > max(x))( n − k) = 1/θk ∗ exp(−sum(x)/θ − (n − k) ∗ max(x)/θ)
pochodna logarytmu wiarygodności to:
−k/θ + sum(x)/θ2 + (n − k) ∗ max(x)/θ2
przyrównujac
˛ do zera otrzymujemy estymator średniej:
mean(x) + (n − k)/k ∗ max(x)
w szczególności, jeśli n = k, to θ = mean(x), natomiast jeśli k = 1, to n ∗ x1.
W zadaniu nie było to jedyne akceptowalne rozwiazanie,
˛
sprawdzarka przyjmowała wszystkie odpowiedzi mieszczace
˛ sie˛ w kwantylach (q0.025 , q0.975 ) rozkładu estymatora NW, wyliczonymi metoda˛ Monte
Carlo.
IV Niezależne Ogólnopolskie Mistrzostwa w Analizie Danych
Wrocław 24 maja 2014, kwalifikacje
Grupa wiekowa 2
Z adanie KS 2: S prawiedliwa gra
Doświadczenie wykonywane jest zgodnie z schematem Bernoulliego z prawdopodobieństwem 1/P
sukcesu w pojedyńczym doświadczeniu. Wygrana osoby, która jeden raz wzieła
˛ udział w grze, jest zmienna˛
losowa˛ W przyjmujac
˛ a˛ wartości −m, a1 , . . . , ak , . . . .Gra jest gra˛ sprawiedliwa˛ gdy wartość przecietna
˛
wygranej jest równa zero: EW = 0. Wartość oczekiwana tak określonej zmiennej losowej wyraża sie˛ wzorem:
EW = −mq + q
∞
X
ak−1 pk−1 = q(−m +
k=2
Stad:
˛
EW = 0 ⇔ m =
ap
), gdy 0 < ap < 1
1 − ap
ap
1 − ap
Psudokod jest zatem nastepuj
˛ acy:
˛
PSEUDOKOD
1. Wczytaj:
P - liczba ścian kości
a - liczba nomadionów (podnoszona jest do odpowiedniej potegi
˛ zależnej od ilości rzutów kostka˛ i od
porażki)
2. Podstaw: p = 1/P
3. Oblicz:
m = m = a ∗ p/(1.0 − a ∗ p)(wartość oczekiwana)
4. Zwróć: m

Podobne dokumenty