Laboratorium Funkcje w pakiecie R: • glm() • step() • anova
Transkrypt
Laboratorium Funkcje w pakiecie R: • glm() • step() • anova
MODELOWANIE MATEMATYCZNE 2015 Laboratorium Funkcje w pakiecie R: • glm() • step() • anova() Zadanie 1 Wczytaj dane z pliku http://www.ipipan.eu/~teisseyrep/TEACHING/MM/DANE/ credit.asc dotyczące credit scoringu. W pliku http://www.ipipan.eu/~teisseyrep/TEACHING/MM/DANE/credit.htm znajduje się opis poszczególnych zmiennych. • Dopasuj model regresji logistycznej. • Oblicz estymatory współczynników. • Oblicz szacowane prawdopodobieństwo aposteriori spłacenia kredytu dla pierwszego klienta korzystając z definicji i estymatorów obliczonych w poprzednim punkcie. Porównaj wyniki z uzyskanymi przy użyciu odpowiedniej funkcji w R. • Dokonaj wyboru zmiennych korzystając z kryterium Bayesa. • Na podstawie mniejszego modelu, oszacuj prawdopodobieństwo spłacenia kredytu dla klienta który:: – jest rozwiedzionym mężczyzną (zmienna famges), – spłacane przez niego raty nie przekraczają 20% dochodów (zmienna rate), – ma na koncie oszczędościowym ponad 2000 DM (zmienna sparkont), – w banku spłacił poprzednie kredyty (zmienna moral), – nie ma oszczędności na koncie (zmienna laufkont), – czas trwania ostatniego kredytu wynosił 33 miesiące (zmienna laufzeit). • Porównaj model składający się ze wszystkich zmiennych i model mniejszy stosując test ilorazu wiarogodności. Oblicz statystykę testową i p-wartość. Zadanie 2 (zadanie domowe) Przykład symulacyjny. • Wygeneruj dane z modelu logistycznego yi ∼ Bern(pi ), gdzie pi = 1 , 1 + exp[−(β0 + β1 xi,1 + β2 xi,2 )] dla i = 1, . . . , n, x1,i , x2,i ∼ N (0, 1), n = 50. Parametry β0 = 0.5, β1 = β2 = 1. Dopasuj model logistyczny dla wygenerowanych danych i oblicz estymatory współczynników. Powtórz eksperyment L = 50 razy i na tej podstawie oszacuj błąd średniokwadratowy M SE = E(||β̂ − β||2 ), gdzie || · || jest normą euklidesową. • Powtórz eksperyment dla n = 50, 60, 70, . . . , 300 i narysuj wykres pokazujący zależność M SE od n.