Funkcje powiązań, miary zależności i grube ogony, czyli
Transkrypt
Funkcje powiązań, miary zależności i grube ogony, czyli
Wprowadzenie Modelowanie Przykªad Funkcje powi¡za«, miary zale»no±ci i grube ogony, czyli kilka sªów o zale»no±ci w statystyce i matematyce nansowej Marcin Pitera Uniwersytet Jagiello«ski 9 maja 2012 Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Kilka wst¦pnych sªów: Denicja kowariancji i korelacji Kowariancja Liczba okre±laj¡ca zale»no±¢ liniow¡ mi¦dzy zmiennymi losowymi X i Y. cov (X , Y ) = E [(X − µX )(Y − µY )] Korelacja Wspóªczynnik korelacji liniowej Pearsona - unormowana kowariancja. ρX ,Y = (X , Y ) σX σY cov Z Wikipedii: Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Wady wspóªczynnika korelacji liniowej Najcz¦±ciej cytowane wady 1. Wspóªczynnik ten nie jest niezmienniczy wzgl¦dem przeksztaªce« monotonicznych. Przykªadowo, korelacja mi¦dzy X i Y jest ró»na od korelacji mi¦dzy ln X i ln Y . 2. Cz¦sto ze wzgl¦du na rozkªad zmiennych, warto±¢ korelacji jest bardzo ograniczona. Przykªadowo, je±li ln X ∼ N (0, 1) oraz ln Y ∼ N (0, 4), to ρ ∈ (−0.09, 0.66). 3. Z caªkowitej dodatniej zale»no±ci (monotonicznej) jednej zmiennej od drugiej nie wynika, i» ρ = 1. Podobnie w drug¡ stron¦ (z −1). 4. Zerowa warto±¢ korelacji wcale nie oznacza niezale»no±ci zmiennych losowych (np. dla 2 wymiarowego rozkªadu t-studenta). 5. Cz¦sto nie da si¦ poprawnie zdeniowa¢ wspóªczynnika korelacji (gdy wariancje zmiennych losowych s¡ niesko«czone). 6. Podatno±¢ na próbki odstaj¡ce. 7. Nie jest zbyt 'odporna'. XY XY Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Co to s¡ grube ogony? Kilka obrazków Przykªad jednowymiarowy: pokaza¢ w R. Wiele wymiarów Je»eli mamy model wielowymiarowy, to ªatwiej 'zapomnie¢' o grubych ogonach. Pokaza¢ w R. Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci ρ Spearmana Rangowanie Mamy np. 2 obserwacje z rozkªadu dwuwymiarowego (1, 5), (2, 3), (4, 6). . Zamiast rozwa»a¢ bezpo±rednio warto±ci warto±ci, spróbujmy je uporz¡dkowa¢ i rozwa»a¢ miejsce danej warto±ci wzgl¦dem innych. Tzn: dla 'pierwszego' wymiaru dostajemy ( 13 , 32 , 33 ), dla drugiego ( 32 , 13 , 33 ). W tedy otrzymujemy próbk¦ 1 2 2 1 3 3 ( , ), ( , ), ( , ). 3 3 3 3 3 3 Dla takiej próbki liczymy standardowe ρ Pearsona. Otrzyman¡ w ten sposób warto±¢ nazywamy ρ Spearmana. Uwaga Jest to tzw. miara monotonicznej zgodno±ci. Opowiemy o tym dokªadniej w dalszej cz¦±ci referatu. Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Czym jest kopuªa? Uproszczenie Ograniczymy si¦ do dwóch wymiarów. Teoria wielowymiarowa jest bardzo podobna. Dystrybuanty brzegowe Zaªó»my, »e mamy dan¡ par¦ zmiennych losowych X , Y (okre±lon¡ na R). Rozwa»my dwuwymiarow¡ dystrybuant¦ ª¡cz¡c¡ X i Y dan¡ wzorem: I H (x , y ) = P (X ≤ x, Y ≤ y) Jednowymiarowe dystrybuanty F (x ) = P (X ≤ x ) = H (x , ∞) oraz G (x ) = P (Y ≤ y ) = H (∞, y ) nazywamy wtedy dystrybuantami brzegowymi. I I Czym jest kopuªa? Funkcj¡, która ª¡czy dystrybuant¦ wielowymiarow¡ z jej jednowymiarowymi dystrybuantami brzegowymi. Funkcj¡ opisuj¡c¡ zale»no±¢ mi¦dzy zmiennymi. Marcin Pitera Funkcje Copula Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Wprowadzenie Modelowanie Przykªad Denicja 2-kopuªy Denicja 2-kopuª¡ nazywamy funkcj¦ C : I 2 → I , która speªnia nastepuj¡ce warunki: 1. Dla ka»dego u , v ∈ I , C (u , 0) = C (0, v ) = 0, C (u , 1) = u oraz C (1, v ) = v 2. Dla u1 , u2 , v1 , v2 ∈ I takich, »e u1 ≤ u2 , v1 ≤ v2 C jest 2-rosn¡ca. Mamy C (u2 , v2 ) − C (u2 , v1 ) − C (u1 , v2 ) + C (u1 , v1 ) ≥ 0 1 C(u,v)= = 0 na C(u,v)= = u na C(u,v) 0 C(u,v)= = v na 1 - - Marcin Pitera + = Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Twierdzenie Sklara Twierdzenie (Sklar 1959) Niech H b¦dzie dystrybuant¡ dwuwymiarow¡ z funkcjami brzegowymi F oraz G . Istnieje wtedy kopuªa C taka, »e: ∀x , y ∈ R : H (x , y ) = C (F (x ), G (y )) Ponadto: 1. Je»eli F i G s¡ ci¡gªe, to C jest jedyna. W przeciwnym przypadku C jest jednoznacznie okre±lona na Ran(F ) × Ran(G ). 2. Podobnie je»eli C jest kopuª¡ oraz F i G s¡ dystrybuantami, to funkcja H zdeniowana powy»ej jest dystrybuant¡ ª¡czn¡ o funkcjach brzegowych F i G. Odwrócenie dystrybuant Zakªadaj¡c, »e dystrybuanty s¡ ±ci±le rosn¡ce albo rozwa»aj¡c funkcje quasi-odwrotne dostajemy te» wzór: ∀x , y ∈ R : C (x , y ) = H (F (−1) (x ), G (−1) (y )) Marcin Pitera Funkcje Copula Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Wprowadzenie Modelowanie Przykªad Miary monotonicznej zgodno±ci Najbardziej znane 1. ρ Spearmana. Wspóªczynnik korelacji rang. Wzór w j¦zyku kopuª: S ρS = 12 ZZ I 2 uvdC (u , v ) − 3 = 12 ZZ I 2 C (u , v )dudv − 3 2. τ Kendalla - stanowi ró»nic¦ mi¦dzy prawdopodobie«stwem, »e porównywane zmienne b¦d¡ ukªadaªy si¦ w tym samym porz¡dku dla dwóch obserwacji, a prawdopodobie«stwem, »e uªo»¡ si¦ w przeciwnym porz¡dku. τ = P[(x1 − x2 )(y1 − y2 ) > 0] − P[(x1 − x2 )(y1 − y2 ) < 0] W j¦zyku kopuª: τ = Q (C , C ) = 4 ZZ I Marcin Pitera 2 C (u , v )dC (u , v ) − 1 Funkcje Copula Wprowadzenie Modelowanie Przykªad Kilka wst¦pnych sªów: Kowariancja i korelacja Grube ogony ρ Spearmana Czym jest kopuªa? Denicja kopuªy Twierdzenie Sklara Miary monotonicznej zgodno±ci Inne Zachowanie w ogonach - tail index I tail index: λL = lim 0+ v→ I P [F (X ) ≤ v |G (Y ) ≤ v ] = lim+ C (v , v ) v →0 v upper tail index: λU = lim v→ 1− P [F (X ) > v |G (Y ) > v ] = lim− 1 − 2v + C (v , v ) 1−v →1 v PQD - Positive quadratic dependance P [X ≤ x , Y ≤ y ] ≥ P [X ≤ x ]P [Y ≤ y ] ⇔ C (u , v ) ≥ uv Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Zalety u»ycia funkcji Copula Kilka udogodnie« 1. Twierdzenie sklara ⇒ H (x , y ) = C (F (x ), G (y )) ⇒ Pozwala nam to na osobne modelowanie rozkªadów brzegowych i funkcji copula. 2. Monotoniczne przeksztaªcenia ⇒ Cα( )β( ) = C ⇒ monotoniczne przeksztaªcenia nie zmieniaj¡ kopuªy. 3. Znamy du»o rodzin kopuª ⇒ Tworzenie wielowymiarowych rozkªadów innych ni» normalne/eliptyczne [np. kopuªy archimedesowe (Gumbel, Clayton, Frank), vine copula, sko±na kopuªa t-studenta]. X Marcin Pitera Y Funkcje Copula XY Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kilka znanych rodzin kopuª Kopuªy zwi¡zane z rozkªadami eliptycznymi 1. Kopuªa Gaussa 2. Kopuªa t-studenta 3. Sko±na kopuªa t-studenta (praca, str 26) Zalety I I I Cz¦sto znane procedury estymacji. Szczególnie dla kopuªy Gaussa. - np. przez macierz kowariancji, czy macierz z τ Kendalla. (potem b¦d¡ algorytmy) Dosy¢ dobrze opisuj¡ zale»no±¢ przy bardzo du»ej liczbie wymiarów. I numerycznie umo»liwiaj¡ jej opis. (CDO, czy bankructwa) pakiet 'copula' w R oraz inne programy (szczególnie nansowe) Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kopuªy zwi¡zane z rozkªadami eliptycznymi Kopuªa Gaussa C Ga (u) := Φ R Φ−1 (u1 ), Φ−1 (u2 ), . . . , Φ−1 (un ) 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 1.0 R 0.0 0.2 0.4 0.6 Rysunek: G¦sto±¢ i próbka z 2-kopuªy Gaussa, Marcin Pitera Funkcje Copula 0.8 1.0 0.0 0.2 0.4 ρ = 0.5 i ρ = 0.3 0.6 0.8 1.0 Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kopuªy zwi¡zane z rozkªadami eliptycznymi Kopuªa t-studenta R ,v (tv−1 (u1 ), . . . , tv−1 (un )) 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 R v 1.0 C Stud (u) := t , 0.0 0.2 Rysunek: G¦sto±¢ i próbka z 2-kopuªy t-Studenta, Marcin Pitera 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 (ρ = 0.5, v = 3) i (ρ = 0.1, v = 5) Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kopuªy zwi¡zane z rozkªadami eliptycznymi 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 1.0 Sko±na kopuªa t-studenta 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Rysunek: Próbka 1000 elementowa dla sko±nej 2-kopuªy t-studenta, (v = 3, µ = (0.5, 0), ρ = 0.5, γ = (0.9, 0)) oraz (v = 4, µ = (0, 0), ρ = 0.5, γ = (−0.7, 0.7)) Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kilka znanych rodzin kopuª Kopuªy Archimedesowe C (u , v ) = ϕ[−1] (ϕ(u ) + ϕ(v )) ϕ : I → [0, ∞], ci¡gªa, ±ci±le malej¡ca, ϕ(1) = 0, ϕ jest wypukªa. Przykªadowe rodziny 1. Kopuªa Franka 2. Kopuªa Gumbela 3. Kopuªa Claytona Zalety I I I I atwa estymacja z u»yciem τ Kendalla. Du»o procedur estymacji. (równie» nieparametrycznych) Dobre dopasowanie do danych maªowymiarowych. Du»o uogólnie« (np.Vine Copula) Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kopuªy Archimedesowe Kopuªa Franka Cα (u1 , . . . , u n )=− 1 " ln 1 + Qn α −α Generator: ϕα (u ) = − ln ee −α −−11 α > 0 i= 1( e −α ui − 1) # (e −α − 1)n−1 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 1.0 u 0.0 0.2 0.4 0.6 0.8 Rysunek: G¦sto±¢ i próbka z 2-kopuªy Franka, Marcin Pitera Funkcje Copula 1.0 0.0 0.2 0.4 α = 4 i α = 15 0.6 0.8 1.0 Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kopuªy Archimedesowe 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 1.0 Kopuªy Gumbela i Claytona 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Rysunek: Próbka 1000 elementowa dla jednoparametrowych 2-kopuª z rodziny Gumbela i Claytona (α = 2.5) Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Kilka znanych rodzin kopuª Inne Rodziny 1. Extreme-value Copulas (modelowanie rzadko wyst¦puj¡cych procesów) 2. Kopuªy zwi¡zane z funkcjami prze»ycia (Survival copulas) 3. Lévy copulas, Markov copulas, semimartingale copula (w nansach dynamiczne podej±cie). Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Wst¦p Rodziny kopuª Estymacja Estymacja - przegl¡d metod Podstawowy podziaª - MLE 1. MLE (Exact Maximum Likelihood Estimation) 2. IFM (Infrence Functions for Margins) 3. CML (Canonical Maximum Likelihood) Podstawowy podziaª - Inne 1. KA - τ Kendalla Clayton: τ = 1− 2 2+θ (τ ∈ [0, 1]\{0}) Gumbel: 2. KA - Estymacja generatora (przez 'poziomice' kopuªy) 3. Du»o innych.. Marcin Pitera Funkcje Copula τ = 1−θ−1 (τ ∈ [0, 1]) Wprowadzenie Modelowanie Przykªad Przykªad 3-wymiarowy model stóp zwrotu 1. Mamy trzy akcje - PKO, PEKAO, ORBIS. Ich notowania w okre±lonym czasie 2. Chcemy stworzy¢ 3-wymiarowy model logarytmicznych stóp zwrotu, zakªadaj¡c kopuª¦ normaln¡ i brzegi t-studenta. U»yjemy modelu GARCH(1,1)-Copula. GARCH(1,1): y |ψ −1 ∼ N (0, h ) t h t t t = α0 + α1 yt2−1 + β1 ht −1 Marcin Pitera Funkcje Copula Wprowadzenie Modelowanie Przykªad Przykªad rodowisko R Marcin Pitera Funkcje Copula