Wykład 5 - "Modelowanie upadłości firm i modele skoringowe"

Transkrypt

Wykład 5 - "Modelowanie upadłości firm i modele skoringowe"
D. Ciołek
ZASTOSOWANIA EKONOMETRII
Modelowanie zmiennych jakościowych
dr Dorota Ciołek
Katedra Ekonometrii
Wydział Zarządzania UG
http://wzr.pl/~dciolek
[email protected]
1
D. Ciołek
Zmienne jakościowe jako zm. objaśniane
Zmienne dwumianowe - binarne – dychotomiczne: typu TAK/NIE np.











firma ogłosiła upadłość lub nie
firma jest w złej lub dobrej kondycji finansowej
spółka jest lub nie jest celem przejęcia
firma prowadzi działalność eksportową lub nie
itp.
Konstruuje się tzw. modele zmiennej dwumianowej
modele wyboru binarnego (binary choice model)
modele danych binarnych (binary response model)
Narzędzia ekonometryczne:
Linowy model prawdopodobieństwa
Model probitowy
Model logitowy
Komplementarny model log-log
2
D. Ciołek
Zmienne jakościowe jako zm. objaśniane
Zmienne wielomianowe – takie, które mają wiele kategorii (wiele
wariantów), charakteryzujących się naturalnym uporządkowaniem np.
 w badaniu sondażowym – gdy firma nie chce ujawnić swoich
wyników sprzedażowych może odpowiedzieć na pytanie: czy
sprzedaż wzrosła, pozostała na tym samym poziomie , czy spadła
lub w analizie sytuacji firmy czy notowania giełdowe w określonym
czasie: spadły, nie zmieniły się, wzrosły
 pomiar cech niemierzalnych w badaniach ankietowych: preferencje,
poglądy, zadowolenie, czy ocena: satysfakcja z pracy pracownika
(bardzo niezadowolony, trochę niezadowolony, neutralny, w miarę
zadowolony, bardzo zadowolony)
 zmienne przedziałowe – badany nie zawsze chce (a zazwyczaj nie
chce) określić dokładną wysokość swojego dochodu – prosimy o
wskazanie jednego z wymienionych przedziałów
 miejsce w rankingu – ranking najlepszych uczelni, odpowiedź na
polecenia: proszę uszeregować wyróżnione marki samochodów od
najbardziej prestiżowych do najmniej prestiżowych
3
D. Ciołek
Cele modelowania
1) Ustalenie czynników, które w danej zbiorowości są istotne dla
określenia prawdopodobieństwa P(y=1) - weryfikacja hipotezy na temat
mechanizmu generującego wartości zmiennej Y. Co jest ważne, a co jest
nieistotne?
2) Prognoza prawdopodobieństwa zdarzenia lub wystąpienia stanu
polegającego na tym, że zmienna Y przyjmie wartość 1 – prognoza
wartości zmiennej Y dla konkretnego zestawu zmiennych objaśniających –
dokonanie klasyfikacji nowego obiektu.
3) Prognoza zmiany prawdopodobieństwa P(y=1) wywołanej zmianą
wartości jednej ze zmiennych objaśniających – odpowiedź na pytanie, Jak
analizowana zmienna jakościowa reaguje na zmiany czynników
objaśniających? Pozwala również określić ważności poszczególnych
czynników objaśniających.
4) Konstrukcja funkcji zmiennych X pozwalającej rozróżnić
(dyskryminować) dwie grupy należące do danej zbiorowości:
jedną z y=1 oraz drugą z y=0.
4
D. Ciołek
Model dla zmiennej jakościowej:
model prawdopodobieństwa
k
y   0    j xij  ui
*
i
j 1
*
gdzie y i jest tzw. zmienną ukrytą (latent varable) np. dla zm.
binarenej:
*
i
i
*
i
1 dla y  0
y 
 0 dla y  0
(Raczej) nie wykorzystuje się klasycznej regresji liniowej
(Liniowego Modelu Prawdopodobieństwa) ponieważ wartości
teoretyczne wyliczone z takiego modelu mogą znajdować się poza
przedziałem <0,1> - niezgodne z logika prawdopodobieństwa.
5
D. Ciołek
Model logitowy - założenia
Binarna zmienna Y może przyjąć dwie wartości:
yi  1 lub yi  0
Załóżmy, że prawdopodobieństwo
P( yi  1)  pi oraz P( yi  0)  1  pi


Rozkład prawdopodobieństwa zmiennej Y to zerojedynkowy rozkład
Bernoulliego
Funkcja prawdopodobieństwa w tym rozkładzie jest następująca:
f ( yi )  piyi 1  pi 
1 yi



dla
yi  0,1
W modelu logitowym wyjaśniamy, jak określone zmienne X
wpływają na zmienną Y, a dokładnie na prawdopodobieństwo
pi .
To pi reprezentuje swego rodzaju skłonność danego osobnika lub
danej jednostki do podejmowania decyzji lub przyjmowania stanu
odpowiadającego wartości y=1.
Dotyczy to zarówno jednostek świadomie podejmujących decyzję
jak i tych, które trafiają do danej kategorii, nie decydując o tym.
6
D. Ciołek
Model logitowy - definicja

Korzysta się z rozkładu logistycznego, którego dystrybuanta to:
pi 

1
1 e
W modelu logitowym zmienną objaśnianą jest tzw. logit:
logit( pi )  ln

(  xi '  )
pi
1  pi
logarytm ilorazu szans przyjęcia oraz
nieprzyjęcia wartości 1 przez zmienną y
Logit zapisuje się jako liniowa funkcję zmiennych objaśniających X:
logit( pi )   0  1 X 1i   2 X 2i  ...   k X ki  i
Metoda estymacji:
Metoda Największej Wiarygodności (Maximum Likelihood Estimation)
Uwaga: Model probitowy w praktyce daje te same wyniki estymacji:
logit = 1,6 probit
Miary dopasowania modelu są identyczne.
7
D. Ciołek
Etapy budowy modelu

Zebranie danych i kodowanie zmiennych jakościowych.

Kontrola braków danych – w niektórych przypadkach braki danych
są równie ważne jak zebrane informacje.

Identyfikacja i kontrola obserwacji nietypowych (outliers).

Sprawdzenie zmiennych objaśniających, jak silnie wyjaśniają
zmienność zmiennej objaśnianej – siła predykcyjna, jakość
zmiennych.

Sprawdzenie , czy nie zachodzi zbyt wysoka korelacja między
wybranymi zmiennymi objaśniającymi – bliska współliniowość.

Oszacowanie modelu.

Ocena dobroci dopasowania.

Interpretacja.

Wykorzystanie – prognozowanie, symulacje
8
D. Ciołek
Interpretacja wyników oszacowania
Jaka jest wrażliwość prawdopodobieństwa
pi na zmienne objaśniające?
1) Znak oszacowania parametru przy danej zmiennej X określa kierunek
wpływu X na Y (dodatni – wzrost szans, ujemny – spadek szans).
2) Efekty krańcowe – najczęściej wyliczane są dla średnich wartości
wszystkich zmiennych objaśniających.
3) tzw. ilorazy szans (odds ratio) – exp()-1 mówi o ile procent
wzrasta prawdopodobieństwo sukcesu (Y=1), jeżeli zmienna przez tym
parametrze wzrośnie o jednostkę.
4) Wyliczając wartości teoretyczne (wartości przewidywane) możemy
określić prawdopodobieństwo sukcesu (Y=1) dla poszczególnych
przypadków.
9
D. Ciołek
Sprawdzenie dopasowania modelu

Istotność statystyczna poszczególnych parametrów –
statystyka z o rozkładzie normalnym N(0,1)

Istotność całego modelu – test ilorazu wiarygodności
Hipoteza zerowa w tym teście mówi, że wszystkie parametry przy zmiennych
równają się zero, czyli, że prawdziwy jest model tylko z wyrazem wolnym.

Normalność rozkładu reszt

Dopasowanie modelu do danych rzeczywistych:
- pseudo-R2 (np. R2 McFaddena) – wyższe wartości świadczą o
lepszym dopasowaniu
- tablica trafności
- krzywa ROC (a dokładniej pole powierzchni pod krzywą ROC
– więcej niż 0,5 oznacza klasyfikację lepszą niż losowa)
- kryterium Akaike’a (AIC) – do porównania różnych modeli
10
D. Ciołek
Tablica trafności






wszystkie przypadki z wartościami przewidywanymi
(prawdopodobieństwami) mniejszymi lub równymi 0,5 są
zaklasyfikowane jako y=0,
te z wartościami przewidywanymi większymi od 0,5 jako y=1.
iloraz szans (Statistica) oblicza się jako stosunek iloczynu
poprawnie zaklasyfikowanych przypadków do iloczynu
niepoprawnie zaklasyfikowanych przypadków.
ilorazy szans większe od 1 wskazują, że klasyfikacja jest lepsza od
klasyfikacji losowej.
im większy iloraz szans tym lepiej dopasowany model.
procent trafnych prognoz (% poprawnych) – liczba wszystkich
trafnych klasyfikacji do liczby wszystkich przypadków razy 100 –
tzw. zliczeniowy R2
11
D. Ciołek
Dobór próby do modelu logitowego

Model opisuje na ogół zjawiska (Y=1), dla których częstość
występowania zdecydowanie różni się od 50%. Np.:
- N1 firm jest zagrożonych finansowo (Y=1)
- N2 firm nie jest zagrożonych finansowo (Y=0).

W tym przypadku N1 jest diametralnie mniejsza niż N2.
Najczęściej w celu zapewnienia wyrazistości próby spośród obu
grup firm losujemy n1 i n2 jednostek w taki sposób, aby zapewnić
n1=n2. Oznacza to, że próba nie jest losowa lecz jest to tzw.
próba dobierana.
Proponowane są dwa rozwiązania:

Ważony estymator parametrów (estymator Manskiego-Lermana)

Wystarczy jedynie korekta wyrazu wolnego (Maddala 1983)

Zaleca, aby brać do analizy przynajmniej około 10 do 20 razy więcej
przypadków (obserwacji, pomiarów, respondentów) niż występuje w
niej zmiennych (pytań). W przeciwnym wypadku oceny linii regresji
będą bardzo niestabilne i będą się silnie zmieniać wraz ze wzrostem
12
liczby przypadków.
D. Ciołek
Obserwacje nietypowe (outliers)

Z definicji nietypowe i występują rzadko – obserwacja odstająca

Związek między zmienną objaśnianą a objaśniającą dla danej
obserwacji jest inny niż dla reszty obserwacji w zbiorze danych.

Uwzględnienie w analizie obserwacji nietypowych może zaburzyć
wyniki.

Szczególnie mało odporne są metody i współczynniki bazujące na
założeniu rozkładu normalnego i zależnościach liniowych, takie
jak korelacja Pearsona, regresja liniowa, analiza korespondencji,
itp.

Nawet jedna obserwacja nietypowa może znacząco zmienić
wartość i znak współczynnika kierunkowego linii regresji lub
współczynnika korelacji.

Zazwyczaj zakładamy, że obserwacje nietypowa reprezentują błąd
losowy, który chcielibyśmy kontrolować

Stosuje się testy diagnostyczne wykrywające obserwacje
nietypowe oraz tzw. obserwacje wysokiej dźwigni (leverage)
13
D. Ciołek
Wykrywanie obserwacji nietypowych

Nie istnieje jedna powszechnie stosowana metoda automatycznego
usuwania odstających obserwacji - zdefiniowanie tego, co uznajemy
za obserwację nietypową, jest sprawą subiektywną (i taką musi
pozostać) i decyzję o identyfikacji odstających obserwacji musi badacz
podejmować indywidualnie opierając się na swoim doświadczeniu oraz
powszechnie akceptowanej praktyce w danej dziedzinie badań.

Niektórzy badacze używają podejścia ilościowego: Na przykład
wykluczają obserwację, która wychodzi poza przedział obejmujący ±2
odchylenia standardowe (lub nawet ±1,5 odchylenia standardowego)
od wartości średniej grupowej.

Popularnym sposobem wykrywania obserwacji odstających jest
stworzenie wykresu ramkowego (skrzynkowego) – tzw. wykres
ramka-wąsy

Test Grubbsa - polega na wyliczeniu jak daleko potencjalna
obserwacja odstająca znajduje się od pozostałych wartości w zbiorze
danych. Statystyka testu Grubbsa (G) - stosunek największego
bezwzględnego odchylenia od średniej wartości z próby do odchylenia
standardowego próby.
14
D. Ciołek
Przykład 1
Modelowanie zagrożenia finansowego i
bankructwa
15
D. Ciołek
Metody oceny ryzyka upadłości

Klasyczna analiza wskaźnikowa jednowymiarowa

Analiza dyskryminacyjna: np. Z-score Altmana

Mikroekonometria finansowa – analiza logitowa:
- modele dwumianowe
- modele wielomianowe

Modele czasu trwania (duration)

Sieci neuronowe

Drzewa decyzyjne, klasyfikacyjne

Teoria chaosu

Algorytmy genetyczne
16
D. Ciołek
Zagrożenie finansowe
(financial distress, corporate insolvency)
* Całkowite zdrowie przedsiębiorstwa – sytuacja najlepsza
* Zagrożenie finansowe – sytuacja pośrednia
* Upadłość (bankructwo) - sytuacja ostateczna

Kategoria płynna i dynamiczna

Brak obiektywnej miary takiego zagrożenia
Należy wyraźnie rozdzielić
modelowanie upadłości
od modelowania zagrożenia finansowego
17
D. Ciołek
Zagrożenie upadłości a upadłość

W sytuacji bankructwa lub wniosku o ustalenie bankructwa rzecz
jest zero-jedynkowa – złożenie formalnego wniosku o upadłość

Wniosek o upadłość wcale nie oznacza, że firma faktycznie
kwalifikuje się do upadłości – ostatnio coraz częściej upadłość jest
sposobem na przetrwanie/uratowanie/przekształcenie/zmianę
własności

W Polsce definiuje się tzw. „upadłość na własne życzenie” – szacuje
się, że jedynie 10% upadłości w Polsce to bankructwa faktyczne.

Badania zagrożenia finansowego powinno być znacznie ważniejsze
niż badanie upadłości:
Firma zagrożona finansowo – określone prawdopodobieństwo
zaprzestania działalności i dalszego funkcjonowania
Firma określona przez sąd jako upadała – przestaje działać,
ale perspektywy jej dalszego funkcjonowania mogą być całkiem
dobre.
18
D. Ciołek
Metoda określenia
zagrożenia/niewydolności finansowej

Problemy finansowe – trudno jednoznacznie ustalić
(pomijając nawet problem zatajania faktycznego stanu)

W literaturze spotyka się od 2 do 5 stanów zagrożenia finansowego

Odmienna definicja zmiennej objaśnianej – model dwumianowy lub
wielomianowy uporządkowany

Pytanie: W jaki sposób „mierzyć zagrożenie finansowe – gdzie leży
punkt odcięcia pomiędzy firmą z kłopotami a firmą bez kłopotów?
19
D. Ciołek
Model 1.

Platt i Platt (2006)
Model dwumianowy:
yi=1 jeżeli i-ta firma jest finansowo zagrożona
yi=0 jeżeli i-ta firma jest finansowo zdrowa

Punkt odcięcia pomiędzy firmą zagrożoną a nie zagrożoną:
jednocześnie ujemne wartości EBITDA, EBIT i zysku netto

Próba składała się z 276 firm zagrożonych i 1127 firm pozostałych

Informacje o firmach z lat 1999 i 2000

Pięć zmiennych objaśniających:
1. rentowność sprzedaży = (zysk netto+amortyzacja)/sprzedaż
2. rentowność aktywów = EBITDA/aktywa ogółem
3. stopa zadłużenia = bieżąca rata kapitałowa zadłużania
długookresowego/aktywa ogółem
4. zdolność spłaty odsetek = zysk netto skorygowany/odsetki
5. Stopa wysokiej płynności = (majątek obrotowy – zapasy)/
zobowiązania krótkoterminowe
20
D. Ciołek
Model 1.

cd
Wymienione czynniki objaśniające obliczono jako odchylenia od
średnich wartości wskaźników w każdej z 14 analizowanych branż –
co w pewnym stopniu pozwoliło uchwycić zróżnicowanie pomiędzy
branżami (specyfikę poszczególnych branż).
Ze znaków oszacowań parametrów wynika, że:
 Zagrożenie finansowe jest mniejsze przy:
- większych przepływach pieniężnych
- większym operacyjnym zysku
- większym pokryciem odsetek
 Zagrożenie finansowe jest większe przy:
- większym lewarowaniu
- większej płynności
21
D. Ciołek
Ograniczenia

Badania statystyczno-ekonometryczne opierają się na próbach
statystycznych, które nie odzwierciedlają sytuacji bieżącej, ale
sytuację sprzed jakiegoś czasu – wnioski mają operacyjne
opóźnienie.

Oznacza to, że gdyby na podstawie takiego badania podejmować
szybkie decyzje operacyjne (na przykład decyzje inwestycyjne),
takie decyzje mogą nie być trafne.

Dlatego korzystne w przypadku modeli upadłości warto
wykorzystać dane o zmiennych objaśniających z okresów
poprzedzających:
prawdopodobieństwo upadłości firmy w roku t może być
objaśnione za pomocą zmiennych objaśniających z roku
poprzedniego (t-1) z przed dwóch lat (t-2) lub z przed
trzech lat (t-3).
22
D. Ciołek
Model 2
Ciesielski (2005)

Próba 120 firm, z których 60 sklasyfikowano jako upadłe (orzeczenia
sądowe bankructwa ogłoszone w „Monitorze Sądowym i Gospodarczym”)

Informacje o tych firmach pochodziły z lat 2000-2002

Próba podzielona na część bazową (40 bankrutów i 40
niebankrutów) oraz część walidacyjną (kontrolnej) (20 bankrutów i
20 niebankrutów)

Zmienne objaśniające:
PMO – wskaźnik pokrycia majątku obrotowego kapitałem krótkoterminowym
(rezerwy i zobowiązania krótkoterminowe/aktywa obrotowe
NKA – nadwyżka/niedobór kapitału obrotowego dzielona przez aktywa
ogółem
KA – wskaźnik udziału kapitału obrotowego w finansowaniu aktywów ogółem
(kapitał obrotowy/suma aktywów)
BP – wskaźnik bieżącej płynności finansowej
RZ – rotacja zobowiązań
23
D. Ciołek
Model 2
Ciesielski (2005) cd
OZ – wskaźnik ogólnego zadłużenia (zobowiązania ogółem/aktywa ogółem)
PO – wskaźnik pokrycia odsetek zyskiem
WO – wskaźnik wydajności operacyjnej majątku ogółem (przepływy
pieniężne z działalności operacyjnej netto/aktywa ogółem)
ROA – wskaźnik rentowności majątku
KWA – wskaźnik pokrycia majątku kapitałem własnym (kapitał własny plus
zobowiązania długoterminowe/aktywa ogółem).

Model był szacowany dla wielu różnych kombinacji zmiennych
objaśniających.

Wybrano te, które okazały się najlepiej przyporządkowywać firmy,
które znalazły się w grupie walidacyjnej (najlepszy: 83%).
24
D. Ciołek
Przykład 2
Modele scoringowe
25
D. Ciołek
Modele scoringowe
Wykorzystywane np.:

do oceny wiarygodności klientów lub kontrahentów (np.
firmy telekomunikacyjne kredytujące swoich klientów
oferując im telefony za złotówkę)

do wykrywania prób wyłudzeń – ograniczenie strat
generowanych przez nieuczciwych klientów

w windykacji możliwość oceny prawdopodobieństwa
odzyskania należności oraz wybór najskuteczniejszej
metody windykacyjnej

w procesie utrzymania klienta wskazują osoby najbardziej
zagrożone odejściem

we wsparciu procesów sprzedaży wskazując osoby, które z
największym prawdopodobieństwem odpowiedzą na ofertę
poszczególnych produktów
26
D. Ciołek
Scoring ma zastosowanie
gdy chcemy podzielić naszych klientów na kategorie:

spłaci zobowiązanie / nie spłaci

odpowie na ofertę / nie odpowie

przyniesie zysk / nie będzie dochodowy

zagrożony odejściem / pozostanie klientem
Na podstawie cech klienta np. demograficznych,
behawioralnych, budujemy model, który przewiduje
prawdopodobieństwo przynależności do pożądanej przez nas
kategorii.
27
D. Ciołek
Metody
Na podstawie zachowań klientów w przeszłości (dane historyczne)
określamy pewne wzorce zachowań, które następnie można
zastosować dla nowych klientów.

karty scoringowe

regresja logistyczna

drzewa klasyfikacyjne

sieci neuronowe

metoda wektorów nośnych

k-najbliższych sąsiadów
28
D. Ciołek
Etapy budowy modelu scoringowego

Przygotowanie danych historycznych

Kodowanie danych – oznaczenie odpowiednich kategorii np.
kupił/nie kupił

Wybór zmiennych objaśniających (predyktorów) – budujemy
ranking zmiennych i wybieramy tylko te, które są w sposób
istotny powiązane z modelowanym zjawiskiem

Podział zmiennych na przedziały – dyskretyzacja zmiennych (np.
algorytm CHAID)

Oszacowanie modelu np. regresji logitowej

Budowa modelu – np. zamiana modelu regresji logitowej na kartę
scoringową

Ocena dobroci dopasowania modelu

Wykorzystanie modelu

Monitoring - po jakimś czasie model wymaga aktualizacji
29
D. Ciołek
Ocena dobroci dopasowania modelu

Wskaźnik IV (Information Value)

KS – wskaźnik Kołmogorowa-Smirnowa

Wskaźnik GINI

dywergencja

Wskaźnik Hosmera-Lemeshowa

AUC – pole powierzchni pod krzywą ROC

Lift
30