5. Zagadnienia klasyfikacji

Transkrypt

5. Zagadnienia klasyfikacji
Andrzej Pacut
SNUP
sem. letni 2003/2004
5. Zagadnienia klasyfikacji
5-1 Obiekty i obrazy
5-2 Cechy
5-3 Klasyfikacja obrazów
5-4 Funkcje decyzyjne
5-5 *Klasyfikacja obiektów a klasyfikacja obrazów
5-6 *Problem niejednoznaczności obserwacji
5-7 *Niejednoznaczne dziedziczenie klas
5-8 *Dziedziczenie probabilistyczne
5-9 Klasyfikacja binarna a funkcje logiczne
5-10 Klasyfikacja liniowa
5-11 Najprostsze klasyfikacje nieliniowe
5-12 Liczba klasyfikacji liniowych N obrazów w Rn
5-13 Liczba klasyfikacji liniowych - przykład
19 maja 2004
5. Zagadnienia klasyfikacji
5-0
Andrzej Pacut
SNUP
sem. letni 2003/2004
5-14 Liczba binarnych klasyfikacji liniowych
5-15 Klasyfikatory liniowe
5-16 Liniowe klasyfikatory binarne
5-17 *Kontekst probabilistyczny
5-18 Budowa klasyfikatorów — dostępna informacja
19 maja 2004
5. Zagadnienia klasyfikacji
5-0
Andrzej Pacut
SNUP
sem. letni 2003/2004
Obiekty i obrazy
• zbiór obiektów
S
• funkcja obserwacji
• zbiór obrazów U
ϕ : S 7→ U
• zwykle U ⊂ Rn
n – liczba czujników, liczba punktów obrazu
• obraz u = [u1 · · · un ]T ∈ U
• obraz binarny, obraz czarno-biały
ui ∈ {L, H}; (zwykle {0, 1})
19 maja 2004
5. Zagadnienia klasyfikacji
5-1
Andrzej Pacut
SNUP
sem. letni 2003/2004
Cechy
• zbiór wektorów cech
U ∗ ⊂ Rn∗
• funkcja cech ϕ∗ : U 7→ U ∗
• zmodyfikowana funkcja obserwacji ϕ∗ ϕ : S 7→ U ∗
19 maja 2004
5. Zagadnienia klasyfikacji
5-2
Andrzej Pacut
SNUP
sem. letni 2003/2004
Klasyfikacja obrazów
• funkcja klasyfikująca
ℓ(u) = k ⇐⇒ u ∈ Uk
• funkcje przynależności
do klasy Uk , k = 1, . . . , c
χk (u) = 1 ⇐⇒ u ∈ Uk
χk (u) = 0 ⇐⇒ u ∈
/ Uk
• zbiór decyzyjny
P
D = k ∂ Uk
19 maja 2004
5. Zagadnienia klasyfikacji
5-3
Andrzej Pacut
SNUP
sem. letni 2003/2004
Funkcje decyzyjne
• funkcja klasyfikująca ℓ
• funkcje decyzyjne
ℓ(u) = k ⇐⇒ dk (u) > dj (u) dla j 6= k
• funkcje przynależności χk są funkcjami decyzyjnymi
19 maja 2004
5. Zagadnienia klasyfikacji
5-4
Andrzej Pacut
sem. letni 2003/2004
SNUP
*Klasyfikacja obiektów a klasyfikacja obrazów
• klasy obiektów Si
• dziedziczone klasy obrazów Ui = ϕ(Si )
• dziedziczenie jednoznaczne Ui ∩ Uj = ∅ for i 6= j
• klasyfikacja obrazów a klasyfikacja obiektów:
19 maja 2004
u ∈ Uk
5. Zagadnienia klasyfikacji
⇐⇒
s ∈ Sk
5-5
Andrzej Pacut
SNUP
sem. letni 2003/2004
*Problem niejednoznaczności obserwacji
• obraz u
• funkcja obserwacji może nie być odwracalna: niejednoznaczności obserwacji
• przeciwobraz ϕ−1 (u) obrazu u: zbiór obiektów mających ten sam obraz u
s ∈ ϕ−1 (u) ⇐⇒ ϕ(s) = u
• klasy dziedziczone rozłączne: obiekty mające ten sam obraz należą do tej samej
klasy
• klasy dziedziczone mogą nie być rozłączne
19 maja 2004
5. Zagadnienia klasyfikacji
5-6
Andrzej Pacut
SNUP
sem. letni 2003/2004
*Niejednoznaczne dziedziczenie klas
• niejednoznaczność, jeżeli Ui ∩ Uj 6= ∅
• χ przyjmuje wartości z (niezerowych) wierzchołków kostki jednostkowej
19 maja 2004
5. Zagadnienia klasyfikacji
5-7
Andrzej Pacut
SNUP
sem. letni 2003/2004
*Dziedziczenie probabilistyczne
• rozkład obiektów P
• funkcja przynależności w U:
χk (u) = P{s ∈ Sk }
• χ przyjmuje wartości z kostki jednostkowej
19 maja 2004
5. Zagadnienia klasyfikacji
5-8
Andrzej Pacut
sem. letni 2003/2004
SNUP
Klasyfikacja binarna a funkcje logiczne
• N =4
(4 obrazy)
• U ⊂ R2
(obrazy złożone z 2 punktów)
• c=2
(klasyfikacje binarne)
6−
e
+
u
6+
u
+
u
+
6
u
−
e
+
6
u
−
e
−
e
−
e-
−
e
+
u-
+
u
−
e-
−
e
+
u-
u1 AND u2
19 maja 2004
u1 OR u2
NOT u1
5. Zagadnienia klasyfikacji
u1 XOR u2
5-9
Andrzej Pacut
SNUP
sem. letni 2003/2004
Klasyfikacja liniowa
• hiperpłaszczyzna H(w, b) = {u ∈ Rn : wT u + b = 0}
w – wektor normalny, b — przesunięcie
• podprzestrzeń dodatnia U+ (w, b) = {u ∈ Rn : wT u + b > 0} względem
hiperpłaszczyzny H(w, b)
podprzestrzeń ujemna U− (w, b)
• klasyfikacja liniowa: dowolne dwie klasy można rozdzielić hiperpłaszczyzną
19 maja 2004
5. Zagadnienia klasyfikacji
5-10
Andrzej Pacut
sem. letni 2003/2004
SNUP
Najprostsze klasyfikacje nieliniowe
3 obrazy w R, 2 klasy
+ − +
u
e
u-
− + −
e
u
e-
4 obrazy binarne w R2 , 2 klasy
19 maja 2004
6+
u
−
e
−
6
e
+
u
−
e
+
u-
+
u
−
e-
5. Zagadnienia klasyfikacji
5-11
Andrzej Pacut
sem. letni 2003/2004
SNUP
Liczba klasyfikacji liniowych N obrazów w Rn
• liczba klasyfikacji liniowych ≤ L(N, n) (< dla szczególnych usytuowań obrazów)

2N
for N ≤ n + 1 (“mało obrazów”)
L(N, n) =
N −1
2 Pn
for N ≥ n + 1
i=0
i
• liczba klasyfikacji liniowych / liczba klasyfikacji binarnych ≤

N
1
≤1
dla n+1
L(N, n)
r(N, n) =
=
P
N −1
21−N n
B(N )
dla N ≥ 1
i=0
i
n+1
r(N,n)
1
64
0.9
4
256
16
n=1
0.8
0.7
0.6
n = 1, 4, 16, 64, 256
0.5
0.4
0.3
0.2
polowa klasyfikacji
liniowa
0.1
0
0
1
2
3
4
N / (n+1)
• dla co najwyżej N0 = n + 1 obrazów w Rn wszystkie klasyfikacje mogą być liniowe
• dla Nv = 2(n + 1) obrazów w Rn co najwyżej połowa klasyfikacji jest liniowa
Nv : pojemność klasyfikacji liniowych w Rn
19 maja 2004
5. Zagadnienia klasyfikacji
5-12
Andrzej Pacut
sem. letni 2003/2004
SNUP
Liczba klasyfikacji liniowych - przykład
N =
2
N =
3
N =
4
N =
5
N =
6
N =
7
N =
8
wszystkie liniowe
pojemność
••
•••
• • ••
••••
•
••••
••
••••
•••
••••
• • ••
B(N )
4
8
16
32
64
128
256
R1
*4
6
•8
10
12
14
16
2
4
R2
4
*8
14
22
•32
44
58
3
6
R3
4
8
*16
30
52
84
•128
4
8
R4
4
8
16
*32
62
114
198
5
10
R5
4
8
16
32
*64
126
240
6
12
lewa + górna lewa
L(N, n) = L(N − 1, n) + L(N − 1, n − 1)
19 maja 2004
5. Zagadnienia klasyfikacji
5-13
Andrzej Pacut
sem. letni 2003/2004
SNUP
Liczba binarnych klasyfikacji liniowych
19 maja 2004
liczba
max. liczba
liczba
liczba
ułamek
punktów
obrazów
klasyfikacji
klasyfikacji
klasyfikacji
obrazu
binarnych
binarnych
liniowych
liniowych
n
N = 2n
B(N ) = 2N
L(N, n)
r = L/B
2
4
16
14
0.875
3
8
256
128
0.500
4
16
65536
3882
0.059
5
32
4.3 109
412736
9.6 10-5
8
256
1077
1015
10-63
16
65536
1019728
1064
10-19664
5. Zagadnienia klasyfikacji
5-14
Andrzej Pacut
SNUP
sem. letni 2003/2004
Klasyfikatory liniowe
• afiniczne funkcje decyzyjne dk (u) = bk + wkT u, k = 1, . . . , c


b1 + w1T u


..


d(u) = 
 = b + W u = Wu
.


T
bc + wc u
• afiniczne funkcje decyzyjne ⇒ klasy liniowo rozdzielne
klasy liniowo rozdzielne ⇒ istnieją afiniczne funkcje decyzyjne
• funkcje decyzyjne są porównywane parami (liczbę wierszy W można zmniejszyć o
jeden)
bi + wiT u > bj + wjT u
⇔
b + wT u > 0
gdzie w = wi − wj , b = bi − bj
19 maja 2004
5. Zagadnienia klasyfikacji
5-15
Andrzej Pacut
sem. letni 2003/2004
SNUP
Liniowe klasyfikatory binarne

T
b+ + w+
u


• binarny klasyfikator liniowy d(u) = 
T
b− + w− u

−1
ℓ(u) =
1
jeśli wT u + b < 0
jeśli wT u + b > 0
gdzie w = w+ − w− , b = b+ − b−
• zmodyfikowana funkcja decyzyjna – porównywana z zerem
d(u) = b + wT u
• hiperpłaszczyzna klasyfikująca H(w, b) = {u : d(u) = 0}
19 maja 2004
5. Zagadnienia klasyfikacji
5-16
Andrzej Pacut
SNUP
sem. letni 2003/2004
*Kontekst probabilistyczny
• jeśli ϕ(Si ) ∩ ϕ(Sj ) 6= ∅ to klasyfikacja nie jest jednoznaczna.
• dodatkowo znana miara probabilistyczne P na S
– rozkład obrazów w ramach każdej klasy (ciągły)
fu | k (z) dz = P(z ≤ u ≤ z + dz | s ∈ Sk )
– rozkład a priori klas {πk , k = 1, . . . , c}, gdzie πk = P{s ∈ Sk }
• znany obraz u; rozkład a posteriori klas
πk | u = P{s ∈ Sk | u}
(reguła Bayesa) =
πk fu | k (u)
πk fu | k (u)
= Pc
fu (u)
i=1 πi fu | i (u)
• klasyfikacja w zbiorze obrazów
– funkcja decyzyjna: dk (u) = πk | u klasyfikator bayesowski
– równoważna f.d: dk (u) = πk fu | k (u)
• dla dyskretnego rozkładu obrazów: pj | k = P(u = j | s ∈ Sk )
πk pj | k
πk p j | k
= Pc
πk | j =
pj
i=1 πi pj | i
19 maja 2004
5. Zagadnienia klasyfikacji
5-17
Andrzej Pacut
sem. letni 2003/2004
SNUP
Budowa klasyfikatorów — dostępna
informacja
19 maja 2004
• liczba klas c znana
• liczba klas c znana lub nie
• przykład uczący (ui , ℓ(ui ))
• przykład uczący ui (klasa nieznana)
• zbiór uczący (zbiór trenujący)
UL = ui , ℓ(ui ) , i = 1, . . . , N
• zbiór uczący
UL = {ui , i = 1, . . . , N }
5. Zagadnienia klasyfikacji
5-18