Klasyfikacja obiektów

Transkrypt

Klasyfikacja obiektów
PRZETWARZANIE OBRAZÓW CYFROWYCH
DWICZENIE 13
KLASYFIKACJA OBIEKTÓW
CEL DWICZENIA
Celem dwiczenia jest zapoznanie studentów z ideą klasyfikacji obiektów na podstawie informacji wizualnej na
przykładzie klasyfikatora k-NN (ang. k-nearest neighbor)
ZAŁOŻENIA ZWIĄZANE Z REALIZACJĄ DWICZENIA
Przy realizacji dwiczenia należy przyjąd następujące założenia upraszczające dotyczące stosowanych obrazów:

na jednym obrazie występuje tylko jeden obiekt — oznacza to, że obiekty mogą nie byd spójne,

przedmiotem analizy są obrazy binarne.
PROGRAM DWICZENIA
1.
Należy ustalid minimum trzy klasy abstrakcji. Każdą klasę abstrakcji powinno reprezentowad
przynajmniej pięd obrazów. Obrazy mogą zostad przygotowane przy wykorzystaniu programów
graficznych lub też w wyniku przetwarzania zdjęd rzeczywistych obiektów (preferowany sposób).
2.
Zaimplementuj klasyfikator k-NN.
3.
Wykorzystując wiedzę z dwiczenia 12 zaproponuj dwie cechy niezmiennicze pozwalające Twoim
zdaniem najlepiej sklasyfikowad wybrane klasy obiektów. Swój wybór uzasadnij.
4.
Oceo przydatnośd wybranych przez Ciebie cech niezmienniczych do rozróżniania wybranych przez
Ciebie klas abstrakcji. Zwród uwagę ma związki pomiędzy rodzajem rozpoznawanych obiektów
a rodzajem stosowanych cech niezmienniczych.
5.
Czy jedna cecha jest wystarczająca do prawidłowej klasyfikacji obiektów do wybranych przez Ciebie
klas abstrakcji? Przeanalizuj jak na jakośd klasyfikacji wpłynie zastosowanie trzech lub więcej cech.
Oceo jak w ogólnym przypadku może wpływad długości wektora cech na możliwości rozpoznawania
różnych klas obiektów.
6.
Czy istnieje jakaś cecha niezmiennicza (lub ich zestaw), która dla k=1 pozwala na prawidłową
klasyfikację obiektów? Co daje zwiększenie wartości k? Oceo jak na wynik klasyfikacji wpływa dobór
wartości k i rodzaj stosowanej metryki. Zastanów się, czy stosowane przez Ciebie metryki dadzą dobre
wyniki w przypadku bardzo dużych różnic pomiędzy zakresami wartości cech niezmienniczych dla
różnych klas abstrakcji? Przedstaw metrykę, która sprawdzi się w takim przypadku.
7.
Utwórz dodatkowe obrazy z obiektami, które nie są identyczne z obiektami stosowanymi do tej pory.
Przeprowadzid klasyfikację tych obiektów przy pomocy klasyfikatorów opracowanych w ramach
punktów 1–6. Oceo uzyskane wyniki klasyfikacji.
UWAGI DO SPRAWOZDANIA
1.
Swoje odpowiedzi na postawione pytania uzasadnij.
2.
Sprawozdanie powinno zawierad:
 obrazy wzorcowe z opisem do jakich klas należą,
 wzory cech niezmienniczych i ich wartości dla każdego obiektu wzorcowego,
 przykłady działania klasyfikatorów dla różnych metryk i różnych wartości k,
 analizę wpływu metryki i wartości k na działanie klasyfikatora k -NN,
3.
Sprawozdanie najlepiej przesład w postaci skompresowanego katalogu o nazwie zgodnej z zasadami
nazywania sprawozdao obowiązującymi na laboratorium POC. Przesłany katalog powinien zawierad:
 plik sprawozdania w formacie PDF,
 katalog z obrazami testowymi,
 katalog z obrazami wynikowymi,
 katalog z opracowanymi m-plikami.
ZAŁĄCZNIK 1:
UWAGI NA TEMAT KLASYFIKATORA K-NN
Klasyfikator typu k-NN jest klasyfikatorem minimalno-odległościowym — za klasę, do której należy obiekt
oi przyjmuje się klasę najliczniej występującą wśród k najbliższych sąsiadów punktu pi reprezentującego
obiekt oi w przestrzeni cech.
Uwagi dodatkowe:

w zadaniu klasyfikacji obiektów do c  2 klas przyjmuje się k jako dodatnią liczbę nieparzystą
( k  2n  1 dla n
) — w ten sposób unika się wystąpienia w k-elementowym wektorze si
sąsiadów punktu pi takiej samej liczby punktów należących do każdej z klas,

klasę najliczniej występującą w wektorze si dla c  2 i k  2n  1 można określid znajdując
medianę wektora si ,

w przypadku większej liczby klas ( c  2 ) powyższe rozwiązania nie dają gwarancji prawidłowego
określenia przynależności obiektu oi do jednej z klas,

w przypadku stosowania przestrzeni cech o więcej niż jednym wymiarze ( d  1 , liczba ta jest
równa liczbie cech stosowanych do klasyfikacji) należy zwrócid uwagę na to by odległości
mierzone dla poszczególnych wymiarów miały podobny rząd wielkości — w przeciwnym
przypadku odległości mierzone dla niektórych wymiarów nie będą wpływad na wynik klasyfikacji
(zastanów się dlaczego) — spełnienie tego warunku można zapewnid na kilka sposobów:
o
normalizując wartości poszczególnych cech,
o
odpowiednio dobierając wagi wi w przypadku stosowania metryk unormowanych,
o
normalizując wartości pomiaru odległości dla poszczególnych cech — można to osiągnąd
stosując np. iloraz  xi  yi  max  xi , yi  zamiast różnicy xi  yi ,
o
stosując metryki dające znormalizowany zakres odległości — przykładem takiej metryki
jest np. metryka Canberra
d
xi  yi
i 1
xi  yi
dCanberra  x, y   
.