Pełny tekst

Transkrypt

Pełny tekst

Wojciech CZECH
METODY GENERACJI I SELEKCJI
CECH GRAFU W ROZPOZNAWANIU
ZDJĘĆ SATELITARNYCH*)
STRESZCZENIE
W pracy tej przedstawiona została nowa metoda
rozpoznawania zdjęć satelitarnych i lotniczych w oparciu o ich reprezentację w postaci grafów ważonych przekształcanych następnie na
wektory cech za pomocą deskryptorów takich jak ważony współczynnik gronowania lub rozziew wag. Porównanie nowej metody z algorytmami bazującymi na czysto topologicznej reprezentacji cech obrazu pokazuje jej większą skuteczność w procesie rozpoznawania. Testy
zostały przeprowadzone na zbiorach zdjęć satelitarnych uzyskanych
przy pomocy programu Google Earth oraz z bazy CMU/VASC.
Słowa kluczowe: grafy ważone, porównywanie grafów, grafowa
reprezentacja obrazu
1. WSTĘP
Szeroki wachlarz zastosowań grafowych struktur danych, pozwalających
na wygodną reprezentację relacji pomiędzy obiektami, spowodował widoczny
w ostatnich latach rozwój nowych metod ich analizy. Badania występujących
w przyrodzie sieci złożonych, takich jak np. sieci wewnątrzkomórkowych lub
*)
Praca ta powstała przy wsparciu Ministerstwa Nauki i Szkolnictwa Wyższego, projekt nr 3
T11F 010 30.
mgr inż. Wojciech CZECH
e-mail: [email protected]
Akademia Górniczo-Hutnicza
Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki,
Katedra Informatyki
PRACE INSTYTUTU ELEKTROTECHNIKI, zeszyt 243, 2009
44
W. Czech
socjologicznych, przyniosły szereg znaczących rezultatów pozwalających na
zrozumienie natury procesów rządzących ich powstawaniem [1]. Wymienić tutaj
należy odkrycie takich własności sieci rzeczywistych, jak potęgowy rozkład
stopni wierzchołków (scale-freeness), własność małego świata (small-worldiness), wysoki współczynnik gronowania (clustering coefficient) i wiele innych
wpływających na odporność sieci na uszkodzenia lub efektywność propagacji
np. informacji [2]. Wyniki te posiadają szereg praktycznych zastosowań, takich
jak projektowanie nowych leków w oparciu o sieci metaboliczne [3, 4], przewidywanie struktury trzeciorzędowej białek z wykorzystaniem sieci fałdowania
protein [5], przewidywanie funkcji genów za pomocą sieci koekspresji genów [6]
lub określanie toksyczności związków chemicznych wykorzystujące grafową
reprezentację molekuł [7].
Równocześnie można zaobserwować wzrost zainteresowania grafami
w rozpoznawaniu wzorców. W szczególności grafowa reprezentacja zdjęć bądź
kształtów znalazła szereg zastosowań praktycznych [8]. Używając grafu jako
reprezentacji części informacji zawartej w obrazie zyskujemy niezmienność
względem skalowania, rotacji i translacji – własność pożądaną w procesach
rozpoznawania. Taka kombinatoryczna reprezentacja pośrednia wymaga jednak użycia metod porównywania grafów w celu wyznaczenia odległości pomiędzy obiektami, potrzebnej w standardowych metodach klasteryzacji i klasyfikacji.
Spora ilość dostępnych algorytmów porównywania grafów wynika ze
stosowania różnych typów grafów i różnych kryteriów oceny ich podobieństwa.
Grafy reprezentujące obiekty świata rzeczywistego mogą być ważone, skierowane, z etykietami przypisanymi do krawędzi lub wierzchołków, spójne bądź
niespójne. W zależności od dziedziny problemu możemy być zainteresowani
porównaniem określonej cechy strukturalnej grafu, wielu cech lub ogólnie
całości jego struktury, jak np. w przypadku grafowej reprezentacji zdjęć. Metody
porównywania grafów można podzielić na dwie grupy: metody wykorzystujące
reprezentację pośrednią w postaci np. wektora cech lub na algorytmy dokonujące bezpośredniego porównania dwóch obiektów, np. oparte na pojęciu grafowej odległości edycyjnej. Pierwsza z grup jest przydatna przy tworzeniu baz
danych grafów, w których koszt obliczeniowy zapytania jest zredukowany dzięki
możliwości wcześniejszego utworzenia wektorowych reprezentacji. Reprezentacja ta pozwala również na łatwe wykorzystanie klasycznych metod sztucznej
inteligencji, takich jak osadzanie grafów w przestrzeni o małym wymiarze za
pomocą metod MDS (Multidimensional Scaling), PCA (Principal Component
Analysis), LLE (Locally Linear Embedding) oraz algorytmów klasteryzacji i klasyfikacji. Po zastosowaniu grafowych funkcji kernela możliwe jest również
wykorzystanie nieliniowych metod typu kernel, takich jak klasyfikatory z rodziny
SVM (Support Vector Machines) lub Kernel PCA [8].
Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych
45
Transformacja obiektu kombinatorycznego, jakim jest graf, do wektora
cech jest operacją, w której część informacji o grafie zostaje utracona. Wynika
to przede wszystkim z trudności przejścia z obiektu o strukturze będącej niezmiennikiem izomorfizmu do obiektu, w którym kolejność elementów jest istotna,
a który powinien pozostać niezmiennikiem tego przekształcenia. Budowa wzajemnie jednoznacznego odwzorowania wektor – graf jest ciekawym, otwartym
problemem związanym z zagadnieniem poszukiwania izomorfizmu.
W niniejszej pracy opisana zostanie nowa metoda porównywania zdjęć
lotniczych w oparciu o ich grafową reprezentację, wykorzystująca ilościowe metody
oceny własności struktury sieci złożonych jako metodę generacji cech dla grafu.
W następnym rozdziale przedstawiona zostanie metoda transformacji
obrazu w graf ważony, wykorzystująca wykrywanie rogów [9] oraz triangulację
Delaunaya [10]. Następnie w rozdziale 3 omówiona zostanie generacja wektorów cech dla grafu. Rozdział 4 prezentuje przykładowe wyniki klasteryzacji
danych testowych. Praca zakończona będzie krótkim podsumowaniem.
2. GRAFOWA REPREZENTACJA OBRAZU
Transformacja obrazu zapisanego w postaci macierzy pikseli do kombinatorycznej danej, jaką jest graf, wymaga wskazania charakterystycznych elementów obrazu odpowiadających wierzchołkom, a następnie określenia relacji
pomiędzy tymi elementami, co jest równoznaczne z dodaniem krawędzi w grafie. Takimi elementami mogą być np. rogi, zdefiniowane jako przecięcie dwóch
krawędzi [10] lub obszary obrazu charakteryzujące się podobną jasnością,
będące rezultatem segmentacji obrazu. Praca ta wykorzystuje grafy budowane
na podstawie rogów. Współrzędne rogu wskazują obszar obrazu, w którym jego
intensywność zmienia się gwałtownie w dwóch prostopadłych do siebie kierunkach. Załóżmy więc, że rogi będą odpowiadać wierzchołkom grafu. W celu
zdefiniowania powiązań przestrzennych między rogami stosujemy triangulację
Delaunaya. Metoda ta tworzy krawędź między punktami, których komórki Voronoi sąsiadują, dlatego obszarom o dużym zagęszczeniu rogów odpowiadać
będą wierzchołki o wysokim stopniu. Położenie rogów jest istotną cechą obrazu,
wykorzystywaną często w zagadnieniach typu computer vision, szczególnie
przy poszukiwaniu transformacji jednego obrazu w drugi (np. dwie kolejne klatki
w filmie). Triangulacja Delaunaya [11] dokonuje generalizacji informacji zawartej
w rogach, a własności trójkątów będących jej rezultatem, np. rozkład prawdopodobieństwa ich pól powierzchni, dobrze odzwierciedlają ogólne cechy obrazu
46
W. Czech
– źródła. Na rysunku 1 przedstawiono przykładową transformację obrazu w graf
dla lotniczego zdjęcia zamku.
Rys. 1. Wykrywanie rogów oraz triangulacja Delaunaya:
A) detekcja rogów – metoda Harrisa, zdjęcie lotnicze zamku (baza danych CSM/VASC);
B) triangulacja Delaunaua – algorytm Watsona
Opisana wyżej metoda stosowana jest z powodzeniem przy testowaniu
metod porównywania grafów [12, 13]. W niniejszej pracy proponujemy jej rozszerzenie poprzez dodanie wag do krawędzi grafu. Wagi takie powinny zawierać dodatkową informację na temat przestrzennych relacji pomiędzy rogami.
Reprezentacja taka może być przydatna szczególnie w przypadku zdjęć lotniczych lub satelitarnych, w którym przestrzenne relacje pomiędzy obiektami, np.
budynkami w mieście, nie ulegają dużym zmianom. W celu wyznaczenia wagi
krawędzi bierzemy pod uwagę graf Delaunaya dla zbioru rogów obrazów.
Każda krawędź grafu związana jest z dwoma leżącymi naprzeciw niej kątami
(rys. 2C), które pozostają stałe dla różnych zdjęć tego samego obszaru, np. powierzchni ziemi. Słuszność tego założenia warunkowana jest czułością metody
wykrywania rogów i jej wrażliwością na szum. W szczególności, izolowane
punkty typu sól i pieprz mogą zostać potraktowane jako rogi, co pogorszy jakość takiej reprezentacji. Uniknąć tego efektu możemy poprzez wstępną filtrację
obrazu za pomocą filtra mediany oraz manipulując parametrami algorytmu
wykrywającego rogi, tak, aby rogi z mniejszą ilością głosów zostały odrzucone.
Waga krawędzi będzie funkcją f(α,β) dwóch leżących naprzeciw niej
kątów. W przypadku krawędzi leżących bezpośrednio na wypukłej otoczce zbioru rogów (brzeg), drugi z kątów taktujemy jako równy zero – wierzchołek trójkąta, który mu odpowiada, znajduje się w nieskończoności (nieograniczona komórka Voronoi). Przykładowo wybierając jako f maksimum z dwóch kątów,
większą wagę przykładać będziemy do krawędzi łączącej punkty, których odległość jest dużo większa od trzeciego punktu znajdującego się bliżej krawędzi.
Uzyskane w ten sposób wagi są w dalszej kolejności normalizowane tak, aby
zwierały się w przedziale [0, 1]. Na rysunku 2 przedstawiono schemat opisywanej metody przekształcenia zdjęcia w ważony graf.
47
Rys. 2. Schemat przekształcenia obrazu w graf ważony:
A) oryginalne zdjęcie; B) wykrywanie rogów – detektor Harrisa; C) triangulacja Delaunaya,
obliczenie wag krawędzi jako maksimum z dwóch kątów leżących naprzeciw krawędzi, normalizacja wag
3. WEKTORY CECH GRAFU
Porównania grafów dokonujemy w oparciu o wektory cech wygenerowane z zastosowaniem ilościowych metod analizy sieci złożonych. Spośród
wielu deskryptorów grafowych mierzących strukturalne własności sieci do generacji wektora cech zdecydowaliśmy się wykorzystać te, które można obliczyć
w krótkim czasie dla grafów o rozmiarze rzędu 500–1000 wierzchołków (złożoność obliczeniowa O n 2 lub mniejsza). Aby umożliwić porównanie wyników
( )
dla reprezentacji ważonej i bez wag, wybrany został podzbiór deskryptorów
obliczalnych dla obu typów grafów. Krótkie omówienie testowanego zbioru
deskryptorów przedstawione jest poniżej. We wszystkich definicjach przyjmujemy następujące oznaczenia:
• W oznacza macierz wag grafu taką, że: (W )ij = wij jest wagą krawędzi
(i, j ) , w przypadku grafów bez wag
W odpowiada macierzy adiacencji
i składa się wyłącznie z elementów 0 i 1,
• wk jest k-tą kolumną lub k-tym wierszem macierzy W ,
•
•
•
•
N jest zbiorem wierzchołków grafu,
e jest wektorem o wszystkich elementach równych 1,
n jest liczbą wierzchołków grafu,
N k oznacza zbiór sąsiadów wierzchołka k,
• d ij to długość najkrótszej ścieżki pomiędzy wierzchołkiem i oraz j, dla
grafów bez wag jest liczbą całkowitą.
48
W. Czech
Moc wierzchołka
sk = ∑ wkj
(1)
j∈N
Miara ta jest prostym rozszerzeniem stopnia wierzchołka dla grafów ważonych.
Ponieważ deskryptor ten jest skojarzony z wierzchołkiem grafu, do generacji
wektora cech wykorzystujemy statystyczne własności zbioru miar s k dla wszystkich wierzchołków, takie jak wartość średnia, odchylenie standardowe, skośność i kurtoza. Podobnie postępujemy dla pozostałych deskryptorów skojarzonych z wierzchołkami grafu.
Współczynnik gronowania
WCC k =
(W )
(e w ) −
3
kk
2
T
k
wk
2
(2)
2
Ważony współczynnik gronowania, zdefiniowany w pracy [7], jest lokalną miarą
pozwalającą stwierdzić, jaka jest gęstość wzajemnych połączeń między sąsiadami wierzchołka k. W przypadku gafów bez wag, wzór (2) daje ten sam wynik,
co klasyczna definicja określająca prawdopodobieństwo istnienia krawędzi pomiędzy dwoma sąsiadami wierzchołka k [2]. Ponieważ wartość tego deskryptora skorelowana jest z liczbą trójkątów w sieci, możemy oczekiwać, że będzie
on dobrze opisywał grafy będące rezultatem triangulacji.
Rozziew wag
⎡ wkj ⎤
Yk = ∑ ⎢ ⎥
j∈N k ⎣ s k ⎦
2
(3)
Deskryptor ten, opisany m.in. w pracy [2], pozwala stwierdzić, czy wagi krawędzi incydentnych z wierzchołkiem k są tego samego rzędu, czy może kilka
krawędzi dominuje, a pozostałe mają małe wagi. Jest to lokalna miara, której
rozkład prawdopodobieństwa niesie sporo informacji o grafie ważonym. Jest to
jedyny omówiony w tej pracy deskryptor, który ma sens jedynie dla grafów
z wagami.
49
Centralność wierzchołka
bi =
∑
j , k ∈N , j ≠ k
n jk (i )
n jk
(4)
n jk oznacza liczbę najkrótszych ścieżek łączących wierzchołki j oraz k, a n jk (i )
liczbę najkrótszych ścieżek łączących j oraz k, przechodzących przez wierzchołek i. Miara ta wywodzi się z obszaru sieci socjologicznych i określa ważność
danego wierzchołka z punktu widzenia propagacji informacji (po najkrótszych
ścieżkach) [2]. Niejednorodne wagi krawędzi zmieniają najkrótsze ścieżki,
zarówno pod względem ich długości, jak sekwencji wierzchołków, z których się
składają. Deskryptor ten może być obliczany dla grafów z wagami i bez.
Efektywność
E=
1
∑ d ij
n( n − 1) i , j∈N ,i ≠ j
(5)
Efektywność sieci [2] to średnia harmoniczna długości najkrótszych ścieżek
pomiędzy parami wierzchołków. Zgodnie ze swoją nazwą, mierzy ona pojemność informacyjną sieci i jej zdolność do przekazywania informacji. Zawiera się
w przedziale [0, 1], osiągając największą wartość dla grafu pełnego.
Efektywność lokalna
Eloc =
1
∑ E (Gi )
n i∈N
(6)
Deskryptor ten jest średnią arytmetyczną efektywności [patrz równanie (5)] grafów utworzonych z sąsiadów każdego z wierzchołka i oraz istniejących pomiędzy nimi krawędzi. Jego zadanie jest podobne, jak współczynnika gronowania
(1) – jest nim ocena gęstości lokalnych połączeń między sąsiadami wierzchołków.
50
W. Czech
Spectrum macierzy Laplace’a grafu
Niech D będzie diagonalną macierzą sum wag, tzn. (D )ii = ∑ wij . Macierzą
j
Laplace’a grafu nazywamy macierz L = D − W [16]. W przypadku grafów nieskierowanych, z jakimi mamy do czynienia w tej pracy, macierz Laplace’a jest
dodatnio półokreślona, a tym samym wszystkie jej wartości własne są rzeczywiste i większe lub równe 0. Własność tę możemy wykorzystać do uporządkowania spectrum macierzy Laplace’a i stworzenia (n-1)-wymiarowego wektora
cech. Niech λ1 ≤ λ 2 ≤ … ≤ λ n będą wartościami własnymi macierzy Laplace’a
( λ1 = 0 ). Definiujemy deskryptor spektralny grafu jako wektor:
SPEC = [λ 2 ,λ 3 ,…, λ n ]
(7)
Istnieje szereg powiązań między strukturą grafu a algebraicznymi własnościami
reprezentujących go macierzy, dlatego wartości i wektory własne pozwalają na
konstrukcję wektorów cech zwierających znaczną część informacji o grafie.
Przykładem takich związków jest np. powiązanie stałej Cheegera i λ 2 [16].
Deskryptory budowane w oparciu o dekompozycję spektralną macierzy Laplace’a mają dobrą skuteczność w rozpoznawaniu obrazów [13].
Przydatność wektorów cech tworzonych na podstawie wyżej wymienionych miar oceniana została poprzez badanie jakości klasteryzacji testowych
zbiorów zdjęć osadzonych w przestrzeni 2D (Principal Component Analysis,
Isomaps, Locally Linear Embedding, Multidimensional Scaling, Kernel PCA) za
pomocą indeksów walidacyjnych klasteryzacji, takich jak C Index i Davies
Bouldin Index [8].
4. WYNIKI
Poniżej przedstawiono dwa przykładowe eksperymenty na zbiorach danych składających się ze zdjęć satelitarnych i lotniczych.
4.1. Zdjęcia z Google Earth
Testy opisane w tym podrozdziale przeprowadzone zostały na zbiorze czterech
grup zdjęć satelitarnych zebranych z pomocą programu Google Earth. Każda
51
grupa zawiera zdjęcia tych samych fragmentów czterech miast, ale zrobionych
z różnej wysokości (różnice rzędu 100 m) oraz poprzesuwanych i obróconych
względem siebie. Przykładowe zdjęcia ze zbioru testowego pokazane zostały
na rysunku 3.
Kraków, rynek, 50 zdjęć
Bochnia, rynek, 20 zdjęć
Wieliczka, obwodnica, 20 zdjęć
Wrocław, rynek, 50 zdjęć
Rys. 3. Przykładowe zdjęcia każdej z 4 grup: Kraków, Bochnia, Wieliczka,
Wrocław
Zdjęcia przekształcone zostały na dwa rodzaje grafów: bez wag oraz
z wagami wyznaczonymi w sposób opisany w rozdziale 2, przy czym grafy
reprezentujące pojedyncze zdjęcia mogą różnić się rozmiarem – w zależności
od liczby wykrytych rogów (wykorzystanie stałej odcinającej słabsze rogi). Następnie obliczone zostały deskryptory grafowe – w dwóch wariantach dla dwóch
rodzajów reprezentacji. Przetestowano wektory cech budowane oparciu o te
deskryptory, oceniając stopień rozdzielenia grup zdjęć po osadzeniu wektorów
cech w przestrzeni 2D. Przykładowe wyniki przedstawione zostały na rysunku 4.
Wektory cech budowane w oparciu o grafy ważone z wykorzystaniem deskryptorów wymienionych w rozdziale 3 pozwalają na lepsze rozdzielenie zbiorów
testowych za pomocą wektora cech o mniejszym wymiarze. Dla reprezentacji
bez wag wartości indeksów walidacyjnych klasteryzacji (patrz rozdział 3) wynoszą: C index = 0,290, DB index = 1,705, a dla reprezentacji z wagami odpowiednio
0,143 oraz 0,945. Im mniejsza wartość tych wskaźników, tym lepsze rozdzielenie zbiorów.
52
W. Czech
Rys. 4. Rezultat osadzenia wektorów cech grafów reprezentujących
zdjęcia satelitarne miast: Wieliczka (WI), Bochnia (BO), Kraków (KR),
Wrocław (WR) w przestrzeni 2D. U góry najlepszy wynik dla reprezentacji w postaci grafu bez wag, 4D wektor cech złożony z następujących deskryptorów: średnia średniego stopnia najbliższego sąsiada,
średnia centralność wierzchołka, średni współczynnik gronowania, średni
stopień wierzchołka. Redukcja wymiaru za pomocą Principal Component
Analysis. Na dole najlepszy wynik dla grafów ważonych, 2D wektor
cech złożony z deskryptorów: średnia wartość lokalnej efektywności,
średnia wartość mocy wierzchołka
53
4.2. Zdjęcia z bazy CMU/VASC
W tym podrozdziale zaprezentowane zostały testy rozpoznawania w oparciu o zdjęcia z bazy danych CMU/VASC (http://vasc.ri.cmu.edu/idb). Baza ta
zawiera szereg obrazów służących do badania algorytmów typu computer
vision. Ze zbioru Motion data wybrane zostały cztery grupy zdjęć lotniczych.
Przykładowe dane z tego zbioru pokazane są na rysunku 5. Warto zwrócić
uwagę na to, że grupa TB przedstawia podobny obszar, jak grupa TC (różnica
w skali i rotacji).
TA
TB
TC
TE
Rys. 5. Przykładowe zdjęcia każdej z 4 grup testowych
Zdjęcia zostały przekształcone na dwa rodzaje grafów (z wagami i bez nich),
ale w tym przypadku wygenerowano grafy o stałym rozmiarze 100. W tym celu
w algorytmie Harrisa wzięto pod uwagę 100 najwyraźniej zaznaczonych rogów.
Następnie, dla obu rodzajów reprezentacji obliczone zostały spektralne, 99-wymiarowe wektory cech (7). Wektory te osadzone zostały w przestrzeni 2D za
pomocą Kernel PCA z Gaussowską funkcją kernela daną wzorem:
(
k ( x, y ) = exp − σ x − y
2
)
(8)
Wyniki klasteryzacji dla reprezentacji bez wag przedstawione są na rysunku 6.
Wartości indeksów walidacyjnych wynoszą C index = 0,23, DB index = 1,23. Rysunek 7 przedstawia wynik dla wprowadzonej w tej pracy reprezentacji ważonej
(C index = 0,108, DB index = 0,743). Również w tym przypadku reprezentacja
ważona okazała się lepsza. W obu przypadkach redukcji za pomocą Kernel
PCA wartość parametru σ wynosiła 0,03. Nieznaczne wahania tego parametru
nie wpływały na pogorszenie separacji w obu przypadkach, natomiast większe
zmiany, np. zwiększenie do 0,05, dawały gorszy wynik. Dlatego wybrana
wartość 0,03 pozwala na wiarygodne porównanie obu wyników. Zdjęcia z grup
TB i TC znajdują się blisko siebie ponieważ pokazują one ten sam obszar
miasta, prawidłowość ta widoczna jest na obydwu wykresach.
54
W. Czech
Algorytm opisany w tej pracy został zaimplementowany w języku Java.
Czas obliczeń zdominowany jest częścią generującą wektory cech i zależy od
rozmiaru grafu oraz wybranych deskryptorów grafowych. W przedstawionych
wyżej eksperymentach dla rozmiaru grafu rzędu 100 wierzchołków i najcięższego obliczeniowo deskryptora spektralnego, czas generacji pojedynczego
wektora cech jest mniejszy od 0,02 s (laptop, Intel Core Duo 1,87 GHz).
Rys. 6. Wynik osadzenia 99-wymiarowych wektorów cech zbudowanych w oparciu
o reprezentację bez wag. Zastosowano Kernel PCA z Gaussowską funkcją kernela
(C index = 0,23, DB index = 1,23)
55
Rys. 7. Wynik osadzenia 99-wymiarowych wektorów cech zbudowanych w oparciu
o reprezentację z wagami. Zastosowano Kernel PCA z Gaussowską funkcją kernela
(C index = 0,108, DB index = 0,743)
5. PODSUMOWANIE
Wykorzystanie ważonych grafów jako reprezentacji obrazu pozwala na
projektowanie bardziej efektywnych algorytmów klasteryzacji i klasyfikacji.
Relacje pomiędzy obiektami świata rzeczywistego są na ogół heterogeniczne,
dlatego stosując wagi krawędzi można przechować w grafie specyficzne informacje, np. relacje przestrzenne między obiektami. Waga krawędzi odzwier-
56
W. Czech
ciedla siłę relacji między obiektami, a tym samym pozwala na dokładniejszy
opis, niż w binarnym przypadku grafów bez wag. Wadą takiego podejścia jest
mniej intuicyjna interpretacja deskryptorów.
Ilościowe metody analizy sieci złożonych mogą posłużyć go efektywnej
obliczeniowo generacji cech grafu i wykorzystania ich w klasycznych algorytmach rozpoznawania. Ze względu na rozsądny czas obliczeń, na szczególną
uwagę zasługują tutaj deskryptory opisujące lokalną topologię połączeń. Złożoność obliczeniowa wyznaczania wektorów cech grafu ma szczególne znaczenie w przypadku dużych baz danych, np. przechowujących dane o budowie
związków chemicznych.
Przyszłe prace związane z tematem niniejszego artykułu będą polegały
na testowaniu innych typów deskryptorów dla grafów ważonych i funkcji f
służących do obliczania wag krawędzi. Planowane jest również wykorzystanie
deskryptorów grafowych do budowy funkcji kernela dla grafów, pozwalającej na
efektywne użycie klasyfikatora SVM.
LITERATURA
1. R. Albert, A. L. Barabasi: Statistical mechanics of complex networks. Reviews of modern
physics, nr 1, vol. 74, 47–97, 2002.
2. S. Boccaletti, V. Latora, Y. Moreno, M. Chavez, D. U. Hwang: Complex networks: Structure
and dynamics. Physics Reports, nr 4-5, vol. 424, 175–308, 2006.
3. P. Csemely, V. Agoston, S.Pongor: The efficiency of multi-target drugs: the network
approach might help drug design. Trends in Pharmacological Sciences, vol. 26, 178–182,
2005.
4. M. A. Yildirim, K. I. Goh, M. E. Cusick, A. L. Barabasi, M. Vidal: Drug-target network. Nat
Biotechnol, 1119–1126, 2007.
5. D. Gfeller, P. De Los Rios, A. Caflisch, F. Rao: Complex network analysis of free-energy
landscapes. Proceedings of the National Academy of Sciences, nr 6, vol. 104, 1817, 2007.
6. F. Luo, Y. Yang, J. Zhong, H. Gao, L. Khan, D. K. Thompson, J. Zhou: Constructing gene
co-expression networks and predicting functions of unknown genes by random matrix
theory. BMC bioinformatics, nr 1, vol. 8, 299, 2007.
7. L. Ralaivola, S. J. Swamidass, H. Saigo, P. Baldi: Graph kernels for chemical informatics.
Neural networks, nr 8, vol. 18, 2005.
8. Graph-Based Representations in Pattern Recognition. Proc. Of 6th IAPR-TC-15 International Workshop, LNCS 4538, 2007.
9. K. R. Müller, S. Mika, G. Rätsh, K. Tsuda, B. Schölkopf: An Introduction to Kernel-Based
Learning Algorithms. IEEE Transactions on neural networks, nr 2, vol. 12, 181–202.
10. Harris C., Stephens M.: A combined corner and edge detector. Alvey vision conference,
vol. 15, 50, 1988.
11. D. J. Marchette: Random Graphs for Statistical Pattern Recognition. Wiley-Interscience, 2004.
57
12. R. C. Wilson, E. R. Hancock, B. Luo: Pattern Vectors from Algebraic Graph Theory. IEEE
Transactions on Pattern Analysis and Machine Intelligence, nr 7, vol. 27, 1112–1124, 2005.
13. R. C. Wilson, E. R. Hancock, B. Luo: Spectral embedding of graphs. Pattern recognition, nr 10,
vol. 36, 2213–2230, 2003.
14. G. Kalna, D. J. Higham: Clustering coefficients for weighted networks. University of Strathclyde Mathematics Research report 3., 2006.
15. S. Gunter, H. Bunke: Validation indices for graph clustering. Pattern Recognition Letters, nr 8,
vol. 24, 1107–1113, 2003.
16. F. R. K Chung: Spectral Graph Theory. CBMS Regional Conference Series in Mathematics, nr 92.
Rękopis dostarczono dnia 15.09.2009 r.
Opiniował: dr hab. inż. Jacek Starzyński
METHODS FOR GRAPH FEATURE EXTRACTION
IN SATELLITE PHOTO RECOGNITION
W. CZECH
ABSTRACT
This paper presents a new method for satellite
photos recognition using weighted-graph-based representation and
graph feature extraction taking advantage of such graph descriptors
as weighted clustering coefficient and weight disparity. The tests were
performed on groups of satellite photos of cities obtained via Google
Earth. The comparison of the new method with pure topological
approach proves its higher efficiency in recognition process.
Mgr inż. Wojciech CZECH – student II roku studiów doktoranckich Wydziału Elektrotechniki, Automatyki, Informatyki i Elektroniki AGH, kierunek Informatyka. W 2007 r. ukończył studia magisterskie
z informatyki na tym samym wydziale. Laureat I nagrody w XXIV
Konkursie PTI na najlepszą pracę magisterską z Informatyki. Jego
zainteresowania naukowe to teoria sieci złożonych i zastosowania
grafów w rozpoznawaniu obrazów.
58
W. Czech

Pełny tekst

Transkrypt

Podobne dokumenty

Teoria grafów

Matematyka Dyskretna – Elektronika

Segmentacja grafów toyo-kanji drukowanego pisma

Lista zadań nr 1.

• gry: samotnik, godziny szczytu, zapałczanki, kostki happy cubes

MATEMATYCZNE CENTRUM ROZRYWKI