Pełny tekst
Transkrypt
Pełny tekst
Wojciech CZECH METODY GENERACJI I SELEKCJI CECH GRAFU W ROZPOZNAWANIU ZDJĘĆ SATELITARNYCH*) STRESZCZENIE W pracy tej przedstawiona została nowa metoda rozpoznawania zdjęć satelitarnych i lotniczych w oparciu o ich reprezentację w postaci grafów ważonych przekształcanych następnie na wektory cech za pomocą deskryptorów takich jak ważony współczynnik gronowania lub rozziew wag. Porównanie nowej metody z algorytmami bazującymi na czysto topologicznej reprezentacji cech obrazu pokazuje jej większą skuteczność w procesie rozpoznawania. Testy zostały przeprowadzone na zbiorach zdjęć satelitarnych uzyskanych przy pomocy programu Google Earth oraz z bazy CMU/VASC. Słowa kluczowe: grafy ważone, porównywanie grafów, grafowa reprezentacja obrazu 1. WSTĘP Szeroki wachlarz zastosowań grafowych struktur danych, pozwalających na wygodną reprezentację relacji pomiędzy obiektami, spowodował widoczny w ostatnich latach rozwój nowych metod ich analizy. Badania występujących w przyrodzie sieci złożonych, takich jak np. sieci wewnątrzkomórkowych lub *) Praca ta powstała przy wsparciu Ministerstwa Nauki i Szkolnictwa Wyższego, projekt nr 3 T11F 010 30. mgr inż. Wojciech CZECH e-mail: [email protected] Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki, Katedra Informatyki PRACE INSTYTUTU ELEKTROTECHNIKI, zeszyt 243, 2009 44 W. Czech socjologicznych, przyniosły szereg znaczących rezultatów pozwalających na zrozumienie natury procesów rządzących ich powstawaniem [1]. Wymienić tutaj należy odkrycie takich własności sieci rzeczywistych, jak potęgowy rozkład stopni wierzchołków (scale-freeness), własność małego świata (small-worldiness), wysoki współczynnik gronowania (clustering coefficient) i wiele innych wpływających na odporność sieci na uszkodzenia lub efektywność propagacji np. informacji [2]. Wyniki te posiadają szereg praktycznych zastosowań, takich jak projektowanie nowych leków w oparciu o sieci metaboliczne [3, 4], przewidywanie struktury trzeciorzędowej białek z wykorzystaniem sieci fałdowania protein [5], przewidywanie funkcji genów za pomocą sieci koekspresji genów [6] lub określanie toksyczności związków chemicznych wykorzystujące grafową reprezentację molekuł [7]. Równocześnie można zaobserwować wzrost zainteresowania grafami w rozpoznawaniu wzorców. W szczególności grafowa reprezentacja zdjęć bądź kształtów znalazła szereg zastosowań praktycznych [8]. Używając grafu jako reprezentacji części informacji zawartej w obrazie zyskujemy niezmienność względem skalowania, rotacji i translacji – własność pożądaną w procesach rozpoznawania. Taka kombinatoryczna reprezentacja pośrednia wymaga jednak użycia metod porównywania grafów w celu wyznaczenia odległości pomiędzy obiektami, potrzebnej w standardowych metodach klasteryzacji i klasyfikacji. Spora ilość dostępnych algorytmów porównywania grafów wynika ze stosowania różnych typów grafów i różnych kryteriów oceny ich podobieństwa. Grafy reprezentujące obiekty świata rzeczywistego mogą być ważone, skierowane, z etykietami przypisanymi do krawędzi lub wierzchołków, spójne bądź niespójne. W zależności od dziedziny problemu możemy być zainteresowani porównaniem określonej cechy strukturalnej grafu, wielu cech lub ogólnie całości jego struktury, jak np. w przypadku grafowej reprezentacji zdjęć. Metody porównywania grafów można podzielić na dwie grupy: metody wykorzystujące reprezentację pośrednią w postaci np. wektora cech lub na algorytmy dokonujące bezpośredniego porównania dwóch obiektów, np. oparte na pojęciu grafowej odległości edycyjnej. Pierwsza z grup jest przydatna przy tworzeniu baz danych grafów, w których koszt obliczeniowy zapytania jest zredukowany dzięki możliwości wcześniejszego utworzenia wektorowych reprezentacji. Reprezentacja ta pozwala również na łatwe wykorzystanie klasycznych metod sztucznej inteligencji, takich jak osadzanie grafów w przestrzeni o małym wymiarze za pomocą metod MDS (Multidimensional Scaling), PCA (Principal Component Analysis), LLE (Locally Linear Embedding) oraz algorytmów klasteryzacji i klasyfikacji. Po zastosowaniu grafowych funkcji kernela możliwe jest również wykorzystanie nieliniowych metod typu kernel, takich jak klasyfikatory z rodziny SVM (Support Vector Machines) lub Kernel PCA [8]. Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 45 Transformacja obiektu kombinatorycznego, jakim jest graf, do wektora cech jest operacją, w której część informacji o grafie zostaje utracona. Wynika to przede wszystkim z trudności przejścia z obiektu o strukturze będącej niezmiennikiem izomorfizmu do obiektu, w którym kolejność elementów jest istotna, a który powinien pozostać niezmiennikiem tego przekształcenia. Budowa wzajemnie jednoznacznego odwzorowania wektor – graf jest ciekawym, otwartym problemem związanym z zagadnieniem poszukiwania izomorfizmu. W niniejszej pracy opisana zostanie nowa metoda porównywania zdjęć lotniczych w oparciu o ich grafową reprezentację, wykorzystująca ilościowe metody oceny własności struktury sieci złożonych jako metodę generacji cech dla grafu. W następnym rozdziale przedstawiona zostanie metoda transformacji obrazu w graf ważony, wykorzystująca wykrywanie rogów [9] oraz triangulację Delaunaya [10]. Następnie w rozdziale 3 omówiona zostanie generacja wektorów cech dla grafu. Rozdział 4 prezentuje przykładowe wyniki klasteryzacji danych testowych. Praca zakończona będzie krótkim podsumowaniem. 2. GRAFOWA REPREZENTACJA OBRAZU Transformacja obrazu zapisanego w postaci macierzy pikseli do kombinatorycznej danej, jaką jest graf, wymaga wskazania charakterystycznych elementów obrazu odpowiadających wierzchołkom, a następnie określenia relacji pomiędzy tymi elementami, co jest równoznaczne z dodaniem krawędzi w grafie. Takimi elementami mogą być np. rogi, zdefiniowane jako przecięcie dwóch krawędzi [10] lub obszary obrazu charakteryzujące się podobną jasnością, będące rezultatem segmentacji obrazu. Praca ta wykorzystuje grafy budowane na podstawie rogów. Współrzędne rogu wskazują obszar obrazu, w którym jego intensywność zmienia się gwałtownie w dwóch prostopadłych do siebie kierunkach. Załóżmy więc, że rogi będą odpowiadać wierzchołkom grafu. W celu zdefiniowania powiązań przestrzennych między rogami stosujemy triangulację Delaunaya. Metoda ta tworzy krawędź między punktami, których komórki Voronoi sąsiadują, dlatego obszarom o dużym zagęszczeniu rogów odpowiadać będą wierzchołki o wysokim stopniu. Położenie rogów jest istotną cechą obrazu, wykorzystywaną często w zagadnieniach typu computer vision, szczególnie przy poszukiwaniu transformacji jednego obrazu w drugi (np. dwie kolejne klatki w filmie). Triangulacja Delaunaya [11] dokonuje generalizacji informacji zawartej w rogach, a własności trójkątów będących jej rezultatem, np. rozkład prawdopodobieństwa ich pól powierzchni, dobrze odzwierciedlają ogólne cechy obrazu 46 W. Czech – źródła. Na rysunku 1 przedstawiono przykładową transformację obrazu w graf dla lotniczego zdjęcia zamku. Rys. 1. Wykrywanie rogów oraz triangulacja Delaunaya: A) detekcja rogów – metoda Harrisa, zdjęcie lotnicze zamku (baza danych CSM/VASC); B) triangulacja Delaunaua – algorytm Watsona Opisana wyżej metoda stosowana jest z powodzeniem przy testowaniu metod porównywania grafów [12, 13]. W niniejszej pracy proponujemy jej rozszerzenie poprzez dodanie wag do krawędzi grafu. Wagi takie powinny zawierać dodatkową informację na temat przestrzennych relacji pomiędzy rogami. Reprezentacja taka może być przydatna szczególnie w przypadku zdjęć lotniczych lub satelitarnych, w którym przestrzenne relacje pomiędzy obiektami, np. budynkami w mieście, nie ulegają dużym zmianom. W celu wyznaczenia wagi krawędzi bierzemy pod uwagę graf Delaunaya dla zbioru rogów obrazów. Każda krawędź grafu związana jest z dwoma leżącymi naprzeciw niej kątami (rys. 2C), które pozostają stałe dla różnych zdjęć tego samego obszaru, np. powierzchni ziemi. Słuszność tego założenia warunkowana jest czułością metody wykrywania rogów i jej wrażliwością na szum. W szczególności, izolowane punkty typu sól i pieprz mogą zostać potraktowane jako rogi, co pogorszy jakość takiej reprezentacji. Uniknąć tego efektu możemy poprzez wstępną filtrację obrazu za pomocą filtra mediany oraz manipulując parametrami algorytmu wykrywającego rogi, tak, aby rogi z mniejszą ilością głosów zostały odrzucone. Waga krawędzi będzie funkcją f(α,β) dwóch leżących naprzeciw niej kątów. W przypadku krawędzi leżących bezpośrednio na wypukłej otoczce zbioru rogów (brzeg), drugi z kątów taktujemy jako równy zero – wierzchołek trójkąta, który mu odpowiada, znajduje się w nieskończoności (nieograniczona komórka Voronoi). Przykładowo wybierając jako f maksimum z dwóch kątów, większą wagę przykładać będziemy do krawędzi łączącej punkty, których odległość jest dużo większa od trzeciego punktu znajdującego się bliżej krawędzi. Uzyskane w ten sposób wagi są w dalszej kolejności normalizowane tak, aby zwierały się w przedziale [0, 1]. Na rysunku 2 przedstawiono schemat opisywanej metody przekształcenia zdjęcia w ważony graf. Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 47 Rys. 2. Schemat przekształcenia obrazu w graf ważony: A) oryginalne zdjęcie; B) wykrywanie rogów – detektor Harrisa; C) triangulacja Delaunaya, obliczenie wag krawędzi jako maksimum z dwóch kątów leżących naprzeciw krawędzi, normalizacja wag 3. WEKTORY CECH GRAFU Porównania grafów dokonujemy w oparciu o wektory cech wygenerowane z zastosowaniem ilościowych metod analizy sieci złożonych. Spośród wielu deskryptorów grafowych mierzących strukturalne własności sieci do generacji wektora cech zdecydowaliśmy się wykorzystać te, które można obliczyć w krótkim czasie dla grafów o rozmiarze rzędu 500–1000 wierzchołków (złożoność obliczeniowa O n 2 lub mniejsza). Aby umożliwić porównanie wyników ( ) dla reprezentacji ważonej i bez wag, wybrany został podzbiór deskryptorów obliczalnych dla obu typów grafów. Krótkie omówienie testowanego zbioru deskryptorów przedstawione jest poniżej. We wszystkich definicjach przyjmujemy następujące oznaczenia: • W oznacza macierz wag grafu taką, że: (W )ij = wij jest wagą krawędzi (i, j ) , w przypadku grafów bez wag W odpowiada macierzy adiacencji i składa się wyłącznie z elementów 0 i 1, • wk jest k-tą kolumną lub k-tym wierszem macierzy W , • • • • N jest zbiorem wierzchołków grafu, e jest wektorem o wszystkich elementach równych 1, n jest liczbą wierzchołków grafu, N k oznacza zbiór sąsiadów wierzchołka k, • d ij to długość najkrótszej ścieżki pomiędzy wierzchołkiem i oraz j, dla grafów bez wag jest liczbą całkowitą. 48 W. Czech Moc wierzchołka sk = ∑ wkj (1) j∈N Miara ta jest prostym rozszerzeniem stopnia wierzchołka dla grafów ważonych. Ponieważ deskryptor ten jest skojarzony z wierzchołkiem grafu, do generacji wektora cech wykorzystujemy statystyczne własności zbioru miar s k dla wszystkich wierzchołków, takie jak wartość średnia, odchylenie standardowe, skośność i kurtoza. Podobnie postępujemy dla pozostałych deskryptorów skojarzonych z wierzchołkami grafu. Współczynnik gronowania WCC k = (W ) (e w ) − 3 kk 2 T k wk 2 (2) 2 Ważony współczynnik gronowania, zdefiniowany w pracy [7], jest lokalną miarą pozwalającą stwierdzić, jaka jest gęstość wzajemnych połączeń między sąsiadami wierzchołka k. W przypadku gafów bez wag, wzór (2) daje ten sam wynik, co klasyczna definicja określająca prawdopodobieństwo istnienia krawędzi pomiędzy dwoma sąsiadami wierzchołka k [2]. Ponieważ wartość tego deskryptora skorelowana jest z liczbą trójkątów w sieci, możemy oczekiwać, że będzie on dobrze opisywał grafy będące rezultatem triangulacji. Rozziew wag ⎡ wkj ⎤ Yk = ∑ ⎢ ⎥ j∈N k ⎣ s k ⎦ 2 (3) Deskryptor ten, opisany m.in. w pracy [2], pozwala stwierdzić, czy wagi krawędzi incydentnych z wierzchołkiem k są tego samego rzędu, czy może kilka krawędzi dominuje, a pozostałe mają małe wagi. Jest to lokalna miara, której rozkład prawdopodobieństwa niesie sporo informacji o grafie ważonym. Jest to jedyny omówiony w tej pracy deskryptor, który ma sens jedynie dla grafów z wagami. Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 49 Centralność wierzchołka bi = ∑ j , k ∈N , j ≠ k n jk (i ) n jk (4) n jk oznacza liczbę najkrótszych ścieżek łączących wierzchołki j oraz k, a n jk (i ) liczbę najkrótszych ścieżek łączących j oraz k, przechodzących przez wierzchołek i. Miara ta wywodzi się z obszaru sieci socjologicznych i określa ważność danego wierzchołka z punktu widzenia propagacji informacji (po najkrótszych ścieżkach) [2]. Niejednorodne wagi krawędzi zmieniają najkrótsze ścieżki, zarówno pod względem ich długości, jak sekwencji wierzchołków, z których się składają. Deskryptor ten może być obliczany dla grafów z wagami i bez. Efektywność E= 1 ∑ d ij n( n − 1) i , j∈N ,i ≠ j (5) Efektywność sieci [2] to średnia harmoniczna długości najkrótszych ścieżek pomiędzy parami wierzchołków. Zgodnie ze swoją nazwą, mierzy ona pojemność informacyjną sieci i jej zdolność do przekazywania informacji. Zawiera się w przedziale [0, 1], osiągając największą wartość dla grafu pełnego. Efektywność lokalna Eloc = 1 ∑ E (Gi ) n i∈N (6) Deskryptor ten jest średnią arytmetyczną efektywności [patrz równanie (5)] grafów utworzonych z sąsiadów każdego z wierzchołka i oraz istniejących pomiędzy nimi krawędzi. Jego zadanie jest podobne, jak współczynnika gronowania (1) – jest nim ocena gęstości lokalnych połączeń między sąsiadami wierzchołków. 50 W. Czech Spectrum macierzy Laplace’a grafu Niech D będzie diagonalną macierzą sum wag, tzn. (D )ii = ∑ wij . Macierzą j Laplace’a grafu nazywamy macierz L = D − W [16]. W przypadku grafów nieskierowanych, z jakimi mamy do czynienia w tej pracy, macierz Laplace’a jest dodatnio półokreślona, a tym samym wszystkie jej wartości własne są rzeczywiste i większe lub równe 0. Własność tę możemy wykorzystać do uporządkowania spectrum macierzy Laplace’a i stworzenia (n-1)-wymiarowego wektora cech. Niech λ1 ≤ λ 2 ≤ … ≤ λ n będą wartościami własnymi macierzy Laplace’a ( λ1 = 0 ). Definiujemy deskryptor spektralny grafu jako wektor: SPEC = [λ 2 ,λ 3 ,…, λ n ] (7) Istnieje szereg powiązań między strukturą grafu a algebraicznymi własnościami reprezentujących go macierzy, dlatego wartości i wektory własne pozwalają na konstrukcję wektorów cech zwierających znaczną część informacji o grafie. Przykładem takich związków jest np. powiązanie stałej Cheegera i λ 2 [16]. Deskryptory budowane w oparciu o dekompozycję spektralną macierzy Laplace’a mają dobrą skuteczność w rozpoznawaniu obrazów [13]. Przydatność wektorów cech tworzonych na podstawie wyżej wymienionych miar oceniana została poprzez badanie jakości klasteryzacji testowych zbiorów zdjęć osadzonych w przestrzeni 2D (Principal Component Analysis, Isomaps, Locally Linear Embedding, Multidimensional Scaling, Kernel PCA) za pomocą indeksów walidacyjnych klasteryzacji, takich jak C Index i Davies Bouldin Index [8]. 4. WYNIKI Poniżej przedstawiono dwa przykładowe eksperymenty na zbiorach danych składających się ze zdjęć satelitarnych i lotniczych. 4.1. Zdjęcia z Google Earth Testy opisane w tym podrozdziale przeprowadzone zostały na zbiorze czterech grup zdjęć satelitarnych zebranych z pomocą programu Google Earth. Każda Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 51 grupa zawiera zdjęcia tych samych fragmentów czterech miast, ale zrobionych z różnej wysokości (różnice rzędu 100 m) oraz poprzesuwanych i obróconych względem siebie. Przykładowe zdjęcia ze zbioru testowego pokazane zostały na rysunku 3. Kraków, rynek, 50 zdjęć Bochnia, rynek, 20 zdjęć Wieliczka, obwodnica, 20 zdjęć Wrocław, rynek, 50 zdjęć Rys. 3. Przykładowe zdjęcia każdej z 4 grup: Kraków, Bochnia, Wieliczka, Wrocław Zdjęcia przekształcone zostały na dwa rodzaje grafów: bez wag oraz z wagami wyznaczonymi w sposób opisany w rozdziale 2, przy czym grafy reprezentujące pojedyncze zdjęcia mogą różnić się rozmiarem – w zależności od liczby wykrytych rogów (wykorzystanie stałej odcinającej słabsze rogi). Następnie obliczone zostały deskryptory grafowe – w dwóch wariantach dla dwóch rodzajów reprezentacji. Przetestowano wektory cech budowane oparciu o te deskryptory, oceniając stopień rozdzielenia grup zdjęć po osadzeniu wektorów cech w przestrzeni 2D. Przykładowe wyniki przedstawione zostały na rysunku 4. Wektory cech budowane w oparciu o grafy ważone z wykorzystaniem deskryptorów wymienionych w rozdziale 3 pozwalają na lepsze rozdzielenie zbiorów testowych za pomocą wektora cech o mniejszym wymiarze. Dla reprezentacji bez wag wartości indeksów walidacyjnych klasteryzacji (patrz rozdział 3) wynoszą: C index = 0,290, DB index = 1,705, a dla reprezentacji z wagami odpowiednio 0,143 oraz 0,945. Im mniejsza wartość tych wskaźników, tym lepsze rozdzielenie zbiorów. 52 W. Czech Rys. 4. Rezultat osadzenia wektorów cech grafów reprezentujących zdjęcia satelitarne miast: Wieliczka (WI), Bochnia (BO), Kraków (KR), Wrocław (WR) w przestrzeni 2D. U góry najlepszy wynik dla reprezentacji w postaci grafu bez wag, 4D wektor cech złożony z następujących deskryptorów: średnia średniego stopnia najbliższego sąsiada, średnia centralność wierzchołka, średni współczynnik gronowania, średni stopień wierzchołka. Redukcja wymiaru za pomocą Principal Component Analysis. Na dole najlepszy wynik dla grafów ważonych, 2D wektor cech złożony z deskryptorów: średnia wartość lokalnej efektywności, średnia wartość mocy wierzchołka 53 Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 4.2. Zdjęcia z bazy CMU/VASC W tym podrozdziale zaprezentowane zostały testy rozpoznawania w oparciu o zdjęcia z bazy danych CMU/VASC (http://vasc.ri.cmu.edu/idb). Baza ta zawiera szereg obrazów służących do badania algorytmów typu computer vision. Ze zbioru Motion data wybrane zostały cztery grupy zdjęć lotniczych. Przykładowe dane z tego zbioru pokazane są na rysunku 5. Warto zwrócić uwagę na to, że grupa TB przedstawia podobny obszar, jak grupa TC (różnica w skali i rotacji). TA TB TC TE Rys. 5. Przykładowe zdjęcia każdej z 4 grup testowych Zdjęcia zostały przekształcone na dwa rodzaje grafów (z wagami i bez nich), ale w tym przypadku wygenerowano grafy o stałym rozmiarze 100. W tym celu w algorytmie Harrisa wzięto pod uwagę 100 najwyraźniej zaznaczonych rogów. Następnie, dla obu rodzajów reprezentacji obliczone zostały spektralne, 99-wymiarowe wektory cech (7). Wektory te osadzone zostały w przestrzeni 2D za pomocą Kernel PCA z Gaussowską funkcją kernela daną wzorem: ( k ( x, y ) = exp − σ x − y 2 ) (8) Wyniki klasteryzacji dla reprezentacji bez wag przedstawione są na rysunku 6. Wartości indeksów walidacyjnych wynoszą C index = 0,23, DB index = 1,23. Rysunek 7 przedstawia wynik dla wprowadzonej w tej pracy reprezentacji ważonej (C index = 0,108, DB index = 0,743). Również w tym przypadku reprezentacja ważona okazała się lepsza. W obu przypadkach redukcji za pomocą Kernel PCA wartość parametru σ wynosiła 0,03. Nieznaczne wahania tego parametru nie wpływały na pogorszenie separacji w obu przypadkach, natomiast większe zmiany, np. zwiększenie do 0,05, dawały gorszy wynik. Dlatego wybrana wartość 0,03 pozwala na wiarygodne porównanie obu wyników. Zdjęcia z grup TB i TC znajdują się blisko siebie ponieważ pokazują one ten sam obszar miasta, prawidłowość ta widoczna jest na obydwu wykresach. 54 W. Czech Algorytm opisany w tej pracy został zaimplementowany w języku Java. Czas obliczeń zdominowany jest częścią generującą wektory cech i zależy od rozmiaru grafu oraz wybranych deskryptorów grafowych. W przedstawionych wyżej eksperymentach dla rozmiaru grafu rzędu 100 wierzchołków i najcięższego obliczeniowo deskryptora spektralnego, czas generacji pojedynczego wektora cech jest mniejszy od 0,02 s (laptop, Intel Core Duo 1,87 GHz). Rys. 6. Wynik osadzenia 99-wymiarowych wektorów cech zbudowanych w oparciu o reprezentację bez wag. Zastosowano Kernel PCA z Gaussowską funkcją kernela (C index = 0,23, DB index = 1,23) Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 55 Rys. 7. Wynik osadzenia 99-wymiarowych wektorów cech zbudowanych w oparciu o reprezentację z wagami. Zastosowano Kernel PCA z Gaussowską funkcją kernela (C index = 0,108, DB index = 0,743) 5. PODSUMOWANIE Wykorzystanie ważonych grafów jako reprezentacji obrazu pozwala na projektowanie bardziej efektywnych algorytmów klasteryzacji i klasyfikacji. Relacje pomiędzy obiektami świata rzeczywistego są na ogół heterogeniczne, dlatego stosując wagi krawędzi można przechować w grafie specyficzne informacje, np. relacje przestrzenne między obiektami. Waga krawędzi odzwier- 56 W. Czech ciedla siłę relacji między obiektami, a tym samym pozwala na dokładniejszy opis, niż w binarnym przypadku grafów bez wag. Wadą takiego podejścia jest mniej intuicyjna interpretacja deskryptorów. Ilościowe metody analizy sieci złożonych mogą posłużyć go efektywnej obliczeniowo generacji cech grafu i wykorzystania ich w klasycznych algorytmach rozpoznawania. Ze względu na rozsądny czas obliczeń, na szczególną uwagę zasługują tutaj deskryptory opisujące lokalną topologię połączeń. Złożoność obliczeniowa wyznaczania wektorów cech grafu ma szczególne znaczenie w przypadku dużych baz danych, np. przechowujących dane o budowie związków chemicznych. Przyszłe prace związane z tematem niniejszego artykułu będą polegały na testowaniu innych typów deskryptorów dla grafów ważonych i funkcji f służących do obliczania wag krawędzi. Planowane jest również wykorzystanie deskryptorów grafowych do budowy funkcji kernela dla grafów, pozwalającej na efektywne użycie klasyfikatora SVM. LITERATURA 1. R. Albert, A. L. Barabasi: Statistical mechanics of complex networks. Reviews of modern physics, nr 1, vol. 74, 47–97, 2002. 2. S. Boccaletti, V. Latora, Y. Moreno, M. Chavez, D. U. Hwang: Complex networks: Structure and dynamics. Physics Reports, nr 4-5, vol. 424, 175–308, 2006. 3. P. Csemely, V. Agoston, S.Pongor: The efficiency of multi-target drugs: the network approach might help drug design. Trends in Pharmacological Sciences, vol. 26, 178–182, 2005. 4. M. A. Yildirim, K. I. Goh, M. E. Cusick, A. L. Barabasi, M. Vidal: Drug-target network. Nat Biotechnol, 1119–1126, 2007. 5. D. Gfeller, P. De Los Rios, A. Caflisch, F. Rao: Complex network analysis of free-energy landscapes. Proceedings of the National Academy of Sciences, nr 6, vol. 104, 1817, 2007. 6. F. Luo, Y. Yang, J. Zhong, H. Gao, L. Khan, D. K. Thompson, J. Zhou: Constructing gene co-expression networks and predicting functions of unknown genes by random matrix theory. BMC bioinformatics, nr 1, vol. 8, 299, 2007. 7. L. Ralaivola, S. J. Swamidass, H. Saigo, P. Baldi: Graph kernels for chemical informatics. Neural networks, nr 8, vol. 18, 2005. 8. Graph-Based Representations in Pattern Recognition. Proc. Of 6th IAPR-TC-15 International Workshop, LNCS 4538, 2007. 9. K. R. Müller, S. Mika, G. Rätsh, K. Tsuda, B. Schölkopf: An Introduction to Kernel-Based Learning Algorithms. IEEE Transactions on neural networks, nr 2, vol. 12, 181–202. 10. Harris C., Stephens M.: A combined corner and edge detector. Alvey vision conference, vol. 15, 50, 1988. 11. D. J. Marchette: Random Graphs for Statistical Pattern Recognition. Wiley-Interscience, 2004. Metody generacji i selekcji cech grafu w rozpoznawaniu zdjęć satelitarnych 57 12. R. C. Wilson, E. R. Hancock, B. Luo: Pattern Vectors from Algebraic Graph Theory. IEEE Transactions on Pattern Analysis and Machine Intelligence, nr 7, vol. 27, 1112–1124, 2005. 13. R. C. Wilson, E. R. Hancock, B. Luo: Spectral embedding of graphs. Pattern recognition, nr 10, vol. 36, 2213–2230, 2003. 14. G. Kalna, D. J. Higham: Clustering coefficients for weighted networks. University of Strathclyde Mathematics Research report 3., 2006. 15. S. Gunter, H. Bunke: Validation indices for graph clustering. Pattern Recognition Letters, nr 8, vol. 24, 1107–1113, 2003. 16. F. R. K Chung: Spectral Graph Theory. CBMS Regional Conference Series in Mathematics, nr 92. Rękopis dostarczono dnia 15.09.2009 r. Opiniował: dr hab. inż. Jacek Starzyński METHODS FOR GRAPH FEATURE EXTRACTION IN SATELLITE PHOTO RECOGNITION W. CZECH ABSTRACT This paper presents a new method for satellite photos recognition using weighted-graph-based representation and graph feature extraction taking advantage of such graph descriptors as weighted clustering coefficient and weight disparity. The tests were performed on groups of satellite photos of cities obtained via Google Earth. The comparison of the new method with pure topological approach proves its higher efficiency in recognition process. Mgr inż. Wojciech CZECH – student II roku studiów doktoranckich Wydziału Elektrotechniki, Automatyki, Informatyki i Elektroniki AGH, kierunek Informatyka. W 2007 r. ukończył studia magisterskie z informatyki na tym samym wydziale. Laureat I nagrody w XXIV Konkursie PTI na najlepszą pracę magisterską z Informatyki. Jego zainteresowania naukowe to teoria sieci złożonych i zastosowania grafów w rozpoznawaniu obrazów. 58 W. Czech