pobierz plik referatu
Transkrypt
pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Rozdział 43 w Przegląd standardów, celów, metod i zastosowań eksploracji danych multimedialnych w 1 Wstęp da .b w Streszczenie. W rozdziale opisano znaczenie eksploracji danych multimedialnych. Przedstawiono genezę danych multimedialnych oraz opisano cele ich eksploracji, stosowane standardy, metody i przykłady praktycznych zastosowań. Podsumowano korzyści wynikające z eksploracji, opisano kwestie dyskusyjne oraz opisano główne problemy, jakie powinny być rozwiązane w przyszłości. pl s. Rozwój technologii informatycznej szczególnie istotnie przejawia się w metodach i technikach pozyskiwania danych. Dane mogą być przechowywane w różnorodnej formie mediów cyfrowych np. zdjęć, plików dźwiękowych, plików video rejestrowanych za pomocą kamer cyfrowych, aparatów fotograficznych lub telefonów komórkowych. Eksperci oceniają, że w ciągu najbliższych kilku lat ludzkość wygeneruje więcej danych niż w poprzednich tysiącleciach [10], a koszt jednostki pamięci maleje o połowę co dziewięć miesięcy [7]. Objętość gromadzonych danych rośnie w różnym stopniu, przy czym najszybszy wzrost objętości odnotowano w zasobach internetowych i multimedialnych [20]. Możliwości człowieka do oceny wymiarowości i złożoności danych są ograniczone, dlatego ważne są narzędzia, które w takiej ocenie mogą pomóc. W rozdziale rozpatrzono problemy standaryzacji danych multimedialnych i procesów ich eksploracji. Następnie dokonano krótkiego przeglądu celów, metod i technik używanych w eksploracji danych multimedialnych. Dalej przedstawiono dziedziny, w których praktycznie zastosowano metody eksploracji danych multimedialnych, problemy jakie się pojawiają wraz z rozwojem tych metod oraz perspektywy dalszych zastosowań. 2 Rozwój form zapisu i obsługi danych multimedialnych Za początek obsługi danych multimedialnych przyjmuje się połączenie tekstu i obrazu w jednym dokumencie już w latach 60-tych XX wieku. Następnie zsynchronizowano Janusz Świerzowicz Politechnika Rzeszowska, Zakład Informatyki w Zarządzaniu, ul. W. Pola 2, 35-959 Rzeszów, Polska email:[email protected] (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 J. Świerzowicz w dźwięk, obraz wideo i animację [18]. W wyniku intensywnych badań prowadzonych od lat 90-tych XX wieku nad pozyskiwaniem, przechowywaniem, transmisją, i prezentacją danych multimedialnych powstały i nadal rozwijane są standardy opracowane przez MPEG, Web3D oraz ISO takie jak: MP3 – dla stratnej kompresji dźwięku poziomu 3, MPEG-4 – zawierający technologiczne elementy, umożliwiające integrację produkcji, dystrybucji i dostępu do zawartości cyfrowej telewizji, interakcyjnych aplikacji graficznych i multimediów, MPEG-7 – dla opisu treści multimedialnych, X3D – otwarty standard XML, umożliwiający tworzenie, bieżącą komunikację i wymianę danych, reprezentujących trójwymiarowe obiekty dla prezentacji w sieci i w urządzeniach mobilnych, MX – formalizm XML dla reprezentacji utworów muzycznych opisany w warstwach: strukturalnej, logicznej, nutowej, prezentacji i dźwiękowej [8], [21]. Wyżej wymienione standardy opracowane dla reprezentowania złożonych danych multimedialnych, umożliwiają łączenie i synchronizację dźwięku, obrazów, sekwencji video, obiektów trójwymiarowych ze zdarzeniami, a za pomocą języków skryptowych pozwalają opisać treść każdego obiektu multimedialnego. Dla przechowywania danych multimedialnych stosowane są multimedialne bazy danych obsługiwane za pomocą pakietów SQL/MM [13], [16]. Jednym ze skutków złożoności kodowania danych multimedialnych i wzrostu ich objętości jest problem nadmiaru danych, który wymusza używanie inteligentnych i automatycznych narzędzi programistycznych dla przekształcania „surowych” danych w informację, a informacji w wiedzę. Jest nią eksploracja danych, którą definiujemy jako inteligentny i zautomatyzowany proces identyfikacji i odkrywania użytecznych struktur takich jak wzorce, modele i relacje w zbiorach danych [6]. Proces ten, będący istotnym fragmentem ogólnego procesu odkrywania wiedzy z danych powinien być iteracyjnym, szczegółowo zaplanowanym, stosującym odpowiednie techniki analityczne do pozyskiwania ukrytej, wartościowej informacji. Na skutek postępu w technologii informacyjnej osiągalne stają się bardzo duże zbiory cyfrowych fotografii obrazów medycznych, zdjęć lotniczych i satelitarnych, obrazów z symulacji komputerowych, oraz obrazy rejestrowane w różnorodnych badaniach naukowych. Metodą, która umożliwia uzyskiwanie odkrywanie zależności pomiędzy obrazami przechowywanymi w bazach obrazów nazywamy eksploracją obrazów – (ang. image mining) [25]. Głównym problemem jest tutaj obsługa relatywnych danych, niejawnej informacji przestrzennej i różnorodnej interpretacji tych samych wizualnych wzorców. Dla rozwiązywania tych problemów stosuje się między innymi podejście sterowane obrazami, w którym ustalane są hierarchiczne warstwy. Niższa warstwa zawiera informacje o pikselach i obiektach, natomiast w warstwie wyższej jest zawarta wiedza dziedzinowa dla wygenerowania semantycznych konceptów z warstwy niższej i do połączenia ich z danymi alfanumerycznymi [26]. Poszerzeniem tej koncepcji jest eksploracja danych multimedialnych, której celem jest uzyskanie interesującej wiedzy i zrozumienie semantyki przechowywanej w danych zawierającej skorelowane obrazy, dźwięk, wideo i tekst. Z uwagi na dużą objętość i wymiarowość danych multimedialnych istotnym zagadnieniem jest wybór cech, pozwalających na redukcję wymiarowości problemu. Można wyróżnić cechy oparte na opisie obiektów oraz cechy uzyskiwane na podstawie analizy fizycznych charakterystyk danych multimedialnych uwzględniając np. cechy wizualne obrazów wideo oraz cechy sygnału akustycznego. W celu ujednolicenia wpływu cech na wyniki eksploracji, przeprowadza się ich normalizację. Bazy multimedialne, zawierające kombinację danych powyższych typów mogą być albo najpierw integrowane za pomocą rozproszonych procesorów multimedialnych, a później eksplorowane, albo można stosować narzędzia eksploracji baz homogenicznych, a następ- da .b w w pl s. 536 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Przegląd celów, metod i zastosowań eksploracji danych multimedialnych nie łączyć uzyskiwane wyniki [23]. Schematy multimedialnych baz danych powinny również podlegać normalizacji, prowadzących do redukcji anomalii ich obsługi. 3 Aspekty standaryzacji eksploracji danych w Wielu producentów oraz organizacji zrzeszających zaawansowanych użytkowników baz danych i usług analitycznych rozwija technologiczne standardy dla różnych aspektów eksploracji danych. Wysiłki te dotyczą procesów, modeli, atrybutów, interfejsów programowania aplikacji oraz przetwarzania danych. Celem opracowania standardowego modelu procesu eksploracji danych jest dążenie do ujednolicenia tego procesu niezależnie od dziedziny zastosowań, w oparciu o istniejące opisy, pozwalające na użycie rozwojowych technologii informatycznych dla rozwiązywania problemów biznesowych w praktyce. Standardowy model procesu dla eksploracji danych, (ang. Cross Industrial Standard Process for Data Mining – CRISP DM) opracowany w 1999 roku przez konsorcjum producentów i zaawansowanych użytkowników oprogramowania eksploracji danych, jest obecnie uaktualniany [22]. Głównym założeniem tego modelu jest jego neutralność w stosunku do dziedziny zastosowania, aplikacji, narzędzia i dostawcy oprogramowania co symbolicznie przedstawia rys. 1. da .b w w neutralność pl s. Rys. 1. Założenia neutralności modelu CRISP DM W modelu tym można wyróżnić zadania opisane na czterech poziomach abstrakcji: faz F, zadań ogólnych ZO, zadań wyspecjalizowanych ZS oraz instancji procesów IP. Model procesu eksploracji danych (MPZD) można zatem przedstawić w postaci macierzowej: 537 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 J. Świerzowicz MPZD = [F1 ... ... Fn ] [ = [ZS = [IP Fi = ZOi ,1 ... ZOi ,m (i ) ZOi , j w ZS i , j ,k i , j ,1 i , j , k ,1 (1) ] ... ZS i , j , r (i , j ) (2) ] ... IPi , j ,k , s (i , j ,k ) (3) ] (4) w w gdzie: n- liczba faz w procesie eksploracji danych, Fi – i-ta faza w procesie eksploracji, ZOi,j – j – te zadanie ogólne i-tej fazy, m(i) - liczba zadań ogólnych w i-tej fazie, ZSi,j,k – k – te zadanie wyspecjalizowane j-tego zadania ogólnego, i - tej fazy, r(i,j) - liczba zadań specjalizowanych j-tego zadania ogólnego w i-tej fazie, IPi,j,k,l – l - ta instancja procesu k – tego zadania specjalizowanego j-tego zadania ogólnego i-tej fazy, s(i,j,k) - liczba instancji procesu dla k - tego zadania specjalizowanego, j - tego zadania ogólnego w i-tej fazie. ZO1,m(1) ZO 2,1 ZO 2,m(2) ZS 2,1,1 ZS i,1,1 ZS 2,1,2 ZS i,j,r F1 ZS 3,1,1 ZS 3,1,2 ZS 2,j,r F2 ZO i,m(i) ZO ZO ZO n,1 n,m(n) i,1 IP i,m(i),r(i),s(i) IP n,m(n),r(n),s(n) ZS i,1,1 ZS n,j,r ZS n,1,2 Fn=6 ZS ZS ZO ZS i,j,r n,1,1 i,1,2 Fi=5 Rys. 2. Graficzne przedstawienie modelu CRISP DM IP 3,m(3),r(i3,s(3) ZS 3,j,r F3 4,m(i) ZO 4,1 4,m(4),r(i4),s(4) pl s. IP ZO 3,m(3) IP 2,m(2),r(2),s(2) IP i,m(i),r(i),s(i) ZS i,1,2 ZO 3,1 da .b ZO1,1 ZS 4,j,r ZS ZS 4,1,1 4,1,2 F4 Na rys. 2. przedstawiono w postaci prostopadłościanów fazy: zrozumienia dziedziny F1, dotyczącą zrozumienia celów i wymagań użytkownika z perspektywy dziedziny; efektem wyjściowym tej fazy jest przetworzenie celów biznesowych lub badawczych do zdefiniowanego problemu eksploracji danych; zrozumienia danych F2, dotyczącą wstępnego zbierania danych, identyfikacji problemów jakości danych i odkrywania interesujących zestawów danych dla sformułowania hipotez o ukrytej wartościowej informacji, oraz określenia podzbiorów danych dla dalszych badań; przygotowania danych F3, obejmującą konstruowanie zestawu danych dla narzędzi modelowania; w fazie tej nacisk jest położony na wybór tabel, rekordów i atrybutów, jak również na transformacje i czyszczeniu danych; modelo538 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Przegląd celów, metod i zastosowań eksploracji danych multimedialnych w wania F4, dotyczącą wyboru technik modelowania i ustalenia optymalnych wartości parametrów; ewaluację modelu F5, w odniesieniu do osiągnięcia celów dziedziny; wdrażania F6, obejmującą zastosowanie modelu w procesie podejmowania decyzji; w fazie tej będą generowane raporty, a proces eksploracji danych będzie powtarzalny. Poziom zadań ogólnych ZO obejmuje całkowity proces eksploracji danych, wszystkie możliwe aplikacje i techniki modelowania. Poziom zadań wyspecjalizowanych ZS opisuje jak ogólne zadanie może różnić się w różnych sytuacjach. Poziom instancji procesu IP rejestruje działania, decyzje i wyniki związane z aktualnym zastosowaniem eksploracji danych. w 4 Cele, metody, dziedziny i przykłady zastosowań eksploracji danych multimedialnych w W dalszej części rozdziału krótko opisano najbardziej popularne cele, metody eksploracji danych multimedialnych takie jak: podział zestawu obiektów, odkrywanie reguł, drzewa decyzyjne, rozpoznawanie wzorców, predykcja trendów i redukcja wymiarowości oraz podano przykłady zastosowań tych metod w biometrii, medycynie, przemyśle samochodowym, odzieżowym oraz w produkcji telewizyjnej. da .b 4.1 Charakterystyka celów i metod pl s. Jednym z popularnych celów eksploracji danych jest podział zestawu obiektów opisanych w przestrzeni wielowymiarowej na mniejsze, spójne jednostki: klasy, podstruktury lub części. Te podstruktury umożliwiają lepsze zrozumienie zależności zachodzących w zbiorze obiektów i pozwalają przypisać nowy obiekt do jednej z klas, w oparciu o odpowiednią informację. W klasyfikacji z nadzorem, każdy obiekt należy do jednej z predefiniowanych klas opisanych przez wektor danych. Ta klasa musi być zrekonstruowana na podstawie wektora danych [3]. W klasyfikacji bez nadzoru tj. w grupowaniu, nowy obiekt jest przypisywany do grupy podobnych obiektów, zgodnie z jego zawartością, a podobieństwo obiektów wewnątrz grupy jest maksymalizowane. Grupowanie jest często używane we wczesnych stadiach procesu eksploracji danych multimedialnych. Jeżeli celem eksploracji jest odkrywanie zachodzących prawidłowości stosowana jest metoda odkrywania reguł asocjacyjnych przyjmujących postać „jeżeli A to B”, gdzie A – poprzednik reguły i B – następnik reguły, są podzbiorami rozłącznymi zbioru obiektów multimedialnych, ze wsparciem s = P(A∩B), oraz miarą dokładności (poziomu ufności) reguły c =P(B│A) [14]. Typowy algorytm działa dwuetapowo: najpierw wyszukuje się zbiór spełniający ograniczenie minimalnego wsparcia, a później generuje się reguły spełniające ograniczenie minimalnego poziomu ufności [25]. Dla klasyfikacji obiektów multimedialnych, oprócz takich metod jak k-najbliższych sąsiadów, Bayesa, SVM, często wykorzystuje się metodę drzew decyzyjnych, w której każdy węzeł drzewa jest związany z testem wartości atrybutu, każda gałąź jest opisana wartością atrybutu, a każdy liść drzewa jest związany z wartością klasy [17]. Jednak, gdy wartości opisywanych atrybutów zmieniają się w niewielkim stopniu, decyzja związana z poprzednim opisem może zmienić się istotnie. Biorąc to pod uwagę do drzew decyzyjnych wprowadzono rozmytość uzyskując rozmyte drzewa decyzyjne [5]. W przypadku, gdy celem eksploracji danych multimedialnych jest rozpoznawanie wzorców lub predykcja trendów dla konstrukcji modelu stosuje się sztuczne sieci neuronowe 539 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 J. Świerzowicz w [12]. Sieci te posiadają zdolność uczenia się złożonych nieliniowych relacji wejścia-wyjścia. Dla redukcji wymiarowości problemu używana jest metoda analizy głównych składowych [11]. W metodzie tej oblicza się macierz kowariancji, charakteryzującej zestaw treningowy. Następnie obliczane są wartości własne i wektory własne macierzy kowariancji. Po uporządkowaniu wartości własnych w kolejności malejącej przeprowadza się transformację liniową przekształcającą n- wymiarową przestrzeń zmiennych w m-wymiarową przestrzeń wygenerowanych głównych składowych, których jest najczęściej mniej niż oryginalnych zmiennych. Dla wyboru głównych składowych stosuje się również teorię zbiorów przybliżonych [19]. w 4.2 Dziedziny i przykłady zastosowań eksploracji danych multimedialnych da .b w Eksploracja danych multimedialnych jest skutecznie stosowana w wielu dziedzinach. Może być użyta do identyfikacji obrazów z fotografii lotniczych lub satelitarnych, odkrywania wzorców w bazach obrazów medycznych [2], identyfikacji osób rozmawiających i słów w systemie rozpoznawania mowy, do analizy utworów muzycznych [8], multimedialnych zasobów internetowych [1], w przemyśle odzieżowym i środków transportu, w usługach turystycznych, produkcji filmowej i telewizyjnej oraz do rozpoznawania tekstu z danych multimedialnych [24]. W dalszej części rozdziału opisano wybrane przykłady zastosowań eksploracji danych multimedialnych w biometrii, medycynie oraz produkcji telewizyjnej. W biometrii rozpatrywane są problemy automatycznej identyfikacji osób na podstawie analizy ich cech psychologicznych, fizycznych i behawioralnych [12]. Biometria łączy w sobie analizę cech fizycznych ręki (geometria, odciski palców i dłoni), oka (źrenica, siatkówka), twarzy (obraz, termogram), ucha, głosu, sposobu poruszania się, podpisu dla identyfikacji nieznanej osoby lub dla weryfikacji jej tożsamości. W systemach biometrycznych muszą zostać rozwiązane liczne problemy związane z eliminacją szumu w danych oraz modyfikacją charakterystyk sensorów. Do głównych zadań należy problem rozpoznawania twarzy, w którym analizuje się miarę podobieństwa między wektorami cech twarzy przechowywanymi w bazie danych, a możliwą instancją obiektu w ramach obrazu. Moduł rozpoznawania obrazów jest częścią multimodalnego biometrycznego systemu uwierzytelnienia [9]. Przykładem zastosowania eksploracji danych multimedialnych w medycynie jest wykorzystanie eksploracji obrazów z badań gastroenterologicznych dla formułowania reguł rekomendujących leczenie [15]. Baza danych przechowuje wzorce, z których każdy rozpatrywany jest jako reprezentatywny przypadek zawierający sformalizowany tekst, wartości numeryczne i obraz endoskopowy. Podczas badania pacjenta, przeprowadzana jest automatyczna klasyfikacja choroby. Innym przykładem zastosowania jest model hurtowni danych, przechowującej podstawowe dane pacjenta wraz z obserwacjami wykrytych patologii i sygnałami EKG [2]. Eksploracja danych multimedialnych jest również szeroko stosowana w odkrywaniu struktur z wiadomości wideo, dla odkrywania interesujących sekwencji lub identyfikacji osób tam występujących. Podstawowym problemem jest wówczas wydzielenie kanału wizyjnego, tekstowego i dźwiękowego [5]. Ze strumienia wideo wydobywa się cechy treści przestrzennej obrazu (kolor, tekstura, kształt), wizualnej treści chwilowej (ruch kamery i obiektu), ze strumienia dźwięku głośność, częstotliwość i barwę, oraz informacje tekstową ukazującą się na ekranie. Następnie eksplorowane są dane koloru ze zbioru ramek, dla odkrywania obecności zachodzących w nich zmian. Efektywny sposób integracji eksploracji danych i wielomodalnego przetwarzania sekwencji wideo zastosowano dla rejestracji pl s. 540 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Przegląd celów, metod i zastosowań eksploracji danych multimedialnych interesujących zdarzeń na meczach piłkarskich. System składa się z parsera wideo, modułu wstępnej filtracji danych i modułu eksploracji [4]. W przemyśle odzieżowym i środków transportu wykorzystywane są bazy danych zawierające antropometryczne i statystyczne dane o populacji mieszkańców Europy i Ameryki, wraz z trójwymiarowymi obrazami kształtów ciała [11]. Stosując metodę grupowania można odnaleźć podobne osoby w populacji przechowywanej w bazie. w 6 Uwagi końcowe i wnioski Literatura 1. da .b w w Analiza metod, algorytmów i zastosowań eksploracji danych multimedialnych ma wpływ na rozwój tej dziedziny technologii informatycznej. Używanie multimodalnych interfejsów i inteligentnych urządzeń przyczyni się do generowania danych w różnorodnej formie, z których wiedza może być uzyskiwana dzięki stosowaniu metod eksploracji danych multimedialnych. Aktualne badania koncentrują się na tworzeniu skalowalnych rozwiązań w rozproszonym i mobilnym środowisku, opracowywaniu nowych standardów procesu eksploracji z uwzględnieniem danych multimedialnych oraz integracji tych rozwiązań z inteligentnymi interfejsami. Nieodpowiedni sposób stosowania eksploracji danych multimedialnych może również przynosić negatywne skutki społeczne związane z zagrożeniem prywatności. pl s. Agyemang, M., Barker, K.,& Alhajj, R. (2005): Web outlier mining: Discovering outliers from web datasets. Intelligent Data Analysis 9, IOS Press, 473-486. 2. Arigon, A. M., Tchounikine, A., Miquel, M.: Handling multiple points of view in a multimedia data warehouse. ACM Transactions on Multimedia Computing, Communications and Applications, 2(3), 199-218, 2006. 3. Bock, H.: The goal of classification. W ramach pracy zbiorowej pod redakcją W. Klosgen, J.M. Zytkow, Handbook of data mining and knowledge discovery, New York, Oxford University Press, 2002. 4. Chen, S. C., Shyu, M. L., Chen, M., Chengcui, Z. A decision tree-based multimodal data mining framework for soccer goal detection. IEEE International Conference on Multimedia and Expo (ICME 2004), Taipei, Taiwan, 2004. 5. Detyniecki, M., Marsala, C. Fuzzy multimedia mining applied to video news. The 9th International Conference on Information Processing and Management of Uncertainity in Knowledge-Based Systems, IPMU 2002, 1001-1008, Annecy, France, 2002. 6. Fayyad, U. (2001). The digital physics of data mining. Communications of the ACM, 44(3), 6265. 7. Fayyad, U., Uthurusamy R.: Evolving data mining into solution for insight. Communications of the ACM, 45(8), 28-31, 2002. 8. Ferrara, A., Ludovico, L., Montanelli, S., Castano, S., Haus, G. :A semantic Web ontology for context-based classification and retrieval of music resources. ACM Transactions on Multimedia Computing, Communications and Applications, 2(3), 177-198, 2006. 9. Frischholz, R.,W., Werner, A.: Avoiding replay-attacs in a face recognition system using headpose estimation. Proceedings of the IEEE International Workshop on Analysis and Modeling of Faces and Gestures (AMFG’03), 1-2, 2003. 10. Hair, J. F.: Knowledge creation in marketing: the role of predictive analytics. European Business Review, 19(4), 303-315, 2007. 541 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 J. Świerzowicz w 11. Herena, V., Paquet, E., le Roux, G.: Cooperative learning and virtual reality-based visualization for data mining. W ramach pracy zbiorowej pod redakcją J. Wang, Data Mining: Opportunities and Challenges,55-79, Hershey, PA: Idea Group Publishing, 2003. 12. Jain, A. K., Ross, A. Multibiometric Systems. Communications of the ACM, 47(1), 34-40, 2004. 13. Kossmann, D.: The state of the art in distributed query processing. ACM Computing Surveys, 32(4), 422–469, 2000. 14. Larose D.: Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych. PWN, Warszawa, 2006. 15. Mazurkiewicz, A., Krawczyk, H.: A parallel environment for image data mining. Proceedings of the International Conference on Parallel Computing in Electrical Engineering (PARELEC’02), Warsaw, Poland, 2002. 16. Melton, J., Eisenberg, A.: SQL multimedia and application packages (SQL/MM), SIGMOD Record, 30(4), 97-102, 2001. 17. Quinlan, J.R.: Introduction of decision trees. Machine Learning, 1(1), 86-106, 1986. 18. Rowe, L. A., Jain, R.: ACM SIGMM Retreat report on future directions in multimedia research, ACM Transaction on Multimedia Computing. Communications and Applications, 1(1), February, 3-13, 2004. 19. Skowron, A., Świnarski, R. W.: Information granulation and pattern recognition. W ramach pracy zbiorowej pod redakcją S. K. Pal, L. Polkowski, A. Skowron, Rough-neural computing, 599-636, Berlin, Heidelberg,Springer-Verlag, 2004. 20. Świerzowicz, J.: Decision support system for data and web mining tools selection. W ramach pracy zbiorowej pod redakcją M. Khosrow-Pour: Issues and trends of information technology management in contemporary organizations, 1118-1120, Hershey,PA, Idea Group Publishing, 2002. 21. Świerzowicz J.: Multimedia Data Mining Concept, W ramach pracy zbiorowej pod redakcją M. Pagani: Encyclopedia of Multimedia Technology and Networking, 696-703, Idea Group Reference, Hershey, London, Singapore, 2005. 22. Świerzowicz, J. Priorytety standaryzacji procesu zgłębiania danych. W ramach pracy zbiorowej pod redakcją Kozielski, S., Kasprowski, P. Mrozek, D. Bazy danych: Nowe Technologie, 401-412, Warszawa, Wydawnictwo Komunikacji i Łączności, 2007. 23. Thuraisingham, B.: XML databases and the Semantic Web. Boca Raton: CRC Press, 2002. 24. Wijesekera, D., Barbara, D.: Multimedia applications. W ramach pracy zbiorowej pod redakcją W. Klosgen, J.M. Zytkow: Handbook of data mining and knowledge discovery, New York, Oxford University Press, 2002. 25. Zhang, J., Hsu, W., Li Lee M.: Image mining: Issues, frameworks and techniques. W ramach pracy zbiorowej pod redakcją O., R. Zaiane, S. J. Simoff: Proceedings of the Second International Workshop on Multimedia Data Mining (MDM/KDD’ 2001) in conjunction with Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining KDD 2001, 13-21, San Francisco, ACM Press, 2001. 26. Zhang, J., Hsu, W., Lee, L. M.: An information driven framework for image mining. Proceedings of 12th International Conference on Database and Expert Systems Applications (DEXA), Munich, Germany,2001. da .b w w pl s. 542 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008