Czym jest wizualizacja danych?
Transkrypt
Czym jest wizualizacja danych?
Wizualizacja danych Proces wizualizacji danych Metody filtrowania i odwzorowania danych Witold Andrzejewski Politechnika Poznańska, Instytut Informatyki Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Czym jest wizualizacja danych? Henning Scharsach: Advanced Raycasting for Virtual Endoscopy on Consumer Graphics Hardware http://www.business-intelligence-secrets.com/wpcontent/uploads/2011/05/1212912_38514992.jpg Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 2 Czym jest wizualizacja danych? Zbiór metod tworzenia, analizy i przekazywania informacji. Może być oparta o różne zmysły. Wzrok Słuch Dotyk Zapach Smak Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 3 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Wizualizacja Transformuje reprezentację symboliczną w geometryczną. Pozwala zobaczyć rzeczy normalnie niewidzialne. Pozwala „przetwarzać” i przyswajać olbrzymie ilości danych szybciej. Jest techniką eksploracji danych, która pozwala badaczowi uzyskać zrozumienie i intuicję reguł rządzących danymi. Wizualizacją można nazwać odwzorowanie danych w ich reprezentację w formacie, który człowiek jest w stanie postrzegać różnymi zmysłami (najczęściej wzrokiem). Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Cele wizualizacji (1/2) Wspomaganie analizy i zrozumienia danych: wybranie interesujących danych, pokazanie ukrytych zależności i charakterystyk w danych, analizowanie danych za pomocą środków wizualnych. Komunikacja przekazanie skomplikowanych informacji w zrozumiałej postaci, wskazanie ekspertom dalszych kierunków badań/działań. Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Cele wizualizacji (2/2) Kontrola Interaktywna wizualizacja pozwalająca na dokładniejszą analizę wybranych właściwości danych na podstawie przesłanek zaobserwowanych wcześniej. Użycie reprezentacji wizualnej w celu jak najszybszego zrozumienia badanych zjawisk. Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Powiązane dziedziny nauki Przetwarzanie sygnałów, obrazów Wizualizacja Psychologia, kognitywistyka Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Wizualizacja a infografika (1/2) Infografika Tworzona ręcznie Dla konkretnego zestawu danych (trudno jest ją odtworzyć dla nowych danych) Ładna wizualnie Przedstawia niewiele danych http://speckyboy.com/2010/11/12/12-inspirationally-designed-infographics-for-designers/ Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 8 Wizualizacja a infografika (2/2) Wizualizacja 1,5 1 0,5 0 -40 -0,5 -1 60 160 260 360 Generowana algorytmicznie Łatwa do odtworzenia dla nowych danych Estetyka nie jest celem, a co najwyżej efektem ubocznym Przedstawia duże zbiory danych -1,5 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 9 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Podział wizualizacji Wizualizacje eksplorujące Tworzone przez twórcę na własny użytek Kiedy twórca chce poznać dane Wizualizacje tłumaczące Kiedy twórca wie co jest w danych i stara się to przekazać innym Może być częścią dłuższej prezentacji Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego str. 10 MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Trójca: Dane-Twórca-Odbiorca Odbiorca Informacja Dane Perswazja Sztuka Twórca Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 11 Wizualizacja informacyjna Neutralna prezentacja faktów Ma przekazać wiedzę odbiorcy http://www.tableausoftware.com/about/blog/2012/04/guest-post-future-data-visualization-16578 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 12 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Wizualizacja perswazyjna Przekazać konkretny punkt widzenia Dane są specjalnie wybrane aby osiągnąć cel http://strata.oreilly.com/2010/08/visualization-as-journalism.html Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 13 Wizualizacja - sztuka Transformacja jednokierunkowa Transformacja danych do postaci graficznej http://planetary.bloom.io/ Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 14 Proces wizualizacji danych Dane uzyskane z symulacji Dane z baz danych Dane z pomiarów Pozyskanie danych Surowe dane Filtrowanie danych Dane gotowe do wizualizacji Dane do wizualizacji Generowanie obrazów Odwzorowanie Zwizualizowane dane Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Pozyskanie danych - źródła Pozyskanie danych Dane uzyskane z symulacji Dane z baz danych Surowe dane Dane z pomiarów Świat rzeczywisty pomiary i obserwacja Świat teoretyczny … Nieraz olbrzymie rozmiary danych do przeanalizowania! modele matematyczne i techniczne Świat sztuczny dane „generowane” przez człowieka Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Dane rzeczywiste • Obrazowanie medyczne • Systemy informacji geograficznej (GIS) • Mikroskopia elektronowa • Meteorologiczne dane satelitarne • Dane sejsmiczne • Krystalografia • Fizyka wysokich energii • Astronomia (Teleskop Hubbla – 100MB dziennie) • Dane systemów obronnych Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Dane teoretyczne Symulacje Nauka • Dynamika molekularna • Chemia kwantowa • Matematyka • • • • Modelowanie molekularne Fizyka obliczeniowa Meteorologia Obliczeniowa mechanika cieczy Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Dane teoretyczne Symulacje Inżynieria • Przeglądanie modeli architektonicznych • Mechanika strukturalna • Projektowanie samochodów Aplikacje komercyjne • Grafika biznesowa • Modele ekonomiczne • Modelowanie finansów Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Dane teoretyczne Systemy informatyczne • Rynek papierów wartościowych (300 milionów transakcji dziennie w Nowym Yorku) • Analiza rynku i sprzedaży • World Wide Web Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Dane sztuczne • Szkice • Malarstwo • Materiały publikowane • TV (reklamówki, trailery) • Filmy (animacje, efekty specjalne) Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Źródła błędów w danych Etap pozyskiwania danych Dokładność i niezawodność urządzenia pomiarowego. Dokładność próbkowania (przestrzenna i czasowa). Czy zmiennoprzecinkowe typy są wystarczająco dokładne z punktu widzenia mierzonych wartości. Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Filtrowanie danych Filtrowanie danych Surowe dane Dane do wizualizacji Konwersja formatu Obcinanie, kadrowanie, usuwanie szumu Resampling Interpolacja, aproksymacja Klasyfikacja, segmentacja Redukcja wymiarowości Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Interpolacja/aproksymacja 4,5 Interpolacja wielomianowa (n-1)D 4 3,5 3 Interpolacja „Nearest Neighbor” (0D) 2,5 2 1 2 3 4 5 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Spline D: EFG , FH I → K FG , FH L FG , FM ∪ FM , FO ∪ ⋯ ∪ EFHQG, FH I D F LR SG 1F2 F ∈ EFG , FM I F ∈ EFM , FO I SM 1F2 ⋮ ⋮ SHQG 1F2 F ∈ EFHQG, FH I ∀WXY,…,k[1 S\QG=S\ W W http://scaledinnovation.com/analytics/splines/aboutSplines.html Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 25 Interpolacja/aproksymacja http://www.farfieldtechnology.com/products/toolbox/noisy/ Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Interpolacja/aproksymacja Lokacja Temperatura Chicago 75 Detroit 79 Motreal 67 Pittsburgh 68 Toronto 72 Washington 75 … … http://www.intellicast.com/Local/WxMap.aspx Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Usuwanie szumu http://www.mathworks.com/matlabcentral/fx_files/34743/2/expsmooth.png http://www.theoildrum.com/uploads/12/eia_iea_ma_jun06.jpg Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Usuwanie szumu/wygładzanie Moving average Savitzky-Golay Kernel smoother Laplacian smoothing Low-pass filter Local regression Smoothing spline Ramer-DouglasPeucker Exponential smoothing Kolmogorov-Zurbenko Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego str. 29 MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Moving average (1/2) 1,2 1,2 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 0 5 10 15 20 25 1,2 0 5 10 15 20 25 0 5 10 15 20 25 1,2 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 0 5 10 15 20 25 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 30 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Moving average (2/2) Najprostszy wariant `\ = 1 a H/M b WXQ H/M c\dW Wariant z wagami `\ = A co z danymi próbkowanymi w nierównomiernych odstępach czasu? H/M 1 b fW c\dW H/M ∑WXQ H/M fW WXQ H/M Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego str. 31 MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Savitsky-Golay filter (1/2) Idea: zamiast średniej - aproksymacja za pomocą funkcji wielomianowej 1,2 1,2 1 1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 32 Savitsky-Golay filter (2/2) Podstawowy pomysł – bardzo kosztowny Przy założeniu stałej częstotliwości próbkowania sprowadza się do średniej kroczącej z wagami Można również obliczać pochodne Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 33 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Local regression Podobne do idei Savitskiego-Golaya Używana jest ważona metoda najmniejszych kwadratów Do regresji wykorzystywanych jest n najbliższych sąsiadów Wagi są obliczane na podstawie odległości Brak optymalizacji, ale i założenia o stałej częstotliwości próbkowania. Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 34 Laplacian Smoothing (1/2) Wygładzanie modeli 3D Każdy wierzchołek jest średnią ważoną topologicznie sąsiednich wierzchołków. Wagi =1 lub na podstawie odległości/pól sąsiadów S= k 1 b f\ S\ j \XG Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 35 Laplacian Smoothing (2/2) http://graphics.stanford.edu/courses/cs468-12-spring/LectureSlides/06_smoothing.pdf Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 36 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Low-pass filter (1/2) Przepuszcza sygnały o niskiej częstotliwości Osłabia sygnały o wysokiej częstotliwości W wersji idealnej można go zrealizować mnożąc sygnał razy funkcję prostokątną w dziedzinie częstotliwości Pozwala uniknąć aliasingu przy próbkowaniu sygnałów Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego str. 37 MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Low-pass filter (2/2) 1,5 70 1 0,9 60 1 0,8 50 0,7 0,5 0,6 40 0,5 0 -40 10 60 110 160 210 260 310 30 360 0,4 0,3 20 -0,5 0,2 10 -1 0,1 0 -80 -1,5 -60 -40 -20 0 0 20 40 60 80 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 38 Kolmogorov-Zurbenko (1/2) Wielokrotne wykonanie średniej kroczącej. Aby uniknąć wielokrotnego wygładzania, można skorzystać ze wzoru: lmn,o = o nQG M b qXQ o nQG M pqn,o s F+` ro Gdzie m to szerokość okna (liczba nieparzysta), k to liczba powtórzeń a pqn,o to współczynniki wielomianu: 1 + u + ⋯ + u nQG o Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 39 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Kolmogorov-Zurbenko (2/2) Uzyskany w ten sposób filtr jest filtrem dolnoprzepustowym o częstotliwości odcięcia: vY ≈ 6 1 − (1/2)G/Mo y rM − (1/2)G/Mo Gdzie z ∈ (0,1) jest predefiniowaną wartością Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 40 Smoothing spline (1/4) (xi,yi) - zbiór punktów/obserwacji, c\ = } ~\ + •\ •\ - ciąg niezależnych zmiennych losowych o wariancji V •\ = •\M Funkcja S(x) - dowolny spline złożony z funkcji dwukrotnie różniczkowalnych, minimalizująca: H c\ − D(~\ ) ‚ = vb •\ M \XY †‡ + (1 − v) ƒ D′′(~) M …~ †ˆ ... jest splinem wygładzającym Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 41 Smoothing Spline (2/4) H ‚ = vb \XY c\ − D(~\ ) •\ M †‡ + (1 − v) ƒ D′′(~) M …~ †ˆ v – określa wagę każdego z dwóch członów ‰ Q‹(† ) M Człon ∑H\XY Š Œ Š to kryterium Š najmniejszych kwadratów – jakość dopasowania spline do punktów pomiarowych. Dla v = 1 mamy zwykły spline. Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 42 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Smoothing Spline (3/4) H ‚ = vb Człon †‡ •† ˆ Intuicja: \XY c\ − D(~\ ) •\ M M †‡ + (1 − v) ƒ D′′(~) M …~ †ˆ D′′(~) …~ określa krzywiznę. funkcja liniowa jest gładka, D ŽŽ ~ = 0 D ŽŽ ~ ≠ 0: funkcja jest wklęsła/wypukła Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 43 Smoothing Spline (4/4) http://support.sas.com/documentation/cdl/en/imlug/65547/HTML/default/images/splineplota.png Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 44 Ramer-Douglas-Peucker (1/2) Algorytm upraszcza krzywą złożoną z odcinków poprzez usuwanie punktów: http://en.wikipedia.org/wiki/Ramer%E2%80%93Douglas%E2%80%93Peucker_algorithm Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 45 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Ramer-Douglas-Peucker (2/2) Tolerancja: 1 2 3 4 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego str. 46 MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Exponential smoothing (1/2) Wygładzanie danych w postaci serii czasowych (i nie tylko). Niech yi oznacza kolejne próbkowane wartości (stała częstotliwość próbkowania) W najprostszej wersji (wygładzanie Browna) `Y = cY `\ = vc\ + (1 − v)`\QG Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego str. 47 MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Exponential smoothing (2/2) 1,5 1 0,5 Bez zmian Lambda=0,2 0 Lambda=0,07 0 50 100 150 200 250 300 350 Lambda=0,03 Lambda=0,01 -0,5 -1 -1,5 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE str. 48 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Resampling http://t3.gstatic.com/images?q=tbn:ANd9GcSe16wH7HVvUwWjYiX00i u_5-Aq6xr1lKFiTIk9-Yrc-ORg4UU&t=1 http://www.omatrix.com/sptmanual/ex_resample.gif http://t0.gstatic.com/images?q=tbn:ANd9GcRs82c2OsSn CTOcSnEvFsrMPoWxIByggR0QhKkxIVUpAQQKlA&t=1 Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Klasyfikacja/segmentacja https://monk.library.illinois.edu/cic/public/analytics/decision_tree.png http://cdn2.business2community.com/wp-content/uploads/2012/06/customer-segmentation-image.jpg Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inteligentnego rozwoju” współfinansowany przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego MATERIAŁY DYDAKTYCZNE I SZKOLENIOWE NA STUDIA PODYPLOMOWE I SZKOLENIA DYSTRYBUOWANE SĄ BEZPŁATNIE
Podobne dokumenty
Redukcja wymiarowości Feature selection Feature extraction
Jarosław Gramacki, Artur Gramacki: „Wybrane metody redukcji wymiarowości danych oraz ich wizualizacji” Człowiek – najlepsza inwestycja Projekt nr POKL.04.03.00-00-131/12 „Inżynieria wiedzy dla inte...
Bardziej szczegółowo