Analiza i przetwarzanie grafowych struktur danych na przykładzie
Transkrypt
Analiza i przetwarzanie grafowych struktur danych na przykładzie
Analiza i przetwarzanie grafowych struktur danych na przykładzie sieci społecznościowych Bartosz Perkowski, Wioletta Sokołowska, Witold Abramowicz Zarys problemu • Sieć społecznościowa jako węzły połączone ze sobą krawędziami • Analiza społeczności w grafie • Analiza charakterystyk krawędzi i węzłów Wyzwania • Jak charakteryzować użytkowników sieci społecznościowej? • W jaki sposób użytkownicy uczestniczą w relacjach? Wyzwania • Jak charakteryzować użytkowników sieci społecznościowej? • W jaki sposób użytkownicy uczestniczą w relacjach? • Czym jest społeczność i jak w grafie wyróżnić społeczności użytkowników? Wyzwania • Specyfika sieci społecznościowych (Facebook) w kontekście Big Data 1,32 mld aktywnych użytkowników 4,5 mld polubień dziennie W jednej minucie: 510 komentarzy, 293 000 zmian statusów, 136 000 zdjęć Dla 42% sprzedających jest krytyczny pod względem biznesowym Źródło: https://zephoria.com/social-media/top-15-valuable-facebook-statistics/ Proponowane rozwiązania • Wykorzystanie grafowych baz danych – neo4j – SAP HANA Graph Engine • Podejścia do wyznaczania społeczności: – podejście od ogółu - graf jako całość – podejście od szczegółu - od użytkownika • Badanie cech użytkowników i powiązań między nimi Proponowane rozwiązania • Problem dużej ilości danych, złożoność i wydajność obliczeniowa: – Konwersja danych do formatów umożliwiających wydajniejsze przeszukiwanie – Import danych – Agregaty danych jako podstawa optymalizacji – Wyszukiwanie i przetwarzanie danych z wykorzystaniem pamięci operacyjnej Proponowane rozwiązania • Wizualizacja danych w postaci grafu Inne możliwe zastosowania • Telekomunikacja – Analiza połączeń między użytkownikami • Energetyka – Analiza zużycia energii w mikrosieciach • Rynki finansowe i ubezpieczeniowe • Logistyka Wnioski • Problem charakteryzowania użytkowników i powiązań między nimi w sieciach społecznościowych • Problemy wielkości i złożoności danych oraz wizualizacja danych • Grafowe bazy danych kluczem do analizy sieci społecznościowych • Adaptacja rozwiązania