Analiza i przetwarzanie grafowych struktur danych na przykładzie

Transkrypt

Analiza i przetwarzanie grafowych struktur danych na przykładzie
Analiza i przetwarzanie
grafowych struktur danych na przykładzie
sieci społecznościowych
Bartosz Perkowski, Wioletta Sokołowska, Witold Abramowicz
Zarys problemu
• Sieć społecznościowa jako węzły połączone ze
sobą krawędziami
• Analiza społeczności w grafie
• Analiza charakterystyk
krawędzi i węzłów
Wyzwania
• Jak charakteryzować użytkowników sieci
społecznościowej?
• W jaki sposób użytkownicy uczestniczą
w relacjach?
Wyzwania
• Jak charakteryzować użytkowników sieci
społecznościowej?
• W jaki sposób użytkownicy uczestniczą
w relacjach?
• Czym jest społeczność i jak w grafie wyróżnić
społeczności użytkowników?
Wyzwania
• Specyfika sieci społecznościowych (Facebook)
w kontekście Big Data
1,32 mld aktywnych
użytkowników
4,5 mld polubień
dziennie
W jednej minucie:
510 komentarzy,
293 000 zmian statusów,
136 000 zdjęć
Dla 42% sprzedających
jest krytyczny pod
względem biznesowym
Źródło: https://zephoria.com/social-media/top-15-valuable-facebook-statistics/
Proponowane rozwiązania
• Wykorzystanie grafowych baz danych
– neo4j
– SAP HANA Graph Engine
• Podejścia do wyznaczania społeczności:
– podejście od ogółu - graf jako całość
– podejście od szczegółu - od użytkownika
• Badanie cech użytkowników i powiązań między
nimi
Proponowane rozwiązania
• Problem dużej ilości danych, złożoność
i wydajność obliczeniowa:
– Konwersja danych do formatów umożliwiających
wydajniejsze przeszukiwanie
– Import danych
– Agregaty danych jako podstawa optymalizacji
– Wyszukiwanie i przetwarzanie danych z
wykorzystaniem pamięci operacyjnej
Proponowane rozwiązania
• Wizualizacja danych w postaci grafu
Inne możliwe zastosowania
• Telekomunikacja
– Analiza połączeń między użytkownikami
• Energetyka
– Analiza zużycia energii w mikrosieciach
• Rynki finansowe i ubezpieczeniowe
• Logistyka
Wnioski
• Problem charakteryzowania użytkowników i
powiązań między nimi w sieciach
społecznościowych
• Problemy wielkości i złożoności danych oraz
wizualizacja danych
• Grafowe bazy danych kluczem do analizy sieci
społecznościowych
• Adaptacja rozwiązania