Warsztaty metod fizyki teoretycznej Zestaw 7 Układy złożone
Transkrypt
Warsztaty metod fizyki teoretycznej Zestaw 7 Układy złożone
Warsztaty metod fizyki teoretycznej Zestaw 7 Układy złożone - sieci w otaczającym nas świecie Marcin Zagórski, Jan Kaczmarczyk 24.04.2014 1 Wprowadzenie W otaczającym nas świecie odnajdujemy wiele struktur, które w naturalny sposób można opisać z użyciem pojęcia grafu (sieci): sieć WWW, Internet, cytowania prac naukowych, transport, metabolizm, sieć kontaktów seksualnych... Zauważmy, że opis takiego systemu będzie znacząco różny od przykładowo regularnej struktury kryształu. Niemniej, jeśli analizowany układ potraktujemy jako zbiór bardzo wielu obiektów (wierzchołki grafu) połączonych prostymi relacjami (krawędzie grafu; np. linki między stronami WWW, połączenia między serwerami, referencje w publikacjach itp.) to z pomocą przychodzą nam metofy fizyki statystycznej [1]. 2 Sformułowanie problemu Każdy z powyższych systemów w dużym uproszczeniu można przedstawić jako zbiór identycznych wierzchołków połączonych krawędziami. Jednak dopiero zdefiniowanie praw rządzących ewolucją takiego układu (przyłączanie nowych wierzchołków, przepinanie krawędzi) pozwala nam analizować jego dynamikę i statystyczne własności. W tym zestawie skupimy się na modelu BA zaproponowanym przez Barabási i Albert [2], który wywołał “lawinowy” wysyp publikacji o podobnej tematyce. Spróbujemy zobaczyć jak zastosowanie prostych praw do pojedynczych elementów układu powoduje jego samoorganizację. Równocześnie obliczymy rozkład krotności oraz średnią odległość będące istotnymi charakterystykami sieci w otaczającym nas świecie. Zad. 1. Zebrane dane. Co z nich wynika? W pracy [3] autorzy zebrali informacje o topologii fragmentu sieci WWW liczącego w przybliżeniu 325 tys. dokumentów HTML oraz 1469 tys. linków między nimi. Zamieszczone wykresy pokazują rozkład krotności P (k) dla tych danych, czyli jakie jest prawdopodobieństwo zaobserwowania strony posiadającej k wychodzących (rys. 1a)/ wchodzących (rys. 1b) linków. Na rys. 1 przerywane linie odpowiadają dopasowaniom analitycznym. Zastanów się: a) jakie jest zachowanie dopasowanej funkcji dla ogona rozkładu P (k) (powiedzmy dla k > 50)? 1 Rysunek 1: Histogram (a) liczby linków wychodzących (znajdujących się w dokumencie HTML) oraz (b) liczby linków prowadzących do danego dokumentu HTML. Rysunek zaczerpnięto z pracy [3]. b) znając jakościowy charakter zaniku oceń na podstawie wykresu jego ilościowy charakter. Zad. 2. Czy umiemy modelować/zrozumieć tego typu zależność? W fizyce oraz w innych naukach, kiedy analizujemy dany problem, często kluczowe jest wybranie jego istotnych cech, a pominięcie takich, które tylko zaciemniają obraz zagadnienia lub utrudniają rachunki. Niebezpieczne bywa również zbytnie uproszczenie modelu, gdyż wtedy możemy nie uzyskać właściwego wyniku końcowego. Okazuje się, że powyższe jakościowe zachowanie można otrzymać rozpatrując model grafu z przypadkowo (ale wg pewnej reguły) przyłączanymi wierzchołkami. Czy masz pomysł od czego (jakiego parametru grafu) mogłaby zależeć ta reguła1 ? Zad. 3. Równania wzrostu. Model BA Rozpatrzmy następujący model sieci. Zaczynając od jednego wierzchołka konstruujemy graf2 przez pojedyncze przyłączanie nowych wierzchołków. Przy czym każdy nowy wierzchołek przyłączamy do dokładnie jednego z wierzchołków istniejących już w grafie z prawdopodobieństwem pk ∼ k. Główną wielkością jaką chcemy obliczyć jest nk (N ), czyli liczba wierzchołków o krotności k w chwili gdy graf ma rozmiar N (posiada N wszystkich wierzchołków). W tym celu rozwiążemy równanie mówiące jak nk zmienia się po dołączeniu nowego wierzchołka: nk (N + 1) = nk (N ) + ξ(k, N ), (1) gdzie ξ(k, N ) jest zmienną losową przyjmującą wartości -1, 0, 1. Znając postać ξ moglibyśmy sy1 2 Wskazówka. Reguła ta nosi nazwę “preferencyjnego przyłączania”. Zakładamy, że graf jest nieskierowany w odróżnieniu od zad. 1 gdzie rozważany graf był skierowany. 2 mulować rozkład nk (N ), jednak nas interesować będzie średnia wartość3 hnk (N )i. Z (1) mamy: hnk (N + 1)i = hnk (N )i + hξ(k, N )i , (2) By rozwiązać powyższe równanie: a) znajdź stałą normalizacyjną dla prawdopodobieństwa pk ∼ k dla grafu o rozmiarze N. Jaki jest jej związek z liczbą wszystkich krawędzi L w grafie? b) wydedukuj postać hξ(k, N )i, c) korzystając z (a) i (b) rozwiąż (2) w granicy termodynamicznej tzn. dla N → ∞ podstaw hnk (N )i = N P (k) i znajdź wyrażenie na P (k). Choć wynik otrzymaliśmy w granicy N zmierzającego do ∞, to bez większych odstępstw można go stosować dla odpowiednio dużych skończonych wartości N . Dyskusja rozwiązania: a) jakie jest asymptotyczne zachowanie P (k) dla dużych k i jak pogodzić to z N < ∞? b) oblicz średnią krotność hki. Czy można było przewidzieć ten wynik? c) jak zachowuje się hk 2 i ze wzrostem N ? d) przykładowo dla N = 106 oblicz hn1 (N )i oraz hn100 (N )i. Jakie płyną z tego wnioski dla topologii badanej sieci? Zad. 4. Efekt małego świata W latach 60-tych ubiegłego wieku S. Milgram przeprowadził eksperyment mający na celu zbadanie jaka jest średnia odległość w sieci skonstruowanej z wzajemnych znajomych spośród osób zamieszkujących w Stanach Zjednoczonych. Stwierdził on, że odległość ta wynosi około 6 osób. Przyjmując, że badana sieć ma rozmiar N = 3 × 108 , zastanów się jakiego rzędu będzie średnia odległość hli dla: a) sieci regularnej kwadratowej w d wymiarach? b) grafu przypadkowego, np. takiego jak opisany w zad. 3? Czy na podstawie znajomości rozwiązań (a) i (b) można określić, z którą siecią - regularną czy przypadkową - miał do czynienia Milgram? 3 Liczona po zespole statystycznym wszystkich grafów mogących powstać w procesie wzrostu. Dla N → ∞ średnia taka jest dobrze określona [5]. 3 Zad. 5. Graf zupełnie przypadkowy Początki teorii grafów przypadkowych wiążą się z klasyczną konstrukcję zaproponowaną przez Erdösa i Rényi’ego prawie pół wieku temu [6]. W modelu tym liczba wierzchołków N i krawędzi L jest ustalona a krawędzie są rozmieszczone zupełnie losowo, tzn. jednorodnie spośród wszystkich N = N (N − 1)/2 możliwości połączenia wierzchołków (krawędzie nie mogą się pokrywać). 2 Bezpośrednio związany z modelem ER jest tzw. model binomialny, w którym zaczynamy konstruować graf z N pustych wierzchołków a następnie każdą parę wierzchołków łączymy z prawdopodobieństwem p. Oblicz: a) rozkład P (L) liczby krawędzi L dla grafu o ustalonym N, b) rozkład krotności P (k), a następnie znajdź rozkład, w który przechodzi P (k) w granicy dużych N przy ustalonej średniej krotności hki. Jaką wartość mają pierwszy (średnia) i drugi moment (wariancja) tego rozkładu? Zad. 6. Model BA dla dowolnego m Konstrukcja grafu przypadkowego rozważana w zad. 3 była szczególnym przypadkiem modelu BA. W ogólnym modelu występuje jeszcze jeden parametr m mówiący ile krawędzi ma nowo przyłączany wierzchołek4 . Postępując analogicznie jak w zad. 3 znajdź rozkład P (k) dla dowolnego m ≥ 1. W tym celu załóż, że graf początkowy składa się z m połączonych ze sobą wierzchołków. Dodatkowo przyjmij, że każda z nowo przyłączanych do grafu krawędzi jest przyłączana niezależnie tzn. wykonaj obliczenia tak jakby zdarzenie, że dwa wierzchołki mogą być połączone więcej niż jedną krawędzią było możliwe5 . Możemy tak zrobić, ponieważ interesuje nas co dzieje się dla N → ∞ a przyczynki od takich zdarzeń są pomijalne w tej granicy. Czy coś zmieni się gdy przeprowadzisz dyskusję rozwiązania analogiczną do tej w zad. 3? Literatura [1] R. Albert, A.-L. Barabási, Statistical mechanics of complex networks, Rev. Mod. Phys. 74 47 (2002). Liczba cytowań: 1351. [2] R. Albert, A.-L. Barabási, Emergence of scaling in random networks, Science 286 509 (1999). [3] A.-L. Barabási, R. Albert, H. Jeong, Scale-free characteristics of random networks: The topology of the world wide web, Physica A 281 69-77 (2000). [4] P. L. Krapivsky, S. Redner, Organization of growing random networks, Phys. Rev. E 63 66123 (2001). [5] S. N. Dorogovtsev, J. F. F. Mendes, A. N. Samukhin, Structure of growing networks: exact solution of the Barabasi-Albert’s model, Phys. Rev. Lett. 85 4633 (2000). [6] P. Erdös, A. Rényi, Publ. Math Debrecen 6 290 (1959); Publ. Math. Inst Hung. Acad. Sci 5 17 (1960). 4 5 W zad. 3 mieliśmy m = 1. W rozpatrywanym modelu taka sytuacja jest zabroniona. 4