Warsztaty metod fizyki teoretycznej Zestaw 7 Układy złożone

Transkrypt

Warsztaty metod fizyki teoretycznej Zestaw 7 Układy złożone
Warsztaty metod fizyki teoretycznej
Zestaw 7
Układy złożone - sieci w otaczającym nas świecie
Marcin Zagórski, Jan Kaczmarczyk
24.04.2014
1
Wprowadzenie
W otaczającym nas świecie odnajdujemy wiele struktur, które w naturalny sposób można opisać
z użyciem pojęcia grafu (sieci): sieć WWW, Internet, cytowania prac naukowych, transport, metabolizm, sieć kontaktów seksualnych... Zauważmy, że opis takiego systemu będzie znacząco różny od
przykładowo regularnej struktury kryształu. Niemniej, jeśli analizowany układ potraktujemy jako
zbiór bardzo wielu obiektów (wierzchołki grafu) połączonych prostymi relacjami (krawędzie grafu;
np. linki między stronami WWW, połączenia między serwerami, referencje w publikacjach itp.) to
z pomocą przychodzą nam metofy fizyki statystycznej [1].
2
Sformułowanie problemu
Każdy z powyższych systemów w dużym uproszczeniu można przedstawić jako zbiór identycznych wierzchołków połączonych krawędziami. Jednak dopiero zdefiniowanie praw rządzących ewolucją takiego układu (przyłączanie nowych wierzchołków, przepinanie krawędzi) pozwala nam analizować jego dynamikę i statystyczne własności.
W tym zestawie skupimy się na modelu BA zaproponowanym przez Barabási i Albert [2], który
wywołał “lawinowy” wysyp publikacji o podobnej tematyce. Spróbujemy zobaczyć jak zastosowanie
prostych praw do pojedynczych elementów układu powoduje jego samoorganizację. Równocześnie
obliczymy rozkład krotności oraz średnią odległość będące istotnymi charakterystykami sieci w
otaczającym nas świecie.
Zad. 1. Zebrane dane. Co z nich wynika?
W pracy [3] autorzy zebrali informacje o topologii fragmentu sieci WWW liczącego w przybliżeniu 325 tys. dokumentów HTML oraz 1469 tys. linków między nimi. Zamieszczone wykresy pokazują
rozkład krotności P (k) dla tych danych, czyli jakie jest prawdopodobieństwo zaobserwowania strony
posiadającej k wychodzących (rys. 1a)/ wchodzących (rys. 1b) linków.
Na rys. 1 przerywane linie odpowiadają dopasowaniom analitycznym. Zastanów się:
a) jakie jest zachowanie dopasowanej funkcji dla ogona rozkładu P (k) (powiedzmy dla k > 50)?
1
Rysunek 1: Histogram (a) liczby linków wychodzących (znajdujących się w dokumencie HTML) oraz
(b) liczby linków prowadzących do danego dokumentu HTML. Rysunek zaczerpnięto z pracy [3].
b) znając jakościowy charakter zaniku oceń na podstawie wykresu jego ilościowy charakter.
Zad. 2. Czy umiemy modelować/zrozumieć tego typu zależność?
W fizyce oraz w innych naukach, kiedy analizujemy dany problem, często kluczowe jest wybranie jego istotnych cech, a pominięcie takich, które tylko zaciemniają obraz zagadnienia lub
utrudniają rachunki. Niebezpieczne bywa również zbytnie uproszczenie modelu, gdyż wtedy możemy nie uzyskać właściwego wyniku końcowego. Okazuje się, że powyższe jakościowe zachowanie
można otrzymać rozpatrując model grafu z przypadkowo (ale wg pewnej reguły) przyłączanymi
wierzchołkami. Czy masz pomysł od czego (jakiego parametru grafu) mogłaby zależeć ta reguła1 ?
Zad. 3. Równania wzrostu. Model BA
Rozpatrzmy następujący model sieci. Zaczynając od jednego wierzchołka konstruujemy graf2
przez pojedyncze przyłączanie nowych wierzchołków. Przy czym każdy nowy wierzchołek przyłączamy do dokładnie jednego z wierzchołków istniejących już w grafie z prawdopodobieństwem
pk ∼ k. Główną wielkością jaką chcemy obliczyć jest nk (N ), czyli liczba wierzchołków o krotności
k w chwili gdy graf ma rozmiar N (posiada N wszystkich wierzchołków).
W tym celu rozwiążemy równanie mówiące jak nk zmienia się po dołączeniu nowego wierzchołka:
nk (N + 1) = nk (N ) + ξ(k, N ),
(1)
gdzie ξ(k, N ) jest zmienną losową przyjmującą wartości -1, 0, 1. Znając postać ξ moglibyśmy sy1
2
Wskazówka. Reguła ta nosi nazwę “preferencyjnego przyłączania”.
Zakładamy, że graf jest nieskierowany w odróżnieniu od zad. 1 gdzie rozważany graf był skierowany.
2
mulować rozkład nk (N ), jednak nas interesować będzie średnia wartość3 hnk (N )i. Z (1) mamy:
hnk (N + 1)i = hnk (N )i + hξ(k, N )i ,
(2)
By rozwiązać powyższe równanie:
a) znajdź stałą normalizacyjną dla prawdopodobieństwa pk ∼ k dla grafu o rozmiarze N. Jaki
jest jej związek z liczbą wszystkich krawędzi L w grafie?
b) wydedukuj postać hξ(k, N )i,
c) korzystając z (a) i (b) rozwiąż (2) w granicy termodynamicznej tzn. dla N → ∞ podstaw
hnk (N )i = N P (k) i znajdź wyrażenie na P (k).
Choć wynik otrzymaliśmy w granicy N zmierzającego do ∞, to bez większych odstępstw można
go stosować dla odpowiednio dużych skończonych wartości N .
Dyskusja rozwiązania:
a) jakie jest asymptotyczne zachowanie P (k) dla dużych k i jak pogodzić to z N < ∞?
b) oblicz średnią krotność hki. Czy można było przewidzieć ten wynik?
c) jak zachowuje się hk 2 i ze wzrostem N ?
d) przykładowo dla N = 106 oblicz hn1 (N )i oraz hn100 (N )i. Jakie płyną z tego wnioski dla
topologii badanej sieci?
Zad. 4. Efekt małego świata
W latach 60-tych ubiegłego wieku S. Milgram przeprowadził eksperyment mający na celu zbadanie jaka jest średnia odległość w sieci skonstruowanej z wzajemnych znajomych spośród osób
zamieszkujących w Stanach Zjednoczonych. Stwierdził on, że odległość ta wynosi około 6 osób.
Przyjmując, że badana sieć ma rozmiar N = 3 × 108 , zastanów się jakiego rzędu będzie średnia
odległość hli dla:
a) sieci regularnej kwadratowej w d wymiarach?
b) grafu przypadkowego, np. takiego jak opisany w zad. 3?
Czy na podstawie znajomości rozwiązań (a) i (b) można określić, z którą siecią - regularną czy
przypadkową - miał do czynienia Milgram?
3
Liczona po zespole statystycznym wszystkich grafów mogących powstać w procesie wzrostu. Dla N → ∞ średnia
taka jest dobrze określona [5].
3
Zad. 5. Graf zupełnie przypadkowy
Początki teorii grafów przypadkowych wiążą się z klasyczną konstrukcję zaproponowaną przez
Erdösa i Rényi’ego prawie pół wieku temu [6]. W modelu tym liczba wierzchołków N i krawędzi
L jest
ustalona a krawędzie są rozmieszczone zupełnie losowo, tzn. jednorodnie spośród wszystkich
N
= N (N − 1)/2 możliwości połączenia wierzchołków (krawędzie nie mogą się pokrywać).
2
Bezpośrednio związany z modelem ER jest tzw. model binomialny, w którym zaczynamy konstruować graf z N pustych wierzchołków a następnie każdą parę wierzchołków łączymy z prawdopodobieństwem p. Oblicz:
a) rozkład P (L) liczby krawędzi L dla grafu o ustalonym N,
b) rozkład krotności P (k), a następnie znajdź rozkład, w który przechodzi P (k) w granicy dużych
N przy ustalonej średniej krotności hki. Jaką wartość mają pierwszy (średnia) i drugi moment
(wariancja) tego rozkładu?
Zad. 6. Model BA dla dowolnego m
Konstrukcja grafu przypadkowego rozważana w zad. 3 była szczególnym przypadkiem modelu BA. W ogólnym modelu występuje jeszcze jeden parametr m mówiący ile krawędzi ma nowo
przyłączany wierzchołek4 . Postępując analogicznie jak w zad. 3 znajdź rozkład P (k) dla dowolnego
m ≥ 1. W tym celu załóż, że graf początkowy składa się z m połączonych ze sobą wierzchołków.
Dodatkowo przyjmij, że każda z nowo przyłączanych do grafu krawędzi jest przyłączana niezależnie
tzn. wykonaj obliczenia tak jakby zdarzenie, że dwa wierzchołki mogą być połączone więcej niż jedną krawędzią było możliwe5 . Możemy tak zrobić, ponieważ interesuje nas co dzieje się dla N → ∞
a przyczynki od takich zdarzeń są pomijalne w tej granicy. Czy coś zmieni się gdy przeprowadzisz
dyskusję rozwiązania analogiczną do tej w zad. 3?
Literatura
[1] R. Albert, A.-L. Barabási, Statistical mechanics of complex networks, Rev. Mod. Phys. 74 47
(2002). Liczba cytowań: 1351.
[2] R. Albert, A.-L. Barabási, Emergence of scaling in random networks, Science 286 509 (1999).
[3] A.-L. Barabási, R. Albert, H. Jeong, Scale-free characteristics of random networks: The topology
of the world wide web, Physica A 281 69-77 (2000).
[4] P. L. Krapivsky, S. Redner, Organization of growing random networks, Phys. Rev. E 63 66123
(2001).
[5] S. N. Dorogovtsev, J. F. F. Mendes, A. N. Samukhin, Structure of growing networks: exact
solution of the Barabasi-Albert’s model, Phys. Rev. Lett. 85 4633 (2000).
[6] P. Erdös, A. Rényi, Publ. Math Debrecen 6 290 (1959); Publ. Math. Inst Hung. Acad. Sci 5 17
(1960).
4
5
W zad. 3 mieliśmy m = 1.
W rozpatrywanym modelu taka sytuacja jest zabroniona.
4