X - Uniwersytet Warszawski

Transkrypt

ROZDZIAŁ V
STATYSTYCZNE PROBLEMY MODELOWANIA BLOKOWEGO
§1. WNIOSKOWANIE STATYSTYCZNE W ANALIZIE DANYCH
SOCJOMETRYCZNYCH
W analizie danych socjometrycznych można wyróżnić dwa podejścia do wnioskowania
statystycznego. W pierwszym podejściu, nazwiemy je „populacyjnym”, traktuje się
zaobserwowaną sieć jak losowo wybrany podgraf dużego grafu populacyjnego. Taki losowo
wybrany fragment sieci populacyjnej jest grafem indukowanym przez próbę losową jej
wierzchołków. Zaobserwowane w nim połączenia między wierzchołkami (obciążenia
krawędzi)
podgrafu
–
próby
pozwalają
na
wyznaczenie
wartości
parametrów
charakteryzujących podgraf. Mogą zatem być statystykami pozwalającymi na wnioskowanie
o cechach sieci populacyjnej, z której próba pochodzi.
Populacyjne podejście do wnioskowania z sieci-próby o parametrach sieci populacyjnej choć
jest jeszcze w „dziecięcej fazie rozwoju” (Frank, 1980) posiada już użyteczne dla praktyki
badawczej wyniki a także pewne osiągnięcia teoretyczne (jak np. monografie Bloemena’y,
1964; oraz Frank’a, 1971). Wyniki te pozwalają na:
– oszacowanie przedziałowe gęstości sieci g  X  , także wyznaczenie niezbędnej w tym
celu liczebności próby (Granovetter, 1976; także Tapierd,et al., 1975)
– oszacowanie oczekiwanej liczby diad odwzajemnionych  M  , asymetrycznych  A  i
pustych  O  w digrafie populacyjnym za pomocą nieobciążonych estymatorów oraz
oszacowanie (również nieobciążone) ich wariancji (Frank, 1979a, 1979b)
– oszacowanie oczekiwanej liczby nieizomorficznych triad w symetrycznym grafie
populacyjnym (triad counts) za pomocą nieobciążonych estymatorów a także
nieobciążone oszacowanie wariancji tych liczb (Frank 1979a, Frank 1979b)
– oszacowanie liczby spójnych komponentów1 w symetrycznym grafie populacyjnym
przechodnim lub typu „las” (Frank, 1978 a; także Tapierd, Lewin, Capobianco, 1975)
1
w polskiej literaturze z teorii grafów „component” tłumaczy się jako składową, ponieważ jednak używaliśmy
tego terminu w odniesieniu do X wielorelacyjnych, poprzestaniemy na powyższej konwencji.
178
– oszacowanie indeksów równowagi strukturalnej w grafie znakowanym symetrycznym
(populacyjnym) oraz wyznaczenie dla nich quasi-przedziałów ufności (  jedno
odchylenie standardowe estymatora; Frank, Harary, 1979/80)
Użyteczność powyższych rezultatów ogranicza się niestety tylko do takich sytuacji, w których
badacza-empiryka rzeczywiście interesuje sieć populacyjna i jej właściwości. Dzieje się tak w
badaniach typu „small-world problem” oraz w rzadkich przypadkach badań nad procesami
urbanizacyjnymi czy nad integracją społeczną rozpatrywaną na poziomie dużych
zbiorowości. Znakomitą większość danych socjometrycznych stanowią jednak socjogramy
zrealizowane w zbiorowościach o niewielkich z punktu widzenia statystyka liczebnościach, w
zbiorowościach, które traktowane są jako jedyny przedmiot badania. W takich sytuacjach
wszystkie charakterystyki zbadanej zbiorowości opisują tylko ją. Nie mamy więc do
czynienia z próbą losową lecz badamy całą zbiorowość. Mimo to liczni autorzy analizujący
takie dane empiryczne mówią o estymacji parametrów, niekiedy także o przyjmowaniu lub
odrzucaniu hipotez, o poziomie istotności. Czy używają oni wówczas terminologii
statystycznej niezgodnie z jej przeznaczeniem? Wydaje się, że nie stosują bowiem drugie
podejście do wnioskowania statystycznego, które nazwiemy modelowym.
W podejściu tym przedmiotem badania, do którego danych empirycznych dostarcza
zaobserwowana sieć, jest model probabilistyczny sieci. Pod pewnymi względami pełni on
podobną funkcję, co populacja w podejściu „populacyjnym”, jego parametry określają
bowiem rozkład prawdopodobieństwa na zbiorze możliwych wyników badania. W związku z
tym, celem badacza jest znalezienie parametrów modelu probabilistycznego, najlepiej
dopasowanego do wyników obserwacji (stąd estymacja) bądź rozstrzygnięcie pytania, która z
alternatywnych parametryzacji modelu zasługuje w świetle posiadanych wyników na większe
zaufanie (stąd weryfikacja hipotez). Rozważmy powyższą analogię między podejściem
populacyjnym i modelowym nieco bardziej szczegółowo.
Punktem wyjścia każdego problemu statystycznego jest skonstruowanie przestrzeni
statystycznej  ,  ,   . Elementy tego układu mają przy tym następującą interpretację:
–  jest zbiorem wyników obserwacji zwanym także przestrzenią prób,
–  jest  -ciałem nad tą przestrzenią,
–  jest rodziną rozkładów prawdopodobieństwa na mierzalnej przestrzeni  ,  
indeksowanej pewnym parametrem  przebiegającym dany zbiór  , można ją zatem
zapisać
179
   P :   
(por. Barra, 1982; Rao, 1982).
„W praktyce, w wyniku obserwacji otrzymuje się jeden punkt z przestrzeni prób  , podczas
gdy prawdziwa wartość parametru  , tzn. prawdziwy rozkład P pozostaje nieznany.
Problem statystyczny polega na sformułowaniu pewnych orzeczeń o nieznanym  na podstawie zaobserwowanego wyniku” (Rao, 1982, s. 157; podkreślenie – HB). Z formalnego
punktu widzenia tak zdefiniowany problem statystyczny jest również stawiany w modelowym
podejściu do wnioskowania W podejściu tym traktuje się zaobserwowaną sieć jako realizację
wielowymiarowej zmiennej losowej. Każda następna realizacja takiej zmiennej może być
różna od poprzedniej. Zakłada się jednak, że zmienna ta posiada „swój”, nieznany badaczowi,
rozkład prawdopodobieństwa na zbiorze swoich możliwych realizacji. Przyjmując pewne
założenia o takim rozkładzie, o jego własnościach badacz konstruuje model probabilistyczny
sieci, to znaczy definiuje rodzinę rozkładów
P :   
na zbiorze możliwych realizacji
wspomnianej zmiennej losowej. Zmienna ta może przyjmować skończoną choć bardzo dużą
liczbę wartości, z których w badaniu zrealizowała się tylko jedna – zaobserwowana sieć X .
Zakładając, że jest to realizacja zmiennej o rozkładzie należącym do rodziny  P :    ,
badacz może zapytać: 1○ który z rozkładów z tej rodziny wygenerował sieć X , tzn. jaki jest
prawdziwy rozkład P , wedle którego zrealizowała się jego obserwacja lub zapytać: 2○ który
z dwóch konkurencyjnych rozkładów P0 , P1 bardziej zasługuje na to, aby go uznać za
prawdziwy?. Udzielenie odpowiedzi na pierwsze z powyższych pytań jest w istocie
oszacowaniem parametrów modelu probabilistycznego sieci. Odpowiedź na pytanie drugie
jest natomiast rozstrzygnięciem problemu weryfikacji hipotezy głoszącej, że prawdziwym
rozkładem, z którego pochodzi obserwacja X jest rozkład P0 przeciwko hipotezie, że
rozkładem tym jest P1 . Zatem w obu przypadkach formułuje się pewne orzeczenia o
nieznanym  na podstawie zaobserwowanego wyniku.
W modelowym podejściu do wnioskowania statystycznego o sieciach relacyjnych konstruuje
się przestrzeń probabilistyczną  X, 2X  P :     , w której:
– X jest zbiorem możliwych realizacji wielowymiarowej zmiennej losowej czyli klasą n obiektowych sieci relacyjnych lub jej podklasą (określoną np. przez liczbą krawędzi,
przez liczbę diad odwzajemnionych, asymetrycznych i pustych itp.)
180
– 2X jest rodziną wszystkich podzbiorów X ; jest ona  -ciałem nad X a zatem  X,2X  jest
przestrzenią mierzalną.
–  P :    jest rodziną rozkładów prawdopodobieństwa na przestrzeni  X,2X  , zaś 
zbiorem dopuszczalnych parametrów (być może wektorowych), które indeksują każdy z
rozkładów tej rodziny. Prawdopodobieństwa w rozkładzie P są pewną funkcją
parametru  . Postać tej funkcji jest określona przez, zbiór założeń przyjmowanych
przez badacza, które ustalają w jaki sposób prawdopodobieństwa realizacji sieci X  X
 zależy od parametru  . Rodzinę rozkładów  P :    wraz ze zbiorem założeń o
relacjach między  i P nazywać będziemy modelem probabilistycznym sieci z klasy
X . Elementy    nazywać będziemy parametrami modelu probabilistycznego.
Aby skonstruować przestrzeń probabilistyczną o powyższej strukturze należy zatem
zdefiniować zbiór X oraz przyjąć założenia o postaci rozkładów P na nim określonych, tzn.
ustalić liczbę, i rodzaj parametrów tych rozkładów definiując przy tym zbiór  . Badacz ma
znaczną swobodę w wyborze takich założeń, gdyż są one operacjonalizacją jego założeń o
charakterze rzeczywistości reprezentowanej przez sieć relacyjną. W konsekwencji modele
probabilistyczne sieci tej samej klasy mogą mieć bardzo różną postać. W niektórych
przypadkach, jak zobaczymy dalej, będą to modele tak proste, że skonstruowana z ich
udziałem przestrzeń
 X, 2 P
X

:    
będzie równoważna prostym przestrzeniom
statystycznym. Częściej jednak będą one bardziej złożone. Mimo to procedury zmierzające do
identyfikacji prawdziwego rozkładu z rodziny  P :    oraz do wyboru jednej z dwóch
hipotetycznych jego postaci będziemy nazywać wnioskowaniem statystycznym o parametrach
probabilistycznych modelu sieci, gdyż są te procedury stosowane w standardowych
problemach statystycznych. Dla każdej realizacji rozważanej tu wielowymiarowej zmiennej
losowej, czyli dla każdej sieci z klasy X można wyznaczyć wartość pewnego liczbowego jej
parametru (np. liczbę krawędzi obciążonych wartością jeden, liczbę diad pełnych, liczbę triad
przechodnich). Parametr sieci jest zatem funkcją z X w zbiór liczb rzeczywistych i w
związku z tym może zostać nazwany statystyką określoną w przestrzeni  X,2X  a więc i w
 X, 2 P
X

:     .
Zrekonstruujemy
teraz
kilka
przestrzeni
probabilistycznych,
określonych w nich statystyk oraz rozstrzyganych za ich pomocą problemów estymacji i
weryfikacji hipotez o parametrach probabilistycznych modeli sieci relacyjnych.
181
Przykład 23 (Ling 1973, 1975; Ling, Killough, 1976)
Jest to przykład najprostszy i dlatego go cytujemy mimo iż nie dotyczy bezpośrednio analizy
danych socjometrycznych. Rozważa się tu klasę symetrycznych, n -wierzchołkowych grafów
o m krawędziach. Z klasy tej obserwujemy jeden graf X . Pod adresem empirycznego grafu
X formułuje się pytanie, które w konsekwencji prowadzi do postawienia odpowiadającego
mu problemu statystycznego: jakie są podstawy do twierdzenia, że zaobserwowany graf
został wygenerowany przez mechanizm losowy? Mniej formalne pytanie brzmi: na ile
zaobserwowana struktura jest realna? Zbiór  dopuszczalnych parametrów modelu sieci
rozdziela się w ten sposób na dwa podzbiory:  0  ,    0  . Wyróżniony jego element  0
operacjonalizuje pojęcie mechanizmu losowego. Zgodnie z tradycją teorii grafów losowych
(por. Erdos & Ranyi, 1959) losowy, symetryczny n -wierzchołkowy graf bez pętli o m krawędziach jest elementem przestrzeni X n , m z określonym na niej równomiernym rozkładem
prawdopodobieństwa:
X  X n, m
n


P0  X     2  
 m 


Pozostałych rozkładów
1
2
P :      
0
nie definiuje się. Posługując się natomiast
rozkładem P0 wyznacza się dla przestrzeni X n , m wartość oczekiwaną liczby spójnych
komponentów grafu z niej wylosowanego, oznaczymy ją przez Cn, m  X  , a także wartość
oczekiwaną liczby spójnych komponentów o dokładnie j -wierzchołkach, oznaczmy ją przez
Cn , m , j . Cn , m oraz Cn , m , j są zatem statystykami określonymi na przestrzeni
X
n,m
,2
Xn , m


, P , P0 :  ,  0  
Ponieważ Ling wyznaczył dokładny rozkład wyżej wymienionych statystyk względem P0 ,
możliwe stało się rozstrzygnięcie problemu wyboru między  0 a      0  a więc
2
Używamy skróconego zapisu
P  X  zamiast pełnego P
 X  
182
zweryfikowania hipotezy H 0 głoszącej, że zaobserwowana struktura jest wygenerowana
przez losowy mechanizm określony rozkładem P0 przeciw konkurencyjnej hipotezie
H1  ~ H 0 .
Przykład 24 oparty na pracach Holland’a, i Leinhardt’a, zwłaszcza (Holland- Leinhardt, 1979; także
Wasserman, 1977)
Podobnie, jak w poprzednim przykładzie, w rodzinie rozkładów  P :    wyróżnia się
jeden rozkład równomierny P0 . Prezentowane tu diadowe podejście do opisu struktury różni
się jednak od poprzedniego wielkością rozważanych przestrzeni wyników obserwacji a także
specyficznymi założeniami dotyczącymi procesu ich powstawania. Rozważmy trzy takie
przypadki.
1○. X=X M , A,O
Przestrzeń wyników obserwacji składa się z wszystkich digrafów o ustalonej liczbie diad
odwzajemnionych  M  , diad asymetrycznych  A  oraz diad pustych  O  .(Te trzy parametry
grafu wyznaczają oczywiście liczbę jego wierzchołków, gdyż
N 
M  AO    .
2 
Równomierny rozkład prawdopodobieństwa na przestrzeni X=X M , A,O ma postać
X  X M , A,O
 n 
  ! 
1   2 
: P0  X   A
2  M ! A ! O !




1
n
który odpowiada procedurze losowego wybierania bez zwracania spośród   diad grafu: M
 2
n
diad odwzajemnionych (pełnych); spośród    M pozostałych wybiera się w identyczny
 2
sposób A diad asymetrycznych, przy czym dla każdej z nich z prawdopodobieństwem
1
2
określa się kierunek asymetrii. Pozostałe diady pozostają puste (a jest ich O ).
183
2. X=X X i  
Rozważa się tu zbiór wszystkich digrafów, których macierze mają identyczne sumy
wierszowe dane wektorem ( n -elementowym)
 X i  .
Według rozkładu P0 , wszystkie te
grafy są jednakowo prawdopodobne, zatem:
 n  1
X  X X i   : P0  X    

i 1  X i  
n
1
Zakłada się tu, że alokacja X i  wyborów obiektu xi między pozostałe obiekty sieci (tzn.
n  1 ) odbywa się według procedury bezzwrotnego losowania X i  spośród nich, natomiast
każdy obiekt
xi
dokonuje swoich wyborów niezależnie od pozostałych – stąd
prawdopodobieństwo uzyskania konkretnego grafu X ze zbioru X X i   jest iloczynem

prawdopodobieństw realizacji poszczególnych wektorów xi .
3. X=X X 
j
Ta przestrzeń statystyczna definiowana jest analogicznie jak poprzednia. Zbiór wyników
obserwacji wyznaczony jest tym razem przez wektor sum kolumnowych macierzy grafu.
Wyróżniony rozkład P0 ma postać:
 n  1
X  X X  : P0  X    

j
j 1  X  j 
n
1
We wszystkich trzech powyższych przestrzeniach statystycznych określa się tę samą
statystykę. Jest nią wektor T  T1 , T2 ,..., T16  którego elementami są liczebności triad typu r ,
gdzie r  1, 2,...,16 (patrz rozdz. I §1). Przy założeniu rozkładu P0 wyznacza się wartość
oczekiwaną tego wektora oraz macierz kowariancji jego elementów a także proste jego
funkcje (jak np.  , czyli standaryzowaną liczbę triad nieprzechodnich). Wyznaczenie
wartości tych statystyk w zaobserwowanym grafie X i porównanie ich z wartościami
oczekiwanymi przy rozkładzie P0 pozwala na uzasadnienie decyzji o przyjęciu, że
184
obserwacja pochodzi z losowej przestrzeni grafów (a więc przyjęciu 0 ) lub o odrzuceniu
takiej hipotezy o losowości zaobserwowanej struktury.
Przykład 25 (Frank, Harary, 1979/80)
Problem statystyczny sformułowany jest podobnie jak w przykładach poprzednich, gdyż jego
rozstrzygnięciem jest przyjęcie lub odrzucenie hipotezy o losowości zaobserwowanego grafu.
W tym jednak przypadku przestrzeń statystyczna i operacje na niej wykonywane są znacznie
bardziej
złożone.
Zbiorem
wyników
obserwacji
jest
symetrycznych grafów znakowanych, oznaczmy ją przez
klasa
n -wierzchołkowych,

X n  . Aby wyznaczyć i
sparametryzować jej rozkład Frank i Harary dokonują dekompozycji grafu z tej klasy na zbiór
n
  diad, z których każda może się znajdować w jednym z trzech stanów
 2
– jej krawędź może być nieobciążona (wówczas X  i, j   X  j , i   0 )
– jej krawędź może być dodatnio oznakowana (wówczas X  i, j   X  j , i   1 )
– jej krawędź może być oznakowana ujemnie ( X  i, j   X  j , i   1 )
Prawdopodobieństwa tego, że diada Dij będzie się znajdowała w jednym z trzech
powyższych stanów określone są za pomocą dwóch parametrów ,  i p :
P  X  i, j   0   1  
P  X  i, j   1  p
P  X  i, j   1  1  p  
Podstawowym założeniem tego modelu probabilistycznego jest przyjęcie, że graf z rodziny

X n  powstaje w następujący sposób:
n
– każda z   diad ma generowane obciążenie (jakiekolwiek, tzn. bądź +1 bądź –1) z
 2
prawdopodobieństwem 
– generowanie obciążeń poszczególnych diad jest niezależne od pozostałych (stochastycznie)
185
– znak obciążenia każdej diady jest generowany z prawdopodobieństwem p, 1  p  dla +1 i
–1 odpowiednio
– znaki obciążeń generowane są niezależnie
– stąd stany diad są wyznaczone również niezależnie od siebie z prawdopodobieństwami
danymi wyżej.
Powyższe założenia specyfikują zatem model probabilistyczny posiadający dwa parametry
  1 oraz p   2 . Jeśli przez  oznaczymy wektor parametrów 1 ,  2  to każdy rozkład

P na zbiorze X n  ma postać:



2



X  Xn  : P  X     1   X  i, j  1  1   X i, j  1  X i, j  1 2  X i, j  1  X i, j  1 1   2 
2

i j 
Parametr   1 ,  2  jest nieznany, należy go zatem oszacować. Nie trudno otrzymać jego
estymatory największej wiarygodności:
ˆ1 
m
n
 
 2
,
ˆ2 
m
m
,
m    X  i, j  
2
i j
m 
1
 X  i, j  1  X i, j 
2 i j
( m oznacza tu liczbę krawędzi oznakowanych w grafie X , zaś m  liczbę krawędzi
oznakowanych dodatnio).
Przyjmując   ˆ1 oraz   ˆ2 Frank i Harary wyznaczają wartości oczekiwane i wariancje
n
triadowych statystyk grafu c  oraz    c  3 tzn. liczby zrównoważonych 3-cykli  c   oraz
 3
 n

liczby zrównoważonych triad     c   , co pozwala im również na wyznaczenie dla nich
 3

pseudo-przedziału ufności (wartość oczekiwana statystyki  jej odchylenie standardowe).
3
c  – oznacza liczbę 3-cykli , c  – liczbę 3-cykli niezrównoważonych w symetrycznym grafie znakowym,
patrz rozdz. I, §1.
186
n
Jeśli w zaobserwowanym grafie X wartości c   X  oraz    c   X  przekraczają granice
 3
tak skonstruowanego przedziału, autorzy proponują odrzucić hipotezę o losowej tzn.
niezależnej dystrybucji połączeń i ich obciążeń a więc odrzucić model probabilistyczny jako
nieadekwatny do danych empirycznych.
Przykład 26 (Holland, Leinhardt, 1980)
W ostatnim już przykładzie modelowego podejścia do wnioskowania statystycznego zbiorem
wyników obserwacji jest klasa X n wszystkich digrafów n -wierzchołkowych. Konstrukcja
rodziny rozkładów  P :    nad takim zbiorem jest dość złożona i nie będziemy jej tu
przytaczać w całości, zwłaszcza, że wektor parametrów ma 2n  2 elementy:
    ,  , 1 ,  2 ,...,  n , 1 ,  2 ,...,  n 
przy czym zakłada się dlań, że
   
i
i
j
j
 0 , natomiast interpretacje tych parametrów są
następujące:

– reprezentuje ogólną tendencję do odwzajemniania wyborów, kontroluje liczbę diad
odwzajemnionych (pełnych) w digrafie
 - reprezentuje ogólną tendencję do wysyłania wyborów, kontroluje liczbę krawędzi
obciążonych (gęstość) w digrafie
1 ,  2 ,...,  n 
– wektor parametrów reprezentuje ekspansywność poszczególnych obiektów
sieci, kontroluje liczbę wysyłanych wyborów przez poszczególne obiekty.
 1 ,  2 ,...,  n 
– wektor parametrów atrakcyjności poszczególnych obiektów, kontrolują one
liczbę wyborów otrzymywanych przez każdy z nich
Prawdopodobieństwo zrealizowania się dowolnego grafu z przestrzeni X n jest funkcją
wektora  :
n
n


exp    M    m    i X i     j X  j 
i 1
j 1


X  X n : P  X  
 kij
i j
187
przy czym M – jest liczbą diad pełnych w digrafie X
m – jest liczbą krawędzi obciążonych tego digrafu
kij – jest funkcją parametrów  ,  ,  i ,  j zapewniającą normalizację wyrażenia do
przedziału  0,1
W powyższym modelu zakłada się, że wszystkie diady Dij digrafu X są generowane
niezależnie od siebie. Prawdopodobieństwa tego, że diada Dij będzie pusta, asymetryczna lub
pełna dają się wyznaczyć z wektora  :
P  Dij  1,1   mij  exp    2   i   j   i   j   kij 1
P  Dij  1, 0    aij  exp     i   j   kij 1
P  Dij   0, 0    nij  kij 1
Dzięki temu oszacowany metodą największej wiarygodności wektor ˆ pozwala na
wyznaczenie dla każdej diady prawdopodobieństwa mˆ ij , aîj , nîj . Ponieważ diada może
znajdować się tylko w jednym z czterech stanów a także
P  X  i, j   1  mij  aij  ij ,
można porównać analizowaną macierz empiryczną X z macierzą wartości oczekiwanych
obciążeń E  X  i, j   ze względu na wektor ˆ . Pozwala to na ocenę stopnia dopasowania
pełnego modelu ˆ do danych.
Estymacja i interpretacja parametrów rozkładu P jest jednak tylko pierwszym krokiem
analizy. Model Holland’a i Leinhardt’a umożliwia bowiem weryfikowanie hipotez o
tendencjach strukturalnych w zaobserwowanym digrafie. Specyfikacja tych hipotez polega na
przyrównaniu do zera niektórych elementów wektora ˆ i wyestymowaniu metodą
największej wiarogodności wartości pozostałych parametrów, na które nie nakłada się
dodatkowych ograniczeń. Niektóre z tych hipotez mają swoje odpowiedniki w poprzednich
przykładach. Zacytujmy cztery przypadki:
188
H 0 :   0,  j  0 (pozostałe parametry bez ograniczeń)
H1 :   0
H2 :
H3 :

j
(pozostałe parametry bez ograniczeń)
 0
(pozostałe parametry bez ograniczeń)
wszystkie parametry wektora  nie są ograniczone
Hipoteza H 0 odpowiada założeniu, że graf został wygenerowany przez taki mechanizm
losowy, w którym nie ma żadnej tendencji do odwzajemniania wyborów    0  , wszystkie
obiekty są równie atrakcyjnymi celami dla każdego nadawcy   j :  j  0  zaś dystrybucja
krawędzi w sieci zalety tylko od indywidualnych ekspansywności obiektów  i  oraz ogólnej
tendencji do wysyłania wyborów w ogóle   .
H2
modyfikuje powyższą hipotezę dopuszczając ingerencję ogólnej tendencji do
odwzajemniania wyborów    0  zaś H1 uzależnia prawdopodobieństwo wygenerowania
obciążenia krawędzi X  i, j  od stopnia atrakcyjności odbiorcy   j  0  . H 3 reprezentuje
pełny model bez żadnych ograniczeń na wartości jego parametrów. Test na istnienie tendencji
do odwzajemniania wyborów w analizowanej sieci polega na weryfikowaniu H 0 przeciwko
H 2 , gdyż różnią się one wartością jednego tylko parametru  , który „kontroluje” liczbę diad
pełnych w grafie. Ponieważ obie hipotezy zakładają brak wpływu atrakcyjności odbiorcy x j
na prawdopodobieństwo pij , alternatywną metodą testowania powyższej tendencji (lecz
niekorzystającą z powyższego założenia) jest weryfikowanie H1 przeciwko H 3 . Dochodzimy
w tym momencie do problemu, który pojawi się również przy okazji weryfikowania hipotez
opartych na probabilistycznej wersji modelu blokowego. Jest to problem istnienia i
liczebności próby w modelowym podejściu do wnioskowania statystycznego.
Weryfikując H1 przeciwko H 3 , Holland i Leinhardt proponują użyć jako statystyki
logarytmu ilorazu wiarogodności:

P3  X 
P1  X 

 mˆ
 aˆ
X  i , j  1 X  j ,i 
ij
 nˆ
m
a
 X  i , j  1 X  j ,i 
ij
n
X  i , j  X  j ,i 
ij
i j
i j
 X  i , j  X  j ,i 
ij
i j
i j
i j
i j
1 X  i , j  1 X  j ,i 
ij
 1 X  i , j  1 X  j ,i 
ij
gdzie mˆ ij , aîj , nîj oznaczają estymatory największej wiarogodności wyznaczone przy
189
założeniu H 3 zaś mij , aij , nij przy założeniu H1 : Logarytm ilorazu funkcji wiarogodności (a
ściślej 2 ln  ) miałby asymptotyczny rozkład  2 o jednym stopniu swobody (gdyż
  0 H1 oraz   0 H 3 , por. np. Rao, 1982 s. 427), gdyby X oznaczał w tym przypadku
próbę losową o dużej liczebności4). Tak jednak nie jest, gdyż jak pamiętamy X jest tu jedną
realizacją, pojedynczą macierzą n  n pochodzącą z przestrzeni X n , na której określone są
rozkłady P . Holland i Leinhardt zauważają ten fakt stwierdzając, że „standardowa teoria nie
stosuje się do tego przypadku” (str. 25)5. Nie badają więc analitycznie rozkładu powyższej
statystyki 2 ln  , lecz w zamian badają ten rozkład (przy założeniu H1 ) za pomocą technik
symulacyjnych dochodząc do wniosku, że nie różni się on zbytnio od rozkładu  2 a ponadto
różnica ta maleje ze wzrostem rozmiarów grafu. W konkluzji stwierdzają, że „rozkład  2 o
jednym stopniu swobody jest wystarczający dla zgrubnej (crude) oceny poziomu istotności w
testowaniu H1 przeciwko H 3 za pomocą ilorazu wiarogodności” (Holland, Leinhardt, 1980
str. 27). Stwierdzenie to wymaga komentarza, gdyż z analogicznym problemem zetkniemy się
w następnej części pracy. Nie ulega wątpliwości, że w modelowaniu danych
socjometrycznych nie mamy do czynienia z próbami losowymi w standardowym,
statystycznym sensie. Dysponujemy bowiem tylko jedną obserwacją. Ubywanie określenia
liczebność próby jest w takim razie niedopuszczalne, tak jak wykorzystywanie
asymptotycznych własności statystyk opartych na dużych próbach. W konsekwencji
weryfikowanie hipotez o modelach probabilistycznych danych socjometrycznych staje się
niezwykle utrudnione, gdyż wtedy testy hipotez muszą wykorzystywać dokładne rozkłady
używanych statystyk, których wyznaczenie choć technicznie możliwe, jest bardzo
pracochłonne.
W tej kłopotliwej sytuacji widzimy jedno tylko rozwiązanie, uzasadnione po części wynikami
badań symulacyjnych Holland’a i Leinhardt’a. Należy uznać, że zaobserwowana macierz jest
4
X musi być w tym przypadku ciągiem niezależnych zmiennych losowych  X 1 , X 2 ,..., X n  o jednakowym
rozkładzie
P  X i  , i  1, 2,..., n , zależnym od (być może wielowymiarowego) parametru  . Gdy n rośnie
do nieskończoności, 2 ln  ma asymptotycznie rozkład
5
Gdyby potraktować ciąg
2 .
n  n  1 n krawędzi grafu X jako ciąg takich zmiennych to okazałoby się to
sprzeczne z założeniami modelu, gdyż zakłada on, że poszczególne krawędzie
1 z różnymi prawdopodobieństwami wyznaczonymi przez parametry modelu:
Analogiczną sprzeczność uzyskuje się traktując
X  i, j  są obciążane wartością
 i , i ,  ,  .
n
X jako realizację ciągu   diad Dij .
 2
190
równoważna realizacji n  n  1 – elementowego ciągu zmiennych losowych (binarnych) o
łącznym rozkładzie określonym parametrami modelu probabilistycznego. W przypadku, gdy
n jest duże a liczba parametrów względem niego mała, statystyki oparte na ilorazie
wiarogodności powinny zachowywać się jak w sytuacjach dużych, niezależnych
prawdziwych prób losowych. Oczekują tego także cytowani wyżej autorzy a zamierzając
przeprowadzić w tej kwestii dalsze badania symulacyjne „nie oczekują żadnych
niespodzianek”.
W przypadku pozytywnych wyników badań symulacyjnych rozwiązanie powyższe pozwala
korzystać z bogatego dorobku klasycznej teorii testowania hipotez na podstawie dużych
prób. Zauważmy, na zakończenie tego paragrafu, że w estymacji parametrów modelu
probabilistycznego metodą największej wiarogodności przyjmowanie założenia o istnieniu
n  n  1 – elementowej próby losowej nie jest konieczne.
191
§2. STOCHASTYCZNY MODEL BLOKOWY I ESTYMACJA JEGO
PARAMETRÓW.
Konstrukcja modelu jakiegokolwiek zjawiska związana jest z dokonywaniem szeregu
upraszczających założeń o przedmiocie badania. Gdy uproszczenia są zbyt wielkie, analiza
danych prowadzi do rezultatów banalnych (mało użytecznych dla teorii zjawiska) lub
ewidentnie fałszywych (gdy uproszczenia ignorują istotne cechy zjawiska). Brak
upraszczających założeń uniemożliwia z kolei efektywne posługiwanie się modelem
probabilistycznym, gdyż trudne jest (lub zgoła niemożliwe) oszacowanie jego zbyt wielu
wówczas parametrów. Ideałem byłoby posiadanie takich założeń upraszczających, które
byłyby jednocześnie mocne w sensie formalnym, tzn. pozwalałyby na konstrukcję
estymowalnego modelu a jednocześnie na tyle elastyczne, by nie negując ich można było w
tym modelu opisać zjawiska złożone, skomplikowane.
Założeniem-uproszczeniem, na którym opierają się triadowe modele Holland’a i Leinhardt’a,
stochastyczne modele Wasserman’a6 (łańcuchy Markowa) a także ostatni model z przykładu
26, jest zasada niezależności stochastycznej zachowania się diad w sieci relacyjnej. Oznacza
ona, że stan połączeń między obiektami diady nie zależy stochastycznie od stanu połączeń
między obiektami innej diady mimo, i jeden z obiektów sieci może należeć do obu diad. Jak
powiadają Holland i Leinhardt, założenie to nie odbiega od rzeczywistości reprezentowanej
za pomocą sieci relacyjnych na tyle, by trzeba było z niego zrezygnować. My przyjmiemy
teraz założenie, które danym empirycznym stawia wymagania mocniejsze niż stochastyczna
niezależność diad. Jest to założenie niezależności pojedynczych krawędzi sieci.
Przy tym założeniu każdy obiekt xi sieci relacyjnej posiada dla każdego z pozostałych
obiektów x j rozkład Pij a na zbiorze dopuszczalnych obciążeń krawędzi X  i, j  . Ponadto,
obciążenia poszczególnych krawędzi sieci są od siebie stochastycznie niezależne. Oznacza to,
że każdy obiekt xi generując obciążenie krawędzi X  i, j  (np. wysyłając wybór do obiektu
x j bądź nie wysyłając) posługuje” się pewnym rozkładem prawdopodobieństwa Pij a
generując obciążenie krawędzi X  i, k  rozkładem Pik . Ponadto decyzje o przydziale wartości
poszczególnych obciążeń zapadają od siebie niezależnie. Założenie powyższe opisuje, jak
widać, zachowanie się obiektów sieci w kategoriach probabilistycznych. Cechą obiektów
6
Wasserman (1979; 1980), także Holland, Leinhardt (1977a, 1977b) traktują proces powstawania i znikania
połączeń w sieci jako proces stochastyczny
192
określającą jego pozycje w sieci nie jest teraz jak to było poprzednio, zbiór wysyłanych i
odebranych wyborów lecz zbiór parametrów rozkładów prawdopodobieństwa, które opisują
tendencje, szanse wysyłania i odebrania wyboru. Zaobserwowana macierz X jest w tym
ujęciu (jedną z wielu możliwych) realizacją takiego układu szans.
Zrozumiałe jest zatem, że przyjęcie założenia o probabilistycznej naturze sieci, jako rezultacie
losowego zachowania się jej obiektów, musi mieć konsekwencje dla pojęcia modelu
blokowego sieci. Model ten również musi być probabilistyczny. Modyfikacja, której należy
poddać deterministyczną wersję optymalnego modelu blokowego nie jest jednak trudna.
Pozycję obiektu xi w sieci X charakteryzuje układ szans definiowany parametrami
odpowiednich rozkładów prawdopodobieństwa na dokonanie i otrzymanie wyboru (od)
pozostałych obiektów. Dwa obiekty będą zatem strukturalnie względem siebie równoważne,
jeśli ich układy szans będą identyczne. Wzór strukturalny będzie z kolei specyfikował te
układy dla członów podziału B zbioru X , wyznaczonego przez powyższą równoważność;
macierz
X
będzie
teraz
macierzą
parametrów
odpowiednich
rozkładów
prawdopodobieństwa.
Przystąpmy do konstrukcji modelu. Jej celem jest uzyskanie probabilistycznego wzoru,
według którego wygenerowana została macierz obserwacji X oraz podziału B zbioru
obiektów sieci X wyznaczonego przez relację strukturalnej równoważności X pokreśloną
na podstawie identyczności „układów szans”).
Rozważania nasze ograniczymy do modeli sieci n -obiektowych, binarnych, czyli do
przestrzeni X n . Przestrzeń statystyczna jest następująca:
X
n

, 2Xn ,  P :    .
Określenie zbioru dopuszczalnych rozkładów P wiąże się z przyjęciem wspomnianego
założenia niezależności obciążeń krawędziowych i wykorzystaniem faktu, że macierz X
(realizacja modelu jest macierz binarną a rozkład prawdopodobieństwa na zbiorze
0,1 wyznaczony jest kompletnie przez jedno prawdopodobieństwo:
Założenie 1.
(5.2.1)
 i  j ij : P  X  ij   1  ij
193
Każda krawędź sieci X ma „swoje” prawdopodobieństwo bycia krawędzią obciążoną
wartością 1.
Założenie 2. (o niezależności)
 X  X n P  X    P  X  ij   1
(5.2.2)
i j
X i , j 
 P  X  i , j   0 
1 X  i , j 
(prawdopodobieństwo realizacji macierzy X  X n jest iloczynem prawdopodobieństw
obciążeń wartością l lub O jej poszczególnych elementów).
Stochastyczny k -członowy model blokowy sieci z klasy X n wyznaczony jest przez założenia
(5.2.1) i (5.2.2) oraz rodzinę rozkładów P :    , w której każdy parametr  definiujący
rozkład P składa się z dwóch części – z macierzy  rs  o wymiarach k  k zawierającej k 2
parametrów dotyczących rozkładów prawdopodobieństwa na obciążeniach poszczególnych
krawędzi X  i, j  oraz macierzy podziału B zbioru obiektów sieci, tzn:
   rs  , B 
gdzie: (i) 1  k  n
(ii) macierz B jest macierzą podziału zbioru X na k podzbiorów
(iii)  i  j :  B  r , i   1 & B  s, j   1  ij   rs 
Oznacza to, że krawędzie sieci X znajdujące się w podmacierzy X rs wyznaczonej przez
podział B posiadają identyczną wartość parametru ij . Funkcja wiarogodności obserwacji X
względem parametru  ma zatem postać:
(5.2.3)

1 X  i , j  
X i, j
L  X ;    P  X      rs rs   1   rs  rs 
r ,s  i, j

Estymacja parametrów  polega na wyznaczeniu takiego wektora   , który będzie w
punkcie
X maksymalizował funkcje wiarogodności. Wątpliwość, czy wyznaczenie  
można nazwać oszacowaniem parametrów (ze względu na obecność podziału B , który jest w
istocie funkcją z X na zbiór 1, 2,..., k ) przedyskutujemy dalej. Teraz wyznaczymy wektor
194
  w pewnej szczególnej sytuacji a mianowicie, gdy k  1 co oznacza, że model nasz posiada
tylko jeden parametr, gdyż odpowiada przypadkowi, w którym wszystkie obiekty zbioru X
wchodzą w skład jedynego „członu podziału”. Wektor parametrów  ma tylko jeden element
a więc
 i, j : ij  
Funkcja wiarogodności ma postać:
(5.2.4)
L  X ;    
1 X  i , j 
1   
X i , j 
i j
X jest siecią zrealizowaną, zatem można dla niej wyznaczyć m   X  i, j  . Stąd:
i j
(5.2.5)
L  X ;     m 1   
N m
Logarytm naturalny funkcji wiarogodności oznaczymy przez l  
Zatem
(5.2.6)
l    ln  m 1   

N m
  m ln    N  m  ln 1    .

Po wyznaczeniu pierwszej pochodnej i przyrównaniu jej do zera, maksimum funkcji l   a w
konsekwencji także i L  X ;   osiągane jest w punkcie   równym gęstości sieci X . Zatem
(5.2.7)
l     sup l      

m
 g X 
N
W przypadku k -członowego stochastycznego modelu blokowego,  rs  jest kwadratową
macierzą rzeczywistą o wymiarach k  k i poza ograniczeniem
 r , s : 0   rs  1
195
nie stawia się jej żadnych dodatkowych wymagań. Jest ona zatem elementem k 2 k2
0,1
wymiarowej przestrzeni
. Drugim członem wektora 
jest podział B . Jest on
elementem zbioru wszystkich k -członowych podziałów n -elementowego zbioru X a
podziałów takich może być S  n, k  7. Wyznaczenie wektora   , który maksymalizowałby
funkcję wiarogodności L nie może zatem polegać na wyznaczeniu pochodnej jej logarytmu i
przyrównaniu jej do zera. Zastosujemy tu jednak efektywną procedurę, analogiczną do tej,
której używaliśmy przy wyznaczaniu optymalnego modelu blokowego w rozdz. III. Weźmy
pod uwagę dowolny k -członowy podział B  i wyznaczmy dla niego funkcję wiarogodności


oznaczoną teraz przez L X ;  B  :
(5.2.8)






1 X  i , j 
N   m
X i, j
L X ; B      rs rs   1   rs   rs     rsmrs 1   rs  rs rs
 i, j
 r,s
r,s




(nadskrypty nad symbolami X rs , mrs , N rs sygnalizują, że wielkości te są wyznaczone przez
podział B  ).


Jej logarytm oznaczymy przez l  B  ; zatem
(5.2.9)


l  B     mrs ln  rs   N rs  mrs  ln 1   rs  
r,s
Po wyznaczeniu pierwszych pochodnych względem każdego z  rs i przyrównaniu ich do zera
otrzymamy układ k 2 równań następującej postaci (dla każdego r , s : r , s  1, 2,..., k ):
(5.2.10)
mrs
 rs

m
N rs  mrs
 0 , których rozwiązaniem jest  rs  rs  g  X rs 
1   rs
N rs

A zatem funkcja L X ;  B 

osiąga maksimum, gdy dla każdego 1  r , s  k ,  rs jest
gęstością podmacierzy X rs wyznaczonej przez podział B  . Oznaczmy taki „warunkowo
optymalny” (ze względu na B  ) estymator przez  rs B  . Wobec tego:
7
liczba Stirlinga drugiego rodzaju.
196
(5.2.11)
 r , s :  rs B   g  X rs 
Podstawmy teraz wyestymowane warunkowo wartości  rs B  do wyrażenia na logarytm
funkcji wiarygodności:
(5.2.12)

 m  
m
l   B     mrs ln rs   N rs  mrs  ln 1  rs  
N rs
N rs  
r,s 




Daje się ona po kilku krokach przekształcić do:
(5.2.13)
 m
m  m   m  
l   B   N  wrs  rs ln rs  1  rs  ln 1  rs  
N rs  
N rs  
r,s
 N rs N rs 

przy czym wrs 

N rs
N
Oznaczmy sumę w nawiasie kwadratowym przez   H  X rs   , co pozwoli zapisać
(5.2.14)


l   B   N  wrs   H  X rs  
r,s
Zważywszy, że gęstości wewnątrzblokowe g  X rs  są częstościami występowania w
podmacierzy
X rs
H  X rs  można
obciążenia krawędziowego równego 1, wielkość


interpretować jako entropię rozkładu obciążeń w tej podmacierzy8. l   B  jest zatem sumą
entropii wewnątrzblokowych ważoną rozmiarami bloków X rs a więc średnią entropii
warunkowych (wewnątrzblokowych).
W (5.2.13) wyznaczyliśmy wartość logarytmu funkcji wiarogodności w punkcie X przy
ustalonym podziale B  . Wartość tę można również wyznaczyć dla każdego k -członowego
podziału B a zatem można znaleźć taki podział B , który logarytm funkcji wiarogodności
będzie maksymalizował, tzn. zachodzić będzie:
8
mierzoną w nitach
197


 B : l   B  l   B    wrs H  X rs   wvt H  X vt  9 ,
r,s
v ,t
gdzie wrs , X rs oznaczają wagi i podmacierze wyznaczone przez podział B zaś wvt i X vt
wagi i podmacierze wyznaczone przez podział B .
Wobec tego  
jest estymatorem wektora 
otrzymywanym metodą największej
wiarogodności zawsze i tylko wtedy, gdy podział B minimalizuje10 średnią entropii
wewnątrzblokowych, zaś oszacowaniami parametrów  rs są gęstości wewnątrzblokowe
wyznaczone przy tym podziale:


(ii)  r , s :  rs 
mrs
N rs
l     sup l    (i)     rs  , B
(5.2.15)

(iii)  B :
w
r ,s
rs
H  X rs    wvt H  X vt 
v ,t
(oznaczenia jak wyżej).
Nietrudno zauważyć, że estymator   największej wiarogodności parametrów k –członowego
stochastycznego modelu blokowego jest modelem blokowym optymalnym w entropijnym
sensie tzn. przy funkcji E .
(5.2.16) Estymator parametru  jest funkcją statystyki dostatecznej dla rodziny rozkładów
P :   
Dowód: Każdej macierzy X  X n można bowiem przyporządkować k 2 -elementowy ciąg t :
t
 N

11
, m11  ,  N12 , m12  ,...,  N rs , mrs  ,...,  N kk , mkk 

spełniający warunki
(i) istnieje taki k -członowy podział B zbioru obiektów sieci X , że elementy N rs są
9
zmiana znaku logarytmów z + na zmiana znaku logarytmów z + na -
10
198
liczebnościami pól podmacierzy X rs wyznaczonymi przez ten podział, zaś mrs są
liczebnościami krawędzi obciążonych wartością l w tych podmacierzach,
(ii) dla dowolnego podziału B zbioru obiektów sieci X zachodzi
  mrs

 mrs  
 m 
mvt


m
ln

N

m
ln
  N vt  mvt  ln 1  vt  



1       mvt ln

rs
rs
rs

N rs
N rs   v ,t 
N vt
N vt  
r,s 



przy czym wielkości N vt , mvt są wyznaczane przez podział B .
Funkcja przyporządkowująca sieci X  X n , ciąg t jest statystyką dla rodziny  P :   
definiującej stochastyczny model blokowy. Przestrzenią wartości tej statystyki, oznaczmy ją
przez  , jest zbiór ciągów k 2 -elementowych o elementach
 N rs , mrs 
spełniających dwa
oczywiste ograniczenia:
(i)
N
r ,s
rs
 n  n  1  N
(ii)  r , s :  0  mrs  N rs  &  0  N rs  N 
Statystyka wyznacza podział przestrzeni X n na podzbiory postaci
X t   X  X n : T  X   t
Czym różnią się między sobą elementy podzbioru Xt a co mają wspólnego?
Podzbiory Xt składają się z takich macierzy X , które:
– dają się podzielić na k 2 podmacierzy X rs zawierających po krawędzie w tym mrs
krawędzi obciążonych wartością 1
– powyższy podział jest najlepszy z możliwych w sensie warunku (ii)
– mają te samą gęstość, gdyż m   mrs jest identyczna dla wszystkich X  Xt .
r ,s
Są to cechy wspólne wszystkich elementów podzbioru Xt . Różnice między nimi polegają
natomiast na tym, że w macierzach X 1 , X 2  X t poszczególne krawędzie X 1  i, j  , X 2  i, j 
199
mogą się różnić od siebie, choć sumy obciążeń w podmacierzach X rs1 , X rs2 muszą być
identyczne (równe mrs ).
Łatwo zauważyć, że warunkowy rozkład P  X X t  nie zależy od  , gdyż wszystkie sieci
X  Xt są jednakowo prawdopodobne:
1
N 
 X  X t : P  X     rs  .
r , s  mrs 
Wobec tego statystyka T jest dostateczna.
200
§3. ESTYMACJA PARAMETRÓW STOCHASTYCZNEGO MODELU
BLOKOWEGO SIECI WIELORELACYJNEJ
Uogólnienie pojęcia stochastycznego modelu blokowego na przypadek sieci wielorelacyjnych
wymaga
przyjęcia
dodatkowego
założenia
niezależności
stochastycznej
obciążeń
krawędziowych poszczególnych składowych sieci. Założenie 2 musi ulec modyfikacji i
będzie miało tu postać założenia 2a:
Założenie 2a
S 
X J i , j 
1 X J  i , j  
 X  X n : P  X     P  X J  i, j   1
P  X J  i, j   0 

J 1  i  j

(5.3.1)
przy czym X   X 1 , X 2 ,..., X J ,..., X S  oznacza teraz sieć o S składowych zaś X n – zbiór
wszystkich n -obiektowych, binarnych sieci S -relacyjnych.
Wektor parametrów  zawiera teraz tyle macierzy  rs  ile jest składowych sieci X zaś
podział B jest oczywiście jeden:



    1  ,  2  ,...,  S  , B12...S 

rs
rs
rs

Funkcja wiarogodności wyraża się teraz następująco:
(5.3.2)
S 
J i, j
X rs
1 X J  i , j   
 
 
L  X ;   P  X      rsJ
1  rsJ  rs  
J 1 
 r ,s  i, j
 
Logarytm naturalny funkcji wiarogodności jest postaci
(5.3.3)
S

 S
l       mrsJ ln  rsJ   N rs  mrsJ  ln 1   rsJ      l  J 
J 1  r , s
 J 1
Wyznaczenie estymatora największej wiarogodności przebiega analogicznie jak dla sieci
jednorelacyjnej, jedyną różnicą jest konieczność maksymalizacji sumy logarytmów funkcji
201
wiarygodności poszczególnych składowych acz przy jednym wspólnym podziale, co
sprowadza się do znalezienia takiego podziału, który tę sumą maksymalizuje. Addytywność
logarytmu funkcji wiarogodności sprawia, że rezultat otrzymany dla pojedynczej sieci X
stosuje się do przypadku sieci wielorelacyjnej tzn. estymatorami parametrów  rsJ są gęstości
wewnątrzblokowe g  X rsJ  wyznaczone przy podziale B maksymalizującym l   tzn. przy
podziale, który minimalizuje sumę (po wszystkich składowych X J , J  1, 2,..., S ) średnich
entropii wewnątrzblokowych H  X rsJ  .
202
§4.WERYFIKACJA HIPOTEZ O PARAMETRACH STOCHASTYCZNEGO
MODELU BLOKOWEGO
Twórca koncepcji modelowania blokowego, H.C.White napisał kiedyś, że „model blokowy
jest hipotezą o zbiorze danych macierzy…” (WBB, 1976, str. 739). Zauważmy jednak, że
hipotezy takiej nie można zweryfikować, gdyż:
– nie posiada związanej z nią hipotezy konkurencyjnej
– nawet gdyby konkurencją byłaby negacja wspomnianej hipotezy, klasyczne podejście
do modelowania blokowego nie posiada kryterium pozwalającego rozstrzygnąć, który
z dwóch modeli „pasuje” bardziej do danych empirycznych.
Optymalnościowe podejście do modelowania blokowego dostarcza takiego kryterium a
ponieważ model entropijnie optymalny jest estymatorem największej wiarygodności
parametrów stochastycznego modelu blokowego, pozwala ono na statystyczne testowanie
hipotez o modelach blokowych zaobserwowanej sieci.
Problematyka weryfikacji hipotez o modelach blokowych dzieli się na dwie zasadnicze grupy
zagadnień:
– testy losowości zaobserwowanej struktury relacyjnej
– testy zgodności konkurencyjnych modeli blokowych.
Testy losowości mają na celu udzielenie odpowiedzi na pytanie: jakie są podstawy do
odrzucenia przypuszczenia, że zaobserwowana sieć została wygenerowana przez mechanizm
losowy produkujący wszystkie sieci z jednakowymi prawdopodobieństwami? Testy
zgodności pozwalają natomiast rozstrzygnąć problem, czy istnieją podstawy aby odrzucić
hipotezę głoszącą, że prawdziwym parametrem  (modelem entropijnie optymalnym) danej
sieci jest parametr inny niż ten, który został uzyskany metodą największej wiarogodności.
Problemy weryfikacji hipotez, o parametr stochastycznego modelu blokowego będziemy
rozwiązywać za pomocą testu ilorazu wiarogodności oraz testu opartego na statystyce  2 .
Przy tej okazji zinterpretujemy wprowadzone w rozdziałach III i IV parametry sieci relacyjnej
– współczynnik kontrastu, parametr: zgodności strukturalnej miedzy dwiema składowymi
sieci oraz kontrastowy miernik zależności miedzy składowymi.
203
§5. SIEĆ LOSOWA A WSPÓŁCZYNNIK KONTRASTU.
Rozważmy dwie hipotezy o następującej treści:
H 0 : sieć X pochodzi z losowej przestrzeni X n , tzn. takiej, że
 X  X n : P  X   const
H1 : sieć X pochodzi z przestrzeni X n , tzn. takiej, że
 X  X n : P  X   P  X 
gdzie
–    rs  , B 
–  rs  jest macierzą parametrów, k  k
– B jest podziałem k -członowym zbioru X , przy czym wartość parametru  jest
nieznana.
Hipoteza H 0 może zostać przełożona na założenie, że wszystkie obciążenia krawędziowe
sieci X generowane są przez ten sam rozkład prawdopodobieństwa na zbiorze 0,1 a zatem
zakłada się w niej, że
 i  j : ij  
H0 definiuje więc 1-członowy model sieci z jednym parametrem  . Jego estymatorem NW
jest  0 
m
, gęstość sieci X . Funkcja wiarygodności dla estymatora  0 ma postać:
N
m
(5.5.1)
m  m
L  X ;      1  
N  N
N m

0
Estymatorem NW parametru  przy założeniu hipotezy H1 jest, jak pamiętamy, wektor


1   rs  , B o własnościach określonych w (5.2.15), dla którego funkcja wiarogodności
204
jest następująca:
 m 
L  X ;1     rs 
r , s  N rs 
(5.5.2)

mrs
 mrs 
1   
N rs 



N rs
 mrs
Zwróćmy uwagę, że H 0 jest szczególnym przypadkiem H1 , gdyż przy podziale B z
hipotezy H1 , zakłada ona, że wszystkie wewnątrzblokowe parametry  rs przyjmują wartość

m
. Mamy zatem do czynienia z problemem testowania hipotezy o zgodności dwóch
N
gęstościowych wzorów strukturalnych przy wspólnym podziale B . Do weryfikacji H 0
przeciw H1 zastosujemy test ze statystyką w postaci ilorazu wiarogodności (patrz np.
Lehman, 1968, Silvey, 1978, Rao, 1982). Iloraz funkcji wiarogodności oznaczymy przez  .
Zatem:

mrs
X  
sup L  X ; 
 0
sup L  X ; 
 0

L  X ;1 
L  X ; 0 


N rs
 mrs
 mrs   mrs 
   1   

N rs 
r , s  N rs 


m
N m
m
m 
  1  
N
N 
Konstrukcją obszaru krytycznego dla powyższego testu można przeprowadzić na dwa
sposoby:
W pierwszym przypadku obszar krytyczny składa się z takich macierzy X , dla których
  X    . Oznaczmy obszar krytyczny przez X k :
X k   X  X n :   X    
przy czym  wyznacza się z warunku:


P X   X  X n :   X        P0  X  X k 
gdzie  jest założonym poziomem istotności.
Aby podjąć decyzję o odrzuceniu lub przyjęciu hipotezy H 0 na poziomie istotności  należy
205
zatem:
– dla każdej macierzy X  X n wyznaczyć L  X ; 0  , L  X ;1  oraz   X 
– macierze te uporządkować ze względu na wartość   X 
– wyznaczyć dystrybuantę   X  ze względu na rozkład P0
– wyznaczyć z niej  tak, aby P0    X       11
– sprawdzić czy w zaobserwowanej macierzy danych
–   X    – a wtedy przyjąć H 0 (tj. rozkład z    0 )
–   X    – a wtedy przyjąć H1 (tj. rozkład z   1 )
Z oczywistych powodów powyższe zadanie jest praktycznie niewykonalne nawet dla
niewielkich danych. Istnieje jednak rozwiązanie nieco mniej pracochłonne. Zamiast
wyznaczać obszar krytyczny i  można zadać pytanie: jakie jest prawdopodobieństwo
(warunkowe ze względu na H 0 ) wygenerowania z rozkładu P0 takich macierzy, dla których
statystyka  przyjmować będzie wartości większe niż   X  wyznaczone dla uzyskanej
obserwacji. Jeśli prawdopodobieństwo to jest większe od  należy przyjąć H 0 gdyż
wówczas   X    . Rozwiązanie to, choć mniej pracochłonne niż poprzednie wymaga
posłużenia
P0
się
 X :   X   C  
maszyną
cyfrową,
gdyż
wyznaczenie
prawdopodobieństwa
gdzie C jest wartością ilorazu w zaobserwowanej macierzy danych,
pociąga za sobą konieczność przejrzenia wciąż jeszcze dużego zbioru macierzy spełniających
powyższy warunek.
W wyznaczeniu efektywnej techniki testowania H 0 przeciwko H1 metodą ilorazu
wiarogodności pomoże nam zlogarytmowanie   X  . Otrzymamy wówczas:

 m   
m
m
m 

(5.5.3) ln   X     mrs ln rs   N rs  mrs  ln 1  rs     m ln   N  m  ln 1   
N rs
N rs   
N
N 


 r , s
a po prostych przekształceniach otrzymujemy wyrażenie:
11
ponieważ przestrzeń wyników jest dyskretna, warunek ten może nie być osiągalny wtedy wyznacza się takie

aby
P0    X     było możliwe bliskie  – patrz Silvey (1978)
206
(5.5.4)


ln   X   N  H  X    wrs H  X rs  
r,s


Łatwo spostrzec, że logarytm ilorazu wiarogodności w omawianym teście łączy ścisły
związek z entropijnym współczynnikiem kontrastu sieci K Ek  X  :
(5.5.5)
ln   X 
K Ek  X  
N H X 
Współczynnik kontrastu K Ek jest więc liniową funkcją logarytmu ilorazu wiarogodności w
powyższym problemie weryfikacji hipotez. Jeśli potrafimy zatem wyznaczyć  potrafimy
zarazem wyznaczyć
K  X  
ln 
, a tym samym odpowiedzieć na pytanie
N H X 
sygnalizowane w rozdz. III – czy współczynnik kontrastu sieci X przy podziale k członowym, K Ek  X  , jest dostatecznie wysoki aby uznać, że obserwowana sieć posiada
wykrystalizowaną strukturę o
k
członach? Jeśli
K Ek  X   K , odpowiedź będzie
negatywna, jeśli K Ek  X   K – pozytywna. Zależność między K Ek  X  i   X  dostarcza
wskazówki
dotyczącej
wyznaczania
P0 ln   X   c  NH  X  K Ek  X   .
Iloraz
wiarogodności będzie bowiem większy od c dla takich macierzy X  , dla których średnia
entropii wewnątrzblokowych (przy podziale B ) będzie mniejsza od analogicznej średniej dla
rozważanej macierzy X :
(5.5.6)
ln   X    NH  X  K Ek  X    wrs H  X rs    wrs H  X rs 
r,s
r,s
Problem wyznaczenia zbioru macierzy X  spełniających warunek wyrażony po lewej stronie
powyższej, równoważności sprowadza się do wyznaczenia takiego zbioru ciągów postaci
N
12

rs
, mrs  , dla których spełniona jest nierówność:12
Przypomnijmy, że podział
stąd i ustalone są wagi
wrs 
B wyznaczający rozmiary bloków X rs (a więc liczebności N rs ) jest ustalony,
N rs
N
207
 
 mrs   
mrs   mrs  
  mrs 


w

ln

1


ln


1        wrs H  X rs 

rs 
 
 
 
N
N
N
N
r,s
rs 
rs  
rs  


 rs 

  r , s
(5.5.7)
Oznaczmy klasę takich macierzy przez X . Prawdopodobieństwo realizacji (w rozkładzie
P0 ) którejkolwiek z macierzy z tej klasy jest równe
 N   m 
 X  X : P0  X     rs   
r , s  mrs   N 




mrs
m

1  
N



N rs
 mrs
Zatem wyznaczenie prawdopodobieństwa P0   X   c  nie jest trudne choć pracochłonne.
Alternatywnym przekładem problemu losowości zaobserwowanej sieci X jest przyjęcie
założenia, że podział B jest dany. Macierz X można wówczas potraktować jako k 2
niezależnych prób losowych o liczebnościach N rs wyznaczanych przez ten podział. W każdej
z nich zrealizował się ciąg niezależnych, binarnych zmiennych losowych
 X  i, j 
rs
o
identycznym rozkładzie określonym przez parametr  rs . Hipoteza H 0 zakłada, że w każdej z
tych prób  rs    const zaś hipoteza konkurencyjna H1 specyfikuje te parametry przez
równość  rs   rs . Testuje się więc hipotezę H 0 , że we wszystkich k 2 próbach zachodzi:
 r , s : P  X rs  i, j   1  
m
Oszacowaniem parametru  dla połączonych prób jest oczywiście ˆ 
natomiast
N
estymatorami parametrów  rs dla poszczególnych N rs – elementowych prób są  rs 
mrs
.
N rs
Statystyka B , służąca do weryfikacji hipotezy o równości parametrów we wszystkich
populacjach ma postać (po przekształceniach):
(5.5.8)
  m  mw 2  mw  m 2 
rs
rs
rs
rs
 , gdzie
B  X    



mwrs
N rs  mwrs 
r,s 


m   X  i, j 

i j


 wrs  N rs

N
208
Posiada ona asymptotycznie rozkład  2 o 2  k 2  1 stopniach swobody (por. Rao, 1982, str.
408).
209
§6. TESTY ZGODNOŚCI DWÓCH WZORÓW STRUKTURALNYCH.
W modelu sieci wielorelacyjnej często zdarza się, że niektóre jej składowe mają podobną
interpretację np. reprezentują związki o pozytywnym zabarwieniu emocjonalnym. W takich
sytuacjach naturalne staje się pytanie: na ile uzasadniona jest hipoteza że to X 2 a nie X 1 jest
wzorem strukturalnym składowej X 1 ?
W probabilistycznej wersji modelowania blokowego dwie rozpatrywane w tym przypadku
hipotezy będą miały następującą postać
H 0 :  rs1   X 2
czyli
   0   X 2 , B12 
H1 :  rs1   X 1
czyli
  1   X 1 , B12 

przy czym w obu hipotezach zakłada się wspólny podział B12 optymalny dla dwurelacyjnej
sieci X   X 1 , X 2  . Iloraz wiarogodności ma tu postać:
(5.6.1)
 X1 
sup L  X 1; 
 0
L  X 1; 0 

L  X 1;  X 1 , B12  

  1
2
L  X ;  X , B12  
Po podstawieniu do funkcji wiarogodności oszacowań parametrów modelu składowej X 1
oraz hipotetycznych ich wartości wyznaczanych przez H 0 (oszacowań dla składowej X 2 )
otrzymamy:
 m1rs 



 
r , s  N rs 
(5.6.2)
L  X ;  X , B12 

(5.6.3)
 m2 
L  X 1 ;  X 2 , B12      rs 
r , s  N rs 
1
1

m1rs
m1rs

m1rs 
 1 

N rs 


m2 
 1  rs 
N rs 

N rs  m1rs
N rs  m1rs
oraz
210
(5.6.4)
 m1 
  X 1     rs2 
r , s  mrs 
m1rs
 N  m1rs 
  rs
2 
 N rs  mrs 
N rs  m1rs
natomiast logarytm ilorazu wiarogodności przybierze postać:
(5.6.5)
 m1 
N  m1rs
ln   X 1    m1rs ln  rs2    N rs  m1rs  ln rs
N rs  mrs2
r ,s
 mrs 
Wystarczy teraz wyznaczyć zbiór takich macierzy X  , dla których iloraz wiarogodności
przyjmie
wartość
większą
od
zaobserwowanego
X1 
oraz
wyznaczyć
prawdopodobieństwo realizacji dowolnej macierzy z tego zbioru w hipotetycznym rozkładzie
P0 . Niech prawdopodobieństwo to wyniesie 1 . Jeśli 1   , gdzie  jest założonym
poziomem istotności, nie ma podstaw do odrzucenia H 0 , jeśli
natomiast 1   , H 0
odrzucamy.
Hipotezę o zgodności wzorów strukturalnych można zoperacjonalizować inaczej, traktując
składowe X 1 , X 2 jako realizacje k 2 niezależnych prób o liczebnościach N rs wyznaczonych
przez wspólny podział B12 . Hipoteza o zgodności wzorów strukturalnych może wówczas
zostać przełożona na założenie mówiące, że w każdej parze takich prób
zerojedynkowe zmienne
X rs1  i, j  , X rs2  i, j 
X
1
rs
, X rs2 
generowane są przez ten sam rozkład
prawdopodobieństwa. Zatem:
H 0 :  r , s :  rs1   rs2   rs
H1 :  H 0
H 0 zakłada więc, że w każdej z par prób  X rs1 , X rs2  zachodzi
P  X rs1  i, j   1  P  X rs2  i, j   1   rs
oraz
211
P  X rs1  i, j   0   P  X rs2  i, j   0   1   rs
Dla każdej pary prób estymatorami  rs na podstawie informacji z obu prób są
m1rs  mrs2
ˆ
 rs 
2 N rs
(5.6.7)
Stąd statystyka T służąca do weryfikacji H 0 przeciw X 1 , ma postać
(5.6.8)

 1
 mrs  m rs
T   
m rs
r ,s



2

 mrs2  mrs 
m rs
2




2
2
 N rs  m1rs   N rs  m rs 
 N rs  mrs2   N rs  m rs  



 



N rs  m rs
N rs  m rs


gdzie
m rs  N rsˆrs 
m1rs  mrs2
2
będzie miała asymptotycznie rozkład  2 o k 2 stopniach swobody. Łatwo zauważyć, że T
wyraża się identyczną formułą, co współczynnik zgodności wzorów strukturalnych
  X 1 , X 2  , który zatem posiada przy założeniu H 0 powyższy rozkład  2 .
212
§7. TEST ZGODNOŚCI DWÓCH MODELI BLOKOWYCH LOKALNIE
OPTYMALNYCH
Dotychczas rozważane testy zgodności modeli blokowych dwóch składowych
X1, X 2
opierały się na wspólnym podziale obiektów B12 dwurelacyjnej (co najmniej) sieci X . Jeśli
uchylimy to założenie i będziemy badać zgodność modeli lokalnie optymalnych dla
poszczególnych składowych X 1 , X 2 to rozważane przez nas hipotezy będą miały następującą
postać:
H 0 : modelem składowej X 1 jest  X  , B12 
H1 :  H 0
a przekładając to na język modeli stochastycznych:

H 0 :  1   0   vt0  , B2

H1 :  1   0
gdzie  1 oznacza parametr modelu składowej X 1 traktowanej jako sieć jednorelacyjna
natomiast
  , B 
0
vt
2
jest estymatorem największej wiarogodności tego parametru
wyznaczonym jednakże przy podziale B2 , który jest podziałem lokalnie optymalnym dla X 2 .
Zastosujemy test ilorazu wiarogodności. Statystyka   X 1  będzie w nim określona tak:
(5.7.1)
X
1

sup L  X 1 ;  
 0
L  X 1 ; 0 

L  X 1 ; 1 
L  X 1 ; 0 
Funkcje wiarogodności obu rozważanych parametrów będą następujące:
213
(5.7.2)
 m1rs 
L  X ;    

r , s  N rs 
1
m1rs

1
 m1rs 
 1 

 N rs 
N rs  m1rs

(podstawiliśmy do funkcji L  X 1 ; 1  lokalny estymator 1   rs1  , B1
(5.7.3)
 m1 
L  X 1; 0     vt 
v , t  N vt 
m1vt
 m1 
 1  vt 
N vt 


N vt  m1vt
przy czym N vt oraz mvt1 oznaczają rozmiary podmacierzy X vt1 oraz sumy ich obciążeń
krawędziowych przy podziale B2 . Sumy te wyrażają się prostą formułą:
(5.7.4)
mvt1   X 1  i, j   B2  v, i   B2  t , j 
i j
mvt1
Łatwo wykazać, że ilorazy
są estymatorami NW parametrów  vt . Po podstawieniu
N vt
odpowiednich estymatorów do ilorazu wiarogodności otrzymujemy:
(5.7.5)
 X1  
 m1rs 



r , s  N rs 
m1rs
 mvt1 



v , t  N vt 
m1vt
 m1rs 
 1 

 N rs 
 m1 
 1  vt 
 N vt 
N rs  m1rs
Nvt  m1vt
Wyznaczenie prawdopodobieństwa tego, że przy założeniu H 0 wygenerowana zostanie taka
macierz
X 0 , dla której iloraz wiarogodności przyjmie wartość większą niż w
zaobserwowanej składowej X 1 wiąże się podobnie jak poprzednio, z koniecznością
wyznaczenia zbioru X 0n wszystkich takich macierzy X 0 , których prawdopodobieństwo
realizacji w rozkładzie P0 będzie wyższe niż P0  X 1  wyrażone w liczniku ilorazu   X 1  .
Dla tych macierzy   X 0     X 1  .
Wyznaczenie z kolei prawdopodobieństwa realizacji każdej X 0  X 0n jest nieco bardziej
złożone niż poprzednio, gdyż P0 jest zdefiniowany dla innego podziału zbioru obiektów niż
214

P1 . Zauważmy, że model  0   vt0  , B2

przyporządkowuje każdej krawędzi sieci X 1
pewien parametr  vt0 , gdy krawędź ta jest elementem podmacierzy X vt1 wyznaczonej przez
podział B2 :
 i, j P0  X vt1  i, j   1   vt0
(5.7.6)
Wobec tego macierz parametrów dla wszystkich poszczególnych krawędzi sieci X 1 ,
oznaczmy ją przez X 0 jest dana przez równanie reprodukcyjne:
X 0  B2T   vt0   B2
(5.7.7)
Mamy bowiem:
 i, j : X 0  i, j    vt0  B2  v, i   B2  t , j   1
(5.7.8)
Niech X 0 będzie elementem zbioru X 0n .Wówczas prawdopodobieństwo jej wygenerowania
przez model  0 jest równe:
P0  X 0     0  i, j 
(5.7.9)
X 0 i , j 
i j
1   0  i, j  
1 X 0  i , j 
, gdzie  0  i, j   X 0  i, j 
a jeśli dla ustalonej X 0 oznaczymy:
mvt0   X 0  i, j  B2  v, i   B2  t , j 
i j
to otrzymamy
(5.7.10)
P0  X 0     vt0 mvt 1   vt0 
0
Nvt  mvt0
v ,t
Kontrastowy miernik zależności między lokalnie optymalnymi modelami blokowymi
215
składowymi X 1 i X 2 , oznaczany przez  E wiąże liniowy związek z logarytmem ilorazu
wiarogodności   X 1  . Po prostych przekształceniach daje się on przekształcić do postaci
(5.7.11):
E  X 1 ; X 2   1 
(5.7.11)
w
v ,t
vt
H  X vt1    wrs H  X rs1 
H X
r ,s
1
 K  X
Ek
1
B1 
przy czym K Ek  X 1 B1  oznacza entropijny współczynnik lokalnego kontrastu składowej X 1 .
Łatwo zauważyć, że H  X 1  oraz K Ek  X 1 B1  są dla X 1 wartościami stałymi, natomiast
licznik ułamka występującego w  E to nic innego, jak logarytm ilorazu wiarogodności
  X 1  podzielony przez stałą N Zatem:
E  X ; X
1
(5.7.12)
2
  1 N  H
ln   X 1 
X K X
1
Ek
1
B1 
Podobnie jak w przypadku poprzednio rozważanych miar związków między składowymi
sieci, tak i tu wyznaczenie prawdopodobieństwa 1 :


1  P   X 1   c , gdzie c   E  X 1 ; X 2   1  N  H  X 1  K Ek  X 1 B1 
0
pozwala na ocenę istotności parametru zależności kontrastowej
E  X 1 ; X 2 
w
zaobserwowanej sieci. Jeśli 1 jest większe od założonego poziomu istotności, nie ma
podstaw do odrzucenia H 0 , jeśli mniejsze, H 0 odrzucamy. Powyższy problem weryfikacyjny
był w istocie testem hipotezy o zgodności dwóch podziałów B1 , B2 gdyż estymator  0 został
wyznaczony przy założeniu podziału B2 . Łatwo jednak problem powyższy zmodyfikować
tak, aby testować zgodność całych modeli blokowych, tzn. testować hipotezę, że lokalnym

probabilistycznym modelem składowej X 1 jest  2   vt2  , B2
 X , B  . Testowałoby się wówczas hipotezę H
1

1
0

czyli
X
2
, B2 

a nie
: składowa X 1 została wygenerowana przez
216

model  X 2 , B2  czyli  0   vt0  , B2


X 1 : ~ H0
Procedura wyznaczania P0   X   c  gdzie c    X 1  jest podobna do poprzedniej. W
tym jednak przypadku logarytm ilorazu wiarogodności dla zaobserwowanej składowej X 1 nie
jest związany z żadnym z wprowadzonych przez nas mierników związku między składowymi
sieci relacyjnej. Wyznaczymy zatem test oparty na statystyce  . Każdy parametr  vt0  i, j 
określa prawdopodobieństwo wygenerowania dla krawędzi X 1  i, j  obciążenia równego 1,
które jest zarazem wartością oczekiwaną zmiennej binarnej odpowiadającej te krawędzi.
Zatem mrs0 :
(5.7.13)
mrs0   X 10  i, j   B1  r , i   B1  s, j  , gdzie X 10  B2T X 2 B2 ,
i j
jest wartością oczekiwaną sumy obciążeń krawędziowych w podmacierzy X rs1 przy założeniu
H 0 , gdyż jest to suma wartości oczekiwanych ciągu zmiennych odpowiadającego
podmacierzy X rs1 . Ponieważ ciąg ten liczy N rs - elementów, wobec tego dla każdego z nich:
(5.7.16)
0
m
mrs0
 r , s P0  X  i, j   1 
oraz P0  X rs1  i, j   0   1  rs
N rs
N rs
1
rs
a wartości oczekiwane liczby krawędzi obciążonych wartością 1 oraz liczby krawędzi
obciążonych wartością 0 są dla każdego bloku X rs1 (wedle H 0 ) równe:
(5.7.17)


m0
E0   X rs1  i, j   = N rs  P0  X rs1  i, j   1  N rs  rs  mrs0
N rs
 i, j

(5.7.16)


E0  1  X rs1  i, j    = N rs  P0  X rs1  i, j   0   N rs
 i, j

 m0
 1  rs
 N rs

0
  N rs  mrs

217
Stąd statystyka Tc :
(5.7.17)
Tc  X
1

r,s
m
1
rs
 mrs0 
mrs0
2
m

0
rs
 m1rs 
2
N rs  mrs0
ma asymptotycznie rozkład  2 o k 2 stopniach swobody.
218
§8. PROBLEM WYBORU LICZBY CZŁONÓW PODZIAŁU W MODELU
BLOKOWYM.
Nasze dotychczasowe rozważania dotyczyły modeli o ustalonej liczbie członów podziału, nie
zajmowaliśmy się natomiast problemem wyboru tej liczby. W klasycznej wersji modelowała
blokowego kryterium wyboru k było merytoryczne i w pewnym sensie narzucone przez
charakter analizowanych danych empirycznych. Badacz sam decydował, czy dzielić dalej
macierz czy też nie do czego był zmuszany przez interakcyjnie działający CONCOR – jeśli
np. podział na 4 części wystarczał do zadowalających interpretacji modelu, nie było potrzeby
konstruowania modelu 5-członowego. Z kolei specyficzny charakter danych (jak np. w
przypadku dużych sieci o niskich gęstościach poszczególnych składowych) skłaniał do
zwiększenia k , gdyż modele 7-8-członowe pozwalały na lepsze interpretacje niż 3-4członowe. Jedynym ograniczeniem formalnym istotnym dla sieci kilkunastoobiektowych
stosowanym w klasycznym modelowaniu blokowym był postulat zagwarantowania
minimalnej liczebności obiektów w członie podziału. Probabilistyczne podejście do modeli
blokowych pozwala problem wyboru k przedstawić jako problem weryfikacji hipotez.
Weźmy pod uwagę dwa optymalne modele blokowe sieci X : k -członowy model
X
k
, B k  oraz k  1 -członowy model

X
k 1
, B k 1  . O podziale B k 1 nie zakładamy, ze

zawiera się w B k . Problem wyboru jednego z tych modeli jest równoważny problemowi
wyboru jednej z dwóch hipotez:
H 0 :   0   X k , B k 

H1 :    0
Jeśli założyć, że  wyznacza zbiór możliwych k  1 -członowych modeli [tzn., że macierz
 rs  ma
wymiary  k  1   k  1 ], to okazuje się, że hipoteza zerowa specyfikuje pewien
szczególny przypadek modelu k  1 -członowego. Macierz parametrów X 0 poszczególnych
krawędzi  i, j  sieci X dana jest przez H 0 znanym równaniem reprodukcyjnym
219
X 0   B k  X k  B k
T
tego dla każdego podziału B a więc także dla B k 1 można na jej podstawie wyznaczyć
parametry  rs  i, j  wszystkich krawędzi w każdym z bloków X rs wyznaczanym przez B k 1 ,
przy czym, jeśli B k 1  B k , nie wszystkie one muszą być w nim identyczne. Oznacza to, że
0 jest szczególnym przypadkiem    , stąd można skorzystać z przedstawionych w
poprzednim paragrafie technik weryfikacji tego rodzaju hipotez. Dla przykładu rozważmy test
ilorazu wiarogodności. Indeksy r , s wyznacza podział B k 1 . Iloraz wiarogodności jest tu
równy:
(5.8.1)
X  
sup L  X ; 
 0
L  X ; 0 

 1   
mrs
rs
r,s
  i , j 
i j
0
X i , j 
rs
N rs  mrs
1 X  i , j 
1   0  i, j  
gdzie
 0  i, j   X   i, j 
0
Wystarczy wyznaczyć teraz zbiór X 0n o elementach X 0 , dla których   X 0     X  oraz
wyznaczyć prawdopodobieństwo realizacji któregokolwiek z nich przy P0 , aby na przyjętym
poziomie istotności przyjąć lub odrzucić H 0 . Przypadek, w którym B k 1 zawiera się w B k
dostarcza
ciekawej,
choć
wymagającej
dokładniejszego
zbadania
(technikami
symulacyjnymi) możliwości wykorzystania asymptotycznych własności podwojonego
logarytmu ilorazu wiarogodności. Jednocześnie przypadek ten jest nierozłącznie związany ze
stosowaniem hierarchicznych procedur eksploracyjnych do wyznaczania modeli blokowych
jak np. CONCOR-a. Zauważmy bowiem, że przy założeniu zawierania się dwóch podziałów,
model blokowy oparty na podziale B k jest elementem pewnej szczególnej podprzestrzeni
   . Przestrzeń tę charakteryzuje bowiem układ k  1 równości miedzy parametrami
macierzy  rs  .
Posłużymy się przykładem.
220
Przykład 27
11 12 13 14
 21  22  23  24
31 32 33 34
 41  42  43  44
Rozważmy macierz parametrów  rs  . Niech k  3 oraz B k 1  B k . Przy założeniu H 0
istnieje taki v -ty człon podziału B 3 , który w podziale B 4 dzielony jest na dwie części. Niech
v  2 . Zatem H 0 nakłada na  rs  następujące ograniczenia
12  13 ,
 24  34 ,
 22   23  32  33 ,
 42   43 .
 21  31 ,
Układ takich k  1 równań można zapisać w postaci ogólnej:
(5.8.1)


v :  r , s :  rv   r  v 1 &  rs   v 1 s ,
r , s  1, 2, ..., k  1
v  1, 2, ..., k
Jeśli przez  oznaczać będziemy przestrzeń takich modeli k  1 -członowych, które spełniają
powyższy warunek, to iloraz wiarogodności przyjmuje teraz postać następującą:
(5.8.3)
sup L  X ; 
  X    
sup L  X ; 
 

 1   
N rs  mrs
vtm 1  vt 
N vt  mvt
r,s
mrs
rs
vt
rs
,
r , s  1, 2, ..., k  1
v ,t
v, t  1, 2,..., k
Dla dużych prób losowych podwojony logarytm naturalny powyższego ilorazu, czyli
221
2 ln   X  posiada rozkład  2 o k  1 stopniach swobody, gdyż przy wspólnym dla obu
hipotez podziale B k 1 hipoteza H 0 nakłada na macierz  rs  k  1 ograniczeń (por. Silvey,
1978, str. 146, Rao, 1982, str. 426). Ta pociągająca swą prostotą ewentualność (logarytm
  X  to przecież różnica entropijnych miar dopasowania do danych optymalnych modeli
blokowych k i k  1 -członowych) wymaga jednak zarówno teoretycznej dyskusji na temat jej
uzasadnienia (brak próby losowej!) oraz, jak wspomnieliśmy, przeprowadzenia niezbędnych
eksperymentów symulacyjnych. Zawieranie się podziałów upraszcza znakomicie procedurę
weryfikacyjną przy zastosowaniu proponowanego przez nas „populacyjnego” podejścia do
wnioskowania o modelach blokowych. Testowanie H 0 przeciw H1 , ogranicza się bowiem do
sprawdzenia istotności różnic między podmacierzami X rv i X r  v 1 oraz X vs i X  v 1 s co łatwo
przeprowadzić za pomocą metod prezentowanych w niniejszym rozdziale.
222
BIBLIOGRAFIA
Wykaz skrótów używanych w tekście:
Czasopisma:
AJS
ASR
BS
HO
HR
JASA
JMP
JMS
P
QQ
S
SF
SM
SMR
SN
American Journal of Sociology
American Sociological Review
Behavioral Science
Human Organizations
Human Relations
Journal of American Statistical Association
Journal of Mathematical Psychology
Journal of Mathematical Sociology
Psychometrika
Quality and Quantity
Sociometry
Social Forces
Sociological Methodology
Sociological Methods and Research
Social Networks
Publikacje zwarte:
PSNR
Holland,P. W., Leinhardt,S. [eds.] PERSPECTIVES OF SOCIAL
NETWORK RESEARCH, New York: Academic Press 1979
Autorzy:
ABL
B
BBA
BNS
BW
W
WBB
Arabie,P., Boorman,S.A., Levitt, P.R.
Breiger,R.L.
Breiger,R.L., Boorman,S.A., Arabie,P.
Banaszak,H., Nowotny,S., Styczeń,M.
Boorman,S.A., White,H.C.
White,H.C.
White,H.C., Boorman,S.A., Breiger,R.L.
223
Prace cytowane:
Abell,P.
1975 MODELE W SOCJOLOGII. Warszawa, PWN.
Alba,R.D., Kaduschin,C.
1976 The intersection of social circles: a new measure of social proximity in networks.
SMR5:77-102.
Alba,R.D., Moore,G.
1978 Elite social circles. SMR7:167-187.
Alfierowa, Z., Jezżewa, W.
1974 ZASTOSOWANIA TEORII GRAFÓW W RACHUNKU EKONOMICZNYM.
Warszawa, PWE.
Arabie,P.
1977 Clustering representation of group overlap. JMS5:113-128
Arabie,P., Boorman, S.A., Levitt,P.E.
1978 Constructing blockmodels: how and why. JMP17:2l-63.
Banaszak, H., Nowotny, S., Styczeń, M.
1983 STATYSTYKA - SKRYPT DLA SOCOLOGÓW. IS UW, Warszawa
Barra,J.R.
1982 MATEMATYCZNE PODSTAWY STATYSTYKI. Warszawa: PWN.
Bavelas,A.
1960 Communication Patterns in Task-Oriented Groups, w: D.Cartwright, A.Zander [red],
GROUP DYNAMICS. New York: Harper and Row.
Beauchamp,M.A.
1965 An improved index of centrality. BS10:161-163.
Bernard,H.R., Killworth,P.D.
1973 On the structure of an ocean going research vessel and other important things. Social
Science Research 2: 145-184.
1977 Informant accuracy in social networks data II. Human Communication Research 4:318.
Bernard, H. R., Killworth,P.D. , Sailer,L.
1979/80
Informant accuracy in social network data IV: a comparison of clique-level
structure in behavioral and cognitive network data. SN 2: 191-218.
Bloemena, A.R.
1964 SAMPLING FROM A GRAPH. Amsterdam: Mathematisch Centrum
Bonacich,P.
1979 The algebra of blockmodelling. SM 1980:
1980 The common structure semigroup - an alternative to Boorman and White joint
reduction. AJS 86: 159-166
Boorman, S. A.
1975 A combinatorial optimization model for transmission of job information through
contact networks. Bell Journall of Economics 6: 216-249
Boorman, S. A.
1976 Social structure from multiple networks: II, role structures. AJS 81: 1324-1446.
Borowkow, A.A.
1977 RACHUNEK PRAWDOPODOBIEŃSTWA. Warszawa: PWN
Bott,E.
1955 Urban families: conjugal roles and social network. HR 8: 345-384
1957 FAMILY AND SOCIAL NETWORK. London: Tavistock.
Boyd, J.
224
1969 The algebra of group kinship. JMS 6:139-167.
1979/80 The universal semigroup of relations. SN 2: 91-117.
Boyd,J, Haehl, J.H., Sailer,L.
1972 Kinship systems and inverse semigroups. JMS 2: 37-61
Brams,S.J.
1968 Measuring the concentration of power in political systems. American Political Science
Review 62: 461-476.
Breiger,R.L., Boorman, S.A., Arabie, P.
1975 An algorithm for clustering relational data with application to social network analysis.
JMP 12: 328-383
Breiger,R.L.
1976 Career attributes and network structure: a blockmodel study of biomedical research
specialty. ASR 41: 117-135
1979 Toward an operational theory of community elite structures. QQ 13: 21-57.
Breiger, R.L., Ennis,J.E.
1979 Personae and social roles: the network structure of personality types in small groups.
Social Psychology Quarterly 42: 262-270
Breiger.,R.L,, Pattison, P.E.
1978 The joint structure of two communities. SMR 7: 213-226
Buga,J., Nykowski, I.
1974 ZAGADNIENIA TRANSPORTOWE W PROGRAMOWANIU LINIOWYM.
Warszawa: PWN.
Burt,R.S.
1976 Positions in networks. SF 55: 93-123.
1980 Models of Network structure. Annual Review of Sociology: 79-141.
Cartwright,D., Harary, F.
1956 Structural balance: a generalization of Heider’s theory. Psychological Revue 43: 277293.
Clifford, A.H., Preston, G.B.
1961 THE ALGEBRAIC THEORY OF SEMIGROUPS. Providence: American
Mathematical Society.
Deo,N.
1980 TEORIA GRAFÓW. Warszawa: PWN.
Doreian, P.
1969 A note on the detection of cliques in valued graphs. S 32: 167-178.
Freeman, L.C.
1976 A BIBLIOGRAPHY OF SOCIAL NETWORKS. Monticello: Council of Planning
Librarians.
1977 A set of measures of centrality based on betweeness. S 40: 35-41.
1978 Centrality in social networks. Conceptual clarification SN 1: 215-239.
Erdos.P., Renyi,A.
1959 On random. graphs. Publication Mathematicae, Debrecen: 290-297.
Erickson, B.H., Kringas, P.R.
1975 The small world of politics. Canadian Review of Sociology and Anthropology 12:
585-593.
Festinger, L.
1949 The analysis of sociograms using matrix algebra. HR 2: 153-158.
Festinger,L., Schacter. S., Back, K.W.
1950 SOCIAL PRESSURES IN INFORMAL GROUPS. Stanford: Stanford University
Press.
225
Flament, C.
1963 APPLICATIONS OF GRAPH THEORY TO GROUP STRUCTURE. New York:
Prentice Hall.
Ford, L.R., Fulkerson, D.R
1969 PRZEPŁYWY W SIECIACH. Warszawa: PWN.
Frank, O.
1971 STATISTICAL INFERENCE IN GRAPHS. Stockholm: Swedish Research Institute of
National Defense.
1978 Sampling and Estimation in large social networks. SN 1: 91-101
1979a Moment properties of subgraph counts in stochastic graphs. Annals of the NY
Academy of Sciences 319: 207-218.
1979b Estimating a graph from triad counts. Journal of Statistical Computation and
Simulation 9: 31-46.
1979/80 Balance in stochastic signed graphs. SN 2: 155-163.
1980 Sampling and inference in a population graph. International Statistical Review 48: 3341.
Granovetter, M.S.
1973 Strength of weak ties. AJS 78: 1360-1380.
1976 Network sampling: some first steps. AJS 81: 1287-1303.
Harary, F.
1969 GRAPH THEORY. New York: Wesley.
Harary, F., Norman, R.Z.
1953 GRAPH THEOHY AS A MATHEMATICAL MODEL IN SOCIAL SCIENCE. Ann
Arbor, Mich.: Institute for Social Research.
Harary,F., et. al.
1965 STRUCTURAL MODELS: AN INTRODUCTION TO THE THEORY OF
DIRECTED GRAPHS. New York: Wiley.
Heil, G.H., White.H.C.
1974 An algorithm for constructing homomorphism of multiple graphs. Unpubl., Dep. of
Sociology, Harvard University.
1976 An algorithm for finding simultaneous homomorphic correspondence between graphs
and their image graphs. BS 21: 26-35.
Hoivik, T., Gleditsch, N.P.
1975 Structural Parameters of Graphs. A Theoretical Investigation. W: H. Blalock [red],
QUANTITATIVE SOCIOLOGY, New York: Academic Press.
Holland, P.W., Leinhardt,S.
1970 A method for detecting structure in sociometric data. AJS 76: 492-513.
1973 The structural implication of measurement error in sociometry. JMS 3: 1-27.
1977a Social structure as a network process. Zeitschrift fur Sociologie 6: 386-402.
1977b A dynamic model for social networks. JMS 5: 5-20.
1978 An omnibus test for social structure using triads. SMR 7: 227-256.
1979 Structural Sociometry. W: PSNR.
Homans, G.C.
1950 THE HUMAN GROUP. New York: Harcourt.
Hubert, L.J., Baker, F.B.
1978 Evaluating conformity of sociometric measures. P 43: 31-42.
Ignasiak, E.
1975 PROGRAMOWANIE SIECIOWE. Warszawa: PWE.
Light, J.M., Mullins, N.C.
1979 A Primer on Blockmodeling Procedure. W: PSNR.
226
Ling, R.F.
1973 The expected number of components in random linear graph. The Annals of
Probability 5: 876-881.
1975 An exact probability distribution on the connectivity of random graphs. JMP 12: 9098.
Ling, R.F., Killough, G.H.
1976 Probability tables for cluster analysis based on a the of random graphs. JASA 354:
293-300.
Lipski, W.
1982 KOMBINATORYKA DLA PROGRAMISTÓW. Warszawa: WNT.
Lissowski, G.
1974a ZALEŻNOŚCI STATYSTYCZNE MIEDZI DWIEMA ZMIENNYM LOSOWYMI.
POJĘCIA PODSTAWOWE. Niepublikowana praca doktorska, Uniwersytet
Warszawski.
1974b Statistical Association and Prediction. W: K. Szaniawski [red]: PROBLEMS OF
FORMALIZATION IN THE SOCIAL SCIENCES, Wrocław: Ossolineum.
Linzell,J.
1974 THE ANALYSIS OF SOCIAL NETWORKS. Essex: ECPR Summer School
Monographs on Social Science Data Analysis.
Lorrain, F.P., White, H.C.
1971 Structural equivalence of individuals in social network. JMS 1: 49-80.
Lorrain,F.P.
1973 Handbook of Two-block Two-generator models. Unpubl., Dep. of Sociology, Harvard
University.
Lounsbury, P.A.
1964 A Formal Account of the Crow- and Omaha-Type Kinship Terminologies. W: W.
Goodenough [ed]: EXPLORATIONS IN CULTURAL ANTHROPOLOGY. New
York: McGraw Hill.
Luce, R.D., Perry, A.D.
1949 A method of matrix analysis of group structure. P 14: 95-116.
Marsden, P.V., Lauman, E.O.
1977 Collective Action in a Community Elite: Exchange, Influence and Issue Resolution.
W: R.J.Liebert, A.W. Imershein [red]: POWER, PARADIGMS AND COMMUNITY
RESEARCH. Beverly Hill: Sage
Mayer, T.F.
1975 MATEMATICAL MODELS OF GROUP STRUCTURE. New York: Bobs-Merrill.
Mokken,R.
1979 Cliques, clubs and clans. QQ 13: 161-173Moreno,J.L.
1934 WHO WILL SURVIVE? Washington, DC: Nerv. Ment. Dis, Publ.
1951 SOCIOMETRY, EXPERIMENTAL METHOD AND THE SCIENCE OF
SOCIOLOGY New York: Beacon House.
Moxley, R.L., Moxley, N.F.
1974 Determining point-centrality in uncontrived social networks. S 37: 122-130.
Mullins, N.C. et, al.
1977 The group structure of cocitation clusters: a comparative study. ASR 42: 552-562.
Nadel, S,F.
1957 THE THEORY OF SOCIAL STRUCTURE. Glencoe, Ill.: The Free Press
Newcomb, T.
1961 THE ACQUAINTANCE PROCESS. New York: Holt,Reinhart and Win
227
Niemoller, K.
1980 Application of graph theory to social structure. QQ 15:
Nordlie, P.G..
1958 A longitudinal Study of Interpersonal Attraction in a Natural Group Setting. Unpubl.
ph.d. diss., Univ. of Michigan
Ore, 0.
1962 THEORY OF GRAPHS. Providence: American Mathematical Society
Radcliffe-Brown, A.R.
1940 On social structure. Journal o the Royal Anthropological Society of Great Britain and
Ireland 70: 1-12.
Rao, C.J.
1982 MODELE LINIOWE STATYSTYKI MATEMATYCZNEJ. Warszawa: PWN.
Rasiowa, H.
1975 WSTĘP DO MATEMATYKI WSPÓŁCZESNEJ. Warszawa: PWN.
Restle, F.
1959 A metric and an ordering on sets. P 24: 207-220.
Roethlisberger, F.J., Dickson, V.J.
1939 MANAGEMENT AND THE WORKER. Cambridge, Mass.: Harvard University Press
Roichacher, R.C.
1974 A review of mathematical methods in sociometry. SMR 3: 125-171.
Sabidussi, G.
1966 The centrality index of graph. P 31: 581-603.
Sailer, L.D.
1978 Structural equivalence: meaning and definition, computation and application. SN 1:
73-90.
Sampson, S.F.
1969 Crisis in a Cloister. Ann Arbor, Michigan: University Microfilm No 69-5775
Schwart, J.
1977a An examination of CONCOR and related methods for blocking sociometric data. SM
1977: 255-282.
1977b The Structure of Affective Relations Over Time: A Blockmodel Analysis. W:
Anwendung Mathematischer Verfahren. Zur Analyse Sociale Netwerke. Berichte und
Diskussion. Internationale Wissenschaftliche Fachkonferenz. V17 bis l9, Hamburg.
Seidman, S.B., Foster, B.L.
1978 A note on the potential for genuine cross-fertilization between anthropology and
mathematics. SN 1: 65-72.
Silvey, S.D.
1978 WNIOSKOWANIE STATYSTYCZNE. Warszawa: PWN.
Szaniawski, K.
1974a Kryteria podejmowania decyzji. W: J.Kozielecki [red], PROBLEMY PSYCHOLOGII
MATEMATYCZNEJ. Warszawa: PWN.
1974b Pragmatyczna Wartość Informacji. W: J.Kozielecki [red], PROBLEMY
PSYCHOLOGII MATEMATYCZNEJ. Warszawa: PWN.
Tapiero, C. et. al.
1975 Structural Inference in Organizations. JMS 4: 121 -130.
Taylor, M.
1969 Influence structures. S 32: 490-502.
Theil, H.
1979 ZASADY EKONOMETRII. Warszawa: PWN.
Travers, J., Milgram, S.
228
1969 An experimental study of the small world problem. S 32: 425-443.
Wasserman, S.S.
1977 Random directed graph distributions and the triad census in social networks. JMS 5:
61-86.
1979 A stochastic model for directed graphs with transition rates determined by reciprocity.
SM 1980: 392-412.
1980 Analysing social networks as stochastic process. JASA 370: 280-294.
White, H.C.
1963 AN ANATOMY OF KINSHIP: MATHEMATICAL MODELS FOR STRUCTUREJ
OF CUMULATED ROLES. New York: Prentice Hall.
1969 Notes on Finding Models of Structural Equivalence, Drawing on Theories Of Roles,
Duality, Sociometry and Balance. [mimeo] Cambridge, Mass.: Harvard University.
1972 Do Networks Matter? Unpubl., Harvard Univ.
1973 Models for Interrelated Roles from Multiple Networks in Small Populations. W: P.J.
Knopp, et. al. [red], PROCEEDINGS ON THE APPLICATION OF
UNDERGRADUATE
MATHEMATICS
THE
ENGINEERING,
LIFE,
MANAGERIAL AND SOCIAL SCIENCES Georgia: Georgia Institute of
Technology.
1974 Null probabilities for blockmodels of social networks. Unpubl., Dep. of Sociology,
Harvard Univ.
1977 Probabilities of homomorphic mappings from multiple graph JMP 16: 121-134.
White, H.C., Boorman, S.A., Breiger, R.L.
1976 Social structure from multiple networks: I. blockmodels of roles and positions. AJS
81: 730-780.
229

X - Uniwersytet Warszawski

Transkrypt

Podobne dokumenty

Gazetka 1111.pub - Polish Club of Denver

Social banking - nieuchronna przyszłość?

Beatyfikacja Jana Pawła II, obchody w parafii św. Józefa w Denver

Gazetka - Polish Club of Denver