X - Uniwersytet Warszawski
Transkrypt
X - Uniwersytet Warszawski
ROZDZIAŁ V STATYSTYCZNE PROBLEMY MODELOWANIA BLOKOWEGO §1. WNIOSKOWANIE STATYSTYCZNE W ANALIZIE DANYCH SOCJOMETRYCZNYCH W analizie danych socjometrycznych można wyróżnić dwa podejścia do wnioskowania statystycznego. W pierwszym podejściu, nazwiemy je „populacyjnym”, traktuje się zaobserwowaną sieć jak losowo wybrany podgraf dużego grafu populacyjnego. Taki losowo wybrany fragment sieci populacyjnej jest grafem indukowanym przez próbę losową jej wierzchołków. Zaobserwowane w nim połączenia między wierzchołkami (obciążenia krawędzi) podgrafu – próby pozwalają na wyznaczenie wartości parametrów charakteryzujących podgraf. Mogą zatem być statystykami pozwalającymi na wnioskowanie o cechach sieci populacyjnej, z której próba pochodzi. Populacyjne podejście do wnioskowania z sieci-próby o parametrach sieci populacyjnej choć jest jeszcze w „dziecięcej fazie rozwoju” (Frank, 1980) posiada już użyteczne dla praktyki badawczej wyniki a także pewne osiągnięcia teoretyczne (jak np. monografie Bloemena’y, 1964; oraz Frank’a, 1971). Wyniki te pozwalają na: – oszacowanie przedziałowe gęstości sieci g X , także wyznaczenie niezbędnej w tym celu liczebności próby (Granovetter, 1976; także Tapierd,et al., 1975) – oszacowanie oczekiwanej liczby diad odwzajemnionych M , asymetrycznych A i pustych O w digrafie populacyjnym za pomocą nieobciążonych estymatorów oraz oszacowanie (również nieobciążone) ich wariancji (Frank, 1979a, 1979b) – oszacowanie oczekiwanej liczby nieizomorficznych triad w symetrycznym grafie populacyjnym (triad counts) za pomocą nieobciążonych estymatorów a także nieobciążone oszacowanie wariancji tych liczb (Frank 1979a, Frank 1979b) – oszacowanie liczby spójnych komponentów1 w symetrycznym grafie populacyjnym przechodnim lub typu „las” (Frank, 1978 a; także Tapierd, Lewin, Capobianco, 1975) 1 w polskiej literaturze z teorii grafów „component” tłumaczy się jako składową, ponieważ jednak używaliśmy tego terminu w odniesieniu do X wielorelacyjnych, poprzestaniemy na powyższej konwencji. 178 – oszacowanie indeksów równowagi strukturalnej w grafie znakowanym symetrycznym (populacyjnym) oraz wyznaczenie dla nich quasi-przedziałów ufności ( jedno odchylenie standardowe estymatora; Frank, Harary, 1979/80) Użyteczność powyższych rezultatów ogranicza się niestety tylko do takich sytuacji, w których badacza-empiryka rzeczywiście interesuje sieć populacyjna i jej właściwości. Dzieje się tak w badaniach typu „small-world problem” oraz w rzadkich przypadkach badań nad procesami urbanizacyjnymi czy nad integracją społeczną rozpatrywaną na poziomie dużych zbiorowości. Znakomitą większość danych socjometrycznych stanowią jednak socjogramy zrealizowane w zbiorowościach o niewielkich z punktu widzenia statystyka liczebnościach, w zbiorowościach, które traktowane są jako jedyny przedmiot badania. W takich sytuacjach wszystkie charakterystyki zbadanej zbiorowości opisują tylko ją. Nie mamy więc do czynienia z próbą losową lecz badamy całą zbiorowość. Mimo to liczni autorzy analizujący takie dane empiryczne mówią o estymacji parametrów, niekiedy także o przyjmowaniu lub odrzucaniu hipotez, o poziomie istotności. Czy używają oni wówczas terminologii statystycznej niezgodnie z jej przeznaczeniem? Wydaje się, że nie stosują bowiem drugie podejście do wnioskowania statystycznego, które nazwiemy modelowym. W podejściu tym przedmiotem badania, do którego danych empirycznych dostarcza zaobserwowana sieć, jest model probabilistyczny sieci. Pod pewnymi względami pełni on podobną funkcję, co populacja w podejściu „populacyjnym”, jego parametry określają bowiem rozkład prawdopodobieństwa na zbiorze możliwych wyników badania. W związku z tym, celem badacza jest znalezienie parametrów modelu probabilistycznego, najlepiej dopasowanego do wyników obserwacji (stąd estymacja) bądź rozstrzygnięcie pytania, która z alternatywnych parametryzacji modelu zasługuje w świetle posiadanych wyników na większe zaufanie (stąd weryfikacja hipotez). Rozważmy powyższą analogię między podejściem populacyjnym i modelowym nieco bardziej szczegółowo. Punktem wyjścia każdego problemu statystycznego jest skonstruowanie przestrzeni statystycznej , , . Elementy tego układu mają przy tym następującą interpretację: – jest zbiorem wyników obserwacji zwanym także przestrzenią prób, – jest -ciałem nad tą przestrzenią, – jest rodziną rozkładów prawdopodobieństwa na mierzalnej przestrzeni , indeksowanej pewnym parametrem przebiegającym dany zbiór , można ją zatem zapisać 179 P : (por. Barra, 1982; Rao, 1982). „W praktyce, w wyniku obserwacji otrzymuje się jeden punkt z przestrzeni prób , podczas gdy prawdziwa wartość parametru , tzn. prawdziwy rozkład P pozostaje nieznany. Problem statystyczny polega na sformułowaniu pewnych orzeczeń o nieznanym na podstawie zaobserwowanego wyniku” (Rao, 1982, s. 157; podkreślenie – HB). Z formalnego punktu widzenia tak zdefiniowany problem statystyczny jest również stawiany w modelowym podejściu do wnioskowania W podejściu tym traktuje się zaobserwowaną sieć jako realizację wielowymiarowej zmiennej losowej. Każda następna realizacja takiej zmiennej może być różna od poprzedniej. Zakłada się jednak, że zmienna ta posiada „swój”, nieznany badaczowi, rozkład prawdopodobieństwa na zbiorze swoich możliwych realizacji. Przyjmując pewne założenia o takim rozkładzie, o jego własnościach badacz konstruuje model probabilistyczny sieci, to znaczy definiuje rodzinę rozkładów P : na zbiorze możliwych realizacji wspomnianej zmiennej losowej. Zmienna ta może przyjmować skończoną choć bardzo dużą liczbę wartości, z których w badaniu zrealizowała się tylko jedna – zaobserwowana sieć X . Zakładając, że jest to realizacja zmiennej o rozkładzie należącym do rodziny P : , badacz może zapytać: 1○ który z rozkładów z tej rodziny wygenerował sieć X , tzn. jaki jest prawdziwy rozkład P , wedle którego zrealizowała się jego obserwacja lub zapytać: 2○ który z dwóch konkurencyjnych rozkładów P0 , P1 bardziej zasługuje na to, aby go uznać za prawdziwy?. Udzielenie odpowiedzi na pierwsze z powyższych pytań jest w istocie oszacowaniem parametrów modelu probabilistycznego sieci. Odpowiedź na pytanie drugie jest natomiast rozstrzygnięciem problemu weryfikacji hipotezy głoszącej, że prawdziwym rozkładem, z którego pochodzi obserwacja X jest rozkład P0 przeciwko hipotezie, że rozkładem tym jest P1 . Zatem w obu przypadkach formułuje się pewne orzeczenia o nieznanym na podstawie zaobserwowanego wyniku. W modelowym podejściu do wnioskowania statystycznego o sieciach relacyjnych konstruuje się przestrzeń probabilistyczną X, 2X P : , w której: – X jest zbiorem możliwych realizacji wielowymiarowej zmiennej losowej czyli klasą n obiektowych sieci relacyjnych lub jej podklasą (określoną np. przez liczbą krawędzi, przez liczbę diad odwzajemnionych, asymetrycznych i pustych itp.) 180 – 2X jest rodziną wszystkich podzbiorów X ; jest ona -ciałem nad X a zatem X,2X jest przestrzenią mierzalną. – P : jest rodziną rozkładów prawdopodobieństwa na przestrzeni X,2X , zaś zbiorem dopuszczalnych parametrów (być może wektorowych), które indeksują każdy z rozkładów tej rodziny. Prawdopodobieństwa w rozkładzie P są pewną funkcją parametru . Postać tej funkcji jest określona przez, zbiór założeń przyjmowanych przez badacza, które ustalają w jaki sposób prawdopodobieństwa realizacji sieci X X zależy od parametru . Rodzinę rozkładów P : wraz ze zbiorem założeń o relacjach między i P nazywać będziemy modelem probabilistycznym sieci z klasy X . Elementy nazywać będziemy parametrami modelu probabilistycznego. Aby skonstruować przestrzeń probabilistyczną o powyższej strukturze należy zatem zdefiniować zbiór X oraz przyjąć założenia o postaci rozkładów P na nim określonych, tzn. ustalić liczbę, i rodzaj parametrów tych rozkładów definiując przy tym zbiór . Badacz ma znaczną swobodę w wyborze takich założeń, gdyż są one operacjonalizacją jego założeń o charakterze rzeczywistości reprezentowanej przez sieć relacyjną. W konsekwencji modele probabilistyczne sieci tej samej klasy mogą mieć bardzo różną postać. W niektórych przypadkach, jak zobaczymy dalej, będą to modele tak proste, że skonstruowana z ich udziałem przestrzeń X, 2 P X : będzie równoważna prostym przestrzeniom statystycznym. Częściej jednak będą one bardziej złożone. Mimo to procedury zmierzające do identyfikacji prawdziwego rozkładu z rodziny P : oraz do wyboru jednej z dwóch hipotetycznych jego postaci będziemy nazywać wnioskowaniem statystycznym o parametrach probabilistycznych modelu sieci, gdyż są te procedury stosowane w standardowych problemach statystycznych. Dla każdej realizacji rozważanej tu wielowymiarowej zmiennej losowej, czyli dla każdej sieci z klasy X można wyznaczyć wartość pewnego liczbowego jej parametru (np. liczbę krawędzi obciążonych wartością jeden, liczbę diad pełnych, liczbę triad przechodnich). Parametr sieci jest zatem funkcją z X w zbiór liczb rzeczywistych i w związku z tym może zostać nazwany statystyką określoną w przestrzeni X,2X a więc i w X, 2 P X : . Zrekonstruujemy teraz kilka przestrzeni probabilistycznych, określonych w nich statystyk oraz rozstrzyganych za ich pomocą problemów estymacji i weryfikacji hipotez o parametrach probabilistycznych modeli sieci relacyjnych. 181 Przykład 23 (Ling 1973, 1975; Ling, Killough, 1976) Jest to przykład najprostszy i dlatego go cytujemy mimo iż nie dotyczy bezpośrednio analizy danych socjometrycznych. Rozważa się tu klasę symetrycznych, n -wierzchołkowych grafów o m krawędziach. Z klasy tej obserwujemy jeden graf X . Pod adresem empirycznego grafu X formułuje się pytanie, które w konsekwencji prowadzi do postawienia odpowiadającego mu problemu statystycznego: jakie są podstawy do twierdzenia, że zaobserwowany graf został wygenerowany przez mechanizm losowy? Mniej formalne pytanie brzmi: na ile zaobserwowana struktura jest realna? Zbiór dopuszczalnych parametrów modelu sieci rozdziela się w ten sposób na dwa podzbiory: 0 , 0 . Wyróżniony jego element 0 operacjonalizuje pojęcie mechanizmu losowego. Zgodnie z tradycją teorii grafów losowych (por. Erdos & Ranyi, 1959) losowy, symetryczny n -wierzchołkowy graf bez pętli o m krawędziach jest elementem przestrzeni X n , m z określonym na niej równomiernym rozkładem prawdopodobieństwa: X X n, m n P0 X 2 m Pozostałych rozkładów 1 2 P : 0 nie definiuje się. Posługując się natomiast rozkładem P0 wyznacza się dla przestrzeni X n , m wartość oczekiwaną liczby spójnych komponentów grafu z niej wylosowanego, oznaczymy ją przez Cn, m X , a także wartość oczekiwaną liczby spójnych komponentów o dokładnie j -wierzchołkach, oznaczmy ją przez Cn , m , j . Cn , m oraz Cn , m , j są zatem statystykami określonymi na przestrzeni X n,m ,2 Xn , m , P , P0 : , 0 Ponieważ Ling wyznaczył dokładny rozkład wyżej wymienionych statystyk względem P0 , możliwe stało się rozstrzygnięcie problemu wyboru między 0 a 0 a więc 2 Używamy skróconego zapisu P X zamiast pełnego P X 182 zweryfikowania hipotezy H 0 głoszącej, że zaobserwowana struktura jest wygenerowana przez losowy mechanizm określony rozkładem P0 przeciw konkurencyjnej hipotezie H1 ~ H 0 . Przykład 24 oparty na pracach Holland’a, i Leinhardt’a, zwłaszcza (Holland- Leinhardt, 1979; także Wasserman, 1977) Podobnie, jak w poprzednim przykładzie, w rodzinie rozkładów P : wyróżnia się jeden rozkład równomierny P0 . Prezentowane tu diadowe podejście do opisu struktury różni się jednak od poprzedniego wielkością rozważanych przestrzeni wyników obserwacji a także specyficznymi założeniami dotyczącymi procesu ich powstawania. Rozważmy trzy takie przypadki. 1○. X=X M , A,O Przestrzeń wyników obserwacji składa się z wszystkich digrafów o ustalonej liczbie diad odwzajemnionych M , diad asymetrycznych A oraz diad pustych O .(Te trzy parametry grafu wyznaczają oczywiście liczbę jego wierzchołków, gdyż N M AO . 2 Równomierny rozkład prawdopodobieństwa na przestrzeni X=X M , A,O ma postać X X M , A,O n ! 1 2 : P0 X A 2 M ! A ! O ! 1 n który odpowiada procedurze losowego wybierania bez zwracania spośród diad grafu: M 2 n diad odwzajemnionych (pełnych); spośród M pozostałych wybiera się w identyczny 2 sposób A diad asymetrycznych, przy czym dla każdej z nich z prawdopodobieństwem 1 2 określa się kierunek asymetrii. Pozostałe diady pozostają puste (a jest ich O ). 183 2. X=X X i Rozważa się tu zbiór wszystkich digrafów, których macierze mają identyczne sumy wierszowe dane wektorem ( n -elementowym) X i . Według rozkładu P0 , wszystkie te grafy są jednakowo prawdopodobne, zatem: n 1 X X X i : P0 X i 1 X i n 1 Zakłada się tu, że alokacja X i wyborów obiektu xi między pozostałe obiekty sieci (tzn. n 1 ) odbywa się według procedury bezzwrotnego losowania X i spośród nich, natomiast każdy obiekt xi dokonuje swoich wyborów niezależnie od pozostałych – stąd prawdopodobieństwo uzyskania konkretnego grafu X ze zbioru X X i jest iloczynem prawdopodobieństw realizacji poszczególnych wektorów xi . 3. X=X X j Ta przestrzeń statystyczna definiowana jest analogicznie jak poprzednia. Zbiór wyników obserwacji wyznaczony jest tym razem przez wektor sum kolumnowych macierzy grafu. Wyróżniony rozkład P0 ma postać: n 1 X X X : P0 X j j 1 X j n 1 We wszystkich trzech powyższych przestrzeniach statystycznych określa się tę samą statystykę. Jest nią wektor T T1 , T2 ,..., T16 którego elementami są liczebności triad typu r , gdzie r 1, 2,...,16 (patrz rozdz. I §1). Przy założeniu rozkładu P0 wyznacza się wartość oczekiwaną tego wektora oraz macierz kowariancji jego elementów a także proste jego funkcje (jak np. , czyli standaryzowaną liczbę triad nieprzechodnich). Wyznaczenie wartości tych statystyk w zaobserwowanym grafie X i porównanie ich z wartościami oczekiwanymi przy rozkładzie P0 pozwala na uzasadnienie decyzji o przyjęciu, że 184 obserwacja pochodzi z losowej przestrzeni grafów (a więc przyjęciu 0 ) lub o odrzuceniu takiej hipotezy o losowości zaobserwowanej struktury. Przykład 25 (Frank, Harary, 1979/80) Problem statystyczny sformułowany jest podobnie jak w przykładach poprzednich, gdyż jego rozstrzygnięciem jest przyjęcie lub odrzucenie hipotezy o losowości zaobserwowanego grafu. W tym jednak przypadku przestrzeń statystyczna i operacje na niej wykonywane są znacznie bardziej złożone. Zbiorem wyników obserwacji jest symetrycznych grafów znakowanych, oznaczmy ją przez klasa n -wierzchołkowych, X n . Aby wyznaczyć i sparametryzować jej rozkład Frank i Harary dokonują dekompozycji grafu z tej klasy na zbiór n diad, z których każda może się znajdować w jednym z trzech stanów 2 – jej krawędź może być nieobciążona (wówczas X i, j X j , i 0 ) – jej krawędź może być dodatnio oznakowana (wówczas X i, j X j , i 1 ) – jej krawędź może być oznakowana ujemnie ( X i, j X j , i 1 ) Prawdopodobieństwa tego, że diada Dij będzie się znajdowała w jednym z trzech powyższych stanów określone są za pomocą dwóch parametrów , i p : P X i, j 0 1 P X i, j 1 p P X i, j 1 1 p Podstawowym założeniem tego modelu probabilistycznego jest przyjęcie, że graf z rodziny X n powstaje w następujący sposób: n – każda z diad ma generowane obciążenie (jakiekolwiek, tzn. bądź +1 bądź –1) z 2 prawdopodobieństwem – generowanie obciążeń poszczególnych diad jest niezależne od pozostałych (stochastycznie) 185 – znak obciążenia każdej diady jest generowany z prawdopodobieństwem p, 1 p dla +1 i –1 odpowiednio – znaki obciążeń generowane są niezależnie – stąd stany diad są wyznaczone również niezależnie od siebie z prawdopodobieństwami danymi wyżej. Powyższe założenia specyfikują zatem model probabilistyczny posiadający dwa parametry 1 oraz p 2 . Jeśli przez oznaczymy wektor parametrów 1 , 2 to każdy rozkład P na zbiorze X n ma postać: 2 X Xn : P X 1 X i, j 1 1 X i, j 1 X i, j 1 2 X i, j 1 X i, j 1 1 2 2 i j Parametr 1 , 2 jest nieznany, należy go zatem oszacować. Nie trudno otrzymać jego estymatory największej wiarygodności: ˆ1 m n 2 , ˆ2 m m , m X i, j 2 i j m 1 X i, j 1 X i, j 2 i j ( m oznacza tu liczbę krawędzi oznakowanych w grafie X , zaś m liczbę krawędzi oznakowanych dodatnio). Przyjmując ˆ1 oraz ˆ2 Frank i Harary wyznaczają wartości oczekiwane i wariancje n triadowych statystyk grafu c oraz c 3 tzn. liczby zrównoważonych 3-cykli c oraz 3 n liczby zrównoważonych triad c , co pozwala im również na wyznaczenie dla nich 3 pseudo-przedziału ufności (wartość oczekiwana statystyki jej odchylenie standardowe). 3 c – oznacza liczbę 3-cykli , c – liczbę 3-cykli niezrównoważonych w symetrycznym grafie znakowym, patrz rozdz. I, §1. 186 n Jeśli w zaobserwowanym grafie X wartości c X oraz c X przekraczają granice 3 tak skonstruowanego przedziału, autorzy proponują odrzucić hipotezę o losowej tzn. niezależnej dystrybucji połączeń i ich obciążeń a więc odrzucić model probabilistyczny jako nieadekwatny do danych empirycznych. Przykład 26 (Holland, Leinhardt, 1980) W ostatnim już przykładzie modelowego podejścia do wnioskowania statystycznego zbiorem wyników obserwacji jest klasa X n wszystkich digrafów n -wierzchołkowych. Konstrukcja rodziny rozkładów P : nad takim zbiorem jest dość złożona i nie będziemy jej tu przytaczać w całości, zwłaszcza, że wektor parametrów ma 2n 2 elementy: , , 1 , 2 ,..., n , 1 , 2 ,..., n przy czym zakłada się dlań, że i i j j 0 , natomiast interpretacje tych parametrów są następujące: – reprezentuje ogólną tendencję do odwzajemniania wyborów, kontroluje liczbę diad odwzajemnionych (pełnych) w digrafie - reprezentuje ogólną tendencję do wysyłania wyborów, kontroluje liczbę krawędzi obciążonych (gęstość) w digrafie 1 , 2 ,..., n – wektor parametrów reprezentuje ekspansywność poszczególnych obiektów sieci, kontroluje liczbę wysyłanych wyborów przez poszczególne obiekty. 1 , 2 ,..., n – wektor parametrów atrakcyjności poszczególnych obiektów, kontrolują one liczbę wyborów otrzymywanych przez każdy z nich Prawdopodobieństwo zrealizowania się dowolnego grafu z przestrzeni X n jest funkcją wektora : n n exp M m i X i j X j i 1 j 1 X X n : P X kij i j 187 przy czym M – jest liczbą diad pełnych w digrafie X m – jest liczbą krawędzi obciążonych tego digrafu kij – jest funkcją parametrów , , i , j zapewniającą normalizację wyrażenia do przedziału 0,1 W powyższym modelu zakłada się, że wszystkie diady Dij digrafu X są generowane niezależnie od siebie. Prawdopodobieństwa tego, że diada Dij będzie pusta, asymetryczna lub pełna dają się wyznaczyć z wektora : P Dij 1,1 mij exp 2 i j i j kij 1 P Dij 1, 0 aij exp i j kij 1 P Dij 0, 0 nij kij 1 Dzięki temu oszacowany metodą największej wiarygodności wektor ˆ pozwala na wyznaczenie dla każdej diady prawdopodobieństwa mˆ ij , aˆij , nˆij . Ponieważ diada może znajdować się tylko w jednym z czterech stanów a także P X i, j 1 mij aij ij , można porównać analizowaną macierz empiryczną X z macierzą wartości oczekiwanych obciążeń E X i, j ze względu na wektor ˆ . Pozwala to na ocenę stopnia dopasowania pełnego modelu ˆ do danych. Estymacja i interpretacja parametrów rozkładu P jest jednak tylko pierwszym krokiem analizy. Model Holland’a i Leinhardt’a umożliwia bowiem weryfikowanie hipotez o tendencjach strukturalnych w zaobserwowanym digrafie. Specyfikacja tych hipotez polega na przyrównaniu do zera niektórych elementów wektora ˆ i wyestymowaniu metodą największej wiarogodności wartości pozostałych parametrów, na które nie nakłada się dodatkowych ograniczeń. Niektóre z tych hipotez mają swoje odpowiedniki w poprzednich przykładach. Zacytujmy cztery przypadki: 188 H 0 : 0, j 0 (pozostałe parametry bez ograniczeń) H1 : 0 H2 : H3 : j (pozostałe parametry bez ograniczeń) 0 (pozostałe parametry bez ograniczeń) wszystkie parametry wektora nie są ograniczone Hipoteza H 0 odpowiada założeniu, że graf został wygenerowany przez taki mechanizm losowy, w którym nie ma żadnej tendencji do odwzajemniania wyborów 0 , wszystkie obiekty są równie atrakcyjnymi celami dla każdego nadawcy j : j 0 zaś dystrybucja krawędzi w sieci zalety tylko od indywidualnych ekspansywności obiektów i oraz ogólnej tendencji do wysyłania wyborów w ogóle . H2 modyfikuje powyższą hipotezę dopuszczając ingerencję ogólnej tendencji do odwzajemniania wyborów 0 zaś H1 uzależnia prawdopodobieństwo wygenerowania obciążenia krawędzi X i, j od stopnia atrakcyjności odbiorcy j 0 . H 3 reprezentuje pełny model bez żadnych ograniczeń na wartości jego parametrów. Test na istnienie tendencji do odwzajemniania wyborów w analizowanej sieci polega na weryfikowaniu H 0 przeciwko H 2 , gdyż różnią się one wartością jednego tylko parametru , który „kontroluje” liczbę diad pełnych w grafie. Ponieważ obie hipotezy zakładają brak wpływu atrakcyjności odbiorcy x j na prawdopodobieństwo pij , alternatywną metodą testowania powyższej tendencji (lecz niekorzystającą z powyższego założenia) jest weryfikowanie H1 przeciwko H 3 . Dochodzimy w tym momencie do problemu, który pojawi się również przy okazji weryfikowania hipotez opartych na probabilistycznej wersji modelu blokowego. Jest to problem istnienia i liczebności próby w modelowym podejściu do wnioskowania statystycznego. Weryfikując H1 przeciwko H 3 , Holland i Leinhardt proponują użyć jako statystyki logarytmu ilorazu wiarogodności: P3 X P1 X mˆ aˆ X i , j 1 X j ,i ij nˆ m a X i , j 1 X j ,i ij n X i , j X j ,i ij i j i j X i , j X j ,i ij i j i j i j i j 1 X i , j 1 X j ,i ij 1 X i , j 1 X j ,i ij gdzie mˆ ij , aˆij , nˆij oznaczają estymatory największej wiarogodności wyznaczone przy 189 założeniu H 3 zaś mij , aij , nij przy założeniu H1 : Logarytm ilorazu funkcji wiarogodności (a ściślej 2 ln ) miałby asymptotyczny rozkład 2 o jednym stopniu swobody (gdyż 0 H1 oraz 0 H 3 , por. np. Rao, 1982 s. 427), gdyby X oznaczał w tym przypadku próbę losową o dużej liczebności4). Tak jednak nie jest, gdyż jak pamiętamy X jest tu jedną realizacją, pojedynczą macierzą n n pochodzącą z przestrzeni X n , na której określone są rozkłady P . Holland i Leinhardt zauważają ten fakt stwierdzając, że „standardowa teoria nie stosuje się do tego przypadku” (str. 25)5. Nie badają więc analitycznie rozkładu powyższej statystyki 2 ln , lecz w zamian badają ten rozkład (przy założeniu H1 ) za pomocą technik symulacyjnych dochodząc do wniosku, że nie różni się on zbytnio od rozkładu 2 a ponadto różnica ta maleje ze wzrostem rozmiarów grafu. W konkluzji stwierdzają, że „rozkład 2 o jednym stopniu swobody jest wystarczający dla zgrubnej (crude) oceny poziomu istotności w testowaniu H1 przeciwko H 3 za pomocą ilorazu wiarogodności” (Holland, Leinhardt, 1980 str. 27). Stwierdzenie to wymaga komentarza, gdyż z analogicznym problemem zetkniemy się w następnej części pracy. Nie ulega wątpliwości, że w modelowaniu danych socjometrycznych nie mamy do czynienia z próbami losowymi w standardowym, statystycznym sensie. Dysponujemy bowiem tylko jedną obserwacją. Ubywanie określenia liczebność próby jest w takim razie niedopuszczalne, tak jak wykorzystywanie asymptotycznych własności statystyk opartych na dużych próbach. W konsekwencji weryfikowanie hipotez o modelach probabilistycznych danych socjometrycznych staje się niezwykle utrudnione, gdyż wtedy testy hipotez muszą wykorzystywać dokładne rozkłady używanych statystyk, których wyznaczenie choć technicznie możliwe, jest bardzo pracochłonne. W tej kłopotliwej sytuacji widzimy jedno tylko rozwiązanie, uzasadnione po części wynikami badań symulacyjnych Holland’a i Leinhardt’a. Należy uznać, że zaobserwowana macierz jest 4 X musi być w tym przypadku ciągiem niezależnych zmiennych losowych X 1 , X 2 ,..., X n o jednakowym rozkładzie P X i , i 1, 2,..., n , zależnym od (być może wielowymiarowego) parametru . Gdy n rośnie do nieskończoności, 2 ln ma asymptotycznie rozkład 5 Gdyby potraktować ciąg 2 . n n 1 n krawędzi grafu X jako ciąg takich zmiennych to okazałoby się to sprzeczne z założeniami modelu, gdyż zakłada on, że poszczególne krawędzie 1 z różnymi prawdopodobieństwami wyznaczonymi przez parametry modelu: Analogiczną sprzeczność uzyskuje się traktując X i, j są obciążane wartością i , i , , . n X jako realizację ciągu diad Dij . 2 190 równoważna realizacji n n 1 – elementowego ciągu zmiennych losowych (binarnych) o łącznym rozkładzie określonym parametrami modelu probabilistycznego. W przypadku, gdy n jest duże a liczba parametrów względem niego mała, statystyki oparte na ilorazie wiarogodności powinny zachowywać się jak w sytuacjach dużych, niezależnych prawdziwych prób losowych. Oczekują tego także cytowani wyżej autorzy a zamierzając przeprowadzić w tej kwestii dalsze badania symulacyjne „nie oczekują żadnych niespodzianek”. W przypadku pozytywnych wyników badań symulacyjnych rozwiązanie powyższe pozwala korzystać z bogatego dorobku klasycznej teorii testowania hipotez na podstawie dużych prób. Zauważmy, na zakończenie tego paragrafu, że w estymacji parametrów modelu probabilistycznego metodą największej wiarogodności przyjmowanie założenia o istnieniu n n 1 – elementowej próby losowej nie jest konieczne. 191 §2. STOCHASTYCZNY MODEL BLOKOWY I ESTYMACJA JEGO PARAMETRÓW. Konstrukcja modelu jakiegokolwiek zjawiska związana jest z dokonywaniem szeregu upraszczających założeń o przedmiocie badania. Gdy uproszczenia są zbyt wielkie, analiza danych prowadzi do rezultatów banalnych (mało użytecznych dla teorii zjawiska) lub ewidentnie fałszywych (gdy uproszczenia ignorują istotne cechy zjawiska). Brak upraszczających założeń uniemożliwia z kolei efektywne posługiwanie się modelem probabilistycznym, gdyż trudne jest (lub zgoła niemożliwe) oszacowanie jego zbyt wielu wówczas parametrów. Ideałem byłoby posiadanie takich założeń upraszczających, które byłyby jednocześnie mocne w sensie formalnym, tzn. pozwalałyby na konstrukcję estymowalnego modelu a jednocześnie na tyle elastyczne, by nie negując ich można było w tym modelu opisać zjawiska złożone, skomplikowane. Założeniem-uproszczeniem, na którym opierają się triadowe modele Holland’a i Leinhardt’a, stochastyczne modele Wasserman’a6 (łańcuchy Markowa) a także ostatni model z przykładu 26, jest zasada niezależności stochastycznej zachowania się diad w sieci relacyjnej. Oznacza ona, że stan połączeń między obiektami diady nie zależy stochastycznie od stanu połączeń między obiektami innej diady mimo, i jeden z obiektów sieci może należeć do obu diad. Jak powiadają Holland i Leinhardt, założenie to nie odbiega od rzeczywistości reprezentowanej za pomocą sieci relacyjnych na tyle, by trzeba było z niego zrezygnować. My przyjmiemy teraz założenie, które danym empirycznym stawia wymagania mocniejsze niż stochastyczna niezależność diad. Jest to założenie niezależności pojedynczych krawędzi sieci. Przy tym założeniu każdy obiekt xi sieci relacyjnej posiada dla każdego z pozostałych obiektów x j rozkład Pij a na zbiorze dopuszczalnych obciążeń krawędzi X i, j . Ponadto, obciążenia poszczególnych krawędzi sieci są od siebie stochastycznie niezależne. Oznacza to, że każdy obiekt xi generując obciążenie krawędzi X i, j (np. wysyłając wybór do obiektu x j bądź nie wysyłając) posługuje” się pewnym rozkładem prawdopodobieństwa Pij a generując obciążenie krawędzi X i, k rozkładem Pik . Ponadto decyzje o przydziale wartości poszczególnych obciążeń zapadają od siebie niezależnie. Założenie powyższe opisuje, jak widać, zachowanie się obiektów sieci w kategoriach probabilistycznych. Cechą obiektów 6 Wasserman (1979; 1980), także Holland, Leinhardt (1977a, 1977b) traktują proces powstawania i znikania połączeń w sieci jako proces stochastyczny 192 określającą jego pozycje w sieci nie jest teraz jak to było poprzednio, zbiór wysyłanych i odebranych wyborów lecz zbiór parametrów rozkładów prawdopodobieństwa, które opisują tendencje, szanse wysyłania i odebrania wyboru. Zaobserwowana macierz X jest w tym ujęciu (jedną z wielu możliwych) realizacją takiego układu szans. Zrozumiałe jest zatem, że przyjęcie założenia o probabilistycznej naturze sieci, jako rezultacie losowego zachowania się jej obiektów, musi mieć konsekwencje dla pojęcia modelu blokowego sieci. Model ten również musi być probabilistyczny. Modyfikacja, której należy poddać deterministyczną wersję optymalnego modelu blokowego nie jest jednak trudna. Pozycję obiektu xi w sieci X charakteryzuje układ szans definiowany parametrami odpowiednich rozkładów prawdopodobieństwa na dokonanie i otrzymanie wyboru (od) pozostałych obiektów. Dwa obiekty będą zatem strukturalnie względem siebie równoważne, jeśli ich układy szans będą identyczne. Wzór strukturalny będzie z kolei specyfikował te układy dla członów podziału B zbioru X , wyznaczonego przez powyższą równoważność; macierz X będzie teraz macierzą parametrów odpowiednich rozkładów prawdopodobieństwa. Przystąpmy do konstrukcji modelu. Jej celem jest uzyskanie probabilistycznego wzoru, według którego wygenerowana została macierz obserwacji X oraz podziału B zbioru obiektów sieci X wyznaczonego przez relację strukturalnej równoważności X pokreśloną na podstawie identyczności „układów szans”). Rozważania nasze ograniczymy do modeli sieci n -obiektowych, binarnych, czyli do przestrzeni X n . Przestrzeń statystyczna jest następująca: X n , 2Xn , P : . Określenie zbioru dopuszczalnych rozkładów P wiąże się z przyjęciem wspomnianego założenia niezależności obciążeń krawędziowych i wykorzystaniem faktu, że macierz X (realizacja modelu jest macierz binarną a rozkład prawdopodobieństwa na zbiorze 0,1 wyznaczony jest kompletnie przez jedno prawdopodobieństwo: Założenie 1. (5.2.1) i j ij : P X ij 1 ij 193 Każda krawędź sieci X ma „swoje” prawdopodobieństwo bycia krawędzią obciążoną wartością 1. Założenie 2. (o niezależności) X X n P X P X ij 1 (5.2.2) i j X i , j P X i , j 0 1 X i , j (prawdopodobieństwo realizacji macierzy X X n jest iloczynem prawdopodobieństw obciążeń wartością l lub O jej poszczególnych elementów). Stochastyczny k -członowy model blokowy sieci z klasy X n wyznaczony jest przez założenia (5.2.1) i (5.2.2) oraz rodzinę rozkładów P : , w której każdy parametr definiujący rozkład P składa się z dwóch części – z macierzy rs o wymiarach k k zawierającej k 2 parametrów dotyczących rozkładów prawdopodobieństwa na obciążeniach poszczególnych krawędzi X i, j oraz macierzy podziału B zbioru obiektów sieci, tzn: rs , B gdzie: (i) 1 k n (ii) macierz B jest macierzą podziału zbioru X na k podzbiorów (iii) i j : B r , i 1 & B s, j 1 ij rs Oznacza to, że krawędzie sieci X znajdujące się w podmacierzy X rs wyznaczonej przez podział B posiadają identyczną wartość parametru ij . Funkcja wiarogodności obserwacji X względem parametru ma zatem postać: (5.2.3) 1 X i , j X i, j L X ; P X rs rs 1 rs rs r ,s i, j Estymacja parametrów polega na wyznaczeniu takiego wektora , który będzie w punkcie X maksymalizował funkcje wiarogodności. Wątpliwość, czy wyznaczenie można nazwać oszacowaniem parametrów (ze względu na obecność podziału B , który jest w istocie funkcją z X na zbiór 1, 2,..., k ) przedyskutujemy dalej. Teraz wyznaczymy wektor 194 w pewnej szczególnej sytuacji a mianowicie, gdy k 1 co oznacza, że model nasz posiada tylko jeden parametr, gdyż odpowiada przypadkowi, w którym wszystkie obiekty zbioru X wchodzą w skład jedynego „członu podziału”. Wektor parametrów ma tylko jeden element a więc i, j : ij Funkcja wiarogodności ma postać: (5.2.4) L X ; 1 X i , j 1 X i , j i j X jest siecią zrealizowaną, zatem można dla niej wyznaczyć m X i, j . Stąd: i j (5.2.5) L X ; m 1 N m Logarytm naturalny funkcji wiarogodności oznaczymy przez l Zatem (5.2.6) l ln m 1 N m m ln N m ln 1 . Po wyznaczeniu pierwszej pochodnej i przyrównaniu jej do zera, maksimum funkcji l a w konsekwencji także i L X ; osiągane jest w punkcie równym gęstości sieci X . Zatem (5.2.7) l sup l m g X N W przypadku k -członowego stochastycznego modelu blokowego, rs jest kwadratową macierzą rzeczywistą o wymiarach k k i poza ograniczeniem r , s : 0 rs 1 195 nie stawia się jej żadnych dodatkowych wymagań. Jest ona zatem elementem k 2 k2 0,1 wymiarowej przestrzeni . Drugim członem wektora jest podział B . Jest on elementem zbioru wszystkich k -członowych podziałów n -elementowego zbioru X a podziałów takich może być S n, k 7. Wyznaczenie wektora , który maksymalizowałby funkcję wiarogodności L nie może zatem polegać na wyznaczeniu pochodnej jej logarytmu i przyrównaniu jej do zera. Zastosujemy tu jednak efektywną procedurę, analogiczną do tej, której używaliśmy przy wyznaczaniu optymalnego modelu blokowego w rozdz. III. Weźmy pod uwagę dowolny k -członowy podział B i wyznaczmy dla niego funkcję wiarogodności oznaczoną teraz przez L X ; B : (5.2.8) 1 X i , j N m X i, j L X ; B rs rs 1 rs rs rsmrs 1 rs rs rs i, j r,s r,s (nadskrypty nad symbolami X rs , mrs , N rs sygnalizują, że wielkości te są wyznaczone przez podział B ). Jej logarytm oznaczymy przez l B ; zatem (5.2.9) l B mrs ln rs N rs mrs ln 1 rs r,s Po wyznaczeniu pierwszych pochodnych względem każdego z rs i przyrównaniu ich do zera otrzymamy układ k 2 równań następującej postaci (dla każdego r , s : r , s 1, 2,..., k ): (5.2.10) mrs rs m N rs mrs 0 , których rozwiązaniem jest rs rs g X rs 1 rs N rs A zatem funkcja L X ; B osiąga maksimum, gdy dla każdego 1 r , s k , rs jest gęstością podmacierzy X rs wyznaczonej przez podział B . Oznaczmy taki „warunkowo optymalny” (ze względu na B ) estymator przez rs B . Wobec tego: 7 liczba Stirlinga drugiego rodzaju. 196 (5.2.11) r , s : rs B g X rs Podstawmy teraz wyestymowane warunkowo wartości rs B do wyrażenia na logarytm funkcji wiarygodności: (5.2.12) m m l B mrs ln rs N rs mrs ln 1 rs N rs N rs r,s Daje się ona po kilku krokach przekształcić do: (5.2.13) m m m m l B N wrs rs ln rs 1 rs ln 1 rs N rs N rs r,s N rs N rs przy czym wrs N rs N Oznaczmy sumę w nawiasie kwadratowym przez H X rs , co pozwoli zapisać (5.2.14) l B N wrs H X rs r,s Zważywszy, że gęstości wewnątrzblokowe g X rs są częstościami występowania w podmacierzy X rs H X rs można obciążenia krawędziowego równego 1, wielkość interpretować jako entropię rozkładu obciążeń w tej podmacierzy8. l B jest zatem sumą entropii wewnątrzblokowych ważoną rozmiarami bloków X rs a więc średnią entropii warunkowych (wewnątrzblokowych). W (5.2.13) wyznaczyliśmy wartość logarytmu funkcji wiarogodności w punkcie X przy ustalonym podziale B . Wartość tę można również wyznaczyć dla każdego k -członowego podziału B a zatem można znaleźć taki podział B , który logarytm funkcji wiarogodności będzie maksymalizował, tzn. zachodzić będzie: 8 mierzoną w nitach 197 B : l B l B wrs H X rs wvt H X vt 9 , r,s v ,t gdzie wrs , X rs oznaczają wagi i podmacierze wyznaczone przez podział B zaś wvt i X vt wagi i podmacierze wyznaczone przez podział B . Wobec tego jest estymatorem wektora otrzymywanym metodą największej wiarogodności zawsze i tylko wtedy, gdy podział B minimalizuje10 średnią entropii wewnątrzblokowych, zaś oszacowaniami parametrów rs są gęstości wewnątrzblokowe wyznaczone przy tym podziale: (ii) r , s : rs mrs N rs l sup l (i) rs , B (5.2.15) (iii) B : w r ,s rs H X rs wvt H X vt v ,t (oznaczenia jak wyżej). Nietrudno zauważyć, że estymator największej wiarogodności parametrów k –członowego stochastycznego modelu blokowego jest modelem blokowym optymalnym w entropijnym sensie tzn. przy funkcji E . (5.2.16) Estymator parametru jest funkcją statystyki dostatecznej dla rodziny rozkładów P : Dowód: Każdej macierzy X X n można bowiem przyporządkować k 2 -elementowy ciąg t : t N 11 , m11 , N12 , m12 ,..., N rs , mrs ,..., N kk , mkk spełniający warunki (i) istnieje taki k -członowy podział B zbioru obiektów sieci X , że elementy N rs są 9 zmiana znaku logarytmów z + na zmiana znaku logarytmów z + na - 10 198 liczebnościami pól podmacierzy X rs wyznaczonymi przez ten podział, zaś mrs są liczebnościami krawędzi obciążonych wartością l w tych podmacierzach, (ii) dla dowolnego podziału B zbioru obiektów sieci X zachodzi mrs mrs m mvt m ln N m ln N vt mvt ln 1 vt 1 mvt ln rs rs rs N rs N rs v ,t N vt N vt r,s przy czym wielkości N vt , mvt są wyznaczane przez podział B . Funkcja przyporządkowująca sieci X X n , ciąg t jest statystyką dla rodziny P : definiującej stochastyczny model blokowy. Przestrzenią wartości tej statystyki, oznaczmy ją przez , jest zbiór ciągów k 2 -elementowych o elementach N rs , mrs spełniających dwa oczywiste ograniczenia: (i) N r ,s rs n n 1 N (ii) r , s : 0 mrs N rs & 0 N rs N Statystyka wyznacza podział przestrzeni X n na podzbiory postaci X t X X n : T X t Czym różnią się między sobą elementy podzbioru Xt a co mają wspólnego? Podzbiory Xt składają się z takich macierzy X , które: – dają się podzielić na k 2 podmacierzy X rs zawierających po krawędzie w tym mrs krawędzi obciążonych wartością 1 – powyższy podział jest najlepszy z możliwych w sensie warunku (ii) – mają te samą gęstość, gdyż m mrs jest identyczna dla wszystkich X Xt . r ,s Są to cechy wspólne wszystkich elementów podzbioru Xt . Różnice między nimi polegają natomiast na tym, że w macierzach X 1 , X 2 X t poszczególne krawędzie X 1 i, j , X 2 i, j 199 mogą się różnić od siebie, choć sumy obciążeń w podmacierzach X rs1 , X rs2 muszą być identyczne (równe mrs ). Łatwo zauważyć, że warunkowy rozkład P X X t nie zależy od , gdyż wszystkie sieci X Xt są jednakowo prawdopodobne: 1 N X X t : P X rs . r , s mrs Wobec tego statystyka T jest dostateczna. 200 §3. ESTYMACJA PARAMETRÓW STOCHASTYCZNEGO MODELU BLOKOWEGO SIECI WIELORELACYJNEJ Uogólnienie pojęcia stochastycznego modelu blokowego na przypadek sieci wielorelacyjnych wymaga przyjęcia dodatkowego założenia niezależności stochastycznej obciążeń krawędziowych poszczególnych składowych sieci. Założenie 2 musi ulec modyfikacji i będzie miało tu postać założenia 2a: Założenie 2a S X J i , j 1 X J i , j X X n : P X P X J i, j 1 P X J i, j 0 J 1 i j (5.3.1) przy czym X X 1 , X 2 ,..., X J ,..., X S oznacza teraz sieć o S składowych zaś X n – zbiór wszystkich n -obiektowych, binarnych sieci S -relacyjnych. Wektor parametrów zawiera teraz tyle macierzy rs ile jest składowych sieci X zaś podział B jest oczywiście jeden: 1 , 2 ,..., S , B12...S rs rs rs Funkcja wiarogodności wyraża się teraz następująco: (5.3.2) S J i, j X rs 1 X J i , j L X ; P X rsJ 1 rsJ rs J 1 r ,s i, j Logarytm naturalny funkcji wiarogodności jest postaci (5.3.3) S S l mrsJ ln rsJ N rs mrsJ ln 1 rsJ l J J 1 r , s J 1 Wyznaczenie estymatora największej wiarogodności przebiega analogicznie jak dla sieci jednorelacyjnej, jedyną różnicą jest konieczność maksymalizacji sumy logarytmów funkcji 201 wiarygodności poszczególnych składowych acz przy jednym wspólnym podziale, co sprowadza się do znalezienia takiego podziału, który tę sumą maksymalizuje. Addytywność logarytmu funkcji wiarogodności sprawia, że rezultat otrzymany dla pojedynczej sieci X stosuje się do przypadku sieci wielorelacyjnej tzn. estymatorami parametrów rsJ są gęstości wewnątrzblokowe g X rsJ wyznaczone przy podziale B maksymalizującym l tzn. przy podziale, który minimalizuje sumę (po wszystkich składowych X J , J 1, 2,..., S ) średnich entropii wewnątrzblokowych H X rsJ . 202 §4.WERYFIKACJA HIPOTEZ O PARAMETRACH STOCHASTYCZNEGO MODELU BLOKOWEGO Twórca koncepcji modelowania blokowego, H.C.White napisał kiedyś, że „model blokowy jest hipotezą o zbiorze danych macierzy…” (WBB, 1976, str. 739). Zauważmy jednak, że hipotezy takiej nie można zweryfikować, gdyż: – nie posiada związanej z nią hipotezy konkurencyjnej – nawet gdyby konkurencją byłaby negacja wspomnianej hipotezy, klasyczne podejście do modelowania blokowego nie posiada kryterium pozwalającego rozstrzygnąć, który z dwóch modeli „pasuje” bardziej do danych empirycznych. Optymalnościowe podejście do modelowania blokowego dostarcza takiego kryterium a ponieważ model entropijnie optymalny jest estymatorem największej wiarygodności parametrów stochastycznego modelu blokowego, pozwala ono na statystyczne testowanie hipotez o modelach blokowych zaobserwowanej sieci. Problematyka weryfikacji hipotez o modelach blokowych dzieli się na dwie zasadnicze grupy zagadnień: – testy losowości zaobserwowanej struktury relacyjnej – testy zgodności konkurencyjnych modeli blokowych. Testy losowości mają na celu udzielenie odpowiedzi na pytanie: jakie są podstawy do odrzucenia przypuszczenia, że zaobserwowana sieć została wygenerowana przez mechanizm losowy produkujący wszystkie sieci z jednakowymi prawdopodobieństwami? Testy zgodności pozwalają natomiast rozstrzygnąć problem, czy istnieją podstawy aby odrzucić hipotezę głoszącą, że prawdziwym parametrem (modelem entropijnie optymalnym) danej sieci jest parametr inny niż ten, który został uzyskany metodą największej wiarogodności. Problemy weryfikacji hipotez, o parametr stochastycznego modelu blokowego będziemy rozwiązywać za pomocą testu ilorazu wiarogodności oraz testu opartego na statystyce 2 . Przy tej okazji zinterpretujemy wprowadzone w rozdziałach III i IV parametry sieci relacyjnej – współczynnik kontrastu, parametr: zgodności strukturalnej miedzy dwiema składowymi sieci oraz kontrastowy miernik zależności miedzy składowymi. 203 §5. SIEĆ LOSOWA A WSPÓŁCZYNNIK KONTRASTU. Rozważmy dwie hipotezy o następującej treści: H 0 : sieć X pochodzi z losowej przestrzeni X n , tzn. takiej, że X X n : P X const H1 : sieć X pochodzi z przestrzeni X n , tzn. takiej, że X X n : P X P X gdzie – rs , B – rs jest macierzą parametrów, k k – B jest podziałem k -członowym zbioru X , przy czym wartość parametru jest nieznana. Hipoteza H 0 może zostać przełożona na założenie, że wszystkie obciążenia krawędziowe sieci X generowane są przez ten sam rozkład prawdopodobieństwa na zbiorze 0,1 a zatem zakłada się w niej, że i j : ij H0 definiuje więc 1-członowy model sieci z jednym parametrem . Jego estymatorem NW jest 0 m , gęstość sieci X . Funkcja wiarygodności dla estymatora 0 ma postać: N m (5.5.1) m m L X ; 1 N N N m 0 Estymatorem NW parametru przy założeniu hipotezy H1 jest, jak pamiętamy, wektor 1 rs , B o własnościach określonych w (5.2.15), dla którego funkcja wiarogodności 204 jest następująca: m L X ;1 rs r , s N rs (5.5.2) mrs mrs 1 N rs N rs mrs Zwróćmy uwagę, że H 0 jest szczególnym przypadkiem H1 , gdyż przy podziale B z hipotezy H1 , zakłada ona, że wszystkie wewnątrzblokowe parametry rs przyjmują wartość m . Mamy zatem do czynienia z problemem testowania hipotezy o zgodności dwóch N gęstościowych wzorów strukturalnych przy wspólnym podziale B . Do weryfikacji H 0 przeciw H1 zastosujemy test ze statystyką w postaci ilorazu wiarogodności (patrz np. Lehman, 1968, Silvey, 1978, Rao, 1982). Iloraz funkcji wiarogodności oznaczymy przez . Zatem: mrs X sup L X ; 0 sup L X ; 0 L X ;1 L X ; 0 N rs mrs mrs mrs 1 N rs r , s N rs m N m m m 1 N N Konstrukcją obszaru krytycznego dla powyższego testu można przeprowadzić na dwa sposoby: W pierwszym przypadku obszar krytyczny składa się z takich macierzy X , dla których X . Oznaczmy obszar krytyczny przez X k : X k X X n : X przy czym wyznacza się z warunku: P X X X n : X P0 X X k gdzie jest założonym poziomem istotności. Aby podjąć decyzję o odrzuceniu lub przyjęciu hipotezy H 0 na poziomie istotności należy 205 zatem: – dla każdej macierzy X X n wyznaczyć L X ; 0 , L X ;1 oraz X – macierze te uporządkować ze względu na wartość X – wyznaczyć dystrybuantę X ze względu na rozkład P0 – wyznaczyć z niej tak, aby P0 X 11 – sprawdzić czy w zaobserwowanej macierzy danych – X – a wtedy przyjąć H 0 (tj. rozkład z 0 ) – X – a wtedy przyjąć H1 (tj. rozkład z 1 ) Z oczywistych powodów powyższe zadanie jest praktycznie niewykonalne nawet dla niewielkich danych. Istnieje jednak rozwiązanie nieco mniej pracochłonne. Zamiast wyznaczać obszar krytyczny i można zadać pytanie: jakie jest prawdopodobieństwo (warunkowe ze względu na H 0 ) wygenerowania z rozkładu P0 takich macierzy, dla których statystyka przyjmować będzie wartości większe niż X wyznaczone dla uzyskanej obserwacji. Jeśli prawdopodobieństwo to jest większe od należy przyjąć H 0 gdyż wówczas X . Rozwiązanie to, choć mniej pracochłonne niż poprzednie wymaga posłużenia P0 się X : X C maszyną cyfrową, gdyż wyznaczenie prawdopodobieństwa gdzie C jest wartością ilorazu w zaobserwowanej macierzy danych, pociąga za sobą konieczność przejrzenia wciąż jeszcze dużego zbioru macierzy spełniających powyższy warunek. W wyznaczeniu efektywnej techniki testowania H 0 przeciwko H1 metodą ilorazu wiarogodności pomoże nam zlogarytmowanie X . Otrzymamy wówczas: m m m m (5.5.3) ln X mrs ln rs N rs mrs ln 1 rs m ln N m ln 1 N rs N rs N N r , s a po prostych przekształceniach otrzymujemy wyrażenie: 11 ponieważ przestrzeń wyników jest dyskretna, warunek ten może nie być osiągalny wtedy wyznacza się takie aby P0 X było możliwe bliskie – patrz Silvey (1978) 206 (5.5.4) ln X N H X wrs H X rs r,s Łatwo spostrzec, że logarytm ilorazu wiarogodności w omawianym teście łączy ścisły związek z entropijnym współczynnikiem kontrastu sieci K Ek X : (5.5.5) ln X K Ek X N H X Współczynnik kontrastu K Ek jest więc liniową funkcją logarytmu ilorazu wiarogodności w powyższym problemie weryfikacji hipotez. Jeśli potrafimy zatem wyznaczyć potrafimy zarazem wyznaczyć K X ln , a tym samym odpowiedzieć na pytanie N H X sygnalizowane w rozdz. III – czy współczynnik kontrastu sieci X przy podziale k członowym, K Ek X , jest dostatecznie wysoki aby uznać, że obserwowana sieć posiada wykrystalizowaną strukturę o k członach? Jeśli K Ek X K , odpowiedź będzie negatywna, jeśli K Ek X K – pozytywna. Zależność między K Ek X i X dostarcza wskazówki dotyczącej wyznaczania P0 ln X c NH X K Ek X . Iloraz wiarogodności będzie bowiem większy od c dla takich macierzy X , dla których średnia entropii wewnątrzblokowych (przy podziale B ) będzie mniejsza od analogicznej średniej dla rozważanej macierzy X : (5.5.6) ln X NH X K Ek X wrs H X rs wrs H X rs r,s r,s Problem wyznaczenia zbioru macierzy X spełniających warunek wyrażony po lewej stronie powyższej, równoważności sprowadza się do wyznaczenia takiego zbioru ciągów postaci N 12 rs , mrs , dla których spełniona jest nierówność:12 Przypomnijmy, że podział stąd i ustalone są wagi wrs B wyznaczający rozmiary bloków X rs (a więc liczebności N rs ) jest ustalony, N rs N 207 mrs mrs mrs mrs w ln 1 ln 1 wrs H X rs rs N N N N r,s rs rs rs rs r , s (5.5.7) Oznaczmy klasę takich macierzy przez X . Prawdopodobieństwo realizacji (w rozkładzie P0 ) którejkolwiek z macierzy z tej klasy jest równe N m X X : P0 X rs r , s mrs N mrs m 1 N N rs mrs Zatem wyznaczenie prawdopodobieństwa P0 X c nie jest trudne choć pracochłonne. Alternatywnym przekładem problemu losowości zaobserwowanej sieci X jest przyjęcie założenia, że podział B jest dany. Macierz X można wówczas potraktować jako k 2 niezależnych prób losowych o liczebnościach N rs wyznaczanych przez ten podział. W każdej z nich zrealizował się ciąg niezależnych, binarnych zmiennych losowych X i, j rs o identycznym rozkładzie określonym przez parametr rs . Hipoteza H 0 zakłada, że w każdej z tych prób rs const zaś hipoteza konkurencyjna H1 specyfikuje te parametry przez równość rs rs . Testuje się więc hipotezę H 0 , że we wszystkich k 2 próbach zachodzi: r , s : P X rs i, j 1 m Oszacowaniem parametru dla połączonych prób jest oczywiście ˆ natomiast N estymatorami parametrów rs dla poszczególnych N rs – elementowych prób są rs mrs . N rs Statystyka B , służąca do weryfikacji hipotezy o równości parametrów we wszystkich populacjach ma postać (po przekształceniach): (5.5.8) m mw 2 mw m 2 rs rs rs rs , gdzie B X mwrs N rs mwrs r,s m X i, j i j wrs N rs N 208 Posiada ona asymptotycznie rozkład 2 o 2 k 2 1 stopniach swobody (por. Rao, 1982, str. 408). 209 §6. TESTY ZGODNOŚCI DWÓCH WZORÓW STRUKTURALNYCH. W modelu sieci wielorelacyjnej często zdarza się, że niektóre jej składowe mają podobną interpretację np. reprezentują związki o pozytywnym zabarwieniu emocjonalnym. W takich sytuacjach naturalne staje się pytanie: na ile uzasadniona jest hipoteza że to X 2 a nie X 1 jest wzorem strukturalnym składowej X 1 ? W probabilistycznej wersji modelowania blokowego dwie rozpatrywane w tym przypadku hipotezy będą miały następującą postać H 0 : rs1 X 2 czyli 0 X 2 , B12 H1 : rs1 X 1 czyli 1 X 1 , B12 przy czym w obu hipotezach zakłada się wspólny podział B12 optymalny dla dwurelacyjnej sieci X X 1 , X 2 . Iloraz wiarogodności ma tu postać: (5.6.1) X1 sup L X 1; 0 L X 1; 0 L X 1; X 1 , B12 1 2 L X ; X , B12 Po podstawieniu do funkcji wiarogodności oszacowań parametrów modelu składowej X 1 oraz hipotetycznych ich wartości wyznaczanych przez H 0 (oszacowań dla składowej X 2 ) otrzymamy: m1rs r , s N rs (5.6.2) L X ; X , B12 (5.6.3) m2 L X 1 ; X 2 , B12 rs r , s N rs 1 1 m1rs m1rs m1rs 1 N rs m2 1 rs N rs N rs m1rs N rs m1rs oraz 210 (5.6.4) m1 X 1 rs2 r , s mrs m1rs N m1rs rs 2 N rs mrs N rs m1rs natomiast logarytm ilorazu wiarogodności przybierze postać: (5.6.5) m1 N m1rs ln X 1 m1rs ln rs2 N rs m1rs ln rs N rs mrs2 r ,s mrs Wystarczy teraz wyznaczyć zbiór takich macierzy X , dla których iloraz wiarogodności przyjmie wartość większą od zaobserwowanego X1 oraz wyznaczyć prawdopodobieństwo realizacji dowolnej macierzy z tego zbioru w hipotetycznym rozkładzie P0 . Niech prawdopodobieństwo to wyniesie 1 . Jeśli 1 , gdzie jest założonym poziomem istotności, nie ma podstaw do odrzucenia H 0 , jeśli natomiast 1 , H 0 odrzucamy. Hipotezę o zgodności wzorów strukturalnych można zoperacjonalizować inaczej, traktując składowe X 1 , X 2 jako realizacje k 2 niezależnych prób o liczebnościach N rs wyznaczonych przez wspólny podział B12 . Hipoteza o zgodności wzorów strukturalnych może wówczas zostać przełożona na założenie mówiące, że w każdej parze takich prób zerojedynkowe zmienne X rs1 i, j , X rs2 i, j X 1 rs , X rs2 generowane są przez ten sam rozkład prawdopodobieństwa. Zatem: H 0 : r , s : rs1 rs2 rs H1 : H 0 H 0 zakłada więc, że w każdej z par prób X rs1 , X rs2 zachodzi P X rs1 i, j 1 P X rs2 i, j 1 rs oraz 211 P X rs1 i, j 0 P X rs2 i, j 0 1 rs Dla każdej pary prób estymatorami rs na podstawie informacji z obu prób są m1rs mrs2 ˆ rs 2 N rs (5.6.7) Stąd statystyka T służąca do weryfikacji H 0 przeciw X 1 , ma postać (5.6.8) 1 mrs m rs T m rs r ,s 2 mrs2 mrs m rs 2 2 2 N rs m1rs N rs m rs N rs mrs2 N rs m rs N rs m rs N rs m rs gdzie m rs N rsˆrs m1rs mrs2 2 będzie miała asymptotycznie rozkład 2 o k 2 stopniach swobody. Łatwo zauważyć, że T wyraża się identyczną formułą, co współczynnik zgodności wzorów strukturalnych X 1 , X 2 , który zatem posiada przy założeniu H 0 powyższy rozkład 2 . 212 §7. TEST ZGODNOŚCI DWÓCH MODELI BLOKOWYCH LOKALNIE OPTYMALNYCH Dotychczas rozważane testy zgodności modeli blokowych dwóch składowych X1, X 2 opierały się na wspólnym podziale obiektów B12 dwurelacyjnej (co najmniej) sieci X . Jeśli uchylimy to założenie i będziemy badać zgodność modeli lokalnie optymalnych dla poszczególnych składowych X 1 , X 2 to rozważane przez nas hipotezy będą miały następującą postać: H 0 : modelem składowej X 1 jest X , B12 H1 : H 0 a przekładając to na język modeli stochastycznych: H 0 : 1 0 vt0 , B2 H1 : 1 0 gdzie 1 oznacza parametr modelu składowej X 1 traktowanej jako sieć jednorelacyjna natomiast , B 0 vt 2 jest estymatorem największej wiarogodności tego parametru wyznaczonym jednakże przy podziale B2 , który jest podziałem lokalnie optymalnym dla X 2 . Zastosujemy test ilorazu wiarogodności. Statystyka X 1 będzie w nim określona tak: (5.7.1) X 1 sup L X 1 ; 0 L X 1 ; 0 L X 1 ; 1 L X 1 ; 0 Funkcje wiarogodności obu rozważanych parametrów będą następujące: 213 (5.7.2) m1rs L X ; r , s N rs 1 m1rs 1 m1rs 1 N rs N rs m1rs (podstawiliśmy do funkcji L X 1 ; 1 lokalny estymator 1 rs1 , B1 (5.7.3) m1 L X 1; 0 vt v , t N vt m1vt m1 1 vt N vt N vt m1vt przy czym N vt oraz mvt1 oznaczają rozmiary podmacierzy X vt1 oraz sumy ich obciążeń krawędziowych przy podziale B2 . Sumy te wyrażają się prostą formułą: (5.7.4) mvt1 X 1 i, j B2 v, i B2 t , j i j mvt1 Łatwo wykazać, że ilorazy są estymatorami NW parametrów vt . Po podstawieniu N vt odpowiednich estymatorów do ilorazu wiarogodności otrzymujemy: (5.7.5) X1 m1rs r , s N rs m1rs mvt1 v , t N vt m1vt m1rs 1 N rs m1 1 vt N vt N rs m1rs Nvt m1vt Wyznaczenie prawdopodobieństwa tego, że przy założeniu H 0 wygenerowana zostanie taka macierz X 0 , dla której iloraz wiarogodności przyjmie wartość większą niż w zaobserwowanej składowej X 1 wiąże się podobnie jak poprzednio, z koniecznością wyznaczenia zbioru X 0n wszystkich takich macierzy X 0 , których prawdopodobieństwo realizacji w rozkładzie P0 będzie wyższe niż P0 X 1 wyrażone w liczniku ilorazu X 1 . Dla tych macierzy X 0 X 1 . Wyznaczenie z kolei prawdopodobieństwa realizacji każdej X 0 X 0n jest nieco bardziej złożone niż poprzednio, gdyż P0 jest zdefiniowany dla innego podziału zbioru obiektów niż 214 P1 . Zauważmy, że model 0 vt0 , B2 przyporządkowuje każdej krawędzi sieci X 1 pewien parametr vt0 , gdy krawędź ta jest elementem podmacierzy X vt1 wyznaczonej przez podział B2 : i, j P0 X vt1 i, j 1 vt0 (5.7.6) Wobec tego macierz parametrów dla wszystkich poszczególnych krawędzi sieci X 1 , oznaczmy ją przez X 0 jest dana przez równanie reprodukcyjne: X 0 B2T vt0 B2 (5.7.7) Mamy bowiem: i, j : X 0 i, j vt0 B2 v, i B2 t , j 1 (5.7.8) Niech X 0 będzie elementem zbioru X 0n .Wówczas prawdopodobieństwo jej wygenerowania przez model 0 jest równe: P0 X 0 0 i, j (5.7.9) X 0 i , j i j 1 0 i, j 1 X 0 i , j , gdzie 0 i, j X 0 i, j a jeśli dla ustalonej X 0 oznaczymy: mvt0 X 0 i, j B2 v, i B2 t , j i j to otrzymamy (5.7.10) P0 X 0 vt0 mvt 1 vt0 0 Nvt mvt0 v ,t Kontrastowy miernik zależności między lokalnie optymalnymi modelami blokowymi 215 składowymi X 1 i X 2 , oznaczany przez E wiąże liniowy związek z logarytmem ilorazu wiarogodności X 1 . Po prostych przekształceniach daje się on przekształcić do postaci (5.7.11): E X 1 ; X 2 1 (5.7.11) w v ,t vt H X vt1 wrs H X rs1 H X r ,s 1 K X Ek 1 B1 przy czym K Ek X 1 B1 oznacza entropijny współczynnik lokalnego kontrastu składowej X 1 . Łatwo zauważyć, że H X 1 oraz K Ek X 1 B1 są dla X 1 wartościami stałymi, natomiast licznik ułamka występującego w E to nic innego, jak logarytm ilorazu wiarogodności X 1 podzielony przez stałą N Zatem: E X ; X 1 (5.7.12) 2 1 N H ln X 1 X K X 1 Ek 1 B1 Podobnie jak w przypadku poprzednio rozważanych miar związków między składowymi sieci, tak i tu wyznaczenie prawdopodobieństwa 1 : 1 P X 1 c , gdzie c E X 1 ; X 2 1 N H X 1 K Ek X 1 B1 0 pozwala na ocenę istotności parametru zależności kontrastowej E X 1 ; X 2 w zaobserwowanej sieci. Jeśli 1 jest większe od założonego poziomu istotności, nie ma podstaw do odrzucenia H 0 , jeśli mniejsze, H 0 odrzucamy. Powyższy problem weryfikacyjny był w istocie testem hipotezy o zgodności dwóch podziałów B1 , B2 gdyż estymator 0 został wyznaczony przy założeniu podziału B2 . Łatwo jednak problem powyższy zmodyfikować tak, aby testować zgodność całych modeli blokowych, tzn. testować hipotezę, że lokalnym probabilistycznym modelem składowej X 1 jest 2 vt2 , B2 X , B . Testowałoby się wówczas hipotezę H 1 1 0 czyli X 2 , B2 a nie : składowa X 1 została wygenerowana przez 216 model X 2 , B2 czyli 0 vt0 , B2 X 1 : ~ H0 Procedura wyznaczania P0 X c gdzie c X 1 jest podobna do poprzedniej. W tym jednak przypadku logarytm ilorazu wiarogodności dla zaobserwowanej składowej X 1 nie jest związany z żadnym z wprowadzonych przez nas mierników związku między składowymi sieci relacyjnej. Wyznaczymy zatem test oparty na statystyce . Każdy parametr vt0 i, j określa prawdopodobieństwo wygenerowania dla krawędzi X 1 i, j obciążenia równego 1, które jest zarazem wartością oczekiwaną zmiennej binarnej odpowiadającej te krawędzi. Zatem mrs0 : (5.7.13) mrs0 X 10 i, j B1 r , i B1 s, j , gdzie X 10 B2T X 2 B2 , i j jest wartością oczekiwaną sumy obciążeń krawędziowych w podmacierzy X rs1 przy założeniu H 0 , gdyż jest to suma wartości oczekiwanych ciągu zmiennych odpowiadającego podmacierzy X rs1 . Ponieważ ciąg ten liczy N rs - elementów, wobec tego dla każdego z nich: (5.7.16) 0 m mrs0 r , s P0 X i, j 1 oraz P0 X rs1 i, j 0 1 rs N rs N rs 1 rs a wartości oczekiwane liczby krawędzi obciążonych wartością 1 oraz liczby krawędzi obciążonych wartością 0 są dla każdego bloku X rs1 (wedle H 0 ) równe: (5.7.17) m0 E0 X rs1 i, j = N rs P0 X rs1 i, j 1 N rs rs mrs0 N rs i, j (5.7.16) E0 1 X rs1 i, j = N rs P0 X rs1 i, j 0 N rs i, j m0 1 rs N rs 0 N rs mrs 217 Stąd statystyka Tc : (5.7.17) Tc X 1 r,s m 1 rs mrs0 mrs0 2 m 0 rs m1rs 2 N rs mrs0 ma asymptotycznie rozkład 2 o k 2 stopniach swobody. 218 §8. PROBLEM WYBORU LICZBY CZŁONÓW PODZIAŁU W MODELU BLOKOWYM. Nasze dotychczasowe rozważania dotyczyły modeli o ustalonej liczbie członów podziału, nie zajmowaliśmy się natomiast problemem wyboru tej liczby. W klasycznej wersji modelowała blokowego kryterium wyboru k było merytoryczne i w pewnym sensie narzucone przez charakter analizowanych danych empirycznych. Badacz sam decydował, czy dzielić dalej macierz czy też nie do czego był zmuszany przez interakcyjnie działający CONCOR – jeśli np. podział na 4 części wystarczał do zadowalających interpretacji modelu, nie było potrzeby konstruowania modelu 5-członowego. Z kolei specyficzny charakter danych (jak np. w przypadku dużych sieci o niskich gęstościach poszczególnych składowych) skłaniał do zwiększenia k , gdyż modele 7-8-członowe pozwalały na lepsze interpretacje niż 3-4członowe. Jedynym ograniczeniem formalnym istotnym dla sieci kilkunastoobiektowych stosowanym w klasycznym modelowaniu blokowym był postulat zagwarantowania minimalnej liczebności obiektów w członie podziału. Probabilistyczne podejście do modeli blokowych pozwala problem wyboru k przedstawić jako problem weryfikacji hipotez. Weźmy pod uwagę dwa optymalne modele blokowe sieci X : k -członowy model X k , B k oraz k 1 -członowy model X k 1 , B k 1 . O podziale B k 1 nie zakładamy, ze zawiera się w B k . Problem wyboru jednego z tych modeli jest równoważny problemowi wyboru jednej z dwóch hipotez: H 0 : 0 X k , B k H1 : 0 Jeśli założyć, że wyznacza zbiór możliwych k 1 -członowych modeli [tzn., że macierz rs ma wymiary k 1 k 1 ], to okazuje się, że hipoteza zerowa specyfikuje pewien szczególny przypadek modelu k 1 -członowego. Macierz parametrów X 0 poszczególnych krawędzi i, j sieci X dana jest przez H 0 znanym równaniem reprodukcyjnym 219 X 0 B k X k B k T tego dla każdego podziału B a więc także dla B k 1 można na jej podstawie wyznaczyć parametry rs i, j wszystkich krawędzi w każdym z bloków X rs wyznaczanym przez B k 1 , przy czym, jeśli B k 1 B k , nie wszystkie one muszą być w nim identyczne. Oznacza to, że 0 jest szczególnym przypadkiem , stąd można skorzystać z przedstawionych w poprzednim paragrafie technik weryfikacji tego rodzaju hipotez. Dla przykładu rozważmy test ilorazu wiarogodności. Indeksy r , s wyznacza podział B k 1 . Iloraz wiarogodności jest tu równy: (5.8.1) X sup L X ; 0 L X ; 0 1 mrs rs r,s i , j i j 0 X i , j rs N rs mrs 1 X i , j 1 0 i, j gdzie 0 i, j X i, j 0 Wystarczy wyznaczyć teraz zbiór X 0n o elementach X 0 , dla których X 0 X oraz wyznaczyć prawdopodobieństwo realizacji któregokolwiek z nich przy P0 , aby na przyjętym poziomie istotności przyjąć lub odrzucić H 0 . Przypadek, w którym B k 1 zawiera się w B k dostarcza ciekawej, choć wymagającej dokładniejszego zbadania (technikami symulacyjnymi) możliwości wykorzystania asymptotycznych własności podwojonego logarytmu ilorazu wiarogodności. Jednocześnie przypadek ten jest nierozłącznie związany ze stosowaniem hierarchicznych procedur eksploracyjnych do wyznaczania modeli blokowych jak np. CONCOR-a. Zauważmy bowiem, że przy założeniu zawierania się dwóch podziałów, model blokowy oparty na podziale B k jest elementem pewnej szczególnej podprzestrzeni . Przestrzeń tę charakteryzuje bowiem układ k 1 równości miedzy parametrami macierzy rs . Posłużymy się przykładem. 220 Przykład 27 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 Rozważmy macierz parametrów rs . Niech k 3 oraz B k 1 B k . Przy założeniu H 0 istnieje taki v -ty człon podziału B 3 , który w podziale B 4 dzielony jest na dwie części. Niech v 2 . Zatem H 0 nakłada na rs następujące ograniczenia 12 13 , 24 34 , 22 23 32 33 , 42 43 . 21 31 , Układ takich k 1 równań można zapisać w postaci ogólnej: (5.8.1) v : r , s : rv r v 1 & rs v 1 s , r , s 1, 2, ..., k 1 v 1, 2, ..., k Jeśli przez oznaczać będziemy przestrzeń takich modeli k 1 -członowych, które spełniają powyższy warunek, to iloraz wiarogodności przyjmuje teraz postać następującą: (5.8.3) sup L X ; X sup L X ; 1 N rs mrs vtm 1 vt N vt mvt r,s mrs rs vt rs , r , s 1, 2, ..., k 1 v ,t v, t 1, 2,..., k Dla dużych prób losowych podwojony logarytm naturalny powyższego ilorazu, czyli 221 2 ln X posiada rozkład 2 o k 1 stopniach swobody, gdyż przy wspólnym dla obu hipotez podziale B k 1 hipoteza H 0 nakłada na macierz rs k 1 ograniczeń (por. Silvey, 1978, str. 146, Rao, 1982, str. 426). Ta pociągająca swą prostotą ewentualność (logarytm X to przecież różnica entropijnych miar dopasowania do danych optymalnych modeli blokowych k i k 1 -członowych) wymaga jednak zarówno teoretycznej dyskusji na temat jej uzasadnienia (brak próby losowej!) oraz, jak wspomnieliśmy, przeprowadzenia niezbędnych eksperymentów symulacyjnych. Zawieranie się podziałów upraszcza znakomicie procedurę weryfikacyjną przy zastosowaniu proponowanego przez nas „populacyjnego” podejścia do wnioskowania o modelach blokowych. Testowanie H 0 przeciw H1 , ogranicza się bowiem do sprawdzenia istotności różnic między podmacierzami X rv i X r v 1 oraz X vs i X v 1 s co łatwo przeprowadzić za pomocą metod prezentowanych w niniejszym rozdziale. 222 BIBLIOGRAFIA Wykaz skrótów używanych w tekście: Czasopisma: AJS ASR BS HO HR JASA JMP JMS P QQ S SF SM SMR SN American Journal of Sociology American Sociological Review Behavioral Science Human Organizations Human Relations Journal of American Statistical Association Journal of Mathematical Psychology Journal of Mathematical Sociology Psychometrika Quality and Quantity Sociometry Social Forces Sociological Methodology Sociological Methods and Research Social Networks Publikacje zwarte: PSNR Holland,P. W., Leinhardt,S. [eds.] PERSPECTIVES OF SOCIAL NETWORK RESEARCH, New York: Academic Press 1979 Autorzy: ABL B BBA BNS BW W WBB Arabie,P., Boorman,S.A., Levitt, P.R. Breiger,R.L. Breiger,R.L., Boorman,S.A., Arabie,P. Banaszak,H., Nowotny,S., Styczeń,M. Boorman,S.A., White,H.C. White,H.C. White,H.C., Boorman,S.A., Breiger,R.L. 223 Prace cytowane: Abell,P. 1975 MODELE W SOCJOLOGII. Warszawa, PWN. Alba,R.D., Kaduschin,C. 1976 The intersection of social circles: a new measure of social proximity in networks. SMR5:77-102. Alba,R.D., Moore,G. 1978 Elite social circles. SMR7:167-187. Alfierowa, Z., Jezżewa, W. 1974 ZASTOSOWANIA TEORII GRAFÓW W RACHUNKU EKONOMICZNYM. Warszawa, PWE. Arabie,P. 1977 Clustering representation of group overlap. JMS5:113-128 Arabie,P., Boorman, S.A., Levitt,P.E. 1978 Constructing blockmodels: how and why. JMP17:2l-63. Banaszak, H., Nowotny, S., Styczeń, M. 1983 STATYSTYKA - SKRYPT DLA SOCOLOGÓW. IS UW, Warszawa Barra,J.R. 1982 MATEMATYCZNE PODSTAWY STATYSTYKI. Warszawa: PWN. Bavelas,A. 1960 Communication Patterns in Task-Oriented Groups, w: D.Cartwright, A.Zander [red], GROUP DYNAMICS. New York: Harper and Row. Beauchamp,M.A. 1965 An improved index of centrality. BS10:161-163. Bernard,H.R., Killworth,P.D. 1973 On the structure of an ocean going research vessel and other important things. Social Science Research 2: 145-184. 1977 Informant accuracy in social networks data II. Human Communication Research 4:318. Bernard, H. R., Killworth,P.D. , Sailer,L. 1979/80 Informant accuracy in social network data IV: a comparison of clique-level structure in behavioral and cognitive network data. SN 2: 191-218. Bloemena, A.R. 1964 SAMPLING FROM A GRAPH. Amsterdam: Mathematisch Centrum Bonacich,P. 1979 The algebra of blockmodelling. SM 1980: 1980 The common structure semigroup - an alternative to Boorman and White joint reduction. AJS 86: 159-166 Boorman, S. A. 1975 A combinatorial optimization model for transmission of job information through contact networks. Bell Journall of Economics 6: 216-249 Boorman, S. A. 1976 Social structure from multiple networks: II, role structures. AJS 81: 1324-1446. Borowkow, A.A. 1977 RACHUNEK PRAWDOPODOBIEŃSTWA. Warszawa: PWN Bott,E. 1955 Urban families: conjugal roles and social network. HR 8: 345-384 1957 FAMILY AND SOCIAL NETWORK. London: Tavistock. Boyd, J. 224 1969 The algebra of group kinship. JMS 6:139-167. 1979/80 The universal semigroup of relations. SN 2: 91-117. Boyd,J, Haehl, J.H., Sailer,L. 1972 Kinship systems and inverse semigroups. JMS 2: 37-61 Brams,S.J. 1968 Measuring the concentration of power in political systems. American Political Science Review 62: 461-476. Breiger,R.L., Boorman, S.A., Arabie, P. 1975 An algorithm for clustering relational data with application to social network analysis. JMP 12: 328-383 Breiger,R.L. 1976 Career attributes and network structure: a blockmodel study of biomedical research specialty. ASR 41: 117-135 1979 Toward an operational theory of community elite structures. QQ 13: 21-57. Breiger, R.L., Ennis,J.E. 1979 Personae and social roles: the network structure of personality types in small groups. Social Psychology Quarterly 42: 262-270 Breiger.,R.L,, Pattison, P.E. 1978 The joint structure of two communities. SMR 7: 213-226 Buga,J., Nykowski, I. 1974 ZAGADNIENIA TRANSPORTOWE W PROGRAMOWANIU LINIOWYM. Warszawa: PWN. Burt,R.S. 1976 Positions in networks. SF 55: 93-123. 1980 Models of Network structure. Annual Review of Sociology: 79-141. Cartwright,D., Harary, F. 1956 Structural balance: a generalization of Heider’s theory. Psychological Revue 43: 277293. Clifford, A.H., Preston, G.B. 1961 THE ALGEBRAIC THEORY OF SEMIGROUPS. Providence: American Mathematical Society. Deo,N. 1980 TEORIA GRAFÓW. Warszawa: PWN. Doreian, P. 1969 A note on the detection of cliques in valued graphs. S 32: 167-178. Freeman, L.C. 1976 A BIBLIOGRAPHY OF SOCIAL NETWORKS. Monticello: Council of Planning Librarians. 1977 A set of measures of centrality based on betweeness. S 40: 35-41. 1978 Centrality in social networks. Conceptual clarification SN 1: 215-239. Erdos.P., Renyi,A. 1959 On random. graphs. Publication Mathematicae, Debrecen: 290-297. Erickson, B.H., Kringas, P.R. 1975 The small world of politics. Canadian Review of Sociology and Anthropology 12: 585-593. Festinger, L. 1949 The analysis of sociograms using matrix algebra. HR 2: 153-158. Festinger,L., Schacter. S., Back, K.W. 1950 SOCIAL PRESSURES IN INFORMAL GROUPS. Stanford: Stanford University Press. 225 Flament, C. 1963 APPLICATIONS OF GRAPH THEORY TO GROUP STRUCTURE. New York: Prentice Hall. Ford, L.R., Fulkerson, D.R 1969 PRZEPŁYWY W SIECIACH. Warszawa: PWN. Frank, O. 1971 STATISTICAL INFERENCE IN GRAPHS. Stockholm: Swedish Research Institute of National Defense. 1978 Sampling and Estimation in large social networks. SN 1: 91-101 1979a Moment properties of subgraph counts in stochastic graphs. Annals of the NY Academy of Sciences 319: 207-218. 1979b Estimating a graph from triad counts. Journal of Statistical Computation and Simulation 9: 31-46. 1979/80 Balance in stochastic signed graphs. SN 2: 155-163. 1980 Sampling and inference in a population graph. International Statistical Review 48: 3341. Granovetter, M.S. 1973 Strength of weak ties. AJS 78: 1360-1380. 1976 Network sampling: some first steps. AJS 81: 1287-1303. Harary, F. 1969 GRAPH THEORY. New York: Wesley. Harary, F., Norman, R.Z. 1953 GRAPH THEOHY AS A MATHEMATICAL MODEL IN SOCIAL SCIENCE. Ann Arbor, Mich.: Institute for Social Research. Harary,F., et. al. 1965 STRUCTURAL MODELS: AN INTRODUCTION TO THE THEORY OF DIRECTED GRAPHS. New York: Wiley. Heil, G.H., White.H.C. 1974 An algorithm for constructing homomorphism of multiple graphs. Unpubl., Dep. of Sociology, Harvard University. 1976 An algorithm for finding simultaneous homomorphic correspondence between graphs and their image graphs. BS 21: 26-35. Hoivik, T., Gleditsch, N.P. 1975 Structural Parameters of Graphs. A Theoretical Investigation. W: H. Blalock [red], QUANTITATIVE SOCIOLOGY, New York: Academic Press. Holland, P.W., Leinhardt,S. 1970 A method for detecting structure in sociometric data. AJS 76: 492-513. 1973 The structural implication of measurement error in sociometry. JMS 3: 1-27. 1977a Social structure as a network process. Zeitschrift fur Sociologie 6: 386-402. 1977b A dynamic model for social networks. JMS 5: 5-20. 1978 An omnibus test for social structure using triads. SMR 7: 227-256. 1979 Structural Sociometry. W: PSNR. Homans, G.C. 1950 THE HUMAN GROUP. New York: Harcourt. Hubert, L.J., Baker, F.B. 1978 Evaluating conformity of sociometric measures. P 43: 31-42. Ignasiak, E. 1975 PROGRAMOWANIE SIECIOWE. Warszawa: PWE. Light, J.M., Mullins, N.C. 1979 A Primer on Blockmodeling Procedure. W: PSNR. 226 Ling, R.F. 1973 The expected number of components in random linear graph. The Annals of Probability 5: 876-881. 1975 An exact probability distribution on the connectivity of random graphs. JMP 12: 9098. Ling, R.F., Killough, G.H. 1976 Probability tables for cluster analysis based on a the of random graphs. JASA 354: 293-300. Lipski, W. 1982 KOMBINATORYKA DLA PROGRAMISTÓW. Warszawa: WNT. Lissowski, G. 1974a ZALEŻNOŚCI STATYSTYCZNE MIEDZI DWIEMA ZMIENNYM LOSOWYMI. POJĘCIA PODSTAWOWE. Niepublikowana praca doktorska, Uniwersytet Warszawski. 1974b Statistical Association and Prediction. W: K. Szaniawski [red]: PROBLEMS OF FORMALIZATION IN THE SOCIAL SCIENCES, Wrocław: Ossolineum. Linzell,J. 1974 THE ANALYSIS OF SOCIAL NETWORKS. Essex: ECPR Summer School Monographs on Social Science Data Analysis. Lorrain, F.P., White, H.C. 1971 Structural equivalence of individuals in social network. JMS 1: 49-80. Lorrain,F.P. 1973 Handbook of Two-block Two-generator models. Unpubl., Dep. of Sociology, Harvard University. Lounsbury, P.A. 1964 A Formal Account of the Crow- and Omaha-Type Kinship Terminologies. W: W. Goodenough [ed]: EXPLORATIONS IN CULTURAL ANTHROPOLOGY. New York: McGraw Hill. Luce, R.D., Perry, A.D. 1949 A method of matrix analysis of group structure. P 14: 95-116. Marsden, P.V., Lauman, E.O. 1977 Collective Action in a Community Elite: Exchange, Influence and Issue Resolution. W: R.J.Liebert, A.W. Imershein [red]: POWER, PARADIGMS AND COMMUNITY RESEARCH. Beverly Hill: Sage Mayer, T.F. 1975 MATEMATICAL MODELS OF GROUP STRUCTURE. New York: Bobs-Merrill. Mokken,R. 1979 Cliques, clubs and clans. QQ 13: 161-173Moreno,J.L. 1934 WHO WILL SURVIVE? Washington, DC: Nerv. Ment. Dis, Publ. 1951 SOCIOMETRY, EXPERIMENTAL METHOD AND THE SCIENCE OF SOCIOLOGY New York: Beacon House. Moxley, R.L., Moxley, N.F. 1974 Determining point-centrality in uncontrived social networks. S 37: 122-130. Mullins, N.C. et, al. 1977 The group structure of cocitation clusters: a comparative study. ASR 42: 552-562. Nadel, S,F. 1957 THE THEORY OF SOCIAL STRUCTURE. Glencoe, Ill.: The Free Press Newcomb, T. 1961 THE ACQUAINTANCE PROCESS. New York: Holt,Reinhart and Win 227 Niemoller, K. 1980 Application of graph theory to social structure. QQ 15: Nordlie, P.G.. 1958 A longitudinal Study of Interpersonal Attraction in a Natural Group Setting. Unpubl. ph.d. diss., Univ. of Michigan Ore, 0. 1962 THEORY OF GRAPHS. Providence: American Mathematical Society Radcliffe-Brown, A.R. 1940 On social structure. Journal o the Royal Anthropological Society of Great Britain and Ireland 70: 1-12. Rao, C.J. 1982 MODELE LINIOWE STATYSTYKI MATEMATYCZNEJ. Warszawa: PWN. Rasiowa, H. 1975 WSTĘP DO MATEMATYKI WSPÓŁCZESNEJ. Warszawa: PWN. Restle, F. 1959 A metric and an ordering on sets. P 24: 207-220. Roethlisberger, F.J., Dickson, V.J. 1939 MANAGEMENT AND THE WORKER. Cambridge, Mass.: Harvard University Press Roichacher, R.C. 1974 A review of mathematical methods in sociometry. SMR 3: 125-171. Sabidussi, G. 1966 The centrality index of graph. P 31: 581-603. Sailer, L.D. 1978 Structural equivalence: meaning and definition, computation and application. SN 1: 73-90. Sampson, S.F. 1969 Crisis in a Cloister. Ann Arbor, Michigan: University Microfilm No 69-5775 Schwart, J. 1977a An examination of CONCOR and related methods for blocking sociometric data. SM 1977: 255-282. 1977b The Structure of Affective Relations Over Time: A Blockmodel Analysis. W: Anwendung Mathematischer Verfahren. Zur Analyse Sociale Netwerke. Berichte und Diskussion. Internationale Wissenschaftliche Fachkonferenz. V17 bis l9, Hamburg. Seidman, S.B., Foster, B.L. 1978 A note on the potential for genuine cross-fertilization between anthropology and mathematics. SN 1: 65-72. Silvey, S.D. 1978 WNIOSKOWANIE STATYSTYCZNE. Warszawa: PWN. Szaniawski, K. 1974a Kryteria podejmowania decyzji. W: J.Kozielecki [red], PROBLEMY PSYCHOLOGII MATEMATYCZNEJ. Warszawa: PWN. 1974b Pragmatyczna Wartość Informacji. W: J.Kozielecki [red], PROBLEMY PSYCHOLOGII MATEMATYCZNEJ. Warszawa: PWN. Tapiero, C. et. al. 1975 Structural Inference in Organizations. JMS 4: 121 -130. Taylor, M. 1969 Influence structures. S 32: 490-502. Theil, H. 1979 ZASADY EKONOMETRII. Warszawa: PWN. Travers, J., Milgram, S. 228 1969 An experimental study of the small world problem. S 32: 425-443. Wasserman, S.S. 1977 Random directed graph distributions and the triad census in social networks. JMS 5: 61-86. 1979 A stochastic model for directed graphs with transition rates determined by reciprocity. SM 1980: 392-412. 1980 Analysing social networks as stochastic process. JASA 370: 280-294. White, H.C. 1963 AN ANATOMY OF KINSHIP: MATHEMATICAL MODELS FOR STRUCTUREJ OF CUMULATED ROLES. New York: Prentice Hall. 1969 Notes on Finding Models of Structural Equivalence, Drawing on Theories Of Roles, Duality, Sociometry and Balance. [mimeo] Cambridge, Mass.: Harvard University. 1972 Do Networks Matter? Unpubl., Harvard Univ. 1973 Models for Interrelated Roles from Multiple Networks in Small Populations. W: P.J. Knopp, et. al. [red], PROCEEDINGS ON THE APPLICATION OF UNDERGRADUATE MATHEMATICS THE ENGINEERING, LIFE, MANAGERIAL AND SOCIAL SCIENCES Georgia: Georgia Institute of Technology. 1974 Null probabilities for blockmodels of social networks. Unpubl., Dep. of Sociology, Harvard Univ. 1977 Probabilities of homomorphic mappings from multiple graph JMP 16: 121-134. White, H.C., Boorman, S.A., Breiger, R.L. 1976 Social structure from multiple networks: I. blockmodels of roles and positions. AJS 81: 730-780. 229