Skalowanie druk.indb
Transkrypt
Skalowanie druk.indb
Katarzyna Wądołowska* Wprowadzenie do modelowania strukturalnego Geneza Modelowanie równań strukturalnych (nazywane dalej SEM, od Structural Equation Modeling) jest metodą opisu zależności między wieloma zmiennymi stosowaną w analizie złożonych, zazwyczaj przyczynowo interpretowanych, modeli zjawisk społecznych oraz w złożonych modelach skalowania. Należy do obszernej klasy modeli liniowych, w których zakłada się, że zmienne statystyczne, przy użyciu których model jest budowany, są mierzone na skali co najmniej interwałowej, zaś zależności między elementami modelu mają charakter liniowy. Jak się dalej okaże, w najpopularniejszej odmianie modelowania strukturalnego, przy estymacji jego parametrów konieczne będzie ponadto przyjęcie założenia, że w populacji, którą model ma opisywać, zmienne te mają rozkłady normalne. Modelowanie strukturalne jest syntezą dwóch metod: − analizy czynnikowej, wyrosłej z pomiarowych potrzeb psychologii i psychometrii, − modeli równań jednoczesnych, znanych również jako analiza ścieżkowa, rozwiniętych głównie w ekonometrii, lecz stosowanych również w innych naukach społecznych do opisu przyczynowo interpretowanych relacji między zjawiskami. Katarzyna Wądołowska jest absolwentką ekonometrii i socjologii na Uniwersytecie Warszawskim. Jej prace magisterskie traktowały o modelach nieparametrycznych oraz wykorzystaniu modeli równań strukturalnych z estymacją PLS w skalowaniu wielowymiarowych cech ukrytych. Obecnie pracuje w CBOS jako analityk. Interesuje się m.in. modelowaniem strukturalnym i jego zastosowaniem w skalowaniu ([email protected]). * Skalowanie druk.indb 203 2009-12-09 14:25:53 204 Katarzyna Wądołowska Omówimy teraz pokrótce oba źródła inspiracji, których syntezą jest metodologia SEM. Analiza czynnikowa Początki analizy czynnikowej, w formie modelu wspólnych czynników, przypisuje się głównie pracy Spearmana (1904) zajmującej się pomiarem i opisem struktury zdolności umysłowych (Kaplan 2009: 2–3). Zakładał on, że obserwowalne zależności statystyczne między różnymi testami zdolności umysłowych mogą być wyjaśnione przez ogólny czynnik zdolności wspólny dla wszystkich testów oraz specyficzne czynniki zdolności powiązane z każdym z testów. Celem analizy czynnikowej jest ustalenie udziału obojga rodzajów czynników (traktowanych jako zmienne ukryte), w zmienności obserwowalnych testów1. Ustalenie udziałów czynników wspólnych i swoistych w zmienności obserwowalnych wskaźników pozwala na oszacowanie ich wartości. Od tego momentu zmienne ukryte stają się konstruktami. Czynnikowej składowej modelu strukturalnego, nazywanej składową pomiarową, towarzyszy składowa przyczynowa, w której relacje między konstruktami opisuje się przy użyciu równań jednoczesnych. Równania takie są domeną analizy ścieżkowej. Analiza ścieżkowa Druga ze składowych modeli strukturalnych, analiza ścieżkowa, ma swe początki w pracach Sewalla Wrighta (1918). Jego głównym wkładem było przedstawienie za pomocą diagramu ścieżkowego sposobu, w jaki korelacje pomiędzy zmiennymi mogą być powiązane z parametrami modelu (Kaplan 2009: 3–4). Następnie pokazał on, jak równania modelu można wykorzystać do estymacji efektu bezpośredniego, pośredniego oraz całkowitego jednej zmiennej na inną. Podstawy analizy czynnikowej szczegółowo omawia tekst Andrzeja Szarkowskiego, zaś praktyczne problemy jej stosowania jako narzędzia wspomagającego skalowanie porusza artykuł Mariusza Grzędy (przyp. – HB). 1 Skalowanie druk.indb 204 2009-12-09 14:25:53 Wprowadzenie do modelowania strukturalnego 205 Druga linia rozwoju analizy ścieżkowej wiąże się z ekonometrycznymi pracami Haavelmo (1943). Był on zainteresowany modelowaniem współzależności pomiędzy zmiennymi ekonomicznymi za pomocą systemu równań jednoczesnych, w którym grupę zmiennych zależnych wyjaśnia się za pomocą innych zmiennych zależnych oraz zmiennych niezależnych zaproponowanych w modelu. Modelowanie strukturalne obejmuje oba rodzaje analizy ścieżkowej i pozwala na analizę równań jednoczesnych z wieloma zmiennymi zależnymi (Bollen i Long 1993). SEM Synteza czynnikowego i ścieżkowego podejścia do modelowania złożonych zjawisk społecznych w jedną spójną metodę jest dziełem Karla Jöreskoga (1973) i jego uczniów. Wedle Jöreskoga model równań strukturalnych składa się z dwóch części: − części pomiarowej, łączącej zmienne obserwowalne z ukrytymi poprzez konfirmacyjny model pomiarowy − oraz części strukturalnej, łączącej ze sobą zmienne ukryte za pomocą systemu równań jednoczesnych. Ważnym elementem modelu strukturalnego są błędy pomiaru dla wszystkich typów zmiennych występujących w modelu. W modelowaniu strukturalnym w wersji Jöreskoga szacowanie parametrów modelu odbywa się przy użyciu estymatorów największej wiarogodności (Maximum Likelihood Estimators MLE). W przypadku, gdy model nie zakłada błędów pomiaru dla zmiennych obserwowalnych, redukuje się do modelu równań jednoczesnych rozwiniętego w ekonometrii. Podsumowując, równania strukturalne zajmują się opisem zależności pomiędzy zmiennymi obserwowalnymi przy użyciu mniejszej liczby zmiennych ukrytych. Relacje między obserwowalnymi wskaźnikami a konstruktami oraz między konstruktami opisywane są przy użyciu parametrów strukturalnych modelu. Są one hipotezą, przy użyciu której usiłuje się jak najdokładniej zrekonstruować zależności między zmiennymi obserwowalnymi. Jej testowanie polega na weryfikacji hipotez na temat parametrów pomiarowych (czynnikowych) oraz strukturalnych (ścieżkowych) składowej modelu (Jöreskog 1993). Test taki polega, naj- Skalowanie druk.indb 205 2009-12-09 14:25:53 206 Katarzyna Wądołowska ogólniej biorąc, na zbadaniu, czy zależności między zmiennymi obserwowalnymi zrekonstruowane przy użyciu oszacowanych uprzednio parametrów modelu są bliskie zależnościom empirycznie zarejestrowanym. Przeprowadzenie takiej rekonstrukcji wymaga przyjęcia szeregu założeń na temat: 1) relacji między obserwowalnymi wskaźnikami a konstruktami, 2) relacji między konstruktami, 3) relacji między błędami pomiaru konstruktów i wskaźników. Założenia modelowania strukturalnego Założenia modelu mają dwa źródła: teoretyczne i techniczne. Najważniejszym z nich są przesłanki teoretyczne, z których wywodzi się zarówno hipotezy na temat pomiarowej, jak i strukturalnej składowej układu równań strukturalnych. Hipotezy te specyfikują, które z parametrów przyjmują ustaloną wartość (najczęściej zero) i które z wartości parametrów trzeba oszacować na podstawie danych empirycznych. Drugi rodzaj założeń nie wynika z teorii zjawiska, które model ma opisywać, lecz z przyczyn technicznych. Założenia te w większości przypadków opisują zależności między błędami pomiaru (podobnie jak założenia o czynnikach swoistych w analizie czynnikowej) i choć wydają się naturalne (a przynajmniej niesprzeczne z teorią modelowanego zjawiska) przyjmowane są po to, aby zadanie oszacowania pozostałych, „wolnych” parametrów modelu, było zadaniem wykonalnym. Przesłanki teoretyczne Zmienne obserwowalne i ukryte Wiele z teorii konstruowanych w naukach społecznych formułowane jest przy użyciu zmiennych, których bezpośrednia obserwacja czy pomiar nie są możliwe (Jöreskog 1993). Przykłady stanowią inteligencja, alienacja, dyskryminacja, konserwatyzm, anomia, satysfakcja czy postawy. Pomiaru takich hipotetycznych konstruktów dokonuje się zatem pośrednio za pomocą jednej lub więcej zmiennych obserwowalnych, które są najczęściej odpowiedziami na pytania kwestionariusza. Skalowanie druk.indb 206 2009-12-09 14:25:53 Wprowadzenie do modelowania strukturalnego 207 Zmienne niezależne i zależne Definiując hipotetyczne konstrukty badacz specyfikuje w teorii, w jaki sposób są one ze sobą powiązane. Obejmuje to klasyfikację konstruktów na zależne i niezależne. Dla każdego konstruktu zależnego określa się zależności z pozostałymi konstruktami: ich znak oraz wielkość efektu bezpośredniego jednego konstruktu na drugi. Ewentualne zależności pomiędzy konstruktami niezależnymi traktuje się natomiast jako „dane” i pozostawia się je poza analizą (Bollen 1989: 12). Ponieważ konstrukty teoretyczne są nieobserwowalne, założenia nie mogą być testowane bezpośrednio. W tym celu dla każdego konstruktu definiuje się zbiór empirycznie mierzalnych wskaźników i test założeń przeprowadza się porównując obserwowalną macierz kowariancji między wskaźnikami z macierzą kowariancji przewidywaną przez model. Założenia pomiarowe Zależności pomiędzy konstruktami składają się na część strukturalną modelu, zaś te pomiędzy wskaźnikami i ich konstruktami stanowią jego część pomiarową. Zwykle przyjmuje się, że zależności pomiędzy zmiennymi w modelu mają charakter liniowy lub bliski liniowemu2, a więc zarazem, że wskaźniki mierzone są na skali interwałowej lub ilorazowej3. Przesłanki techniczne Czynniki nieuwzględnione w modelu W modelowaniu równań strukturalnych nie oczekuje się, iż zależności pomiędzy zmiennymi będą w stanie całkowicie wyjaśnić zróżnicowanie zmiennych zależnych. Najczęściej konstrukty niezależne wyjaśniają jedynie Zdarzało się jednak, że analizę strukturalną przeprowadzano na modelach nieliniowych (Jöreskog 1993). 3 Jeśli natomiast wskaźniki są mierzone na skali porządkowej, przyjmuje się wtedy najczęściej istnienie zmiennych ciągłych tkwiących u podstaw każdej z nich, a następnie formułuje się model pomiarowy w oparciu o owe zmienne ciągłe używając jako danych empirycznych korelacji polichorycznych odpowiadających współczynnikom korelacji liniowej między zmiennymi porządkowymi. 2 Skalowanie druk.indb 207 2009-12-09 14:25:53 208 Katarzyna Wądołowska część wariancji i kowariancji konstruktów zależnych. Przyjmuje się wówczas, że istnieją jakieś inne zmienne powiązane z konstruktami zależnymi, które z różnych przyczyn nie zostały w modelu uwzględnione. Wagę takich nieujętych w analizie zmiennych reprezentują błędy strukturalne, po jednym dla każdego konstruktu. Zatem błędy strukturalne wskazują na wariancję i kowariancję zmiennych zależnych niewyjaśnioną poprzez zmienne niezależne w modelu (Jöreskog 1993). Zależności między błędami Fundamentalnym założeniem modeli strukturalnych jest, że błędy strukturalne nie są skorelowane ani ze sobą (ich kowariancja wynosi zero), ani ze zmiennymi poprzedzającymi je w modelu. Podobne błędy, nazywane błędami pomiaru, pojawiają się w modelu pomiarowym. Interpretuje się je jako sumę czynników specyficznych oraz losowych błędów pomiaru w zmiennych obserwowalnych (Jöreskog 1993). Z założenia błędy pomiaru nie powinny być skorelowane ani ze sobą, ani ze wskaźnikami „obcymi”. Jeśli są, oznacza to, że takie wskaźniki współdefiniują coś jeszcze poza konstruktem, którego są wskaźnikami. Identyfikacja modelu Istotnym elementem każdego modelowania statystycznego jest wykonalność zadania estymacji parametrów. W modelowaniu strukturalnym problem ten nazywa się problemem identyfikacji modelu, czyli możliwości znalezienia unikalnych oszacowań wartości jego parametrów (Kaplan 2009: 18). Warunkiem koniecznym aczkolwiek niewystarczającym identyfikacji, zaproponowanym przez Bollena (1989: 328) jest spełnianie przez model warunku t< 1 2 ( p + q )( p + q + 1) (1) gdzie t wskazuje na liczbę parametrów, które mają być oszacowane, zaś p i q to całkowite liczby odpowiednio zmiennych zależnych i niezależnych w modelu. Gdy zachodzi równość, wówczas model jest dokładnie zidentyfikowany. Jeżeli t jest mniejsze od ½(p + q)(p + q + 1) model jest „przeidentyfikowany”, jeśli natomiast jest większe – model jest niezidentyfikowany. Skalowanie druk.indb 208 2009-12-09 14:25:53 Wprowadzenie do modelowania strukturalnego 209 Trafność pomiarowa modelu Testowanie modelu strukturalnego – a więc testowanie hipotetycznej struktury zależności przyczynowych pomiędzy konstruktami – może być bez znaczenia, jeśli nie założy się najpierw istotności modelu pomiarowego (Jöreskog 1993). Dlatego ważne jest, aby analizę równań strukturalnych zacząć od zweryfikowania zależności pomiędzy konstruktami oraz wybranymi dla nich wskaźnikami. Jeśli okaże się, że wyselekcjonowane wskaźniki nie reprezentują przypisanych im zmiennych ukrytych, wówczas należy zmienić skonstruowaną teorię, zanim zostanie ona poddana analizie. Użyteczne może się okazać przeprowadzenie analizy dla każdego konstruktu z osobna, następnie dla par konstruktów, a na koniec dla wszystkich konstruktów jednocześnie dopuszczając istnienie korelacji pomiędzy zmiennymi. Inaczej mówiąc, macierz kowariancji pomiędzy konstruktami nie powinna mieć ograniczeń. Model strukturalny – prezentacja krok po kroku Pokażemy teraz krok po kroku, zaczynając od przypadków najprostszych, jak w języku modeli strukturalnych formułuje się hipotezy na temat modelowanych zjawisk społecznych, jakie założenia temu towarzyszą oraz w jaki sposób estymuje się parametry modeli. Model ścieżkowy Specyfikacja Założymy teraz, że składniki strukturalnej składowej modelu (konstrukty) są zmiennymi obserwowalnymi, przez co estymacja składnika pomiarowego jest zbędna. Taki model przedstawia zależności pomiędzy zmiennymi zależnymi i zmiennymi niezależnymi. Zmienne zależne „wyjaśnia się” zakładając, że są one zależne przyczynowo od innych zmiennych zależnych oraz/lub zmiennych niezależnych (Long 1983: 25–28). Niech: − η będzie wektorem zmiennych zależnych o wymiarach (r × 1) − ξ będzie wektorem zmiennych niezależnych o wymiarach (s × 1) Skalowanie druk.indb 209 2009-12-09 14:25:53 210 Katarzyna Wądołowska Prosty model strukturalny bez części pomiarowej definiowany jest przez układ równań, wedle którego każda ze zmiennych zależnych η jest liniową funkcją zmiennych niezależnych ξ, innych zmiennych zależnych η oraz błędów strukturalnych ζ. W notacji macierzowej układ ten ma następującą postać Ș = īȟ + ǺȘ + ȗ (2) gdzie: − Γ jest macierzą współczynników strukturalnych pomiędzy zmiennymi zależnymi i niezależnymi o wymiarach (r × s) − Β jest macierzą współczynników strukturalnych pomiędzy zmiennymi zależnymi o wymiarach (r × r) − wielkość niewyjaśnionej wariancji zmiennej zależnej jest traktowana jako błąd w równaniach zwany błędem strukturalnym i oznaczana przez wektor ζ o wymiarach (r × 1) Uwzględnienie błędów strukturalnych wskazuje na fakt, że posługując się jedynie zbiorem zależności uwzględnionych w równaniu (2) nie da się całkowicie wyjaśnić wariancji zmiennych zależnych η. Operacjonalizacja hipotez na temat modelowanego zjawiska polega na wskazaniu, dla każdej zmiennej modelu, zbioru tych zmiennych, od których ona liniowo zależy i tych, od których jest liniowo niezależna. Praktycznie operacjonalizacja polega na wskazaniu, które ze współczynników równania (2) przyjmują dla konkretnych zmiennych wartość zero, a które mają niezerowe wartości wymagające oszacowania. Zerowa wartość współczynnika równania strukturalnego dla jakiejś pary zmiennych odpowiada hipotezie o braku zależności przyczynowych między reprezentowanymi przez te zmienne zjawiskami, które model ma opisywać: − przyrównanie (i,j)-tego elementu macierzy Γ do zera (γij = 0) oznacza zatem, że zjawisko reprezentowane przez zmienną niezależną ξj nie jest „przyczyną” zjawiska reprezentowanego przez zmienną zależną ηi − jeśli przyrówna się (i,j)-ty element macierzy Β do zera (βij = 0), wówczas przyjmuje się, że zjawisko reprezentowane przez zmienną zależną ηi nie jest „przyczyną” zjawiska reprezentowanego przez zmienną zależną ηj Dodatkowo zakłada się, że żadne ze zjawisk reprezentowanych przez zmienne zależne η nie jest „przyczyną” innego ze zjawisk reprezentowanych Skalowanie druk.indb 210 2009-12-09 14:25:54 211 Wprowadzenie do modelowania strukturalnego przez te zmienne. Odpowiada to założeniu, że wszystkie diagonalne elementy macierzy Β (reprezentującej relacje między zjawiskami „zależnymi”) są równe zero. Przykład Idea modelu strukturalnego może być przedstawiona za pomocą diagramu stanowiącego graficzną reprezentację systemu równań jednoczesnych. Wskazuje on na wszystkie ścieżki występujące pomiędzy zmiennymi w modelu, włączając w to także błędy strukturalne. Rozważmy przykład, w którym zakłada się istnienie zależności pomiędzy trzema zjawiskami: postawą, zamiarem postąpienia i rzeczywistym zachowaniem, w którym4: − postawa reprezentowana jest przez zmienną ξ1 − zamiar postąpienia reprezentowany jest przez zmienną η1 − rzeczywiste zachowanie reprezentowane jest przez zmienną η2 Diagram ścieżkowy obrazujący powyższe zależności przedstawia się następująco: γ 21 ȟ1 γ 11 β 21 Ș1 ζ1 Ș2 ζ2 Rysunek. 1. Diagram ścieżkowy Konstrukty są na diagramie przedstawione za pomocą kół. Strzałki pomiędzy konstruktami reprezentują zaś kierunki zależności i są nazywane ścieżkami strukturalnymi (stąd przedstawiony model nazywany jest modelem ścieżkowym). To właśnie tym ścieżkom przyporządkowane są współczynniki strukturalne. Przedstawione zależności sugerują, że postawa determinuje zamiary, te zaś w następstwie oddziaływują na rzeczywiste zachowanie, które jest także bezpośrednim efektem postawy. Formalnie model strukturalny reprezentowany jest przez następujące równania 4 Przykład pochodzi z Sharmy (1996: 419). Skalowanie druk.indb 211 2009-12-09 14:25:54 212 Katarzyna Wądołowska η1 = γ 11ξ1 + ζ 1 (3) η2 = γ 21ξ1 + β 21η1 + ζ 2 (4) w postaci macierzowej zapisane jako Ș = ī ȟ+ Ǻ Ș + ȗ ⎛ η1 ⎞ ⎛ γ 11 ⎞ ⎛ 0 0 ⎞⎛ η1 ⎞ ⎛ ζ 1 ⎞ ⎜ ⎟ = ⎜ ⎟ ξ1 + ⎜ ⎟⎜ ⎟ + ⎜ ⎟ ⎝η 2 ⎠ ⎝ γ 21 ⎠ ⎝ β 21 0 ⎠⎝η2 ⎠ ⎝ ζ 2 ⎠ (5) Pierwsze równanie wskazuje na zależność pomiędzy postawą (ξ1) i zamierzonym zachowaniem (η1). Równanie drugie przedstawia zależność pomiędzy postawą (ξ1), zamierzonym zachowaniem (η1) oraz rzeczywistym zachowaniem (η2). Estymacja Równanie strukturalne (2) można przekształcić w następujący sposób Șç −−BȘ Bç == īȟ Ãî ++ȗæ (6) ((IçI--=BBÃî ))Ș += æīȟ + ȗ -1 -1 B )-1 īȟ Ãî ++ (II--B B )-1 ȗæ Șç == ((II--B ) ( ) (7) (8) Otrzymana postać nazywana jest zredukowaną formą modelu równań strukturalnych, jako że ścieżki strukturalne są w niej zredukowane do zbioru równań, w których zmienne zależne są funkcjami tylko i wyłącznie zmiennych niezależnych oraz błędów strukturalnych (Long 1983: 33). Zredukowana forma układu równań jest niezbędna dla sformułowania warunków identyfikacji modelu, to znaczy wykonalności zadania estymacji jego parametrów. Aby uzyskać spójną estymację parametrów modelu należy przyjąć następujące założenia techniczne: Z1 Wszystkie zmienne wyrażone są jako odchylenia od swoich średnich E ( Ș ) = E ( ȗ ) = 0 oraz E ( ȟ ) = 0 Z2 Błędy strukturalne są nieskorelowane z konstruktami niezależnymi w modelu E ( ȟȗ ) = 0 lub równowaĪnie E ( ȗȟ ) = 0 Skalowanie druk.indb 212 2009-12-09 14:25:54 Wprowadzenie do modelowania strukturalnego 213 Z3 Błędy strukturalne są nieskorelowane między sobą Z4 Macierz (Ι - Β)-1 istnieje, co po prostu oznacza, że żadne z równań strukturalnych nie jest zbyteczne Przyjmując powyższe założenia można zdefiniować istotne w estymacji macierze kowariancji: − kowariancja błędów strukturalnych ζ jest symetryczną macierzą Ψ o wymiarach (r × r); ponieważ błędy strukturalne są mierzone jako odchylenia od średnich, zatem macierz ta ma postać Ȍ = E ( ȗȗ ) (9) − kowariancja zmiennych niezależnych ξ jest symetryczną macierzą Φ o wymiarach (s × s) (10) ĭ = E ( ȟȟ ) Diagonalna macierzy Ψ jest nieznana, natomiast jej elementy poza główną przekątną są z założenia równe zero. Model pomiarowy Specyfikacja W poprzednim paragrafie założyliśmy, iż zmienne η i ξ są obserwowalne i mogą być mierzone bez błędów pomiaru. W rzeczywistości wiele zmiennych analizowanych w naukach społecznych jest jednak nieobserwowalnych. Zależności pomiędzy zmiennymi nieobserwowalnymi (ukrytymi) a odpowiadającymi im obserwowalnymi wskaźnikami opisuje pomiarowa składowa modeli równań strukturalnych. Składa się ona z pary modeli czynnikowych, w których każdy czynnik reprezentuje konstrukt definiowany za pomocą odpowiednich wskaźników. Podobnie jak w modelu ścieżkowym, także tu w układzie równań strukturalnych obecne są dwie grupy zmiennych (teraz – zmiennych ukrytych): − grupa zmiennych niezależnych opisywana przez wektor ξ zawierający parametry dla s nieobserwowalnych konstruktów wskazywanych przez q obserwowanych wskaźników opisywanych przez wektor x − grupa zmiennych zależnych opisywana przez wektor η zawierający parametry dla r nieobserwowalnych konstruktów wskazywanych przez p obserwowalnych wskaźników opisywanych przez wektor y Skalowanie druk.indb 213 2009-12-09 14:25:56 214 Katarzyna Wądołowska Zależności pomiędzy konstruktami i ich wskaźnikami przedstawia para równań czynnikowych x = ȁ xȟ + į (11) (12) y = ȁy Ș + İ W uproszczeniu (pominięto swoiste składowe wskaźników typu x i y) pomiarową wersję modelu strukturalnego przedstawić można w następujący sposób: Zmienne zaleĪne Zmienne niezaleĪne y1 x1 x2 η1 ... ξ1 ... ... ... ξs xq η2 ... ηr y2 ... ... ... ... ... ... yp Rysunek 2. Schemat pomiarowego modelu równań strukturalnych gdzie: − x reprezentuje wektor o wymiarach (q × 1) wskaźników konstruktów niezależnych ξ − y reprezentuje wektor o wymiarach (p × 1) wskaźników konstruktów zależnych η − Λx jest macierzą o wymiarach (q × s) ładunków czynnikowych konstruktów niezależnych ξ z odpowiadającymi im wskaźnikami x, w której ładunek xi na ξj zapisuje się jako λijx − δ jest wektorem o wymiarach (q × 1) błędów pomiaru wskaźników x, zwanych też czynnikami swoistymi x − Λy jest macierzą o wymiarach (p × r) ładunków czynnikowych konstruktów zależnych η z odpowiadającymi im wskaźnikami y, w której ładunek yi na ηj zapisuje się jako λijy − ε jest wektorem o wymiarach (p × 1) błędów pomiaru wskaźników y, zwanych też czynnikami swoistymi y Równania (11), (12) odpowiadają znanemu z analizy czynnikowej założeniu, że obserwowalne wskaźniki typu x lub y są liniowymi funkcjami Skalowanie druk.indb 214 2009-12-09 14:25:56 Wprowadzenie do modelowania strukturalnego 215 wspólnych konstruktów (ξ lub η odpowiednio) oraz czynników swoistych (δ dla x oraz ε dla y). Estymacja Aby uzyskać spójną estymację parametrów modelu należy przyjąć następujące założenia: Z1 Wszystkie zmienne mierzone są jako odchylenia od ich średnich E ( x ) = E ( į ) = 0 , E ( ȟ ) = 0 , E ( y ) = E ( İ ) = 0 oraz E ( Ș ) = 0 Z2 Dla każdego z równań konstrukty i błędy pomiaru nie są ze sobą skorelowane, w szczególności zakłada się, że E ( ȟį ) = 0 lub równowaĪnie E ( įȟ ) = 0 oraz E ( Șİ ) = 0 lub E ( İȘ ) = 0 Z3 Błędy pomiaru nie są skorelowane z konstruktami w innych równaniach E ( ȟİ ) = 0 lub E ( İȟ ) = 0 , E ( Șį ) = 0 lub E ( įȘ ) = 0 Z4 Błędy pomiaru nie są skorelowane pomiędzy równaniami E ( įİ ) = 0 lub równowaĪnie E ( İį ) = 0 Z5 Wskaźniki niezależne wektora x nie są skorelowane z konstruktami zależnymi η, zaś wskaźniki zależne wektora y nie są skorelowane z konstruktami niezależnymi ξ Z powyższych założeń wynikają następujące konsekwencje dla kowariancji składników modelu: − macierz kowariancji Φ konstruktów niezależnych ξ jest symetryczną macierzą o wymiarach (s × s) − macierz kowariancji COV(η) konstruktów zależnych η jest symetryczną macierzą o wymiarach (r × r) − macierz kowariancji Θδ czynników swoistych δ jest symetryczną macierzą o wymiarach (q × q), niekoniecznie diagonalną5 − macierz kowariancji Θε czynników swoistych ε jest symetryczną macierzą o wymiarach (p × p), niekoniecznie diagonalną Macierz diagonalna poza główną przekątną ma wartość zero. Zakłada się więc, że czynniki swoiste mogą być ze sobą skorelowane. Założenia tego nie przyjmuje się w standardowym modelu czynnikowym. 5 Skalowanie druk.indb 215 2009-12-09 14:25:57 216 Katarzyna Wądołowska Operacjonalizacja pomiarowej wersji modelu polega na narzuceniu ograniczeń na parametry macierzy: Λx, Λy, Φ, Θδ oraz Θε. Wśród nich znajdują się ograniczenia dotyczące pojedynczych parametrów (narzucenie im stałej wartości) oraz ograniczenia dotyczące grupy parametrów (przyrównanie ich do siebie). W ogólnym modelu pomiarowym zmienne obserwowalne x i y mogą być ze sobą oraz między sobą skorelowane. Kowariancję obserwowalnych wskaźników x i y zawiera macierz Σxy o wymiarach (q × p), której (i,j)-ty element wskazuje na kowariancję pomiędzy wskaźnikami xi oraz yj. Podobnie, konstrukty niezależne ξ i konstrukty zależne η mogą być ze sobą skorelowane. Ich kowariancje zawierają się w macierzy COV(ξ,η) o wymiarach (s × r) oraz w macierzy COV(η,ξ) o wymiarach (r × s). Model pomiarowo-ścieżkowy Gdy do modelu ścieżkowego dodać część pomiarową, powstanie model pomiarowo-ścieżkowy. Pozwala on w prosty sposób zilustrować ideę podziału układu równań strukturalnych na część strukturalną i pomiarową. Jego graficzną reprezentacją jest diagram na rysunku 3. Zgodnie z konwencją przyjmowaną w modelowaniu strukturalnym zmienne nieobserwowalne są na diagramie oznaczane jako koła, zaś zmienne obserwowalne jako kwadraty. γ 21 ζ1 γ 11 ȟ1 Ș1 ζ2 β 21 Ș2 Model strukturalny Model pomiarowy λ11x x λ21 λ31x λ11y λ21y λ31y λ42y λ52y λ62y x1 x2 x3 y1 y2 y3 y4 y5 y6 δ1 δ2 δ3 ε1 ε2 ε3 ε4 ε5 ε6 Rysunek 3. Model strukturalny z konstruktami nieobserwowalnymi6 6 Przykład cytujemy za Sharma 1996: 427. Skalowanie druk.indb 216 2009-12-09 14:25:58 Wprowadzenie do modelowania strukturalnego 217 Powyższy rysunek można koncepcyjnie podzielić na dwie części: 1. Model strukturalny wskazujący na zależności pomiędzy zmiennymi ukrytymi, reprezentowany przez diagram ścieżkowy i równania strukturalne tożsame z tymi przedstawionymi dla modelu wyłącznie ze zmiennymi obserwowalnymi, 2. Model pomiarowy wskazujący na zależności pomiędzy konstruktami a ich wskaźnikami, reprezentowany przez następujące równania x1 = λ11x ξ1 + δ1 x2 = λ21x ξ1 + δ 2 x3 = λ31x ξ1 + δ 3 y1 = λ11yη1 + ε1 y2 = λ21y η1 + ε 2 y3 = λ31yη1 + ε 3 y4 = λ42y η 2 + ε 4 y5 = λ52y η 2 + ε 5 y6 = λ62y η 2 + ε 6 (13) (14) w postaci macierzowej zapisane jako x = ȁx ȟ + į x ⎛ x1 ⎞ ⎛ λ11 ⎞ ⎛ δ1 ⎞ ⎜ ⎟ ⎜ x⎟ ⎜ ⎟ ⎜ x2 ⎟ = ⎜ λ21 ⎟ ξ1 + ⎜ δ 2 ⎟ ⎜ x ⎟ ⎜λx ⎟ ⎜δ ⎟ ⎝ 3 ⎠ ⎝ 31 ⎠ ⎝ 3⎠ oraz y = ȁy (15) Ș + İ ⎛ y1 ⎞ ⎛ λ11y 0 ⎞ ⎛ ε1 ⎞ ⎟ ⎜ ⎟ ⎜ y ⎜ ⎟ ⎜ y2 ⎟ ⎜ λ21 0 ⎟ ⎜ε2 ⎟ ⎜ y3 ⎟ ⎜ λ31y 0 ⎟ ⎛ η1 ⎞ ⎜ ε 3 ⎟ ⎟ ⎜ ⎟=⎜ ⎟+⎜ ⎟ y ⎜ ⎜ y4 ⎟ ⎜ 0 λ42 ⎟ ⎝η2 ⎠ ⎜ ε 4 ⎟ ⎜ y5 ⎟ ⎜ 0 λ y ⎟ ⎜ ε5 ⎟ 52 ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎜⎜ ⎟⎟ y ⎟ ⎝ y6 ⎠ ⎝ 0 λ62 ⎠ ⎝ ε6 ⎠ (16) Analiza kowariancji modelu ścieżkowego Analiza kowariancji modelu strukturalnego ma na celu wyprowadzenie z jego założeń konsekwencji dla kowariancji zmiennych obserwowalnych. Porównanie tych konsekwencji z zarejestrowanymi empirycznie zależnościami między zmiennymi obserwowalnymi będzie podstawą do udzielenia od- Skalowanie druk.indb 217 2009-12-09 14:25:58 218 Katarzyna Wądołowska powiedzi na pytanie, czy model strukturalny zjawiska jest wystarczająco zgodny z danymi empirycznymi, czy też należy go – jako hipotezę na temat rzeczywistości – odrzucić, gdyż dane empiryczne są z nimi niezgodne. Prześledzimy dalej, co z założeń modelu wynika na temat zależności (kowariancji) między jego elementami. Analizę struktury kowariancji modelu rozpocznijmy od ponownego założenia o obserwowalności zmiennych ukrytych. Pomoże to zrozumieć komponent strukturalny kowariancji w modelu. Niech η będzie wektorem zmiennych zależnych, zaś ξ wektorem zmiennych niezależnych. Model zakłada powiązanie tych zmiennych ze sobą następującym systemem liniowych równań strukturalnych zapisanych w zredukowanej postaci macierzowej Ș = ( I - B ) īȟ + ( I - B ) ȗ -1 -1 (17) Macierz kowariancji zmiennych zależnych Zgodnie z definicją, macierz kowariancji konstruktów zależnych η jest równa COV ( Ș ) =E ( ȘȘ ) − E ( Ș ) E ( Ș ) (18) Z założeń modelu wynika, że E(η) = 0, zatem COV ( Ș ) =E ( ȘȘ ) (19) Korzystając ze zredukowanej formy modelu równań strukturalnych otrzymujemy ⎡ ⎤ -1 -1 -1 -1 COV ( Ș ) = E ( ȘȘ ) = E ⎢ ( I - B ) īȟ + ( I - B ) ȗ ( I - B ) īȟ + ( I - B ) ȗ ⎥ ⎣ ⎦ ( ( )( )( ) ) -1 -1 -1 -1 = E ⎢⎡ ( I - B ) īȟȟ ī ( I - B ) + ( I - B ) īȟȗ ( I - B ) + ⎣ -1 -1 -1 -1 ( I - B ) ȗȟ ī ( I - B ) + ( I - B ) ȗȗ ( I - B ) ⎤⎥ ⎦ ( )( ) (20) Po skorzystaniu z założenia, że E(ξζ`) = 0 oraz wzorów na kowariancję błędów strukturalnych Ψ = E(ζζ`) i kowariancję zmiennych niezależnych Φ = E(ξξ`) otrzymujemy Skalowanie druk.indb 218 2009-12-09 14:25:59 219 Wprowadzenie do modelowania strukturalnego COV ( Ș ) = ( I - B ) īĭī ( I - B ) + ( I - B ) Ȍ ( I - B ) -1 = (I - B) -1 -1 ( īĭī + Ȍ )( I - B ) -1 -1 (21) -1 Zatem kowariancja zmiennych zależnych w powyższym modelu jest funkcją parametrów strukturalnych Γ i (I - B)-1 oraz kowariancji zmiennych niezależnych Φ i kowariancji błędów strukturalnych Ψ (Long 1983: 33). Macierze kowariancji zmiennych niezależnych i zależnych Kowariancje pomiędzy ξ i η wyznaczane są podobnie. Z założeń modelu E(ξ) = 0 i E(η) = 0 wynika, że COV(η,ξ) = E(ηξ`). Ponownie korzystając ze zredukowanej formy modelu równań strukturalnych można wyznaczyć szukaną macierz kowariancji ( ) -1 -1 COV ( Ș, ȟ ) = E ( Șȟ ) = E ⎡ ( I - B ) īȟ + ( I - B ) ȗ ȟ ⎤ ⎣ ⎦ -1 -1 = E ⎡( I - B ) īȟȟ + ( I - B ) ȗȟ ⎤ ⎦ ⎣ (22) = ( I - B ) īĭ gdzie ostatnia równość wynika z założenia, że E(ζξ`) = 0 oraz definicji kowariancji zmiennych niezależnych E(ξξ`) = Φ. Analogicznie można otrzymać następującą macierz -1 (23) COV ( ȟ, Ș ) = E ( ȟȘ ) = ĭī ( I - B ) -1 Macierz kowariancji zmiennych η oraz ξ Uzyskane wzory kowariancji pozwalają na zdefiniowanie macierzy kowariancji Σ zawierającej wariancje i kowariancje pomiędzy zmiennymi η oraz ξ -1 -1 ⎡ COV ( Ș ) COV ( Ș,ȟ ) ⎤ ⎡⎢( I - B ) ( īĭī + Ȍ )( I - B ) Ȉ=⎢ ⎥= -1 ⎣COV ( ȟ, Ș) COV ( ȟ ) ⎦ ⎢⎣ ĭī ( I - B ) īĭ ⎤ ⎥ ⎥ ĭ ⎦ (24) Macierz kowariancji Σ została zatem zdefiniowana w terminach parametrów strukturalnych B i Γ oraz kowariancji Φ i Ψ. W praktyce Σ jest nieznane, pamiętajmy jednak, że η oraz ξ są zmiennymi obserwowalnymi, zatem do oszacowania Σ mogą zostać użyte stosowne statystyki z próby zawarte w macierzy S, gdzie macierz S jest następująca Skalowanie druk.indb 219 (I - B) -1 2009-12-09 14:26:00 220 Katarzyna Wądołowska ⎡estymatory kowariancji ⎢ z próby pomiĊdzy η ⎢ S=⎢ ⎢ ⎢estymatory kowariancji ⎢⎣ z próby pomiĊdzy ξ i η estymatory kowariancji ⎤ z próby pomiĊdzy η i ξ ⎥⎥ ⎥ ⎥ estymatory kowariancji ⎥ z próby pomiĊdzy ξ ⎦⎥ Proces estymacji obejmuje znalezienie wartości B, Γ, Φ i Ψ, z których wynika macierz kowariancji możliwie bliska obserwowalnej macierzy kowariancji S (Long 1983: 34). Analiza kowariancji modelu pomiarowo-ścieżkowego Uchylając założenie o obserwowalności konstruktów ξ oraz η, ponownie należy rozpatrzyć model strukturalny reprezentowany przez trzy równania (25) Ș = īȟ + ǺȘ + ȗ (26) x = ȁ xȟ + į (27) y = ȁy Ș + İ Pierwsze równanie przedstawia część strukturalną, wskazującą na ścieżki pomiędzy zmiennymi ukrytymi w modelu. Kolejne dwa równania reprezentują jego część pomiarową, w której widoczne są związki konstruktów ξ i η z reprezentującymi je wskaźnikami x oraz y. Macierz kowariancji wskaźników niezależnych Macierz kowariancji pomiędzy wskaźnikami konstruktów niezależnych Σxx przedstawia się następująco Ȉ xx = COV ( x ) = E ( xx ) = E ⎡( ȁ xȟ + į )( ȁ xȟ + į ) ⎤ ⎢⎣ ⎥⎦ = E ⎡ ȁ xȟȟ ȁ x + ȁ xȟį + įȟ ȁ x + įį ⎤ ⎣ ⎦ (28) = ȁ x E ( ȟȟ ) ȁ x + ȁ x E ( ȟį ) + E ( įȟ ) ȁ x + E ( įį ) Korzystając z założeń, że E(ξδ`) = 0 i E(δξ`) = 0 oraz ze wzorów na kowariancje konstruktów niezależnych i czynników swoistych E(ξξ`) = Φ Skalowanie druk.indb 220 2009-12-09 14:26:01 221 Wprowadzenie do modelowania strukturalnego oraz E(δδ`) = Θδ, wyznaczamy macierz kowariancji wskaźników niezależnych7 Ȉ xx = ȁ xĭȁ x + Ĭį (29) Macierz kowariancji wskaźników zależnych Podobnie wyprowadzić można macierz kowariancji dla wskaźników konstruktów zależnych Σyy Ȉ yy = COV ( y ) = E ( yy ) ⎡ ⎤ = E ⎢( ȁ y Ș + İ )( ȁ y Ș + İ ) ⎥ ⎣ ⎦ = E ⎡ ȁ y ȘȘ ȁ y + ȁ y Șİ + İȘ ȁ y + İİ ⎤ ⎦ ⎣ = ȁ y E ( ȘȘ ) ȁ y + ȁ y E ( Șİ ) + E ( İȘ ) ȁ y + E ( İİ (30) ) = ȁ y E ( ȘȘ ) ȁ y + Ĭİ Korzystając ze wzoru na macierz kowariancji pomiędzy konstruktami zależnymi E(ηη`) otrzymujemy macierz kowariancji wskaźników zależnych Ȉ yy = ȁ y ⎡( I - B ) ⎢⎣ -1 ( īĭī -1 + Ȍ )( I - B ) ⎤ ȁ y + Ĭİ ⎦⎥ (31) Macierz kowariancji wskaźników niezależnych i zależnych Macierz kowariancji pomiędzy wskaźnikami konstruktów niezależnych i zależnych Σxy przedstawia się następująco Ȉ xy = COV ( xy ) = E ( xy ) ⎡ ⎤ = E ⎢( ȁ x ȟ + į ) ( ȁ y Ș + İ ) ⎥ ⎣ ⎦ = E ⎡ ȁ x ȟȘ ȁ y + ȁ xȟİ + įȘ ȁ y + įİ ⎤ ⎦ ⎣ (32) = ȁ x E ( ȟȘ ) ȁ y + ȁ x E ( ȟİ ) + E ( įȘ ) ȁ y + E ( įİ ) = ȁ x E ( ȟȘ ) ȁ y 7 Równanie to opisuje model czynnikowy. Skalowanie druk.indb 221 2009-12-09 14:26:02 222 Katarzyna Wądołowska Korzystając ze wzoru na kowariancję pomiędzy konstruktami niezależnymi i zależnymi E(ξη`) otrzymujemy następującą macierz Ȉ xy = ȁ xĭī ( I - B ) ȁ y (33) Ȉ yx = ȁ y ( I - B ) īĭȁ x (34) -1 analogicznie -1 Macierz kowariancji wszystkich wskaźników Uzyskane kowariancje pozwalają na zdefiniowanie macierzy kowariancji Σ między wszystkimi zmiennymi obserwowalnymi. Macierz ta wygląda następująco ⎡ Ȉ yy Ȉ yx ⎤ Ȉ=⎢ ⎥= ⎣ Ȉ xy Ȉ xx ⎦ (35) ⎡ ȁ I - B -1 īĭī + Ȍ I - B -1 ȁ + Ĭ ȁ I - B -1 īĭȁ ⎤ ) ( )( ) y ) y ( İ y ( x ⎥ =⎢ -1 ⎢ ⎥ ȁ x ĭī ( I - B ) ȁ y ȁ xĭȁ x + Ĭį ⎦ ⎣ Dekomponuje ona wariancje i kowariancje zmiennych obserwowalnych x i y na funkcje macierzy ładunków Λx i Λy, wariancje i kowariancje konstruktów ξ i η oraz wariancje i kowariancje czynników swoistych δ i ε. Estymacja macierzy polega na znalezieniu estymatorów parametrów, które możliwie najdokładniej reprodukują wariancje i kowariancje wskaźników z próby (Long 1983: 24). Podsumowanie założeń SEM W modelowaniu strukturalnym estymuje się jednocześnie powiązania pomiędzy zmiennymi ukrytymi i ich wskaźnikami oraz ścieżki strukturalne pomiędzy konstruktami. Taka estymacja jest możliwa, jeżeli przyjmie się kilka niezbędnych założeń (Long 1983: 57): Skalowanie druk.indb 222 2009-12-09 14:26:03 Wprowadzenie do modelowania strukturalnego 223 Z1 Zmienne są mierzone jako odchylenia od średnich E ( Ș) = E ( ȗ ) = 0 E (ȟ ) = 0 E ( x ) = E (į) = 0 E ( y ) = E (İ ) = 0 Z2 Błędy pomiaru są nieskorelowane ze zmiennymi nieobserwowalnymi E ( ȟį ) = 0 lub E ( įȟ ) = 0 E ( Șİ ) = 0 lub E ( İȘ ) = 0 E ( ȟİ ) = 0 lub E ( İȟ ) = 0 E ( Șį ) = 0 lub E ( įȘ ) = 0 Z3 Błędy pomiaru i błędy strukturalne są nieskorelowane pomiędzy równaniami E ( įİ ) = 0 lub E ( İį ) = 0 E ( ȗį ) = 0 lub E ( įȗ ) = 0 E ( ȗİ ) = 0 lub E ( İȗ ) = 0 Z4 Zmienne nieobserwowalne niezależne i błędy strukturalne są nieskorelowane E ( ȟȗ ) = 0 lub E ( ȗȟ ) = 0 Z5 Żadne z równań strukturalnych nie jest zbyteczne, a zatem (I - B) jest macierzą nieosobliwą i tym samym (I - B)-1 istnieje; w przypadku, gdyby (I - B) była macierzą osobliwą wówczas (I - B)-1 by nie istniało8 Z6 Zmienne obserwowalne x oraz y mogą być skorelowane ze sobą, ich kowariancje są elementami macierzy Σxy, gdzie (i,j)-ty element wskazuje na kowariancję pomiędzy xi oraz yj Macierz osobliwa ma zerowy wyznacznik i w związku z tym nie posiada macierzy odwrotnej. 8 Skalowanie druk.indb 223 2009-12-09 14:26:04 224 Katarzyna Wądołowska Z7 Konstrukty niezależne ξ i zależne η mogą być skorelowane ze sobą, ich kowariancje są elementami macierzy COV(ξ,η) lub COV(η,ξ) Z8 Błędy pomiaru δ mogą być skorelowane między sobą, podobnie błędy pomiaru ε; ich macierze kowariancji są symetryczne, ale niekoniecznie diagonalne9 Ĭį = COV ( į ) = E ( įį ) (36) Ĭį = COV ( į ) = E ( įį ) (37) Z9 Błędy strukturalne są nieskorelowane pomiędzy równaniami, a zatem ich macierz kowariancji Ψ powinna być diagonalna Z10 Zmienne obserwowalne niezależne x nie tłumaczą zmienności konstruktów zależnych η, podobnie zmienne obserwowalne zależne y nie tłumaczą zmienności konstruktów niezależnych ξ; wskazuje to na brak połączeń pomiędzy częścią niezależną a częścią zależną składnika pomiarowego modelu Wśród powyższych założeń wyjaśnienia wymaga założenie przedostatnie (Z9). Zgodnie z nim błędy strukturalne nie mogą być ze sobą skorelowane, w związku z czym ich macierz kowariancji jest diagonalna. Założenie to jest najczęściej przyjmowane w modelach równań strukturalnych. W praktyce jednak zdarzają się od niego odstępstwa i dopuszcza się skorelowanie niektórych błędów strukturalnych ze sobą (Long 1983: 30). Takie podejście sugeruje, że konstrukty zależne powiązane z tymi błędami partycypują we wspólnej zmienności niewyjaśnionej przez predyktory modelu. Może się tak zdarzyć, jeśli model nie został dobrze skonstruowany i pominął pewne zmienne, które oddziaływują na owe konstrukty. W takim wypadku konstrukcja modelu powinna zostać zweryfikowana, a brakujące zmienne dodane. Założenia dotyczące skorelowania zmiennych w modelu pokazuje rysunek 4. Brak strzałki łączącej zmienne oznacza założenie o ich liniowej niezależności (zakłada się, że kowariancja takich zmiennych jest równa 0). Dla czytelności przekazu na rysunku nie została zaznaczona możliwość skorelowania ze sobą zmiennych obserwowalnych x oraz y. 9 Macierz diagonalna ma zera poza główną przekątną. Skalowanie druk.indb 224 2009-12-09 14:26:05 225 Wprowadzenie do modelowania strukturalnego COV (ξ 2 ,η3 ) ζ2 ζ1 COV (ξ1 , ξ 2 ) ȟ1 Ș1 λ22x λ32x λ42x λ11y ζ3 COV (η2 ,η3 ) COV (η1 ,η2 ) ȟ2 x λ11x λ21 23 Ș2 λ21y λ31y Ș3 λ32y λ42y λ43y λ53y x1 x2 x3 x4 y1 y2 y3 y4 y5 δ1 δ2 δ3 δ4 ε1 ε2 ε3 ε4 ε5 θ13δ θ13ε θ 25ε Rysunek 4. Graficzna prezentacja założeń SEM dotyczących skorelowania zmiennych − − − − − − − Na powyższym rysunku: koła reprezentują zmienne ukryte kwadraty reprezentują zmienne obserwowalne łuki łączące określone dwie zmienne wskazują na ich skorelowanie ze sobą strzałki wskazują na kierunek zależności interpretowanej w kategoriach przyczynowych łuk przerywany reprezentuje niezerowe kowariancje pomiędzy błędami strukturalnymi gruba linia ciągła oddziela część niezależną i zależną modelu; brak strzałek między konstruktami zależnymi (η) a wskaźnikami niezależnymi (x) oraz między wskaźnikami zależnymi (y) i konstruktami niezależnymi (ξ) wynika z założeń modelu dla czytelności na rysunku pominięto strzałki łączące zmienne wskaźnikowe x oraz y, które muszą się pojawić, gdy konstrukty zależne i niezależne będą ze sobą skorelowane (patrz Z7) Zestawienie składowych pełnego modelu strukturalnego zawiera tabela 1. Skalowanie druk.indb 225 2009-12-09 14:26:05 226 Katarzyna Wądołowska Tabela 1. Składowe pełnego modelu równań strukturalnych Równania strukturalne: Równania pomiarowe: Ș = īȟ + ǺȘ + ȗ x = ȁ xȟ + į y = ȁy Ș + İ ⎡ ȁ I - B -1 īĭī + Ȍ I - B -1 ȁ + Ĭ ȁ I - B -1 īĭȁ ) ( )( ) y ) y ( İ y( x ∑=⎢ -1 ⎢ ȁ xĭī ( I - B ) ȁ y ȁ xĭȁ x + Ĭį ⎣ macierz wymiary kowariancja opis Model strukturalny (dotyczy zaleĪnoĞci liniowych pomiĊdzy konstruktami) Macierz kowariancji wszystkich skáadowych modelu: ī ( s ×1) ( r ×1) (r × s) Ǻ (r × r ) ȗ ( r ×1) ȟ Ș ĭ = E ( ȟȟ ) COV ( Ș ) = E ( ȘȘ ) Ȍ = E ( ȗȗ ) ⎤ ⎥ ⎥ ⎦ konstrukty niezaleĪne konstrukty zaleĪne wspóáczynniki strukturalne (ĞcieĪkowe) pomiĊdzy konstruktami zaleĪnymi i niezaleĪnymi wspóáczynniki strukturalne (ĞcieĪkowe) pomiĊdzy konstruktami zaleĪnymi báĊdy strukturalne (báĊdy w równaniach) Model pomiarowy (áączy konstrukty z ich wskaĨnikami) ȁx ( q ×1) ( p ×1) ( q ×1) ( p ×1) (q × s) ȁ yȁ y ( p×r) x y į İ ∑ xx = E ( xx ) wskaĨniki konstruktów niezaleĪnych ∑ yy = E ( yy wskaĨniki konstruktów zaleĪnych ) Ĭį = E ( įį ) Ĭİ = E ( İİ ) - báĊdy pomiaru (czynniki swoiste) wskaĨników x báĊdy pomiaru (czynniki swoiste) wskaĨników y áadunki czynnikowe pomiĊdzy konstruktami niezaleĪnymi i ich wskaĨnikami áadunki czynnikowe pomiĊdzy konstruktami zaleĪnymi i ich wskaĨnikami Refleksywna i formatywna wersja modelowania strukturalnego W modelowaniu strukturalnym dają się wyróżnić dwa nurty: refleksywny (ang. reflexive) i formatywny (ang. formative). Zasadnicza różnica między nimi polega na traktowaniu relacji pomiędzy wskaźnikiem (zmienną obserwowalną) a cechą ukrytą (konstruktem). W refleksywnej wersji modelowania strukturalnego relacja „bycia wskaźnikiem” wiążąca zmienną obserwowalną z konstruktem ma status hipotezy, którą analiza danych (estymacja parametrów modelu) może potwierdzić, ale Skalowanie druk.indb 226 2009-12-09 14:26:06 Wprowadzenie do modelowania strukturalnego 227 może także sfalsyfikować. Modelowanie w tej wersji polega więc (między innymi) na sprawdzeniu, czy wskaźniki cech ukrytych zostały dobrane poprawnie, to znaczy, czy wszystkie są niezbędne do oszacowania wartości cechy ukrytej i czy oszacowanie to jest wystarczająco rzetelne. Modelowanie strukturalne w wersji refleksywnej jest zatem bardzo podobne do eksploracyjnej analizy czynnikowej (Exploratory Factor Analysis EFA), gdyż do podejmowania decyzji o statusie pojedynczych wskaźników oraz całego modelu używa się tych samych kryteriów: 1 wielkości ładunków czynnikowych, 2 odległości (istotności) ładunków czynnikowych od wartości zero, 3 zasobów wariancji wspólnej cechy ukrytej i wskaźników, 4 stopnia zgodności zależności reprodukowanych przez model z empirycznie zarejestrowanymi zależnościami. Choć struktura pomiarowa (czynnikowa) w SEM jest zakładana, zaś w EFA poszukiwana, w obu przypadkach kryterium oceny jakości tej składowej modelu strukturalnego i oceny wyeksplorowanej struktury czynnikowej jest takie samo – jest to zdolność do odtwarzania przez model zaobserwowanych zależności między wskaźnikami. W formatywnej wersji SEM status wskaźników jest odmienny – zakłada się, że są one wskaźnikami cechy ukrytej i założenie to nie jest przedmiotem analizy ani weryfikacji. Odpowiada to sytuacji, w której badacz dokładnie wie, co jest wskaźnikiem której z cech ukrytych i jego jedynym zadaniem jest maksymalne wykorzystanie informacji zawartych we wskaźnikach do jak najdokładniejszego przewidywania wartości zmiennych zależnych modelu. Szacowanie wartości konstruktów w formatywnej wersji SEM przypomina zatem analizę głównych składowych (Principal Components Analysis PCA), w której poszukuje się takiej liniowej funkcji wskaźników, aby utworzona w ten sposób zmienna (konstrukt) miała jak największą wariancję. Zauważmy, że w formatywnej wersji SEM kwestia zgodności modelu strukturalnego z danymi empirycznymi nie jest wbudowana w procedurę szacowania jego parametrów, gdyż celem jest tu optymalizacja błędów przewidywania zmiennych zależnych, a więc minimalizacja błędów tego przewidywania. Każdy z wymienionych nurtów SEM stosuje dopasowane do swoich założeń techniki estymacji parametrów modelu i przyjmuje w związku z tym Skalowanie druk.indb 227 2009-12-09 14:26:06 228 Katarzyna Wądołowska specyficzne założenia na temat poziomu pomiaru i kształtu ich rozkładów. W konsekwencji zasadnie jest traktować oba nurty jako względnie niezależne sposoby modelowania zjawisk społecznych przy użyciu układów równań liniowych. Od stosowanych w nich technik estymacyjnych pochodzą ich nazwy: SEM-MLE dla wariantu refleksywnego i SEM-PLS dla wersji formatywnej. W formatywnej wersji SEM, zwłaszcza w jego początkowej fazie rozwoju, parametry modeli były szacowane metodą maksymalizacji funkcji wiarogodności (MLE). Estymacja parametrów tą metodą wymaga znajomości postaci funkcji wiążącej rozkład wyników doświadczenia losowego (rozkład statystyki z próby) z wartościami parametrów populacji, z której pochodzi próba. W refleksywnym wariancie SEM, wykorzystującym do estymacji technikę MLE wymaga się w konsekwencji, aby wszystkie zmienne obserwowalne miały rozkłady normalne. SEM-MLE jest najpopularniejsza w piśmiennictwie socjologicznym i wiąże się z wprowadzeniem do użytku (w latach siedemdziesiątych ubiegłego wieku) pakietu statystycznego o nazwie LISREL (skrót od ang. LInear Structural RELationships), którego Jöreskog był współautorem. SEM-PLS jest bardziej popularna w zastosowaniach ekonomicznych i ekonometrycznych, o nazwie PLS (skrót od Partial Least Squares10), nie wymaga przyjmowania założeń o kształcie rozkładu zmiennych modelu. Jest bardziej odporna na łamanie założeń o nieskorelowaniu elementów modelu (braku współliniowości) oraz na niewielkie rozmiary prób. Jest zaimplementowana w kilku pakietach statystycznych o raczej niszowym zasięgu. SEMPLS okazuje się bardzo użytecznym narzędziem skalowania w sytuacji, gdy status wskaźników jest oczywisty i nie ma potrzeby badać, który z nich jaką cechę ukrytą reprezentuje, co zdarza się często w badaniach edukacyjnych. Wtedy zadaniem, z którym SEM-PLS radzi sobie dobrze, jest optymalne wykorzystanie wskaźników do szacowania poziomu wartości tej cechy (cech). Z tego właśnie powodu, mimo niszowego charakteru, omawiamy w tym artykule SEM-PLS. Wedle twórcy modelowania SEM-PLS, Hermana Wolda, PLS powinien być interpretowany jako skrót od „Projection to Latent Structures”, co jego zdaniem bardziej oddaje istotę estymacji, w której „projektuje się” (rzuca – w sensie geometrycznym) zmienne obserwowalne na ukryte wymiary reprezentowane przez konstrukty. 10 Skalowanie druk.indb 228 2009-12-09 14:26:06 Wprowadzenie do modelowania strukturalnego 229 SEM-MLE Teoretyczne podstawy estymacji parametrów modelu strukturalnego metodą największej wiarogodności zapoczątkował na przełomie lat 1960–1970 Karl Jöreskog (Jöreskog 1969). Ich owocem była pierwsza wersja pakietu LISREL), rozwijana do dziś11. Metoda estymacji parametrów modelu strukturalnego narzuca na dane wejściowe restrykcyjne założenia, których spełnienie bywa trudne do osiągnięcia. Oprócz interwałowego charakteru wszystkich zmiennych obserwowalnych SEM-MLE wymaga: 1 relatywnie dużych prób, w przeciwnym razie trudno osiąga się wymaganą zbieżność rozkładów statystyk z próby, 2 normalności rozkładów zmiennych obserwowalnych, 3 braku współliniowości zmiennych obserwowalnych. Wymagania te rzadko udaje się spełnić jednocześnie i bez wyjątków. W naukach społecznych sporadycznie dysponuje się wskaźnikami mierzonymi na skali interwałowej i ponadto o rozkładach zbliżonych do normalnego. Żadnego z tych wymagań nie spełniają surowe wyniki testów kompetencyjnych, które zazwyczaj mają postać zmiennych binarnych lub zmiennych porządkowych o niewielkiej liczbie wartości. Pewnym sposobem rozwiązania problemu poziomu pomiaru wskaźników i kształtu ich populacyjnych rozkładów jest zastąpienie macierzy korelacji z próby jej tetrachorycznym lub polichorycznym odpowiednikiem12. Ostatnia wersja pakietu z roku 2009 ma numer 8.8. Repertuar technik estymacyjnych oferowanych przez LISREL znacznie się rozszerzył, nie zmieniły się jednak zasadnicze założenia na temat danych wejściowych. Jak mocne jest założenie multinormalności rozkładu wskaźników widać z porównania estymatorów otrzymywanych techniką MLE oraz otrzymywanych pozostałymi technikami – ich wartości są praktycznie takie same, choć techniki obliczeniowe prowadzące do ich uzyskania są różne. 12 Stosowanie tego rozwiązania stało się łatwiejsze między innymi dzięki pakietowi PRE-LIS (PREprocesor for LISrel), autorstwa twórców LISREL (Jöreskog, Sorböm 1994), którego pierwsza wersja pojawiła się na rynku w 1986 roku. Założenia, które trzeba przyjąć na temat poziomu pomiaru i rozkładów zmiennych wskaźnikowych, są bardzo wysokie, w tym przypadku jednak – ponieważ są to założenia – nie podlegają weryfikacji. 11 Skalowanie druk.indb 229 2009-12-09 14:26:06 230 Katarzyna Wądołowska Dla danych spełniających pomiarowe i rozkładowe wymagania wymuszone przez technikę estymacyjną, pakiety SEM-MLE oferują standardowe narzędzia oceny modelu: − estymatory największej wiarogodności dla współczynników ścieżkowych i ładunków czynnikowych, − przedziały ufności dla tych parametrów, − test hipotez o istotności różnic wartości parametrów od zera, − oparte na ilorazie wiarogodności sumaryczne wskaźniki stopnia zgodności modelu z danymi empirycznymi, to znaczy stopnia podobieństwa macierzy kowariancji (korelacji) zrekonstruowanej przy użyciu wyestymowanych parametrów z odpowiednią macierzą w próbie, − identyfikację tych parametrów modelu, które w największym stopniu odpowiedzialne są za odchylenia jego przewidywań od rozkładów zmiennych obserwowalnych13. Środki statystyczne oferowane w modelach SEM-MLE pozwalają na podjęcie jednej z dwóch standardowych decyzji na temat całego modelu lub jego pojedynczych parametrów: odrzucić model (lub jego fragment) lub nie odrzucać. Z tego powodu modelowanie w wersji implementowanej w pakiecie LISREL nazywane jest odmianą konfirmacyjnej analizy czynnikowej. Pozwala ona zarówno podtrzymać hipotezę na temat modelowanego zjawiska, jeśli zarejestrowane w próbie zależności między wskaźnikami są bliskie zależnościom wyznaczonym z parametrów modelu, jak i model odrzucić, odrzucając zarazem założenia teoretyczne, na podstawie których został skonstruowany model. Ponadto, dla szczególnych par modeli strukturalnych, z których jeden jest zawarty w drugim14, możliwe jest testowanie hipotezy na temat istotności różnic w stopniu ich dopasowania do danych, co pozwala niekiedy na uzasadnienie decyzji o liczbie parametrów w modelu. Pakietów do modelowania SEM-MLE jest na rynku kilka. Obok LISREL najpopularniejszym jest jego odpowiednik z koncernu SPSS o nazwie AMOS. 14 W żargonie statystycznym mówi się wtedy, że jeden model jest zagnieżdżony w drugim. Dwa modele pozostają w relacji zawierania (zagnieżdżenia), jeśli jeden z nich jest szczególnym przypadkiem drugiego, to znaczy różnią się liczbą ograniczeń nakładanych na te same parametry ścieżkowe lub czynnikowe. 13 Skalowanie druk.indb 230 2009-12-09 14:26:06 Wprowadzenie do modelowania strukturalnego 231 SEM-PLS Alternatywą dla estymacji MLE jest procedura częściowych najmniejszych kwadratów PLS (skrót od Partial Least Squares albo – wedle twórcy – Projection on Latent Structures). Jest ona efektem prac szwedzkiego statystyka Hermana Wolda (1973), który zaproponował ją do estymacji parametrów modeli ścieżkowych ze zmiennymi ukrytymi definiowanymi za pomocą zmiennych obserwowalnych15. Estymacja metodą PLS ma w porównaniu z algorytmami SEM-MLE kilka zalet (Fornell i in. 1996, Cassel i in. 1999): − nie narzuca założeń dotyczących kształtu rozkładów i zależności między zmiennymi wskaźnikowymi, dzięki czemu możliwe jest modelowanie przy użyciu wskaźników nieliniowo powiązanych, − sprawdza się w estymacji zmiennych mierzonych zarówno na skali interwałowej, jak i porządkowej, − jest odporna na skośność rozkładów częstości oraz współliniowość zmiennych obserwowalnych, − dosyć dobrze sobie radzi w sytuacji, gdy badacz ma do czynienia z ograniczoną liczbą obserwacji i licznymi brakami danych. Specyfikacja modelu W modelowaniu SEM-PLS zakłada się, że część strukturalna modelu stanowi wartość oczekiwaną zmiennych zależnych dla danych wartości zmiennych niezależnych. Ogólny model strukturalny ma zatem postać Ε ( Ș Ș,ȟ ) = ǺȘ + īȟ gdzie: − η jest wektorem konstruktów zależnych o wymiarach (m × 1) − ξ jest wektorem konstruktów niezależnych o wymiarach (n × 1) − B jest macierzą (m × m) współczynników dla η − Γ jest macierzą (m × n) współczynników dla ξ Oznacza to, że Ε ( Șȗ ) = Ε ( ȟȗ ) = Ε ( ȗ ) = 0 (38) (39) gdzie ȗ = Ș − Ε ( Ș Ș,ȟ ) . Trudno się oprzeć wrażeniu, że statystyczne podstawy modelowania strukturalnego zawdzięczmy wyłącznie statystykom szwedzkim – Jöreskog był uczniem Wolda. 15 Skalowanie druk.indb 231 2009-12-09 14:26:06 232 Katarzyna Wądołowska Związki konstruktów z obserwowalnymi wskaźnikami przedstawiają się następująco x = ȁ xȟ + į (40) y = ȁy Ș + İ (41) gdzie: − x jest wektorem wskaźników niezależnych o wymiarach (q × 1) − y jest wektorem wskaźników zależnych o wymiarach (p × 1) − Λx jest macierzą (q × n) ładunków pomiędzy x oraz ξ − Λy jest macierzą (p × m) ładunków pomiędzy y oraz η Tym samym dla estymacji PLS zachodzi równość Ε ( İ ) = Ε ( į ) = Ε ( Șİ ) = Ε ( ȟį ) = 0 (42) wedle której błędy pomiaru konstruktów mają średnią zero i są z nimi liniowo nieskorelowane. Technika szacowania parametrów modelu Od strony technicznej PLS łączy w sobie elementy metody głównych składowych (Principal Components Analysis PCA) i klasycznej metody najmniejszych kwadratów (Ordinary Least Squares OLS). Jest to technika iteracyjna prowadząca do ostatecznych oszacowań przez cykliczne powtarzanie dwóch kroków: 1) wyznaczania parametrów składowej pomiarowej modelu, 2) wyznaczania parametrów składowej strukturalnej (Cassel i in. 1999). Metoda PLS wymaga uporządkowania konstruktów tak, aby dla każdej ich pary wiadomo było, który z nich jest od drugiego „wcześniejszy”, co odpowiada hipotezie na temat przyczynowo interpretowanych zależności między zjawiskami, które konstrukty w modelu reprezentują. Krok 1: Dla każdego konstruktu (zmiennej ukrytej modelu) estymuje się parametry jego wskaźników metodą głównych składowych. Tymczasowe wartości konstruktów są zatem liniowymi funkcjami zmiennych obserwowalnych, przy czym w odróżnieniu od klasycznej techniki PCA, w której wagi wskaź- Skalowanie druk.indb 232 2009-12-09 14:26:07 Wprowadzenie do modelowania strukturalnego 233 ników dobierane są tak, aby zmaksymalizować wariancję zmiennej ukrytej (nazywanej w PCA „składową”), w technice PLS maksymalizowana jest „ilość” odtwarzanego związku (mierzonego kowariancją) pomiędzy konstruktem a innymi konstruktami powiązanymi z nim równaniem strukturalnym. Krok pierwszy polega zatem na wyznaczeniu takich współczynników równania tworzącego konstrukty, aby były one (konstrukty) jak najsilniej ze sobą liniowo skorelowane. Krok 2: W kolejnym kroku metodą najmniejszych kwadratów dla każdej zmiennej ukrytej wyznaczana jest jej regresja ze względu na wszystkie poprzedzające ją w modelu konstrukty. Wyznacza się w niej taki zestaw współczynników ścieżkowych, który zmaksymalizuje odsetek wyjaśnianej w ramach modelu wariancji zmiennych ukrytych. Obydwa kroki są powtarzane aż do osiągnięcia zbieżności. Oprócz wymienionych wyżej zalet, estymacja PLS ma także swoje słabe strony. Z jednej strony oparte na niej predykcje są odporne na skrzywienia rozkładów zmiennych wskaźnikowych, z drugiej jednak estymatory ładunków czynnikowych i współczynników ścieżkowych są w niej znacząco obciążone. Ładunki czynnikowe są zazwyczaj przeszacowane, zaś współczynniki ścieżkowe niedoszacowane (Chin 1995). Kolejną słabością PLS jest brak dobrego kryterium oceny jakości całego modelu, jak i jego elementów (pojedynczych parametrów). PLS polega na iteracyjnym, cyklicznym (aż do osiągnięcia zbieżności) wyznaczaniu parametrów obu składowych modelu, stąd nie zawiera parametru wyrażającego syntetycznie stopień zgodności z rozkładami z prób zarówno całego modelu, jak i jego składników. Tym samym zależności przyczynowe między zjawiskami reprezentowanymi przez konstrukty nie podlegają weryfikacji, a więc badacz nie ma wystarczających narzędzi, aby dokonać falsyfikacji teorii leżącej u podłoża konstrukcji modelu strukturalnego. Skalowanie druk.indb 233 2009-12-09 14:26:08 234 Katarzyna Wądołowska SEM-MLE a SEM-PLS Analiza porównawcza obu metod estymacji została przedstawiona w tabeli 2. Tabela 2. Analiza porównawcza: SEM-MLE a SEM-PLS Kryterium SEM–MLE SEM–PLS Typ modelu przyczynowy predykcyjny Cel estymacja parametrów modelu przyczynowego maksymalizacja wariancji wyjaśnianej w modelu Podejście analiza kowariancji analiza wariancji Podstawy teoretyczne wymaga solidnej teorii leżącej u podłoża analizy jest elastyczny, model może mieć słabe podłoże teoretyczne Założenia o rozkładach parametryczne: wielowymiarowy rozkład normalny nieparametryczne: dopuszcza brak normalności Zależności między zmiennymi nie dopuszcza współliniowości dopuszcza współliniowość obu typów zmiennych Typy wskaźników mierzone na skali interwałowej mierzone na skali interwałowej lub porządkowej Metoda estymacji MLE PCA wraz z OLS Identyfikacja modelu zależy od modelu zawsze zidentyfikowany Wartość predykcyjna niska wysoka Źródło: Opracowanie własne na podstawie Chin 1995, Cassel i in. 1999, Esteves i in. 2002. Skalowanie druk.indb 234 2009-12-09 14:26:08 Wprowadzenie do modelowania strukturalnego 235 Literatura Bollen, K.A. & Long J.S., (1993), Introduction; w: K.A. Bollen & J.S. Long (red.), Testing Structural Equation Models, s. 1–9. Beverly Hills and London: Sage Publications. Bollen, K.A., (1989), Structural Equations with Latent Variables. New York: John Wiley & Sons. Cassel, C., Hackl P. & Westlund A.H., (1999), Robustness of Partial Least-Squares Method for Estimating Latent Variable Quality Structures, „Journal of Applied Statistics”, Vol. 26: 435–446. Chin, W.W., (1995), Partial Least Squares is to LISREL as Principal Components Analysis is to Common Factor Analysis, „Technology Studies”, Vol. 2: 315–319. Esteves, J., Pastor J.A. & Casanovas J., (2002), Using the Partial Least Squares (PLS) Method to Establish Critical Success Factors Interdependence in ERP Implementation Projects. Barcelona: Universidad Politecnica de Catalunya. Fornell, C., Johnson M.D., Anderson E.W., Cha J. & Everitt-Bryant E., (1996), The American Customer Satisfaction Index: Nature, Purpose, and Findings, „Journal of Marketing”, Vol. 60: 7–18. Haavelmo, T., (1943), The Statistical Implications of a System of Simultaneous Equations, „Econometrica”, Vol. 11: 1–12. Jöreskog, K.G., (1969), A General Approach to Confirmatory Maximum Likelihood Factor Analysis, „Psychometrika”, Vol. 34: 183–202. Jöreskog, K.G., (1973), A General Method for Estimating a Linear Structural Equation System; w: A.S. Goldberger & O.D. Duncan (red.), Structural Equation Models in the Social Sciences, s. 85–112. New York: Academic Press. Jöreskog, K.G., (1993), Testing Structural Equation Models; w: K.A. Bollen & J.S. Long (red.), Testing Structural Equation Models, s. 294–316. Beverly Hills and London: Sage Publications. Jöreskog, K.G. & Sorböm, D., (1994), Prelis 2 User’s Guide. Lawrence Erlbaum Assoc Inc., Mahwah, USA. Kaplan, D., (2009), Structural Equation Modeling: Foundations and Extensions. Second Edition, Sage University Paper series on Advanced Skalowanie druk.indb 235 2009-12-09 14:26:08 236 Katarzyna Wądołowska Quantitative Techniques in the Social Sciences, 10, Beverly Hills and London: Sage Publications. Long, J.S., (1983), Covariance Structure Models: An Introduction to LISREL. Sage University Paper series on Quantitative Application in the Social Sciences, 07–034, Beverly Hills and London: Sage Publications. Sharma, S., (1996), Applied Multivariate Techniques. New York: John Wiley & Sons. Spearman, C., (1904), General Intelligence, Objectively Determined and Measured, „American Journal of Psychology”, Vol. 15: 201–293. Wold, H., (1973), Nonlinear Iterative Partial Least Squares (NIPALS) Modelling: Some Current Developments; [w:] P.R. Krishnaiah (red.), Multivariate Analysis, s. 383–407. New York: Academic Press. Wright, S., (1918), On the Nature of Size Factors, „Genetics”, Vol. 3: 367–374. Wykaz skrótów EFA Exploratory Factor Analysis Eksploracyjna analiza czynnikowa LISREL Linear Structural Relationships pakiet statystyczny do estymacji SEM metodą MLE MLE Maximum Likelihood Estimators Estymatory największej wiarogodności OLS Ordinary Least Squares Metoda najmniejszych kwadratów PCA Principal Components Analysis Analiza głównych składowych PLS Partial Least Squares Metoda częściowych najmniejszych kwadratów SEM Structural Equation Modeling Modelowanie równań strukturalnych Skalowanie druk.indb 236 2009-12-09 14:26:08