Skalowanie druk.indb

Transkrypt

Katarzyna Wądołowska*
Wprowadzenie do modelowania
strukturalnego
Geneza
Modelowanie równań strukturalnych (nazywane dalej SEM, od Structural Equation Modeling) jest metodą opisu zależności między wieloma zmiennymi stosowaną w analizie złożonych, zazwyczaj przyczynowo interpretowanych, modeli zjawisk społecznych oraz w złożonych modelach skalowania. Należy do obszernej klasy modeli liniowych, w których zakłada się, że
zmienne statystyczne, przy użyciu których model jest budowany, są mierzone na skali co najmniej interwałowej, zaś zależności między elementami modelu mają charakter liniowy. Jak się dalej okaże, w najpopularniejszej odmianie modelowania strukturalnego, przy estymacji jego parametrów konieczne
będzie ponadto przyjęcie założenia, że w populacji, którą model ma opisywać, zmienne te mają rozkłady normalne.
Modelowanie strukturalne jest syntezą dwóch metod:
− analizy czynnikowej, wyrosłej z pomiarowych potrzeb psychologii i psychometrii,
− modeli równań jednoczesnych, znanych również jako analiza ścieżkowa, rozwiniętych głównie w ekonometrii, lecz stosowanych również w innych naukach społecznych do opisu przyczynowo interpretowanych relacji między zjawiskami.
Katarzyna Wądołowska jest absolwentką ekonometrii i socjologii na Uniwersytecie
Warszawskim. Jej prace magisterskie traktowały o modelach nieparametrycznych oraz
wykorzystaniu modeli równań strukturalnych z estymacją PLS w skalowaniu wielowymiarowych cech ukrytych. Obecnie pracuje w CBOS jako analityk. Interesuje się m.in.
modelowaniem strukturalnym i jego zastosowaniem w skalowaniu ([email protected]).
*
Skalowanie druk.indb 203
2009-12-09 14:25:53
204
Katarzyna Wądołowska
Omówimy teraz pokrótce oba źródła inspiracji, których syntezą jest metodologia SEM.
Analiza czynnikowa
Początki analizy czynnikowej, w formie modelu wspólnych czynników,
przypisuje się głównie pracy Spearmana (1904) zajmującej się pomiarem
i opisem struktury zdolności umysłowych (Kaplan 2009: 2–3). Zakładał on,
że obserwowalne zależności statystyczne między różnymi testami zdolności
umysłowych mogą być wyjaśnione przez ogólny czynnik zdolności wspólny
dla wszystkich testów oraz specyficzne czynniki zdolności powiązane z każdym z testów.
Celem analizy czynnikowej jest ustalenie udziału obojga rodzajów czynników (traktowanych jako zmienne ukryte), w zmienności obserwowalnych
testów1.
Ustalenie udziałów czynników wspólnych i swoistych w zmienności obserwowalnych wskaźników pozwala na oszacowanie ich wartości. Od tego
momentu zmienne ukryte stają się konstruktami.
Czynnikowej składowej modelu strukturalnego, nazywanej składową pomiarową, towarzyszy składowa przyczynowa, w której relacje między konstruktami opisuje się przy użyciu równań jednoczesnych. Równania takie są
domeną analizy ścieżkowej.
Analiza ścieżkowa
Druga ze składowych modeli strukturalnych, analiza ścieżkowa, ma swe
początki w pracach Sewalla Wrighta (1918). Jego głównym wkładem było
przedstawienie za pomocą diagramu ścieżkowego sposobu, w jaki korelacje
pomiędzy zmiennymi mogą być powiązane z parametrami modelu (Kaplan
2009: 3–4). Następnie pokazał on, jak równania modelu można wykorzystać
do estymacji efektu bezpośredniego, pośredniego oraz całkowitego jednej
zmiennej na inną.
Podstawy analizy czynnikowej szczegółowo omawia tekst Andrzeja Szarkowskiego, zaś praktyczne problemy jej stosowania jako narzędzia wspomagającego skalowanie
porusza artykuł Mariusza Grzędy (przyp. – HB).
1
2009-12-09 14:25:53
Wprowadzenie do modelowania strukturalnego
205
Druga linia rozwoju analizy ścieżkowej wiąże się z ekonometrycznymi
pracami Haavelmo (1943). Był on zainteresowany modelowaniem współzależności pomiędzy zmiennymi ekonomicznymi za pomocą systemu równań
jednoczesnych, w którym grupę zmiennych zależnych wyjaśnia się za pomocą innych zmiennych zależnych oraz zmiennych niezależnych zaproponowanych w modelu.
Modelowanie strukturalne obejmuje oba rodzaje analizy ścieżkowej i pozwala na analizę równań jednoczesnych z wieloma zmiennymi zależnymi
(Bollen i Long 1993).
SEM
Synteza czynnikowego i ścieżkowego podejścia do modelowania złożonych zjawisk społecznych w jedną spójną metodę jest dziełem Karla Jöreskoga (1973) i jego uczniów. Wedle Jöreskoga model równań strukturalnych
składa się z dwóch części:
− części pomiarowej, łączącej zmienne obserwowalne z ukrytymi poprzez
konfirmacyjny model pomiarowy
− oraz części strukturalnej, łączącej ze sobą zmienne ukryte za pomocą
systemu równań jednoczesnych.
Ważnym elementem modelu strukturalnego są błędy pomiaru dla wszystkich typów zmiennych występujących w modelu.
W modelowaniu strukturalnym w wersji Jöreskoga szacowanie parametrów modelu odbywa się przy użyciu estymatorów największej wiarogodności (Maximum Likelihood Estimators MLE). W przypadku, gdy model nie
zakłada błędów pomiaru dla zmiennych obserwowalnych, redukuje się do
modelu równań jednoczesnych rozwiniętego w ekonometrii.
Podsumowując, równania strukturalne zajmują się opisem zależności pomiędzy zmiennymi obserwowalnymi przy użyciu mniejszej liczby zmiennych ukrytych. Relacje między obserwowalnymi wskaźnikami a konstruktami oraz między
konstruktami opisywane są przy użyciu parametrów strukturalnych modelu. Są
one hipotezą, przy użyciu której usiłuje się jak najdokładniej zrekonstruować zależności między zmiennymi obserwowalnymi. Jej testowanie polega na weryfikacji hipotez na temat parametrów pomiarowych (czynnikowych) oraz strukturalnych (ścieżkowych) składowej modelu (Jöreskog 1993). Test taki polega, naj-
2009-12-09 14:25:53
206
ogólniej biorąc, na zbadaniu, czy zależności między zmiennymi obserwowalnymi zrekonstruowane przy użyciu oszacowanych uprzednio parametrów modelu
są bliskie zależnościom empirycznie zarejestrowanym. Przeprowadzenie takiej
rekonstrukcji wymaga przyjęcia szeregu założeń na temat:
1) relacji między obserwowalnymi wskaźnikami a konstruktami,
2) relacji między konstruktami,
3) relacji między błędami pomiaru konstruktów i wskaźników.
Założenia modelowania strukturalnego
Założenia modelu mają dwa źródła: teoretyczne i techniczne.
Najważniejszym z nich są przesłanki teoretyczne, z których wywodzi się
zarówno hipotezy na temat pomiarowej, jak i strukturalnej składowej układu
równań strukturalnych. Hipotezy te specyfikują, które z parametrów przyjmują ustaloną wartość (najczęściej zero) i które z wartości parametrów trzeba oszacować na podstawie danych empirycznych.
Drugi rodzaj założeń nie wynika z teorii zjawiska, które model ma opisywać, lecz z przyczyn technicznych. Założenia te w większości przypadków
opisują zależności między błędami pomiaru (podobnie jak założenia o czynnikach swoistych w analizie czynnikowej) i choć wydają się naturalne
(a przynajmniej niesprzeczne z teorią modelowanego zjawiska) przyjmowane są po to, aby zadanie oszacowania pozostałych, „wolnych” parametrów
modelu, było zadaniem wykonalnym.
Przesłanki teoretyczne
Zmienne obserwowalne i ukryte
Wiele z teorii konstruowanych w naukach społecznych formułowane jest
przy użyciu zmiennych, których bezpośrednia obserwacja czy pomiar nie są
możliwe (Jöreskog 1993). Przykłady stanowią inteligencja, alienacja, dyskryminacja, konserwatyzm, anomia, satysfakcja czy postawy. Pomiaru takich hipotetycznych konstruktów dokonuje się zatem pośrednio za pomocą jednej
lub więcej zmiennych obserwowalnych, które są najczęściej odpowiedziami
na pytania kwestionariusza.
2009-12-09 14:25:53
207
Zmienne niezależne i zależne
Definiując hipotetyczne konstrukty badacz specyfikuje w teorii, w jaki
sposób są one ze sobą powiązane. Obejmuje to klasyfikację konstruktów na
zależne i niezależne. Dla każdego konstruktu zależnego określa się zależności z pozostałymi konstruktami: ich znak oraz wielkość efektu bezpośredniego jednego konstruktu na drugi. Ewentualne zależności pomiędzy konstruktami niezależnymi traktuje się natomiast jako „dane” i pozostawia się je poza analizą (Bollen 1989: 12). Ponieważ konstrukty teoretyczne są nieobserwowalne, założenia nie mogą być testowane bezpośrednio. W tym celu dla
każdego konstruktu definiuje się zbiór empirycznie mierzalnych wskaźników
i test założeń przeprowadza się porównując obserwowalną macierz kowariancji między wskaźnikami z macierzą kowariancji przewidywaną przez
model.
Założenia pomiarowe
Zależności pomiędzy konstruktami składają się na część strukturalną modelu, zaś te pomiędzy wskaźnikami i ich konstruktami stanowią jego część
pomiarową. Zwykle przyjmuje się, że zależności pomiędzy zmiennymi
w modelu mają charakter liniowy lub bliski liniowemu2, a więc zarazem, że
wskaźniki mierzone są na skali interwałowej lub ilorazowej3.
Przesłanki techniczne
Czynniki nieuwzględnione w modelu
W modelowaniu równań strukturalnych nie oczekuje się, iż zależności
pomiędzy zmiennymi będą w stanie całkowicie wyjaśnić zróżnicowanie
zmiennych zależnych. Najczęściej konstrukty niezależne wyjaśniają jedynie
Zdarzało się jednak, że analizę strukturalną przeprowadzano na modelach nieliniowych (Jöreskog 1993).
3
Jeśli natomiast wskaźniki są mierzone na skali porządkowej, przyjmuje się wtedy
najczęściej istnienie zmiennych ciągłych tkwiących u podstaw każdej z nich, a następnie formułuje się model pomiarowy w oparciu o owe zmienne ciągłe używając jako danych empirycznych korelacji polichorycznych odpowiadających współczynnikom korelacji liniowej między zmiennymi porządkowymi.
2
2009-12-09 14:25:53
208
część wariancji i kowariancji konstruktów zależnych. Przyjmuje się wówczas, że istnieją jakieś inne zmienne powiązane z konstruktami zależnymi,
które z różnych przyczyn nie zostały w modelu uwzględnione. Wagę takich
nieujętych w analizie zmiennych reprezentują błędy strukturalne, po jednym
dla każdego konstruktu. Zatem błędy strukturalne wskazują na wariancję
i kowariancję zmiennych zależnych niewyjaśnioną poprzez zmienne niezależne w modelu (Jöreskog 1993).
Zależności między błędami
Fundamentalnym założeniem modeli strukturalnych jest, że błędy strukturalne nie są skorelowane ani ze sobą (ich kowariancja wynosi zero), ani ze
zmiennymi poprzedzającymi je w modelu.
Podobne błędy, nazywane błędami pomiaru, pojawiają się w modelu pomiarowym. Interpretuje się je jako sumę czynników specyficznych oraz losowych błędów pomiaru w zmiennych obserwowalnych (Jöreskog 1993). Z założenia błędy pomiaru nie powinny być skorelowane ani ze sobą, ani ze
wskaźnikami „obcymi”. Jeśli są, oznacza to, że takie wskaźniki współdefiniują coś jeszcze poza konstruktem, którego są wskaźnikami.
Identyfikacja modelu
Istotnym elementem każdego modelowania statystycznego jest wykonalność zadania estymacji parametrów. W modelowaniu strukturalnym problem ten nazywa się problemem identyfikacji modelu, czyli możliwości
znalezienia unikalnych oszacowań wartości jego parametrów (Kaplan
2009: 18). Warunkiem koniecznym aczkolwiek niewystarczającym identyfikacji, zaproponowanym przez Bollena (1989: 328) jest spełnianie przez
model warunku
t<
1
2
( p + q )( p + q + 1)
(1)
gdzie t wskazuje na liczbę parametrów, które mają być oszacowane, zaś p i q
to całkowite liczby odpowiednio zmiennych zależnych i niezależnych w modelu. Gdy zachodzi równość, wówczas model jest dokładnie zidentyfikowany. Jeżeli t jest mniejsze od ½(p + q)(p + q + 1) model jest „przeidentyfikowany”, jeśli natomiast jest większe – model jest niezidentyfikowany.
2009-12-09 14:25:53
209
Trafność pomiarowa modelu
Testowanie modelu strukturalnego – a więc testowanie hipotetycznej
struktury zależności przyczynowych pomiędzy konstruktami – może być bez
znaczenia, jeśli nie założy się najpierw istotności modelu pomiarowego
(Jöreskog 1993). Dlatego ważne jest, aby analizę równań strukturalnych zacząć od zweryfikowania zależności pomiędzy konstruktami oraz wybranymi
dla nich wskaźnikami. Jeśli okaże się, że wyselekcjonowane wskaźniki nie
reprezentują przypisanych im zmiennych ukrytych, wówczas należy zmienić
skonstruowaną teorię, zanim zostanie ona poddana analizie. Użyteczne może
się okazać przeprowadzenie analizy dla każdego konstruktu z osobna, następnie dla par konstruktów, a na koniec dla wszystkich konstruktów jednocześnie dopuszczając istnienie korelacji pomiędzy zmiennymi. Inaczej mówiąc,
macierz kowariancji pomiędzy konstruktami nie powinna mieć ograniczeń.
Model strukturalny – prezentacja krok po kroku
Pokażemy teraz krok po kroku, zaczynając od przypadków najprostszych,
jak w języku modeli strukturalnych formułuje się hipotezy na temat modelowanych zjawisk społecznych, jakie założenia temu towarzyszą oraz w jaki
sposób estymuje się parametry modeli.
Model ścieżkowy
Specyfikacja
Założymy teraz, że składniki strukturalnej składowej modelu (konstrukty) są zmiennymi obserwowalnymi, przez co estymacja składnika pomiarowego jest zbędna. Taki model przedstawia zależności pomiędzy zmiennymi
zależnymi i zmiennymi niezależnymi. Zmienne zależne „wyjaśnia się” zakładając, że są one zależne przyczynowo od innych zmiennych zależnych
oraz/lub zmiennych niezależnych (Long 1983: 25–28).
Niech:
− η będzie wektorem zmiennych zależnych o wymiarach (r × 1)
− ξ będzie wektorem zmiennych niezależnych o wymiarach (s × 1)
2009-12-09 14:25:53
210
Prosty model strukturalny bez części pomiarowej definiowany jest przez
układ równań, wedle którego każda ze zmiennych zależnych η jest liniową
funkcją zmiennych niezależnych ξ, innych zmiennych zależnych η oraz błędów strukturalnych ζ. W notacji macierzowej układ ten ma następującą postać
Ș = īȟ + ǺȘ + ȗ
(2)
gdzie:
− Γ jest macierzą współczynników strukturalnych pomiędzy zmiennymi
zależnymi i niezależnymi o wymiarach (r × s)
− Β jest macierzą współczynników strukturalnych pomiędzy zmiennymi
zależnymi o wymiarach (r × r)
− wielkość niewyjaśnionej wariancji zmiennej zależnej jest traktowana jako błąd w równaniach zwany błędem strukturalnym i oznaczana przez
wektor ζ o wymiarach (r × 1)
Uwzględnienie błędów strukturalnych wskazuje na fakt, że posługując się
jedynie zbiorem zależności uwzględnionych w równaniu (2) nie da się całkowicie wyjaśnić wariancji zmiennych zależnych η.
Operacjonalizacja hipotez na temat modelowanego zjawiska polega na
wskazaniu, dla każdej zmiennej modelu, zbioru tych zmiennych, od których
ona liniowo zależy i tych, od których jest liniowo niezależna. Praktycznie
operacjonalizacja polega na wskazaniu, które ze współczynników równania
(2) przyjmują dla konkretnych zmiennych wartość zero, a które mają niezerowe wartości wymagające oszacowania. Zerowa wartość współczynnika
równania strukturalnego dla jakiejś pary zmiennych odpowiada hipotezie
o braku zależności przyczynowych między reprezentowanymi przez te
zmienne zjawiskami, które model ma opisywać:
− przyrównanie (i,j)-tego elementu macierzy Γ do zera (γij = 0) oznacza zatem, że zjawisko reprezentowane przez zmienną niezależną ξj nie jest
„przyczyną” zjawiska reprezentowanego przez zmienną zależną ηi
− jeśli przyrówna się (i,j)-ty element macierzy Β do zera (βij = 0), wówczas
przyjmuje się, że zjawisko reprezentowane przez zmienną zależną ηi nie
jest „przyczyną” zjawiska reprezentowanego przez zmienną zależną ηj
Dodatkowo zakłada się, że żadne ze zjawisk reprezentowanych przez
zmienne zależne η nie jest „przyczyną” innego ze zjawisk reprezentowanych
2009-12-09 14:25:54
211
przez te zmienne. Odpowiada to założeniu, że wszystkie diagonalne elementy macierzy Β (reprezentującej relacje między zjawiskami „zależnymi”) są
równe zero.
Przykład
Idea modelu strukturalnego może być przedstawiona za pomocą diagramu stanowiącego graficzną reprezentację systemu równań jednoczesnych.
Wskazuje on na wszystkie ścieżki występujące pomiędzy zmiennymi w modelu, włączając w to także błędy strukturalne. Rozważmy przykład, w którym zakłada się istnienie zależności pomiędzy trzema zjawiskami: postawą,
zamiarem postąpienia i rzeczywistym zachowaniem, w którym4:
− postawa reprezentowana jest przez zmienną ξ1
− zamiar postąpienia reprezentowany jest przez zmienną η1
− rzeczywiste zachowanie reprezentowane jest przez zmienną η2
Diagram ścieżkowy obrazujący powyższe zależności przedstawia się następująco:
γ 21
ȟ1
γ 11
β 21
Ș1
ζ1
Ș2
ζ2
Rysunek. 1. Diagram ścieżkowy
Konstrukty są na diagramie przedstawione za pomocą kół. Strzałki pomiędzy konstruktami reprezentują zaś kierunki zależności i są nazywane
ścieżkami strukturalnymi (stąd przedstawiony model nazywany jest modelem ścieżkowym). To właśnie tym ścieżkom przyporządkowane są współczynniki strukturalne. Przedstawione zależności sugerują, że postawa determinuje zamiary, te zaś w następstwie oddziaływują na rzeczywiste zachowanie, które jest także bezpośrednim efektem postawy. Formalnie model strukturalny reprezentowany jest przez następujące równania
4
Przykład pochodzi z Sharmy (1996: 419).
2009-12-09 14:25:54
212
η1 = γ 11ξ1 + ζ 1
(3)
η2 = γ 21ξ1 + β 21η1 + ζ 2
(4)
w postaci macierzowej zapisane jako
Ș
=
ī
ȟ+
Ǻ
Ș + ȗ
⎛ η1 ⎞ ⎛ γ 11 ⎞
⎛ 0 0 ⎞⎛ η1 ⎞ ⎛ ζ 1 ⎞
⎜ ⎟ = ⎜ ⎟ ξ1 + ⎜
⎟⎜ ⎟ + ⎜ ⎟
⎝η 2 ⎠ ⎝ γ 21 ⎠
⎝ β 21 0 ⎠⎝η2 ⎠ ⎝ ζ 2 ⎠
(5)
Pierwsze równanie wskazuje na zależność pomiędzy postawą (ξ1) i zamierzonym zachowaniem (η1). Równanie drugie przedstawia zależność pomiędzy postawą (ξ1), zamierzonym zachowaniem (η1) oraz rzeczywistym zachowaniem (η2).
Estymacja
Równanie strukturalne (2) można przekształcić w następujący sposób
Șç −−BȘ
Bç == īȟ
Ãî ++ȗæ
(6)
((IçI--=BBÃî
))Ș += æīȟ + ȗ
-1
-1
B )-1 īȟ
Ãî ++ (II--B
B )-1 ȗæ
Șç == ((II--B
)
( )
(7)
(8)
Otrzymana postać nazywana jest zredukowaną formą modelu równań
strukturalnych, jako że ścieżki strukturalne są w niej zredukowane do zbioru
równań, w których zmienne zależne są funkcjami tylko i wyłącznie zmiennych
niezależnych oraz błędów strukturalnych (Long 1983: 33). Zredukowana forma układu równań jest niezbędna dla sformułowania warunków identyfikacji
modelu, to znaczy wykonalności zadania estymacji jego parametrów.
Aby uzyskać spójną estymację parametrów modelu należy przyjąć następujące założenia techniczne:
Z1 Wszystkie zmienne wyrażone są jako odchylenia od swoich średnich
E ( Ș ) = E ( ȗ ) = 0 oraz E ( ȟ ) = 0
Z2 Błędy strukturalne są nieskorelowane z konstruktami niezależnymi
w modelu
E ( ȟȗ ) = 0 lub równowaĪnie E ( ȗȟ ) = 0
2009-12-09 14:25:54
213
Z3 Błędy strukturalne są nieskorelowane między sobą
Z4 Macierz (Ι - Β)-1 istnieje, co po prostu oznacza, że żadne z równań strukturalnych nie jest zbyteczne
Przyjmując powyższe założenia można zdefiniować istotne w estymacji
macierze kowariancji:
− kowariancja błędów strukturalnych ζ jest symetryczną macierzą Ψ
o wymiarach (r × r); ponieważ błędy strukturalne są mierzone jako odchylenia od średnich, zatem macierz ta ma postać
Ȍ = E ( ȗȗ )
(9)
− kowariancja zmiennych niezależnych ξ jest symetryczną macierzą Φ
o wymiarach (s × s)
(10)
ĭ = E ( ȟȟ )
Diagonalna macierzy Ψ jest nieznana, natomiast jej elementy poza główną przekątną są z założenia równe zero.
Model pomiarowy
Specyfikacja
W poprzednim paragrafie założyliśmy, iż zmienne η i ξ są obserwowalne i mogą być mierzone bez błędów pomiaru. W rzeczywistości wiele zmiennych analizowanych w naukach społecznych jest jednak nieobserwowalnych. Zależności pomiędzy zmiennymi nieobserwowalnymi (ukrytymi)
a odpowiadającymi im obserwowalnymi wskaźnikami opisuje pomiarowa
składowa modeli równań strukturalnych. Składa się ona z pary modeli czynnikowych, w których każdy czynnik reprezentuje konstrukt definiowany za
pomocą odpowiednich wskaźników.
Podobnie jak w modelu ścieżkowym, także tu w układzie równań strukturalnych obecne są dwie grupy zmiennych (teraz – zmiennych ukrytych):
− grupa zmiennych niezależnych opisywana przez wektor ξ zawierający parametry dla s nieobserwowalnych konstruktów wskazywanych przez q
obserwowanych wskaźników opisywanych przez wektor x
− grupa zmiennych zależnych opisywana przez wektor η zawierający parametry dla r nieobserwowalnych konstruktów wskazywanych przez p obserwowalnych wskaźników opisywanych przez wektor y
2009-12-09 14:25:56
214
Zależności pomiędzy konstruktami i ich wskaźnikami przedstawia para
równań czynnikowych
x = ȁ xȟ + į
(11)
(12)
y = ȁy Ș + İ
W uproszczeniu (pominięto swoiste składowe wskaźników typu x i y) pomiarową wersję modelu strukturalnego przedstawić można w następujący
sposób:
Zmienne zaleĪne
Zmienne niezaleĪne
y1
x1
x2
η1
...
ξ1
...
...
...
ξs
xq
η2
...
ηr
y2
...
...
...
...
...
...
yp
Rysunek 2. Schemat pomiarowego modelu równań strukturalnych
gdzie:
− x reprezentuje wektor o wymiarach (q × 1) wskaźników konstruktów
niezależnych ξ
− y reprezentuje wektor o wymiarach (p × 1) wskaźników konstruktów
zależnych η
− Λx jest macierzą o wymiarach (q × s) ładunków czynnikowych konstruktów niezależnych ξ z odpowiadającymi im wskaźnikami x, w której ładunek xi na ξj zapisuje się jako λijx
− δ jest wektorem o wymiarach (q × 1) błędów pomiaru wskaźników x,
zwanych też czynnikami swoistymi x
− Λy jest macierzą o wymiarach (p × r) ładunków czynnikowych konstruktów zależnych η z odpowiadającymi im wskaźnikami y, w której ładunek
yi na ηj zapisuje się jako λijy
− ε jest wektorem o wymiarach (p × 1) błędów pomiaru wskaźników y,
zwanych też czynnikami swoistymi y
Równania (11), (12) odpowiadają znanemu z analizy czynnikowej założeniu, że obserwowalne wskaźniki typu x lub y są liniowymi funkcjami
2009-12-09 14:25:56
215
wspólnych konstruktów (ξ lub η odpowiednio) oraz czynników swoistych (δ dla
x oraz ε dla y).
Estymacja
Aby uzyskać spójną estymację parametrów modelu należy przyjąć następujące założenia:
Z1 Wszystkie zmienne mierzone są jako odchylenia od ich średnich
E ( x ) = E ( į ) = 0 , E ( ȟ ) = 0 , E ( y ) = E ( İ ) = 0 oraz E ( Ș ) = 0
Z2 Dla każdego z równań konstrukty i błędy pomiaru nie są ze sobą skorelowane, w szczególności zakłada się, że
E ( ȟį ) = 0 lub równowaĪnie E ( įȟ ) = 0 oraz E ( Șİ ) = 0 lub E ( İȘ ) = 0
Z3 Błędy pomiaru nie są skorelowane z konstruktami w innych równaniach
E ( ȟİ ) = 0 lub E ( İȟ ) = 0 , E ( Șį ) = 0 lub E ( įȘ ) = 0
Z4 Błędy pomiaru nie są skorelowane pomiędzy równaniami
E ( įİ ) = 0 lub równowaĪnie E ( İį ) = 0
Z5 Wskaźniki niezależne wektora x nie są skorelowane z konstruktami zależnymi η, zaś wskaźniki zależne wektora y nie są skorelowane z konstruktami niezależnymi ξ
Z powyższych założeń wynikają następujące konsekwencje dla kowariancji składników modelu:
− macierz kowariancji Φ konstruktów niezależnych ξ jest symetryczną macierzą o wymiarach (s × s)
− macierz kowariancji COV(η) konstruktów zależnych η jest symetryczną
macierzą o wymiarach (r × r)
− macierz kowariancji Θδ czynników swoistych δ jest symetryczną macierzą o wymiarach (q × q), niekoniecznie diagonalną5
− macierz kowariancji Θε czynników swoistych ε jest symetryczną macierzą o wymiarach (p × p), niekoniecznie diagonalną
Macierz diagonalna poza główną przekątną ma wartość zero. Zakłada się więc,
że czynniki swoiste mogą być ze sobą skorelowane. Założenia tego nie przyjmuje się
w standardowym modelu czynnikowym.
5
2009-12-09 14:25:57
216
Operacjonalizacja pomiarowej wersji modelu polega na narzuceniu ograniczeń na parametry macierzy: Λx, Λy, Φ, Θδ oraz Θε. Wśród nich znajdują
się ograniczenia dotyczące pojedynczych parametrów (narzucenie im stałej
wartości) oraz ograniczenia dotyczące grupy parametrów (przyrównanie ich
do siebie).
W ogólnym modelu pomiarowym zmienne obserwowalne x i y mogą być
ze sobą oraz między sobą skorelowane. Kowariancję obserwowalnych
wskaźników x i y zawiera macierz Σxy o wymiarach (q × p), której (i,j)-ty element wskazuje na kowariancję pomiędzy wskaźnikami xi oraz yj.
Podobnie, konstrukty niezależne ξ i konstrukty zależne η mogą być ze sobą skorelowane. Ich kowariancje zawierają się w macierzy COV(ξ,η) o wymiarach (s × r) oraz w macierzy COV(η,ξ) o wymiarach (r × s).
Model pomiarowo-ścieżkowy
Gdy do modelu ścieżkowego dodać część pomiarową, powstanie model
pomiarowo-ścieżkowy. Pozwala on w prosty sposób zilustrować ideę podziału układu równań strukturalnych na część strukturalną i pomiarową. Jego graficzną reprezentacją jest diagram na rysunku 3. Zgodnie z konwencją przyjmowaną w modelowaniu strukturalnym zmienne nieobserwowalne są na diagramie oznaczane jako koła, zaś zmienne obserwowalne jako kwadraty.
γ 21
ζ1
γ 11
ȟ1
Ș1
ζ2
β 21
Ș2
Model strukturalny
Model pomiarowy
λ11x
x
λ21
λ31x
λ11y
λ21y λ31y
λ42y
λ52y
λ62y
x1
x2
x3
y1
y2
y3
y4
y5
y6
δ1
δ2
δ3
ε1
ε2
ε3
ε4
ε5
ε6
Rysunek 3. Model strukturalny z konstruktami nieobserwowalnymi6
6
Przykład cytujemy za Sharma 1996: 427.
2009-12-09 14:25:58
217
Powyższy rysunek można koncepcyjnie podzielić na dwie części:
1. Model strukturalny wskazujący na zależności pomiędzy zmiennymi
ukrytymi, reprezentowany przez diagram ścieżkowy i równania strukturalne tożsame z tymi przedstawionymi dla modelu wyłącznie ze zmiennymi obserwowalnymi,
2. Model pomiarowy wskazujący na zależności pomiędzy konstruktami
a ich wskaźnikami, reprezentowany przez następujące równania
x1 = λ11x ξ1 + δ1
x2 = λ21x ξ1 + δ 2
x3 = λ31x ξ1 + δ 3
y1 = λ11yη1 + ε1
y2 = λ21y η1 + ε 2
y3 = λ31yη1 + ε 3
y4 = λ42y η 2 + ε 4
y5 = λ52y η 2 + ε 5
y6 = λ62y η 2 + ε 6
(13)
(14)
w postaci macierzowej zapisane jako
x
= ȁx ȟ + į
x
⎛ x1 ⎞ ⎛ λ11 ⎞
⎛ δ1 ⎞
⎜ ⎟ ⎜ x⎟
⎜ ⎟
⎜ x2 ⎟ = ⎜ λ21 ⎟ ξ1 + ⎜ δ 2 ⎟
⎜ x ⎟ ⎜λx ⎟
⎜δ ⎟
⎝ 3 ⎠ ⎝ 31 ⎠
⎝ 3⎠
oraz
y
=
ȁy
(15)
Ș + İ
⎛ y1 ⎞ ⎛ λ11y 0 ⎞
⎛ ε1 ⎞
⎟
⎜ ⎟ ⎜ y
⎜ ⎟
⎜ y2 ⎟ ⎜ λ21 0 ⎟
⎜ε2 ⎟
⎜ y3 ⎟ ⎜ λ31y 0 ⎟ ⎛ η1 ⎞ ⎜ ε 3 ⎟
⎟
⎜ ⎟=⎜
⎟+⎜ ⎟
y ⎜
⎜ y4 ⎟ ⎜ 0 λ42 ⎟ ⎝η2 ⎠ ⎜ ε 4 ⎟
⎜ y5 ⎟ ⎜ 0 λ y ⎟
⎜ ε5 ⎟
52
⎟
⎜⎜ ⎟⎟ ⎜⎜
⎜⎜ ⎟⎟
y ⎟
⎝ y6 ⎠ ⎝ 0 λ62 ⎠
⎝ ε6 ⎠
(16)
Analiza kowariancji modelu ścieżkowego
Analiza kowariancji modelu strukturalnego ma na celu wyprowadzenie
z jego założeń konsekwencji dla kowariancji zmiennych obserwowalnych.
Porównanie tych konsekwencji z zarejestrowanymi empirycznie zależnościami między zmiennymi obserwowalnymi będzie podstawą do udzielenia od-
2009-12-09 14:25:58
218
powiedzi na pytanie, czy model strukturalny zjawiska jest wystarczająco
zgodny z danymi empirycznymi, czy też należy go – jako hipotezę na temat
rzeczywistości – odrzucić, gdyż dane empiryczne są z nimi niezgodne. Prześledzimy dalej, co z założeń modelu wynika na temat zależności (kowariancji) między jego elementami.
Analizę struktury kowariancji modelu rozpocznijmy od ponownego założenia o obserwowalności zmiennych ukrytych. Pomoże to zrozumieć komponent strukturalny kowariancji w modelu.
Niech η będzie wektorem zmiennych zależnych, zaś ξ wektorem zmiennych niezależnych. Model zakłada powiązanie tych zmiennych ze sobą następującym systemem liniowych równań strukturalnych zapisanych w zredukowanej postaci macierzowej
Ș = ( I - B ) īȟ + ( I - B ) ȗ
-1
-1
(17)
Macierz kowariancji zmiennych zależnych
Zgodnie z definicją, macierz kowariancji konstruktów zależnych η jest
równa
COV ( Ș ) =E ( ȘȘ ) − E ( Ș ) E ( Ș )
(18)
Z założeń modelu wynika, że E(η) = 0, zatem
COV ( Ș ) =E ( ȘȘ )
(19)
Korzystając ze zredukowanej formy modelu równań strukturalnych
otrzymujemy
⎡
⎤
-1
-1
-1
-1
COV ( Ș ) = E ( ȘȘ ) = E ⎢ ( I - B ) īȟ + ( I - B ) ȗ ( I - B ) īȟ + ( I - B ) ȗ ⎥
⎣
⎦
(
(
)(
)(
)
)
-1
-1
-1
-1
= E ⎢⎡ ( I - B ) īȟȟ ī ( I - B ) + ( I - B ) īȟȗ ( I - B ) +
⎣
-1
-1
-1
-1
( I - B ) ȗȟ ī ( I - B ) + ( I - B ) ȗȗ ( I - B ) ⎤⎥
⎦
(
)(
)
(20)
Po skorzystaniu z założenia, że E(ξζ`) = 0 oraz wzorów na kowariancję
błędów strukturalnych Ψ = E(ζζ`) i kowariancję zmiennych niezależnych
Φ = E(ξξ`) otrzymujemy
2009-12-09 14:25:59
219
COV ( Ș ) = ( I - B ) īĭī ( I - B ) + ( I - B ) Ȍ ( I - B )
-1
= (I - B)
-1
-1
( īĭī
+ Ȍ )( I - B )
-1
-1
(21)
-1
Zatem kowariancja zmiennych zależnych w powyższym modelu jest
funkcją parametrów strukturalnych Γ i (I - B)-1 oraz kowariancji zmiennych
niezależnych Φ i kowariancji błędów strukturalnych Ψ (Long 1983: 33).
Macierze kowariancji zmiennych niezależnych i zależnych
Kowariancje pomiędzy ξ i η wyznaczane są podobnie. Z założeń modelu
E(ξ) = 0 i E(η) = 0 wynika, że COV(η,ξ) = E(ηξ`). Ponownie korzystając ze
zredukowanej formy modelu równań strukturalnych można wyznaczyć szukaną macierz kowariancji
(
)
-1
-1
COV ( Ș, ȟ ) = E ( Șȟ ) = E ⎡ ( I - B ) īȟ + ( I - B ) ȗ ȟ ⎤
⎣
⎦
-1
-1
= E ⎡( I - B ) īȟȟ + ( I - B ) ȗȟ ⎤
⎦
⎣
(22)
= ( I - B ) īĭ
gdzie ostatnia równość wynika z założenia, że E(ζξ`) = 0 oraz definicji kowariancji zmiennych niezależnych E(ξξ`) = Φ. Analogicznie można otrzymać
następującą macierz
-1
(23)
COV ( ȟ, Ș ) = E ( ȟȘ ) = ĭī ( I - B )
-1
Macierz kowariancji zmiennych η oraz ξ
Uzyskane wzory kowariancji pozwalają na zdefiniowanie macierzy kowariancji Σ zawierającej wariancje i kowariancje pomiędzy zmiennymi η
oraz ξ
-1
-1
⎡ COV ( Ș ) COV ( Ș,ȟ ) ⎤ ⎡⎢( I - B ) ( īĭī + Ȍ )( I - B )
Ȉ=⎢
⎥=
-1
⎣COV ( ȟ, Ș) COV ( ȟ ) ⎦ ⎢⎣
ĭī ( I - B )
īĭ ⎤
⎥
⎥
ĭ
⎦
(24)
Macierz kowariancji Σ została zatem zdefiniowana w terminach parametrów strukturalnych B i Γ oraz kowariancji Φ i Ψ. W praktyce Σ jest nieznane,
pamiętajmy jednak, że η oraz ξ są zmiennymi obserwowalnymi, zatem do oszacowania Σ mogą zostać użyte stosowne statystyki z próby zawarte w macierzy
S, gdzie macierz S jest następująca
(I - B)
-1
2009-12-09 14:26:00
220
⎡estymatory kowariancji
⎢ z próby pomiĊdzy η
⎢
S=⎢
⎢
⎢estymatory kowariancji
⎢⎣ z próby pomiĊdzy ξ i η
estymatory kowariancji ⎤
z próby pomiĊdzy η i ξ ⎥⎥
⎥
⎥
estymatory kowariancji ⎥
z próby pomiĊdzy ξ
⎦⎥
Proces estymacji obejmuje znalezienie wartości B, Γ, Φ i Ψ, z których
wynika macierz kowariancji możliwie bliska obserwowalnej macierzy kowariancji S (Long 1983: 34).
Analiza kowariancji modelu pomiarowo-ścieżkowego
Uchylając założenie o obserwowalności konstruktów ξ oraz η, ponownie
należy rozpatrzyć model strukturalny reprezentowany przez trzy równania
(25)
(26)
x = ȁ xȟ + į
(27)
y = ȁy Ș + İ
Pierwsze równanie przedstawia część strukturalną, wskazującą na
ścieżki pomiędzy zmiennymi ukrytymi w modelu. Kolejne dwa równania reprezentują jego część pomiarową, w której widoczne są związki konstruktów ξ i η z reprezentującymi je wskaźnikami x oraz y.
Macierz kowariancji wskaźników niezależnych
Macierz kowariancji pomiędzy wskaźnikami konstruktów niezależnych
Σxx przedstawia się następująco
Ȉ xx = COV ( x ) = E ( xx )
= E ⎡( ȁ xȟ + į )( ȁ xȟ + į ) ⎤
⎢⎣
⎥⎦
= E ⎡ ȁ xȟȟ ȁ x + ȁ xȟį + įȟ ȁ x + įį ⎤
⎣
⎦
(28)
= ȁ x E ( ȟȟ ) ȁ x + ȁ x E ( ȟį ) + E ( įȟ ) ȁ x + E ( įį )
Korzystając z założeń, że E(ξδ`) = 0 i E(δξ`) = 0 oraz ze wzorów na kowariancje konstruktów niezależnych i czynników swoistych E(ξξ`) = Φ
2009-12-09 14:26:01
221
oraz E(δδ`) = Θδ, wyznaczamy macierz kowariancji wskaźników niezależnych7
Ȉ xx = ȁ xĭȁ x + Ĭį
(29)
Macierz kowariancji wskaźników zależnych
Podobnie wyprowadzić można macierz kowariancji dla wskaźników konstruktów zależnych Σyy
Ȉ yy = COV ( y ) = E ( yy
)
⎡
⎤
= E ⎢( ȁ y Ș + İ )( ȁ y Ș + İ ) ⎥
⎣
⎦
= E ⎡ ȁ y ȘȘ ȁ y + ȁ y Șİ + İȘ ȁ y + İİ ⎤
⎦
⎣
= ȁ y E ( ȘȘ ) ȁ y + ȁ y E ( Șİ ) + E ( İȘ ) ȁ y + E ( İİ
(30)
)
= ȁ y E ( ȘȘ ) ȁ y + Ĭİ
Korzystając ze wzoru na macierz kowariancji pomiędzy konstruktami zależnymi E(ηη`) otrzymujemy macierz kowariancji wskaźników zależnych
Ȉ yy = ȁ y ⎡( I - B )
⎢⎣
-1
( īĭī
-1
+ Ȍ )( I - B ) ⎤ ȁ y + Ĭİ
⎦⎥
(31)
Macierz kowariancji wskaźników niezależnych i zależnych
Macierz kowariancji pomiędzy wskaźnikami konstruktów niezależnych
i zależnych Σxy przedstawia się następująco
Ȉ xy = COV ( xy ) = E ( xy
)
⎡
⎤
= E ⎢( ȁ x ȟ + į ) ( ȁ y Ș + İ ) ⎥
⎣
⎦
= E ⎡ ȁ x ȟȘ ȁ y + ȁ xȟİ + įȘ ȁ y + įİ ⎤
⎦
⎣
(32)
= ȁ x E ( ȟȘ ) ȁ y + ȁ x E ( ȟİ ) + E ( įȘ ) ȁ y + E ( įİ )
= ȁ x E ( ȟȘ ) ȁ y
7
Równanie to opisuje model czynnikowy.
2009-12-09 14:26:02
222
Korzystając ze wzoru na kowariancję pomiędzy konstruktami niezależnymi i zależnymi E(ξη`) otrzymujemy następującą macierz
Ȉ xy = ȁ xĭī ( I - B ) ȁ y
(33)
Ȉ yx = ȁ y ( I - B ) īĭȁ x
(34)
-1
analogicznie
-1
Macierz kowariancji wszystkich wskaźników
Uzyskane kowariancje pozwalają na zdefiniowanie macierzy kowariancji Σ między wszystkimi zmiennymi obserwowalnymi. Macierz ta wygląda
następująco
⎡ Ȉ yy Ȉ yx ⎤
Ȉ=⎢
⎥=
⎣ Ȉ xy Ȉ xx ⎦
(35)
⎡ ȁ I - B -1 īĭī + Ȍ I - B -1 ȁ + Ĭ ȁ I - B -1 īĭȁ ⎤
) (
)( ) y
)
y (
İ
y (
x ⎥
=⎢
-1
⎢
⎥
ȁ x ĭī ( I - B ) ȁ y
ȁ xĭȁ x + Ĭį ⎦
⎣
Dekomponuje ona wariancje i kowariancje zmiennych obserwowalnych x
i y na funkcje macierzy ładunków Λx i Λy, wariancje i kowariancje konstruktów ξ i η oraz wariancje i kowariancje czynników swoistych δ i ε. Estymacja
macierzy polega na znalezieniu estymatorów parametrów, które możliwie
najdokładniej reprodukują wariancje i kowariancje wskaźników z próby
(Long 1983: 24).
Podsumowanie założeń SEM
W modelowaniu strukturalnym estymuje się jednocześnie powiązania pomiędzy zmiennymi ukrytymi i ich wskaźnikami oraz ścieżki strukturalne pomiędzy konstruktami. Taka estymacja jest możliwa, jeżeli przyjmie się kilka
niezbędnych założeń (Long 1983: 57):
2009-12-09 14:26:03
223
Z1 Zmienne są mierzone jako odchylenia od średnich
E ( Ș) = E ( ȗ ) = 0
E (ȟ ) = 0
E ( x ) = E (į) = 0
E ( y ) = E (İ ) = 0
Z2 Błędy pomiaru są nieskorelowane ze zmiennymi nieobserwowalnymi
E ( ȟį ) = 0
lub
E ( įȟ ) = 0
E ( Șİ ) = 0
lub
E ( İȘ ) = 0
E ( ȟİ ) = 0
lub
E ( İȟ ) = 0
E ( Șį ) = 0
lub
E ( įȘ ) = 0
Z3 Błędy pomiaru i błędy strukturalne są nieskorelowane pomiędzy równaniami
E ( įİ ) = 0
lub
E ( İį ) = 0
E ( ȗį ) = 0
lub
E ( įȗ ) = 0
E ( ȗİ ) = 0
lub
E ( İȗ ) = 0
Z4 Zmienne nieobserwowalne niezależne i błędy strukturalne są nieskorelowane
E ( ȟȗ ) = 0
lub
E ( ȗȟ ) = 0
Z5 Żadne z równań strukturalnych nie jest zbyteczne, a zatem (I - B) jest macierzą nieosobliwą i tym samym (I - B)-1 istnieje; w przypadku, gdyby
(I - B) była macierzą osobliwą wówczas (I - B)-1 by nie istniało8
Z6 Zmienne obserwowalne x oraz y mogą być skorelowane ze sobą, ich kowariancje są elementami macierzy Σxy, gdzie (i,j)-ty element wskazuje na
kowariancję pomiędzy xi oraz yj
Macierz osobliwa ma zerowy wyznacznik i w związku z tym nie posiada macierzy odwrotnej.
8
2009-12-09 14:26:04
224
Z7 Konstrukty niezależne ξ i zależne η mogą być skorelowane ze sobą, ich
kowariancje są elementami macierzy COV(ξ,η) lub COV(η,ξ)
Z8 Błędy pomiaru δ mogą być skorelowane między sobą, podobnie błędy
pomiaru ε; ich macierze kowariancji są symetryczne, ale niekoniecznie
diagonalne9
Ĭį = COV ( į ) = E ( įį )
(36)
Ĭį = COV ( į ) = E ( įį )
(37)
Z9 Błędy strukturalne są nieskorelowane pomiędzy równaniami, a zatem ich
macierz kowariancji Ψ powinna być diagonalna
Z10 Zmienne obserwowalne niezależne x nie tłumaczą zmienności konstruktów zależnych η, podobnie zmienne obserwowalne zależne y nie tłumaczą zmienności konstruktów niezależnych ξ; wskazuje to na brak połączeń pomiędzy częścią niezależną a częścią zależną składnika pomiarowego modelu
Wśród powyższych założeń wyjaśnienia wymaga założenie przedostatnie
(Z9). Zgodnie z nim błędy strukturalne nie mogą być ze sobą skorelowane,
w związku z czym ich macierz kowariancji jest diagonalna. Założenie to jest
najczęściej przyjmowane w modelach równań strukturalnych. W praktyce
jednak zdarzają się od niego odstępstwa i dopuszcza się skorelowanie niektórych błędów strukturalnych ze sobą (Long 1983: 30). Takie podejście sugeruje, że konstrukty zależne powiązane z tymi błędami partycypują we wspólnej zmienności niewyjaśnionej przez predyktory modelu. Może się tak zdarzyć, jeśli model nie został dobrze skonstruowany i pominął pewne zmienne,
które oddziaływują na owe konstrukty. W takim wypadku konstrukcja modelu powinna zostać zweryfikowana, a brakujące zmienne dodane.
Założenia dotyczące skorelowania zmiennych w modelu pokazuje rysunek 4. Brak strzałki łączącej zmienne oznacza założenie o ich liniowej niezależności (zakłada się, że kowariancja takich zmiennych jest równa 0). Dla
czytelności przekazu na rysunku nie została zaznaczona możliwość skorelowania ze sobą zmiennych obserwowalnych x oraz y.
9
Macierz diagonalna ma zera poza główną przekątną.
2009-12-09 14:26:05
225
COV (ξ 2 ,η3 )
ζ2
ζ1
COV (ξ1 , ξ 2 )
ȟ1
Ș1
λ22x λ32x λ42x
λ11y
ζ3
COV (η2 ,η3 )
COV (η1 ,η2 )
ȟ2
x
λ11x λ21
23
Ș2
λ21y
λ31y
Ș3
λ32y
λ42y
λ43y
λ53y
x1
x2
x3
x4
y1
y2
y3
y4
y5
δ1
δ2
δ3
δ4
ε1
ε2
ε3
ε4
ε5
θ13δ
θ13ε
θ 25ε
Rysunek 4. Graficzna prezentacja założeń SEM dotyczących skorelowania zmiennych
−
−
−
−
−
−
−
Na powyższym rysunku:
koła reprezentują zmienne ukryte
kwadraty reprezentują zmienne obserwowalne
łuki łączące określone dwie zmienne wskazują na ich skorelowanie ze sobą
strzałki wskazują na kierunek zależności interpretowanej w kategoriach
przyczynowych
łuk przerywany reprezentuje niezerowe kowariancje pomiędzy błędami
strukturalnymi
gruba linia ciągła oddziela część niezależną i zależną modelu; brak strzałek między konstruktami zależnymi (η) a wskaźnikami niezależnymi (x)
oraz między wskaźnikami zależnymi (y) i konstruktami niezależnymi (ξ)
wynika z założeń modelu
dla czytelności na rysunku pominięto strzałki łączące zmienne wskaźnikowe x oraz y, które muszą się pojawić, gdy konstrukty zależne i niezależne będą ze sobą skorelowane (patrz Z7)
Zestawienie składowych pełnego modelu strukturalnego zawiera tabela 1.
2009-12-09 14:26:05
226
Tabela 1. Składowe pełnego modelu równań strukturalnych
Równania strukturalne:
Równania pomiarowe:
x = ȁ xȟ + į
y = ȁy Ș + İ
⎡ ȁ I - B -1 īĭī + Ȍ I - B -1 ȁ + Ĭ ȁ I - B -1 īĭȁ
) (
)( ) y
)
y (
İ
y(
x
∑=⎢
-1
⎢
ȁ xĭī ( I - B ) ȁ y
ȁ xĭȁ x + Ĭį
⎣
macierz wymiary kowariancja
opis
Model strukturalny (dotyczy zaleĪnoĞci liniowych pomiĊdzy konstruktami)
Macierz kowariancji
wszystkich skáadowych
modelu:
ī
( s ×1)
( r ×1)
(r × s)
Ǻ
(r × r )
ȗ
( r ×1)
ȟ
Ș
ĭ = E ( ȟȟ
)
COV ( Ș ) = E ( ȘȘ )
Ȍ = E ( ȗȗ
)
⎤
⎥
⎥
⎦
konstrukty niezaleĪne
konstrukty zaleĪne
wspóáczynniki strukturalne (ĞcieĪkowe) pomiĊdzy
konstruktami zaleĪnymi i niezaleĪnymi
wspóáczynniki strukturalne (ĞcieĪkowe) pomiĊdzy
konstruktami zaleĪnymi
báĊdy strukturalne (báĊdy w równaniach)
Model pomiarowy (áączy konstrukty z ich wskaĨnikami)
ȁx
( q ×1)
( p ×1)
( q ×1)
( p ×1)
(q × s)
ȁ yȁ y
( p×r)
x
y
į
İ
∑ xx = E ( xx )
wskaĨniki konstruktów niezaleĪnych
∑ yy = E ( yy
wskaĨniki konstruktów zaleĪnych
)
Ĭį = E ( įį )
Ĭİ = E ( İİ )
-
báĊdy pomiaru (czynniki swoiste) wskaĨników x
báĊdy pomiaru (czynniki swoiste) wskaĨników y
áadunki czynnikowe pomiĊdzy konstruktami
niezaleĪnymi i ich wskaĨnikami
áadunki czynnikowe pomiĊdzy konstruktami
zaleĪnymi i ich wskaĨnikami
Refleksywna i formatywna wersja modelowania
strukturalnego
W modelowaniu strukturalnym dają się wyróżnić dwa nurty: refleksywny (ang. reflexive) i formatywny (ang. formative). Zasadnicza różnica między nimi polega na traktowaniu relacji pomiędzy wskaźnikiem (zmienną obserwowalną) a cechą ukrytą (konstruktem).
W refleksywnej wersji modelowania strukturalnego relacja „bycia wskaźnikiem” wiążąca zmienną obserwowalną z konstruktem ma status hipotezy,
którą analiza danych (estymacja parametrów modelu) może potwierdzić, ale
2009-12-09 14:26:06
227
może także sfalsyfikować. Modelowanie w tej wersji polega więc (między innymi) na sprawdzeniu, czy wskaźniki cech ukrytych zostały dobrane poprawnie, to znaczy, czy wszystkie są niezbędne do oszacowania wartości cechy
ukrytej i czy oszacowanie to jest wystarczająco rzetelne. Modelowanie strukturalne w wersji refleksywnej jest zatem bardzo podobne do eksploracyjnej
analizy czynnikowej (Exploratory Factor Analysis EFA), gdyż do podejmowania decyzji o statusie pojedynczych wskaźników oraz całego modelu używa się tych samych kryteriów:
1 wielkości ładunków czynnikowych,
2 odległości (istotności) ładunków czynnikowych od wartości zero,
3 zasobów wariancji wspólnej cechy ukrytej i wskaźników,
4 stopnia zgodności zależności reprodukowanych przez model z empirycznie zarejestrowanymi zależnościami.
Choć struktura pomiarowa (czynnikowa) w SEM jest zakładana, zaś
w EFA poszukiwana, w obu przypadkach kryterium oceny jakości tej składowej modelu strukturalnego i oceny wyeksplorowanej struktury czynnikowej
jest takie samo – jest to zdolność do odtwarzania przez model zaobserwowanych zależności między wskaźnikami.
W formatywnej wersji SEM status wskaźników jest odmienny – zakłada
się, że są one wskaźnikami cechy ukrytej i założenie to nie jest przedmiotem
analizy ani weryfikacji. Odpowiada to sytuacji, w której badacz dokładnie
wie, co jest wskaźnikiem której z cech ukrytych i jego jedynym zadaniem jest
maksymalne wykorzystanie informacji zawartych we wskaźnikach do jak
najdokładniejszego przewidywania wartości zmiennych zależnych modelu.
Szacowanie wartości konstruktów w formatywnej wersji SEM przypomina
zatem analizę głównych składowych (Principal Components Analysis PCA),
w której poszukuje się takiej liniowej funkcji wskaźników, aby utworzona
w ten sposób zmienna (konstrukt) miała jak największą wariancję.
Zauważmy, że w formatywnej wersji SEM kwestia zgodności modelu
strukturalnego z danymi empirycznymi nie jest wbudowana w procedurę szacowania jego parametrów, gdyż celem jest tu optymalizacja błędów przewidywania zmiennych zależnych, a więc minimalizacja błędów tego przewidywania.
Każdy z wymienionych nurtów SEM stosuje dopasowane do swoich założeń techniki estymacji parametrów modelu i przyjmuje w związku z tym
2009-12-09 14:26:06
228
specyficzne założenia na temat poziomu pomiaru i kształtu ich rozkładów.
W konsekwencji zasadnie jest traktować oba nurty jako względnie niezależne sposoby modelowania zjawisk społecznych przy użyciu układów równań
liniowych. Od stosowanych w nich technik estymacyjnych pochodzą ich nazwy: SEM-MLE dla wariantu refleksywnego i SEM-PLS dla wersji formatywnej.
W formatywnej wersji SEM, zwłaszcza w jego początkowej fazie rozwoju, parametry modeli były szacowane metodą maksymalizacji funkcji wiarogodności (MLE). Estymacja parametrów tą metodą wymaga znajomości postaci funkcji wiążącej rozkład wyników doświadczenia losowego (rozkład
statystyki z próby) z wartościami parametrów populacji, z której pochodzi
próba. W refleksywnym wariancie SEM, wykorzystującym do estymacji
technikę MLE wymaga się w konsekwencji, aby wszystkie zmienne obserwowalne miały rozkłady normalne. SEM-MLE jest najpopularniejsza w piśmiennictwie socjologicznym i wiąże się z wprowadzeniem do użytku (w latach siedemdziesiątych ubiegłego wieku) pakietu statystycznego o nazwie
LISREL (skrót od ang. LInear Structural RELationships), którego Jöreskog
był współautorem.
SEM-PLS jest bardziej popularna w zastosowaniach ekonomicznych
i ekonometrycznych, o nazwie PLS (skrót od Partial Least Squares10), nie wymaga przyjmowania założeń o kształcie rozkładu zmiennych modelu. Jest
bardziej odporna na łamanie założeń o nieskorelowaniu elementów modelu
(braku współliniowości) oraz na niewielkie rozmiary prób. Jest zaimplementowana w kilku pakietach statystycznych o raczej niszowym zasięgu. SEMPLS okazuje się bardzo użytecznym narzędziem skalowania w sytuacji, gdy
status wskaźników jest oczywisty i nie ma potrzeby badać, który z nich jaką
cechę ukrytą reprezentuje, co zdarza się często w badaniach edukacyjnych.
Wtedy zadaniem, z którym SEM-PLS radzi sobie dobrze, jest optymalne wykorzystanie wskaźników do szacowania poziomu wartości tej cechy (cech).
Z tego właśnie powodu, mimo niszowego charakteru, omawiamy w tym artykule SEM-PLS.
Wedle twórcy modelowania SEM-PLS, Hermana Wolda, PLS powinien być interpretowany jako skrót od „Projection to Latent Structures”, co jego zdaniem bardziej oddaje istotę estymacji, w której „projektuje się” (rzuca – w sensie geometrycznym) zmienne obserwowalne na ukryte wymiary reprezentowane przez konstrukty.
10
2009-12-09 14:26:06
229
SEM-MLE
Teoretyczne podstawy estymacji parametrów modelu strukturalnego metodą największej wiarogodności zapoczątkował na przełomie lat 1960–1970
Karl Jöreskog (Jöreskog 1969). Ich owocem była pierwsza wersja pakietu
LISREL), rozwijana do dziś11.
Metoda estymacji parametrów modelu strukturalnego narzuca na dane
wejściowe restrykcyjne założenia, których spełnienie bywa trudne do osiągnięcia. Oprócz interwałowego charakteru wszystkich zmiennych obserwowalnych SEM-MLE wymaga:
1 relatywnie dużych prób, w przeciwnym razie trudno osiąga się wymaganą zbieżność rozkładów statystyk z próby,
2 normalności rozkładów zmiennych obserwowalnych,
3 braku współliniowości zmiennych obserwowalnych.
Wymagania te rzadko udaje się spełnić jednocześnie i bez wyjątków.
W naukach społecznych sporadycznie dysponuje się wskaźnikami mierzonymi na skali interwałowej i ponadto o rozkładach zbliżonych do normalnego.
Żadnego z tych wymagań nie spełniają surowe wyniki testów kompetencyjnych, które zazwyczaj mają postać zmiennych binarnych lub zmiennych porządkowych o niewielkiej liczbie wartości.
Pewnym sposobem rozwiązania problemu poziomu pomiaru wskaźników
i kształtu ich populacyjnych rozkładów jest zastąpienie macierzy korelacji
z próby jej tetrachorycznym lub polichorycznym odpowiednikiem12.
Ostatnia wersja pakietu z roku 2009 ma numer 8.8. Repertuar technik estymacyjnych oferowanych przez LISREL znacznie się rozszerzył, nie zmieniły się jednak zasadnicze założenia na temat danych wejściowych. Jak mocne jest założenie multinormalności rozkładu wskaźników widać z porównania estymatorów otrzymywanych techniką
MLE oraz otrzymywanych pozostałymi technikami – ich wartości są praktycznie takie
same, choć techniki obliczeniowe prowadzące do ich uzyskania są różne.
12
Stosowanie tego rozwiązania stało się łatwiejsze między innymi dzięki pakietowi PRE-LIS (PREprocesor for LISrel), autorstwa twórców LISREL (Jöreskog, Sorböm
1994), którego pierwsza wersja pojawiła się na rynku w 1986 roku. Założenia, które trzeba przyjąć na temat poziomu pomiaru i rozkładów zmiennych wskaźnikowych, są bardzo wysokie, w tym przypadku jednak – ponieważ są to założenia – nie podlegają weryfikacji.
11
2009-12-09 14:26:06
230
Dla danych spełniających pomiarowe i rozkładowe wymagania wymuszone przez technikę estymacyjną, pakiety SEM-MLE oferują standardowe
narzędzia oceny modelu:
− estymatory największej wiarogodności dla współczynników ścieżkowych
i ładunków czynnikowych,
− przedziały ufności dla tych parametrów,
− test hipotez o istotności różnic wartości parametrów od zera,
− oparte na ilorazie wiarogodności sumaryczne wskaźniki stopnia zgodności modelu z danymi empirycznymi, to znaczy stopnia podobieństwa macierzy kowariancji (korelacji) zrekonstruowanej przy użyciu wyestymowanych parametrów z odpowiednią macierzą w próbie,
− identyfikację tych parametrów modelu, które w największym stopniu odpowiedzialne są za odchylenia jego przewidywań od rozkładów zmiennych obserwowalnych13.
Środki statystyczne oferowane w modelach SEM-MLE pozwalają na
podjęcie jednej z dwóch standardowych decyzji na temat całego modelu lub
jego pojedynczych parametrów: odrzucić model (lub jego fragment) lub nie
odrzucać. Z tego powodu modelowanie w wersji implementowanej w pakiecie LISREL nazywane jest odmianą konfirmacyjnej analizy czynnikowej. Pozwala ona zarówno podtrzymać hipotezę na temat modelowanego zjawiska,
jeśli zarejestrowane w próbie zależności między wskaźnikami są bliskie zależnościom wyznaczonym z parametrów modelu, jak i model odrzucić, odrzucając zarazem założenia teoretyczne, na podstawie których został skonstruowany model. Ponadto, dla szczególnych par modeli strukturalnych,
z których jeden jest zawarty w drugim14, możliwe jest testowanie hipotezy na
temat istotności różnic w stopniu ich dopasowania do danych, co pozwala
niekiedy na uzasadnienie decyzji o liczbie parametrów w modelu.
Pakietów do modelowania SEM-MLE jest na rynku kilka. Obok LISREL najpopularniejszym jest jego odpowiednik z koncernu SPSS o nazwie AMOS.
14
W żargonie statystycznym mówi się wtedy, że jeden model jest zagnieżdżony
w drugim. Dwa modele pozostają w relacji zawierania (zagnieżdżenia), jeśli jeden z nich
jest szczególnym przypadkiem drugiego, to znaczy różnią się liczbą ograniczeń nakładanych na te same parametry ścieżkowe lub czynnikowe.
13
2009-12-09 14:26:06
231
SEM-PLS
Alternatywą dla estymacji MLE jest procedura częściowych najmniejszych kwadratów PLS (skrót od Partial Least Squares albo – wedle twórcy
– Projection on Latent Structures). Jest ona efektem prac szwedzkiego statystyka Hermana Wolda (1973), który zaproponował ją do estymacji parametrów modeli ścieżkowych ze zmiennymi ukrytymi definiowanymi za pomocą
zmiennych obserwowalnych15. Estymacja metodą PLS ma w porównaniu
z algorytmami SEM-MLE kilka zalet (Fornell i in. 1996, Cassel i in. 1999):
− nie narzuca założeń dotyczących kształtu rozkładów i zależności między
zmiennymi wskaźnikowymi, dzięki czemu możliwe jest modelowanie
przy użyciu wskaźników nieliniowo powiązanych,
− sprawdza się w estymacji zmiennych mierzonych zarówno na skali interwałowej, jak i porządkowej,
− jest odporna na skośność rozkładów częstości oraz współliniowość
zmiennych obserwowalnych,
− dosyć dobrze sobie radzi w sytuacji, gdy badacz ma do czynienia z ograniczoną liczbą obserwacji i licznymi brakami danych.
Specyfikacja modelu
W modelowaniu SEM-PLS zakłada się, że część strukturalna modelu stanowi wartość oczekiwaną zmiennych zależnych dla danych wartości zmiennych niezależnych. Ogólny model strukturalny ma zatem postać
Ε ( Ș Ș,ȟ ) = ǺȘ + īȟ
gdzie:
− η jest wektorem konstruktów zależnych o wymiarach (m × 1)
− ξ jest wektorem konstruktów niezależnych o wymiarach (n × 1)
− B jest macierzą (m × m) współczynników dla η
− Γ jest macierzą (m × n) współczynników dla ξ
Oznacza to, że
Ε ( Șȗ ) = Ε ( ȟȗ ) = Ε ( ȗ ) = 0
(38)
(39)
gdzie ȗ = Ș − Ε ( Ș Ș,ȟ ) .
Trudno się oprzeć wrażeniu, że statystyczne podstawy modelowania strukturalnego
zawdzięczmy wyłącznie statystykom szwedzkim – Jöreskog był uczniem Wolda.
15
2009-12-09 14:26:06
232
Związki konstruktów z obserwowalnymi wskaźnikami przedstawiają się
następująco
x = ȁ xȟ + į
(40)
y = ȁy Ș + İ
(41)
gdzie:
− x jest wektorem wskaźników niezależnych o wymiarach (q × 1)
− y jest wektorem wskaźników zależnych o wymiarach (p × 1)
− Λx jest macierzą (q × n) ładunków pomiędzy x oraz ξ
− Λy jest macierzą (p × m) ładunków pomiędzy y oraz η
Tym samym dla estymacji PLS zachodzi równość
Ε ( İ ) = Ε ( į ) = Ε ( Șİ ) = Ε ( ȟį ) = 0
(42)
wedle której błędy pomiaru konstruktów mają średnią zero i są z nimi liniowo nieskorelowane.
Technika szacowania parametrów modelu
Od strony technicznej PLS łączy w sobie elementy metody głównych
składowych (Principal Components Analysis PCA) i klasycznej metody najmniejszych kwadratów (Ordinary Least Squares OLS). Jest to technika iteracyjna prowadząca do ostatecznych oszacowań przez cykliczne powtarzanie
dwóch kroków:
1) wyznaczania parametrów składowej pomiarowej modelu,
2) wyznaczania parametrów składowej strukturalnej (Cassel i in. 1999).
Metoda PLS wymaga uporządkowania konstruktów tak, aby dla każdej
ich pary wiadomo było, który z nich jest od drugiego „wcześniejszy”, co odpowiada hipotezie na temat przyczynowo interpretowanych zależności między zjawiskami, które konstrukty w modelu reprezentują.
Krok 1:
Dla każdego konstruktu (zmiennej ukrytej modelu) estymuje się parametry jego wskaźników metodą głównych składowych. Tymczasowe wartości
konstruktów są zatem liniowymi funkcjami zmiennych obserwowalnych,
przy czym w odróżnieniu od klasycznej techniki PCA, w której wagi wskaź-
2009-12-09 14:26:07
233
ników dobierane są tak, aby zmaksymalizować wariancję zmiennej ukrytej
(nazywanej w PCA „składową”), w technice PLS maksymalizowana jest
„ilość” odtwarzanego związku (mierzonego kowariancją) pomiędzy konstruktem a innymi konstruktami powiązanymi z nim równaniem strukturalnym. Krok pierwszy polega zatem na wyznaczeniu takich współczynników
równania tworzącego konstrukty, aby były one (konstrukty) jak najsilniej ze
sobą liniowo skorelowane.
Krok 2:
W kolejnym kroku metodą najmniejszych kwadratów dla każdej zmiennej ukrytej wyznaczana jest jej regresja ze względu na wszystkie poprzedzające ją w modelu konstrukty. Wyznacza się w niej taki zestaw współczynników ścieżkowych, który zmaksymalizuje odsetek wyjaśnianej w ramach modelu wariancji zmiennych ukrytych.
Obydwa kroki są powtarzane aż do osiągnięcia zbieżności.
Oprócz wymienionych wyżej zalet, estymacja PLS ma także swoje słabe
strony. Z jednej strony oparte na niej predykcje są odporne na skrzywienia
rozkładów zmiennych wskaźnikowych, z drugiej jednak estymatory ładunków czynnikowych i współczynników ścieżkowych są w niej znacząco obciążone. Ładunki czynnikowe są zazwyczaj przeszacowane, zaś współczynniki ścieżkowe niedoszacowane (Chin 1995).
Kolejną słabością PLS jest brak dobrego kryterium oceny jakości całego
modelu, jak i jego elementów (pojedynczych parametrów). PLS polega na
iteracyjnym, cyklicznym (aż do osiągnięcia zbieżności) wyznaczaniu parametrów obu składowych modelu, stąd nie zawiera parametru wyrażającego
syntetycznie stopień zgodności z rozkładami z prób zarówno całego modelu,
jak i jego składników. Tym samym zależności przyczynowe między zjawiskami reprezentowanymi przez konstrukty nie podlegają weryfikacji, a więc
badacz nie ma wystarczających narzędzi, aby dokonać falsyfikacji teorii leżącej u podłoża konstrukcji modelu strukturalnego.
2009-12-09 14:26:08
234
SEM-MLE a SEM-PLS
Analiza porównawcza obu metod estymacji została przedstawiona w tabeli 2.
Tabela 2. Analiza porównawcza: SEM-MLE a SEM-PLS
Kryterium
SEM–MLE
SEM–PLS
Typ modelu
przyczynowy
predykcyjny
Cel
estymacja parametrów
modelu przyczynowego
maksymalizacja wariancji
wyjaśnianej w modelu
Podejście
analiza kowariancji
analiza wariancji
Podstawy
teoretyczne
wymaga solidnej teorii
leżącej u podłoża analizy
jest elastyczny, model
może mieć słabe podłoże
teoretyczne
Założenia
o rozkładach
parametryczne:
wielowymiarowy rozkład
normalny
nieparametryczne: dopuszcza
brak normalności
Zależności między
zmiennymi
nie dopuszcza
współliniowości
dopuszcza współliniowość
obu typów zmiennych
Typy wskaźników
mierzone na skali
interwałowej
mierzone na skali
interwałowej lub
porządkowej
Metoda estymacji
MLE
PCA wraz z OLS
Identyfikacja
modelu
zależy od modelu
zawsze zidentyfikowany
Wartość
predykcyjna
niska
wysoka
Źródło: Opracowanie własne na podstawie Chin 1995, Cassel i in. 1999, Esteves i in.
2002.
2009-12-09 14:26:08
235
Literatura
Bollen, K.A. & Long J.S., (1993), Introduction; w: K.A. Bollen & J.S.
Long (red.), Testing Structural Equation Models, s. 1–9. Beverly Hills and
London: Sage Publications.
Bollen, K.A., (1989), Structural Equations with Latent Variables. New
York: John Wiley & Sons.
Cassel, C., Hackl P. & Westlund A.H., (1999), Robustness of Partial Least-Squares Method for Estimating Latent Variable Quality Structures, „Journal of Applied Statistics”, Vol. 26: 435–446.
Chin, W.W., (1995), Partial Least Squares is to LISREL as Principal
Components Analysis is to Common Factor Analysis, „Technology Studies”,
Vol. 2: 315–319.
Esteves, J., Pastor J.A. & Casanovas J., (2002), Using the Partial Least
Squares (PLS) Method to Establish Critical Success Factors Interdependence in ERP Implementation Projects. Barcelona: Universidad Politecnica de
Catalunya.
Fornell, C., Johnson M.D., Anderson E.W., Cha J. & Everitt-Bryant E.,
(1996), The American Customer Satisfaction Index: Nature, Purpose, and
Findings, „Journal of Marketing”, Vol. 60: 7–18.
Haavelmo, T., (1943), The Statistical Implications of a System of Simultaneous Equations, „Econometrica”, Vol. 11: 1–12.
Jöreskog, K.G., (1969), A General Approach to Confirmatory Maximum
Likelihood Factor Analysis, „Psychometrika”, Vol. 34: 183–202.
Jöreskog, K.G., (1973), A General Method for Estimating a Linear Structural Equation System; w: A.S. Goldberger & O.D. Duncan (red.), Structural
Equation Models in the Social Sciences, s. 85–112. New York: Academic
Press.
Jöreskog, K.G., (1993), Testing Structural Equation Models; w: K.A.
Bollen & J.S. Long (red.), Testing Structural Equation Models, s. 294–316.
Beverly Hills and London: Sage Publications.
Jöreskog, K.G. & Sorböm, D., (1994), Prelis 2 User’s Guide. Lawrence
Erlbaum Assoc Inc., Mahwah, USA.
Kaplan, D., (2009), Structural Equation Modeling: Foundations and
Extensions. Second Edition, Sage University Paper series on Advanced
2009-12-09 14:26:08
236
Quantitative Techniques in the Social Sciences, 10, Beverly Hills and London: Sage Publications.
Long, J.S., (1983), Covariance Structure Models: An Introduction to LISREL. Sage University Paper series on Quantitative Application in the Social
Sciences, 07–034, Beverly Hills and London: Sage Publications.
Sharma, S., (1996), Applied Multivariate Techniques. New York: John
Wiley & Sons.
Spearman, C., (1904), General Intelligence, Objectively Determined and
Measured, „American Journal of Psychology”, Vol. 15: 201–293.
Wold, H., (1973), Nonlinear Iterative Partial Least Squares (NIPALS) Modelling: Some Current Developments; [w:] P.R. Krishnaiah (red.), Multivariate Analysis, s. 383–407. New York: Academic Press.
Wright, S., (1918), On the Nature of Size Factors, „Genetics”, Vol. 3:
367–374.
Wykaz skrótów
EFA
Exploratory Factor Analysis
Eksploracyjna analiza czynnikowa
LISREL
Linear Structural Relationships
pakiet statystyczny do estymacji
SEM metodą MLE
MLE
Maximum Likelihood Estimators
Estymatory największej
wiarogodności
OLS
Ordinary Least Squares
Metoda najmniejszych kwadratów
PCA
Principal Components Analysis
Analiza głównych składowych
PLS
Partial Least Squares
Metoda częściowych najmniejszych
kwadratów
SEM
Structural Equation Modeling
Modelowanie równań strukturalnych
2009-12-09 14:26:08

Skalowanie druk.indb

Transkrypt

Podobne dokumenty

„Eksploracja danych” informacje dotyczące zadań

ĆWICZENIA 4. CHARAKTERYSTYKI LICZBOWE WIELO

Automatyczny System Tradingowy

Zadania - metoda Hellwiga, 2014

Konstrukty osobiste nauczyciela

EKONOMETRIA - Przyk adowy egzamin

TESTY KONTROLI SKUTECZNOŚCI PROCESU STERYLIZACJI

Zajęcia nr 4/5. Tabele kontyngencji i ocena zależności (SPSS) Ćw. 1

Zadanie 1. W pliku romanse.gdt znajdują się dane - E-SGH

ćwiczenia z rachunku prawdopodobieństwa matematyka, III rok lista