Wybór optymalnej liczby składowych w analizie czynnikowej – Test

Transkrypt

Wybór optymalnej liczby składowych w analizie czynnikowej – Test
Wybór optymalnej liczby składowych w analizie czynnikowej – Test
Równolegości Horn’a i test MAP Velicera
Wielu badaczy podejmuje decyzje o optymalnej liczbie składowych do
wyodrębnienia na podstawie arbitralnych metod: kryterium Kaisera lub wykres
osypiska. Obie metody są dostępne w większości spośród dostępnych pakietów
statystycznych, Niestety obie metody przeceniają bądź niedoszacowują
optymalnej liczby składowych (Zwick & Velicer, 1986). Nie zawsze też podparcie
wyników o wykres osypiska jednoznacznie wskazuje na sposób interpretacji
wyników, także wśród ekspertów (Crawford & Koopman, 1979; Streiner, 1998).
Analiza Równoległości Horn’a oraz test MAP Velicera pozwalają w bardziej
dokładny sposób na zbadanie optymalnej liczby składowych do wyodrębnienia.
Test MAP oparty jest na średnich wartościach korelacji cząstkowych pomiędzy
zmiennymi kolejno usuwanymi z wpływu czynników. Składowa z najwyższą
wartością własną (eigenvalue) jest usuwana jako pierwsza i jego wpływ na
zależność miedzy itemami jest wyłączony. Następnie, z drugim czynnikiem tez z
największą wartością własną jest usuwany itp. W każdym kroku, obliczany jest
kwadrat średniej korelacji cząstkowej pomiędzy itemami, którego wartość
początkowo maleje, lecz po kilku krokach zaczyna wzrastać. Krok, w którym
uzyskano najniższą wartość kwadratu średniej korelacji cząstkowej określa
zalecaną liczbą składowych do wyodrębnienia.
Test Równoległości (PA) Horn’a jest niejako adaptacją kryterium Kaisera,
która dodatkowo wykorzystuje informacje z próbek losowych. Głównym
założeniem testu jest to, że liczba czynników pochodzących z rzeczywistych
danych powinna mieć większe wartości własne od tych pochodzących z
losowych danych o tej samej wielkości próby i liczby zmiennych. W pierwszym
kroku PA, generowanych jest około tysiąca losowych zbiorów danych o tej samej
liczbie obserwacji i liczbie zmiennych jak w dostępnym zbiorze danych.
Następnie wykonywana jest analiza czynnikowa dla każdego z dostępnych
zbiorów danych (wyliczane są wartości eigenvalue). Na kolejnym etapie
wyliczany jest 95. Percentyl dla największej drugiej, trzeciej itp. wartości własnej
w danym zbiorze danych. Wówczas możliwe jest porównanie wartości własne z
oryginalnego zestawu danych i 95. Percentyla wartości własnych pochodzących
z losowych danych. Wyodrębmiany tyle czynników, gdzie wartości własne z
rzeczywistych danych są większe od wartości własnych pochodzących z
losowych danych.
Analiza w SPSS
Obie analizy możliwe są do przeprowadzenia w nowym okienku dialogowym
dostępnym do pobrania ze strony: www.bedynska.com.pl. W jedno okienko
dialogowe zautomatyzowano makra dostępne w artykule Briana P. O’Connor’a
„SPSS and SAS programs for determining the numer of components using paralel
analysis and Velicer’s MAP test” (2000).
Po zainstalowaniu okienka dialogowego
analizę znajdziemy przechodząc w
analiza -> redukcja wymiarów -> MAP i Parallel.
Następnie przerzucamy zmienne niezbędne do wykonania analizy; ustalamy
specyfikację dla testu Równoległości (Parallel) i klikamy ok.
Wydruk dla analizy MAP
W powyższym przykładzie, optymalna liczba komponentów (składowych) to
wyodrębnienia to 3.
Wydruk dla analizy równoległości (Parallel)
Na wydruku widoczne są wartości dla losowych zbiorów danych. Następnie za
pomocą prostego wykresu liniowego, gdzie na osi X umieszczamy poszczególne
itemy, natomiast na osi Y na oddzielnych liniach wartości własne dla danych
rzeczywistych i losowych decydujemy o liczbie składowych do wyodrębnienia.
W naszym przykładzie, optymalna liczba czynników do wyodrębnienia to 3.
6
wartość własna
5
4
3
2
1
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
item
dane rzeczywiste
dane losowe

Podobne dokumenty