Wybór optymalnej liczby składowych w analizie czynnikowej – Test
Transkrypt
Wybór optymalnej liczby składowych w analizie czynnikowej – Test
Wybór optymalnej liczby składowych w analizie czynnikowej – Test Równolegości Horn’a i test MAP Velicera Wielu badaczy podejmuje decyzje o optymalnej liczbie składowych do wyodrębnienia na podstawie arbitralnych metod: kryterium Kaisera lub wykres osypiska. Obie metody są dostępne w większości spośród dostępnych pakietów statystycznych, Niestety obie metody przeceniają bądź niedoszacowują optymalnej liczby składowych (Zwick & Velicer, 1986). Nie zawsze też podparcie wyników o wykres osypiska jednoznacznie wskazuje na sposób interpretacji wyników, także wśród ekspertów (Crawford & Koopman, 1979; Streiner, 1998). Analiza Równoległości Horn’a oraz test MAP Velicera pozwalają w bardziej dokładny sposób na zbadanie optymalnej liczby składowych do wyodrębnienia. Test MAP oparty jest na średnich wartościach korelacji cząstkowych pomiędzy zmiennymi kolejno usuwanymi z wpływu czynników. Składowa z najwyższą wartością własną (eigenvalue) jest usuwana jako pierwsza i jego wpływ na zależność miedzy itemami jest wyłączony. Następnie, z drugim czynnikiem tez z największą wartością własną jest usuwany itp. W każdym kroku, obliczany jest kwadrat średniej korelacji cząstkowej pomiędzy itemami, którego wartość początkowo maleje, lecz po kilku krokach zaczyna wzrastać. Krok, w którym uzyskano najniższą wartość kwadratu średniej korelacji cząstkowej określa zalecaną liczbą składowych do wyodrębnienia. Test Równoległości (PA) Horn’a jest niejako adaptacją kryterium Kaisera, która dodatkowo wykorzystuje informacje z próbek losowych. Głównym założeniem testu jest to, że liczba czynników pochodzących z rzeczywistych danych powinna mieć większe wartości własne od tych pochodzących z losowych danych o tej samej wielkości próby i liczby zmiennych. W pierwszym kroku PA, generowanych jest około tysiąca losowych zbiorów danych o tej samej liczbie obserwacji i liczbie zmiennych jak w dostępnym zbiorze danych. Następnie wykonywana jest analiza czynnikowa dla każdego z dostępnych zbiorów danych (wyliczane są wartości eigenvalue). Na kolejnym etapie wyliczany jest 95. Percentyl dla największej drugiej, trzeciej itp. wartości własnej w danym zbiorze danych. Wówczas możliwe jest porównanie wartości własne z oryginalnego zestawu danych i 95. Percentyla wartości własnych pochodzących z losowych danych. Wyodrębmiany tyle czynników, gdzie wartości własne z rzeczywistych danych są większe od wartości własnych pochodzących z losowych danych. Analiza w SPSS Obie analizy możliwe są do przeprowadzenia w nowym okienku dialogowym dostępnym do pobrania ze strony: www.bedynska.com.pl. W jedno okienko dialogowe zautomatyzowano makra dostępne w artykule Briana P. O’Connor’a „SPSS and SAS programs for determining the numer of components using paralel analysis and Velicer’s MAP test” (2000). Po zainstalowaniu okienka dialogowego analizę znajdziemy przechodząc w analiza -> redukcja wymiarów -> MAP i Parallel. Następnie przerzucamy zmienne niezbędne do wykonania analizy; ustalamy specyfikację dla testu Równoległości (Parallel) i klikamy ok. Wydruk dla analizy MAP W powyższym przykładzie, optymalna liczba komponentów (składowych) to wyodrębnienia to 3. Wydruk dla analizy równoległości (Parallel) Na wydruku widoczne są wartości dla losowych zbiorów danych. Następnie za pomocą prostego wykresu liniowego, gdzie na osi X umieszczamy poszczególne itemy, natomiast na osi Y na oddzielnych liniach wartości własne dla danych rzeczywistych i losowych decydujemy o liczbie składowych do wyodrębnienia. W naszym przykładzie, optymalna liczba czynników do wyodrębnienia to 3. 6 wartość własna 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 item dane rzeczywiste dane losowe