Analiza czynnikowa • Kolejna z analiz wielozmiennowych • Jej
Transkrypt
Analiza czynnikowa • Kolejna z analiz wielozmiennowych • Jej
Analiza czynnikowa · Kolejna z analiz wielozmiennowych · Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika · Indeks był banalny · I miał wady: o Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie? o Czy wszystkie podpytania mierzyły tak naprawdę to samo? o Czy wszystkie podpytania były jednakowo ważne dla wskaźnika? · Analiza czynnikowa jest bardziej skomplikowana, ale eliminuje ww. problemy Jest kilka metod określania liczby czynników; najpopularniejsze: · Metoda Kaisera o przyjmuje istnienie tylu czynników, ile czynników ma wartość własną większą niż 1 o wartość własna określa procent wyjaśnianych przez dany czynnik wariancji o jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu · metoda Catella o z wykresem osypiska o wyszukuje się punkt reprezentujący czynnik, za którym kończy się stromizna o zlicza się czynniki powyżej tego punktu – tyle ich właśnie trzeba wyodrębnić · !!! korzystamy tu także z metody głównych składowych o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent wariancji wyjściowych zmiennych Jest kilka metod obliczania ładunków czynnikowych · metoda osi głównych o rekomendowana o stara się zmaksymalizować powiązania pomiędzy czynnikami a stwierdzeniami skali o nie wymaga rozkładu normalnego · metoda największej wiarygodności o wymaga rozkładu normalnego o podaje poziom istotności różnicy między strukturą idealną (modelową) w strukturą uzyskaną w badaniu Rotacja by zwiększyć dopasowanie · rotacje ortogonalne o najpopularniejsza: Varimax o zakładamy brak korelacji między czynnikami o przydaje się, gdy przygotowujemy predyktory dla regresji · rotacje nieortogonalne (ukośne) o najpopularniejsza: Oblimin o zakładamy pewien stopień skorelowania czynników o pokaże nam też, jeśli tej korelacji nie będzie Analizę możemy prowadzić na · danych surowych -> macierz korelacji · danych zestandaryzowanych -> macierz kowariancji [standaryzacja: Analiza -> opis statystyczny -> statystyki opisowe -> zapisz standaryzowane wartości jako zmienne ] Przy wyborze zmiennych trzeba uważać na: · związki merytoryczne · kierunek pytania · braki odpowiedzi R11b „Zbyt ufamy nauce, za mało religii” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R11c „Religia-więcej konfliktów niż pokoju” · 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R11d „Osoby religijne często zbyt nietolerancyjne” · 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie R19a „Bóg zajmuje się osobiście każdą istotą” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R19c „Życie ma sens bo istnieje Bóg” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34b „Religia sprzyja zawieraniu przyjaźni” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada R34d „Religia sprzyja spotykaniu właściwych ludzi” · 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada Kontrola braków danych Odwrócenie R11c i R11d Analiza -> redukcja wymiarów -> analiza czynnikowa · Zmienne -> wszystkie brane pod uwagę zmienne · Statystyki o Statystyki opisowe o Rozwiązania wstępne o K-M-O · Wyodrębnianie o Domyślne głównych składowych o Macierz korelacji, bo mamy dane surowe o Pokaż nierotowane rozwiązania czynnikowe o Wyodrębnianie na podstawie wartości własnej większe niż 1 · Rotacja o Wersja pierwsza: Varimax o Wersja druga: Oblimin · Opcje o Sortuj wg wartości ładunków czynnikowych o Ukryj małe współczynniki (wartość bezwzględna poniżej 0,4) Interpretacja tabel: a) Całkowita wyjaśniona wariancja Skład Sumy kwadratów ładunków po Początkowe wartości własne owa Sumy kwadratów ładunków po rotacji wyodrębnieniu Ogółem % % Ogółem % wariancji % wariancji skumulowa skumulowa ny ny Ogółem % wariancji % skumulowany 1 3,736 41,514 41,514 3,736 41,514 41,514 2,788 30,983 30,983 2 1,353 15,033 56,547 1,353 15,033 56,547 1,802 20,020 51,002 3 1,083 12,028 68,576 1,083 12,028 68,576 1,582 17,573 68,576 4 ,778 8,639 77,215 5 ,685 7,609 84,824 6 ,485 5,386 90,210 7 ,402 4,462 94,671 8 ,286 3,183 97,854 9 ,193 2,146 100,000 Metoda wyodrębniania czynników – głównych składowych. · Wartość własna powyżej 1 to 3 czynniki · Wyjaśniają w sumie (po rotacji) 68,6% wariancji (czyli 2/3 przypadków) – to sporo b) Macierz składowycha Składowa 1 2 spotykaniu właściwych ludzi ,811 zawieraniu przyjaźni ,774 odnalezieniu wewnętrznego ,749 3 spokoju i szczęścia uzyskaniu pocieszenia w ,719 kłopotach lub chwilach smutku Bóg zajmuje się osobiście ,680 każdą istotą Życie ma sens bo istnieje ,653 ,482 Bóg Osoby religijne często zbyt ,744 nietolerancyjne Religia-więcej konfliktów niż ,412 ,696 pokoju Zbyt ufamy nauce, za mało ,435 religii Metoda wyodrębniania czynników - Głównych składowych. a. 3 – liczba wyodrębnionych składowych. ,653 · Nie rotowana macierz składowych · Pomijamy c) a Macierz rotowanych składowych Składowa 1 uzyskaniu pocieszenia w 2 3 ,846 kłopotach lub chwilach smutku odnalezieniu wewnętrznego ,831 spokoju i szczęścia spotykaniu właściwych ludzi ,766 zawieraniu przyjaźni ,763 Zbyt ufamy nauce, za mało ,779 religii Życie ma sens bo istnieje ,763 Bóg Bóg zajmuje się osobiście ,610 każdą istotą Religia-więcej konfliktów niż ,862 pokoju Osoby religijne często zbyt ,834 nietolerancyjne Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Varimax z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 4 iteracjach. · Rotowana macierz · Pokazuje, co „ładuje każdy czynnik” · Czy można te czynniki nazwać? d) Testy Kaisera-Mayera-Olkina i Bartletta Miara KMO adekwatności doboru próby Przybliżone chi-kwadrat Test sferyczności Bartletta df Istotność ,768 3352,786 36 ,000 · Test istotny (p<0,05) pokazuje, że między zmiennymi są istotne współczynniki korelacji · Miara większa nić 0,5 wskazuje na dobre własności danych, a im bliżej 1 tym lepiej e) Zasoby zmienności wspólnej Początkowe Po wyodrębnieniu Zbyt ufamy nauce, za mało 1,000 ,615 1,000 ,768 1,000 ,727 1,000 ,567 1,000 ,678 1,000 ,714 zawieraniu przyjaźni 1,000 ,671 uzyskaniu pocieszenia w 1,000 ,724 1,000 ,708 religii Religia-więcej konfliktów niż pokoju Osoby religijne często zbyt nietolerancyjne Bóg zajmuje się osobiście każdą istotą Życie ma sens bo istnieje Bóg odnalezieniu wewnętrznego spokoju i szczęścia kłopotach lub chwilach smutku spotykaniu właściwych ludzi Metoda wyodrębniania czynników – głównych składowych. · Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych czynnikach · Im wyższa -> tym lepiej zmienna wpisuje się w czynnik To samo dla rotacji Oblimin a) Całkowita wyjaśniona wariancja b) Macierz składowa – bez rotacji c) Macierz modelowa – po rotacji, pokazuje czynniki a Macierz modelowa Składowa 1 uzyskaniu pocieszenia w 2 3 ,894 kłopotach lub chwilach smutku odnalezieniu wewnętrznego ,862 spokoju i szczęścia zawieraniu przyjaźni ,759 spotykaniu właściwych ludzi ,750 Religia-więcej konfliktów niż pokoju ,876 Osoby religijne często zbyt ,850 nietolerancyjne Zbyt ufamy nauce, za mało ,823 religii Życie ma sens bo istnieje ,745 Bóg Bóg zajmuje się osobiście ,553 każdą istotą Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. a. Rotacja osiągnęła zbieżność w 5 iteracjach. d) Macierz korelacji składowych Składowa 1 2 3 1 1,000 ,261 ,380 2 ,261 1,000 ,210 3 ,380 ,210 1,000 Metoda wyodrębniania czynników - Głównych składowych. Metoda rotacji - Oblimin z normalizacją Kaisera. · Korelacje pomiędzy czynnikami · Pokazuje, że to lepsza rotacja, bo korelacje są całkiem całkiem e) Test K-M-O f) Zasób zmienności wspólnej Aby utworzyć wskaźnik a) Można postępować jak w przypadku indeksu, ale dodając teraz do siebie tylko składowe danego czynnika b) Albo wykorzystać opcję automatycznego tworzenia wskaźnika o Która uwzględnia, że poszczególne zmienne nie ładują czynnika w takim samym stopniu Oceny -> zapisz jako zmienne -> metoda Anderson-Rubin Na końcu bazy nowe zmienne · Są wystandaryzowane do rozkładu normalnego · Wartości należy interpretować w kategoriach odległości od średniej (o ile części odchylenia standardowego w obie strony) · Ujemne – niski wynik na skali · Okolice zera – przeciętny · Dodatni – wysoki wynik na skali · Zapisany w ten sposób wskaźnik można wykorzystać przy innych analizach jako zmienną Analiza rzetelności · Wiemy, że pyt re34 w całości utworzyło jeden czynnik, jest więc dobrym materiałem na wskaźnik (skalę) · O tym, jak bardzo dobra jest to skala mówi nam analiza rzetelności Analiza -> skalowanie -> analiza rzetelności · Statystyki o Pozycja testowa o Skala przy wykluczeniu Statystyki rzetelności Alfa Cronbacha Liczba pozycji ,851 4 · Min 0,5 · 0,7 i wyżej – skala jest rzetelna Statystyki pozycji Ogółem odnalezieniu wewnętrznego Średnia skali po Wariancja skali Korelacja Alfa Cronbacha usunięciu po usunięciu pozycji Ogółem po usunięciu pozycji pozycji pozycji 6,99 5,748 ,662 ,824 zawieraniu przyjaźni 6,46 4,818 ,721 ,798 uzyskaniu pocieszenia w 7,01 5,705 ,663 ,823 6,43 4,712 ,737 ,791 spokoju i szczęścia kłopotach lub chwilach smutku spotykaniu właściwych ludzi · Czy dałoby się jeszcze poprawić rzetelność skali? Analiza czynnikowa a analiza rzetelności · Można je wykonywać w dowolnej kolejności · Jeśli najpierw czynnikowa, to rzetelności potem nas tylko upewnia · Jeśli najpierw rzetelności, to czynnikowa może pokazać, czy nie ma podskal Dla re18 · · · · Trudno powiedzieć -> jako środek skali Analiza rzetelności Analiza czynnikowa z rotację oblimin Analiza rzetelności dla podskal