Analiza czynnikowa • Kolejna z analiz wielozmiennowych • Jej

Transkrypt

Analiza czynnikowa • Kolejna z analiz wielozmiennowych • Jej
Analiza czynnikowa
· Kolejna z analiz wielozmiennowych
· Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki
Budowa wskaźnika
· Indeks był banalny
· I miał wady:
o Czy wszystkie podpytania były ze sobą połączone merytorycznie i statystycznie?
o Czy wszystkie podpytania mierzyły tak naprawdę to samo?
o Czy wszystkie podpytania były jednakowo ważne dla wskaźnika?
· Analiza czynnikowa jest bardziej skomplikowana, ale eliminuje ww. problemy
Jest kilka metod określania liczby czynników; najpopularniejsze:
· Metoda Kaisera
o przyjmuje istnienie tylu czynników, ile czynników ma wartość własną większą niż 1
o wartość własna określa procent wyjaśnianych przez dany czynnik wariancji
o jeśli czynnik nie wyjaśnia więcej wariancji niż pojedyncza zmienna to nie ma sensu
· metoda Catella
o z wykresem osypiska
o wyszukuje się punkt reprezentujący czynnik, za którym kończy się stromizna
o zlicza się czynniki powyżej tego punktu – tyle ich właśnie trzeba wyodrębnić
· !!! korzystamy tu także z metody głównych składowych
o Tylko ona pozwala uzyskać takie czynniki, które będą wyjaśniały maksymalny procent
wariancji wyjściowych zmiennych
Jest kilka metod obliczania ładunków czynnikowych
· metoda osi głównych
o rekomendowana
o stara się zmaksymalizować powiązania pomiędzy czynnikami a stwierdzeniami skali
o nie wymaga rozkładu normalnego
· metoda największej wiarygodności
o wymaga rozkładu normalnego
o podaje poziom istotności różnicy między strukturą idealną (modelową) w strukturą uzyskaną
w badaniu
Rotacja by zwiększyć dopasowanie
· rotacje ortogonalne
o najpopularniejsza: Varimax
o zakładamy brak korelacji między czynnikami
o przydaje się, gdy przygotowujemy predyktory dla regresji
· rotacje nieortogonalne (ukośne)
o najpopularniejsza: Oblimin
o zakładamy pewien stopień skorelowania czynników
o pokaże nam też, jeśli tej korelacji nie będzie
Analizę możemy prowadzić na
· danych surowych -> macierz korelacji
· danych zestandaryzowanych -> macierz kowariancji
[standaryzacja:
Analiza -> opis statystyczny -> statystyki opisowe -> zapisz standaryzowane wartości jako zmienne ]
Przy wyborze zmiennych trzeba uważać na:
· związki merytoryczne
· kierunek pytania
· braki odpowiedzi
R11b „Zbyt ufamy nauce, za mało religii”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
R11c „Religia-więcej konfliktów niż pokoju”
· 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie
R11d „Osoby religijne często zbyt nietolerancyjne”
· 1 zdec. zgoda, 5 zdec. niezgoda -> rośnie zaufanie
R19a „Bóg zajmuje się osobiście każdą istotą”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
R19c „Życie ma sens bo istnieje Bóg”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
R34a „Religia sprzyja odnalezieniu wewnętrznego spokoju i szczęścia”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
R34b „Religia sprzyja zawieraniu przyjaźni”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
R34c „Religia sprzyja uzyskaniu pocieszenia w kłopotach lub chwilach smutku”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
R34d „Religia sprzyja spotykaniu właściwych ludzi”
· 1 zdec. zgoda, 5 zdec. niezgoda -> zaufanie spada
Kontrola braków danych
Odwrócenie R11c i R11d
Analiza -> redukcja wymiarów -> analiza czynnikowa
· Zmienne -> wszystkie brane pod uwagę zmienne
· Statystyki
o Statystyki opisowe
o Rozwiązania wstępne
o K-M-O
· Wyodrębnianie
o Domyślne głównych składowych
o Macierz korelacji, bo mamy dane surowe
o Pokaż nierotowane rozwiązania czynnikowe
o Wyodrębnianie na podstawie wartości własnej większe niż 1
· Rotacja
o Wersja pierwsza: Varimax
o Wersja druga: Oblimin
· Opcje
o Sortuj wg wartości ładunków czynnikowych
o Ukryj małe współczynniki (wartość bezwzględna poniżej 0,4)
Interpretacja tabel:
a)
Całkowita wyjaśniona wariancja
Skład
Sumy kwadratów ładunków po
Początkowe wartości własne
owa
Sumy kwadratów ładunków po rotacji
wyodrębnieniu
Ogółem
%
%
Ogółem
% wariancji
%
wariancji
skumulowa
skumulowa
ny
ny
Ogółem
% wariancji
%
skumulowany
1
3,736
41,514
41,514
3,736
41,514
41,514
2,788
30,983
30,983
2
1,353
15,033
56,547
1,353
15,033
56,547
1,802
20,020
51,002
3
1,083
12,028
68,576
1,083
12,028
68,576
1,582
17,573
68,576
4
,778
8,639
77,215
5
,685
7,609
84,824
6
,485
5,386
90,210
7
,402
4,462
94,671
8
,286
3,183
97,854
9
,193
2,146
100,000
Metoda wyodrębniania czynników – głównych składowych.
· Wartość własna powyżej 1 to 3 czynniki
· Wyjaśniają w sumie (po rotacji) 68,6% wariancji (czyli 2/3 przypadków) – to sporo
b)
Macierz składowycha
Składowa
1
2
spotykaniu właściwych ludzi
,811
zawieraniu przyjaźni
,774
odnalezieniu wewnętrznego
,749
3
spokoju i szczęścia
uzyskaniu pocieszenia w
,719
kłopotach lub chwilach
smutku
Bóg zajmuje się osobiście
,680
każdą istotą
Życie ma sens bo istnieje
,653
,482
Bóg
Osoby religijne często zbyt
,744
nietolerancyjne
Religia-więcej konfliktów niż
,412
,696
pokoju
Zbyt ufamy nauce, za mało
,435
religii
Metoda wyodrębniania czynników - Głównych składowych.
a. 3 – liczba wyodrębnionych składowych.
,653
· Nie rotowana macierz składowych
· Pomijamy
c)
a
Macierz rotowanych składowych
Składowa
1
uzyskaniu pocieszenia w
2
3
,846
kłopotach lub chwilach
smutku
odnalezieniu wewnętrznego
,831
spokoju i szczęścia
spotykaniu właściwych ludzi
,766
zawieraniu przyjaźni
,763
Zbyt ufamy nauce, za mało
,779
religii
Życie ma sens bo istnieje
,763
Bóg
Bóg zajmuje się osobiście
,610
każdą istotą
Religia-więcej konfliktów niż
,862
pokoju
Osoby religijne często zbyt
,834
nietolerancyjne
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Varimax z normalizacją Kaisera.
a. Rotacja osiągnęła zbieżność w 4 iteracjach.
· Rotowana macierz
· Pokazuje, co „ładuje każdy czynnik”
· Czy można te czynniki nazwać?
d)
Testy Kaisera-Mayera-Olkina i Bartletta
Miara KMO adekwatności doboru próby
Przybliżone chi-kwadrat
Test sferyczności Bartletta
df
Istotność
,768
3352,786
36
,000
· Test istotny (p<0,05) pokazuje, że między zmiennymi są istotne współczynniki korelacji
· Miara większa nić 0,5 wskazuje na dobre własności danych, a im bliżej 1 tym lepiej
e)
Zasoby zmienności wspólnej
Początkowe
Po
wyodrębnieniu
Zbyt ufamy nauce, za mało
1,000
,615
1,000
,768
1,000
,727
1,000
,567
1,000
,678
1,000
,714
zawieraniu przyjaźni
1,000
,671
uzyskaniu pocieszenia w
1,000
,724
1,000
,708
religii
Religia-więcej konfliktów niż
pokoju
Osoby religijne często zbyt
nietolerancyjne
Bóg zajmuje się osobiście
każdą istotą
Życie ma sens bo istnieje
Bóg
odnalezieniu wewnętrznego
spokoju i szczęścia
kłopotach lub chwilach
smutku
spotykaniu właściwych ludzi
Metoda wyodrębniania czynników – głównych składowych.
· Określa ile procent wariancji zmiennej wyjściowej udało się odtworzyć w nowo powstałych
czynnikach
· Im wyższa -> tym lepiej zmienna wpisuje się w czynnik
To samo dla rotacji Oblimin
a) Całkowita wyjaśniona wariancja
b) Macierz składowa – bez rotacji
c) Macierz modelowa – po rotacji, pokazuje czynniki
a
Macierz modelowa
Składowa
1
uzyskaniu pocieszenia w
2
3
,894
kłopotach lub chwilach
smutku
odnalezieniu wewnętrznego
,862
spokoju i szczęścia
zawieraniu przyjaźni
,759
spotykaniu właściwych ludzi
,750
Religia-więcej konfliktów niż
pokoju
,876
Osoby religijne często zbyt
,850
nietolerancyjne
Zbyt ufamy nauce, za mało
,823
religii
Życie ma sens bo istnieje
,745
Bóg
Bóg zajmuje się osobiście
,553
każdą istotą
Metoda wyodrębniania czynników - Głównych składowych.
Metoda rotacji - Oblimin z normalizacją Kaisera.
a. Rotacja osiągnęła zbieżność w 5 iteracjach.
d)
Macierz korelacji składowych
Składowa
1
2
3
1
1,000
,261
,380
2
,261
1,000
,210
3
,380
,210
1,000
Metoda wyodrębniania czynników - Głównych
składowych.
Metoda rotacji - Oblimin z normalizacją Kaisera.
· Korelacje pomiędzy czynnikami
· Pokazuje, że to lepsza rotacja, bo korelacje są całkiem całkiem
e) Test K-M-O
f) Zasób zmienności wspólnej
Aby utworzyć wskaźnik
a) Można postępować jak w przypadku indeksu, ale dodając teraz do siebie tylko składowe danego
czynnika
b) Albo wykorzystać opcję automatycznego tworzenia wskaźnika
o Która uwzględnia, że poszczególne zmienne nie ładują czynnika w takim samym stopniu
Oceny -> zapisz jako zmienne -> metoda Anderson-Rubin
Na końcu bazy nowe zmienne
· Są wystandaryzowane do rozkładu normalnego
· Wartości należy interpretować w kategoriach odległości od średniej (o ile części odchylenia
standardowego w obie strony)
· Ujemne – niski wynik na skali
· Okolice zera – przeciętny
· Dodatni – wysoki wynik na skali
· Zapisany w ten sposób wskaźnik można wykorzystać przy innych analizach jako zmienną
Analiza rzetelności
· Wiemy, że pyt re34 w całości utworzyło jeden czynnik, jest więc dobrym materiałem na wskaźnik
(skalę)
· O tym, jak bardzo dobra jest to skala mówi nam analiza rzetelności
Analiza -> skalowanie -> analiza rzetelności
· Statystyki
o Pozycja testowa
o Skala przy wykluczeniu
Statystyki rzetelności
Alfa Cronbacha
Liczba pozycji
,851
4
· Min 0,5
· 0,7 i wyżej – skala jest rzetelna
Statystyki pozycji Ogółem
odnalezieniu wewnętrznego
Średnia skali po
Wariancja skali
Korelacja
Alfa Cronbacha
usunięciu
po usunięciu
pozycji Ogółem
po usunięciu
pozycji
pozycji
pozycji
6,99
5,748
,662
,824
zawieraniu przyjaźni
6,46
4,818
,721
,798
uzyskaniu pocieszenia w
7,01
5,705
,663
,823
6,43
4,712
,737
,791
spokoju i szczęścia
kłopotach lub chwilach
smutku
spotykaniu właściwych ludzi
· Czy dałoby się jeszcze poprawić rzetelność skali?
Analiza czynnikowa a analiza rzetelności
· Można je wykonywać w dowolnej kolejności
· Jeśli najpierw czynnikowa, to rzetelności potem nas tylko upewnia
· Jeśli najpierw rzetelności, to czynnikowa może pokazać, czy nie ma podskal
Dla re18
·
·
·
·
Trudno powiedzieć -> jako środek skali
Analiza rzetelności
Analiza czynnikowa z rotację oblimin
Analiza rzetelności dla podskal