Statystyczna analiza danych transportowych

Transkrypt

Statystyczna analiza danych transportowych
Statystyczna analiza danych transportowych - Laboratorium III
Analiza zależności między cechami ilościowymi
Korelacja liniowa Pearsona, Korelacja Rang Spearmana
Testowanie hipotez statystycznych – test ANOVA i ANOVA KW
I.
Zależność między cechami ilościowymi – ANALIZA KORELACJI
a) Korelacja liniowa Pearsona
Pozwala określić związek między cechami ilościowymi. Wyjaśnia w jakim stopniu (procencie) jedna
zmienna wpływa na (modeluje) drugą zmienną. Określa kierunek i siłę związku. Mieści się w przedziale od {-1
do 1}. Interpretuje się go w procentach (0-100) Są różne interpretacje współczynnika korelacji. Przyjmujemy
następującą:
rxy< 0,2 – brak związku liniowego
0,2-0,4 – zależność wyraźna liniowa ale niska
0,4 – 0,7 zależność umiarkowana
0,7 – 0,9 –zależność znacząca
powyżej 0,9 – zależność bardzo silna
1) (Dane miesięczne transport baza) Zbadać zależność między Produkcją sprzedaną
przemysłu a Produkcją samochodów osobowych. Dokonać interpretacji współczynnika
korelacji, oszacować prostą regresji oraz dokonać interpretacji.
Y-……………[jednostka]
X-……………[jednostka]
Podać w jakim procencie prosta dopasowana jest do danych (współczynnik
determinacji) (StatystykaStatystyki podstawowe i tabele  macierze korelacji) Wybrać na
jednej liście zmiennych dwie zmienne (zaznaczyć trzymając wciśnięty Ctrl) Następnie przejść
do zakładki Więcej i wcisnąć 2W Rozrzutu, wybrać odpowiednio zmienną zależną (pionowo) i
niezależną (poziomo). Zatwierdzić przyciskiem OK. W ten sposób otrzymać można wykres
rozrzutu, współczynnik korelacji i prostą regresji za jednym razem)
2) (Firmy kurierskie - płace) Zbadać zależność między wiekiem a stażem pracy. Podać
współczynnik korelacji i równanie regresji – zinterpretować. Następnie przeprowadzić analizę
osobno dla kobiet a osobno dla mężczyzn – dokonać interpretacji i porównania.
3) (Ankieta transport) Zbadać zależność między wzrostem a wagą osobno dla kobiet i
mężczyzn zinterpretować i porównać.
a) Korelacja rang Spearmana
4) (Ankieta transport) Za pomocą korelacji rang Spearmana stwierdzić czy istnieje
zależność między oceną wykorzystania środków z UE a oceną inwestycji w infrastrukturę
drogową. Zależność zobrazować na wykresie workowym. Dokonać interpretacji.
(Statystyka Statystyki nieparametryczne Korelacje) Po wejściu w moduł analizy należy
w miejscu Oblicz: wskazać szczegółowy raport. Następnie wybrać dwie zmienne i
zatwierdzić OK. Następnie wcisnąć R-Spearmana. Aby zilustrować zależność należy
posłużyć się wykresem workowym: (Wykresy  Wykresy 2W Wykresy workowe).
5) (Infrastruktura drogowa) Sprawdzić czy istnieje zależność pomiędzy Ludnością w
wieku 25-34 przypadającą na tys. ludności a Samochodami zarejestrowanymi na tys. osób,
Ciężarówkami zarejestrowanymi na tys. osób oraz Wypadkami śmiertelnymi na 100 tys.
osób. Zinterpretować zależności jeśli wystąpią. Określić ich siłę oraz przedstawić na wykresie
workowym.
Na wykresie workowym przedstawić wszystkie trzy wybrane cechy w zależności od
ludności w wieku 25-34 przypadających na tys. mieszkańców. (Wykresy  Wykresy 2W
Wykresy workowe – zakładka więcej). Z opcji Rodzaj wykresy należy wybrać wykres
Wielokrotny następnie przy wyborze zmiennych na pierwszej liście wybrać Ludność w
wieku……. A na drugiej trzy pozostałe. Doprowadzić wykres do jak najlepszego odbioru.
Legendę przesunąć pod wykres. Uwaga: Kliknąć dwa razy na skalę po lewej stronie,
przejść do zakładki Skala i w Menu wybrać ostatnią pozycję Przerwy. Nacisnąć Dodaj
przerwę i wprowadzić zakres od 100 do 250. Tym samym wykres stanie się bardziej
czytelny.
II.
Zależność między cechami jakościowymi – TEST NIEZALEŻNOŚCI CHI
KWADRAT PEARSONA
1. Na podstawie pliku Firmy kurierskie – płace zbadać czy istnieje zależność między
płcią a wykształceniem respondentów.
Postawić odpowiednie hipotezy: zerową i alternatywną a do badań przyjąć
poziom istotności α=0,05. Podjąć decyzję i przeanalizować wyniki.
Statystyka Statystyki podstawowe i tabele  Tabele wielodzielcze. Należy wybrać
odpowiednie zmienne zatwierdzić wybór i przejść do zakładki Opcje. W zakładce opcje
należy wybrać procenty z wiersza oraz zaznaczyć chi kwadrat Pearsona i NW.
Następnie przejść do zakładki Więcej i wcisnąć Dokładne tabele dwudzielcze. Pojawią
się dwie zakładki Tabela procentowa oraz wyniki testu. Odczytać wartość p. Podjąć
decyzję. Opisać zależność za pomocą tabeli procentowej. (przekopiować tabelę do
Excela i tam zrobić odpowiedni wykres).
2. Na podstawie pliku Ankieta transport – wskazać czy istnieje zależność między płcią a
oceną infrastruktury drogowej. Postawić odpowiednie hipotezy: zerową i
alternatywną a do badań przyjąć poziom istotności α=0,05. Podjąć decyzję i
przeanalizować wyniki.
3. Na podstawie pliku Ankieta transport – wskazać czy istnieje zależność między
posiadaniem prawa jazdy a oceną komunikacji publicznej w Rzeszowie.
III.
Zależności między cechami ilościowymi i jakościowymi – ANALIZA
WARIANCJI KRUSKALA – WALLISA
4. Na podstawie pliku Firmy transportowe wskaźniki – wskazać czy istnieje statystycznie
istotna różnica między rodzajem działalności a zyskiem operacyjnym. Postawić
odpowiednie hipotezy: zerową i alternatywną a do badań przyjąć poziom
istotności α=0,05. Podjąć decyzję i przeanalizować wyniki. Wyniki zobrazować na
wykresie ramka wąsy.
Statystyka  Statystyki nieparametryczne Porównanie wielu prób niezależnych
Wybrać odpowiednio zmienne (Zależna- ilościowa, Grupująca – jakościowa) Z
pierwszej zakładki ANOVA Rang Kruskala Wallisa odczytać prawdopodobieństwo
testowe p. Podjąć decyzję.
5. Na podstawie pliku Firmy transportowe wskaźniki – wskazać czy istnieje statystycznie
istotna różnica między rodzajem działalności a przychodami ogółem.
6. Na podstawie pliku Ankieta transport – wskazać czy istnieje statystycznie istotna
róznica w czasie dojazdu respondentów na uczelnię odnośnie miejsca zamieszkania
podczas studiów.