Statystyczna analiza danych transportowych
Transkrypt
Statystyczna analiza danych transportowych
Statystyczna analiza danych transportowych - Laboratorium III Analiza zależności między cechami ilościowymi Korelacja liniowa Pearsona, Korelacja Rang Spearmana Testowanie hipotez statystycznych – test ANOVA i ANOVA KW I. Zależność między cechami ilościowymi – ANALIZA KORELACJI a) Korelacja liniowa Pearsona Pozwala określić związek między cechami ilościowymi. Wyjaśnia w jakim stopniu (procencie) jedna zmienna wpływa na (modeluje) drugą zmienną. Określa kierunek i siłę związku. Mieści się w przedziale od {-1 do 1}. Interpretuje się go w procentach (0-100) Są różne interpretacje współczynnika korelacji. Przyjmujemy następującą: rxy< 0,2 – brak związku liniowego 0,2-0,4 – zależność wyraźna liniowa ale niska 0,4 – 0,7 zależność umiarkowana 0,7 – 0,9 –zależność znacząca powyżej 0,9 – zależność bardzo silna 1) (Dane miesięczne transport baza) Zbadać zależność między Produkcją sprzedaną przemysłu a Produkcją samochodów osobowych. Dokonać interpretacji współczynnika korelacji, oszacować prostą regresji oraz dokonać interpretacji. Y-……………[jednostka] X-……………[jednostka] Podać w jakim procencie prosta dopasowana jest do danych (współczynnik determinacji) (StatystykaStatystyki podstawowe i tabele macierze korelacji) Wybrać na jednej liście zmiennych dwie zmienne (zaznaczyć trzymając wciśnięty Ctrl) Następnie przejść do zakładki Więcej i wcisnąć 2W Rozrzutu, wybrać odpowiednio zmienną zależną (pionowo) i niezależną (poziomo). Zatwierdzić przyciskiem OK. W ten sposób otrzymać można wykres rozrzutu, współczynnik korelacji i prostą regresji za jednym razem) 2) (Firmy kurierskie - płace) Zbadać zależność między wiekiem a stażem pracy. Podać współczynnik korelacji i równanie regresji – zinterpretować. Następnie przeprowadzić analizę osobno dla kobiet a osobno dla mężczyzn – dokonać interpretacji i porównania. 3) (Ankieta transport) Zbadać zależność między wzrostem a wagą osobno dla kobiet i mężczyzn zinterpretować i porównać. a) Korelacja rang Spearmana 4) (Ankieta transport) Za pomocą korelacji rang Spearmana stwierdzić czy istnieje zależność między oceną wykorzystania środków z UE a oceną inwestycji w infrastrukturę drogową. Zależność zobrazować na wykresie workowym. Dokonać interpretacji. (Statystyka Statystyki nieparametryczne Korelacje) Po wejściu w moduł analizy należy w miejscu Oblicz: wskazać szczegółowy raport. Następnie wybrać dwie zmienne i zatwierdzić OK. Następnie wcisnąć R-Spearmana. Aby zilustrować zależność należy posłużyć się wykresem workowym: (Wykresy Wykresy 2W Wykresy workowe). 5) (Infrastruktura drogowa) Sprawdzić czy istnieje zależność pomiędzy Ludnością w wieku 25-34 przypadającą na tys. ludności a Samochodami zarejestrowanymi na tys. osób, Ciężarówkami zarejestrowanymi na tys. osób oraz Wypadkami śmiertelnymi na 100 tys. osób. Zinterpretować zależności jeśli wystąpią. Określić ich siłę oraz przedstawić na wykresie workowym. Na wykresie workowym przedstawić wszystkie trzy wybrane cechy w zależności od ludności w wieku 25-34 przypadających na tys. mieszkańców. (Wykresy Wykresy 2W Wykresy workowe – zakładka więcej). Z opcji Rodzaj wykresy należy wybrać wykres Wielokrotny następnie przy wyborze zmiennych na pierwszej liście wybrać Ludność w wieku……. A na drugiej trzy pozostałe. Doprowadzić wykres do jak najlepszego odbioru. Legendę przesunąć pod wykres. Uwaga: Kliknąć dwa razy na skalę po lewej stronie, przejść do zakładki Skala i w Menu wybrać ostatnią pozycję Przerwy. Nacisnąć Dodaj przerwę i wprowadzić zakres od 100 do 250. Tym samym wykres stanie się bardziej czytelny. II. Zależność między cechami jakościowymi – TEST NIEZALEŻNOŚCI CHI KWADRAT PEARSONA 1. Na podstawie pliku Firmy kurierskie – płace zbadać czy istnieje zależność między płcią a wykształceniem respondentów. Postawić odpowiednie hipotezy: zerową i alternatywną a do badań przyjąć poziom istotności α=0,05. Podjąć decyzję i przeanalizować wyniki. Statystyka Statystyki podstawowe i tabele Tabele wielodzielcze. Należy wybrać odpowiednie zmienne zatwierdzić wybór i przejść do zakładki Opcje. W zakładce opcje należy wybrać procenty z wiersza oraz zaznaczyć chi kwadrat Pearsona i NW. Następnie przejść do zakładki Więcej i wcisnąć Dokładne tabele dwudzielcze. Pojawią się dwie zakładki Tabela procentowa oraz wyniki testu. Odczytać wartość p. Podjąć decyzję. Opisać zależność za pomocą tabeli procentowej. (przekopiować tabelę do Excela i tam zrobić odpowiedni wykres). 2. Na podstawie pliku Ankieta transport – wskazać czy istnieje zależność między płcią a oceną infrastruktury drogowej. Postawić odpowiednie hipotezy: zerową i alternatywną a do badań przyjąć poziom istotności α=0,05. Podjąć decyzję i przeanalizować wyniki. 3. Na podstawie pliku Ankieta transport – wskazać czy istnieje zależność między posiadaniem prawa jazdy a oceną komunikacji publicznej w Rzeszowie. III. Zależności między cechami ilościowymi i jakościowymi – ANALIZA WARIANCJI KRUSKALA – WALLISA 4. Na podstawie pliku Firmy transportowe wskaźniki – wskazać czy istnieje statystycznie istotna różnica między rodzajem działalności a zyskiem operacyjnym. Postawić odpowiednie hipotezy: zerową i alternatywną a do badań przyjąć poziom istotności α=0,05. Podjąć decyzję i przeanalizować wyniki. Wyniki zobrazować na wykresie ramka wąsy. Statystyka Statystyki nieparametryczne Porównanie wielu prób niezależnych Wybrać odpowiednio zmienne (Zależna- ilościowa, Grupująca – jakościowa) Z pierwszej zakładki ANOVA Rang Kruskala Wallisa odczytać prawdopodobieństwo testowe p. Podjąć decyzję. 5. Na podstawie pliku Firmy transportowe wskaźniki – wskazać czy istnieje statystycznie istotna różnica między rodzajem działalności a przychodami ogółem. 6. Na podstawie pliku Ankieta transport – wskazać czy istnieje statystycznie istotna róznica w czasie dojazdu respondentów na uczelnię odnośnie miejsca zamieszkania podczas studiów.