Zajęcia nr 3: Analiza danych
Transkrypt
Zajęcia nr 3: Analiza danych
Laboratorium nr 1 Zadanie 1 1. Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby: 6,9,1,2,5,2,6,2,1,0,1,4,5,6,3,7,3,2,2,3,8,5,3,4,8,0,8,0,5,1,6,4,8,0,3,2 2. 3. 4. 5. 6. 7. Jaka będzie moda dla zbioru: 3; 4; 5; 6; 7; 7; 7; 8; 8; 9 ? Odp 7 A jaka dla zbioru ? 3; 4; 5; 6; 7; 7; 7; 8; 8; 8; 9 ? Odp {7,8} albo 7.5 jaka będzie mediana dla 3; 4; 7; 2; 3; 7; 4; 2; 4; 7; 4 ? Odp: 2; 2; 3; 3; 4; 4; 4; 4; 7; 7; 7 jaka będzie wartość średnia dla zbioru: 3; 4; 5; 7; 7; 8; 9; 9; 9 Odp 61/9 = 6.78 Jaki będzie rozstęp zbioru: 2; 3; 4; 6; 7; 7; 8; 9 Odp 9-2 = 7 Kwartyle: dla zbioru: 3; 4; 7; 2; 3; 7; 4; 2; 4; 7; 4 Najpierw sortujemy: 2; 2; 3; 3; 4; 4; 4; 4;7; 7; 7, Mediana, q2 = 4, Q1 to wartość środkowa z danych: 2; 2; 3; 3; 4 a więc 3, Q3 to wartość srodkowa z danych: 4; 4;7; 7; 7 a wiec 7, IRQ = q3-q1 = 7-3 = 4 8. Oblicz wariancję dla danych: 3; 4; 4; 5; 5; 5; 6; 6; 6; 7; 7; 8; 9 Będzie liczona ze wzoru: 9. Odchylenie standardowe będzie liczone ze wzoru: Zadanie 2. Zbadano profile klientów banku A pod względem liczby osób w rodzinie. Wyniki były następujące: 3,5,3,4,4,4,5,3,6,4,4,4,2,3,4,2,3,4,5,4. Oblicz średnią , medianę i modę. Oblicz q1,q3. Narysuj odpowiedni wykres prezentujący rozkład wartości w zbiorze. Zadanie 3. W pewnej firmie przeprowadzono ankietę dotyczącą liczby telefonów zgłaszających awarię u klientów w ciągu ostatnich 6 miesiecy. Uzyskane wyniki są następujące: Liczba awarii Liczba klientów 0 1 2 3 4 5 35 25 15 10 10 5 Czy prawdą jest, że: Średnia liczba zgłoszonych awarii wynosiła 1.3 ? W badanej próbie najczęściej zgłaszano 2 awarie ? 50 % badanej grupy zgłosiło co najwyżej 1 awarię ? Zadanie 4 Tętna spoczynkowe lekkoatletów wynoszą: 44;34;33;34;35;33;31;41;30;31;31;32;34;45;37;35 Wyznacz: a) b) c) d) e) f) g) wykres pudełkowy (narysuj go ręcznie z zaznaczeniem wszystkich elementów) modę medianę średnią wariancję kwartyle Odchylenie standardowe Zadanie 5. Na podstawie danych dotyczących wydajności pracy Y i stażu pracy X 10 robotników ustalić czy między zmiennymi X i Y istnieje zależność korelacyjna. Jeśli tak, to określić jej kierunek. Sporządzić wykres korelacyjny oraz uporządkować wartości cechy X i odpowiadające im wartości cechy Y Zadanie 6 Dla 13 robotników zanotowano następujące wartości dwóch cech: X - staż pracy w latach, Y liczba braków. Ocenić czy istnieje korelacja pomiędzy tymi cechami i jaki jest jej kierunek. Zadanie 7. Zakładając, że liczba przepracowanych godzin przez pracowników na rzecz nowego projektu wygląda następująco: a) Znajdź odchylenia metodą wartości średniej i odchylenia standardowego. b) Znajdź odchylenia metodą rozstępu międzykwartylowego.