Cw nr 1: Wprowadzenie do analizy danych, statystyka opisowa
Transkrypt
Cw nr 1: Wprowadzenie do analizy danych, statystyka opisowa
Laboratorium nr 1 CZĘŚĆ I : STATYSTYKA OPISOWA : Zadanie1. 1. Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby: 6,9,1,2,5,2,6,2,1,0,1,4,5,6,3,7,3,2,2,3,8,5,3,4,8,0,8,0,5,1,6,4,8,0,3,2 2. 3. 4. 5. 6. 7. Jaka będzie moda dla zbioru: 3; 4; 5; 6; 7; 7; 7; 8; 8; 9 ? Odp 7 A jaka dla zbioru ? 3; 4; 5; 6; 7; 7; 7; 8; 8; 8; 9 ? Odp {7,8} albo 7.5 jaka będzie mediana dla 3; 4; 7; 2; 3; 7; 4; 2; 4; 7; 4 ? Odp: 2; 2; 3; 3; 4; 4; 4; 4; 7; 7; 7 jaka będzie wartość średnia dla zbioru: 3; 4; 5; 7; 7; 8; 9; 9; 9 Odp 61/9 = 6.78 Jaki będzie rozstęp zbioru: 2; 3; 4; 6; 7; 7; 8; 9 Odp 9-2 = 7 Kwartyle: dla zbioru: 3; 4; 7; 2; 3; 7; 4; 2; 4; 7; 4 Najpierw sortujemy: 2; 2; 3; 3; 4; 4; 4; 4;7; 7; 7, Mediana, q2 = 4, Q1 to wartość środkowa z danych: 2; 2; 3; 3; 4 a więc 3, Q3 to wartość srodkowa z danych: 4; 4;7; 7; 7 a wiec 7, IRQ = q3-q1 = 7-3 = 4 Zadanie 2. W pewnym szpitalu badano wagę noworodków przebywających na oddziale położniczym. Uzyskano wagi (w kg): 3,7; 4,0; 3,5; 3,7; 2,5; 1,8; 3,5; 3,6; 2,9; 1,5; 4,5; 2,3; 1,6; 4,2; 3,2; 3,8; 2,5; 2,4; 3,7; 5,0; 3,4; 2,6; 2,8; 2,6; 4,1; 4,8; 3,0; 4,4; 3,0; 3,2. a) Podaj najczęściej występującą wagę noworodka. b) Podaj wagę środkową noworodka na tym oddziale. c) Podaj rozstęp wyników tj. różnicę między największą a najmniejszą wagą. d) Oblicz średnia wartość wagi noworodków. e) Oblicz jaki procent liczby noworodków ma wagę powyżej 4 kg Zadanie 3. W pewnej firmie przeprowadzono ankietę dotyczącą liczby telefonów zgłaszających awarię u klientów w ciągu ostatnich 6 miesiecy. Uzyskane wyniki są następujące: Liczba awarii Liczba klientów 0 1 2 3 4 5 35 25 15 10 10 5 Czy prawdą jest, że: Średnia liczba zgłoszonych awarii wynosiła 1.3 ? W badanej próbie najczęściej zgłaszano 2 awarie ? 50 % badanej grupy zgłosiło co najwyżej 1 awarię ? CZĘŚĆ II : GRAFICZNA REPREZENTACJA DANYCH : 1. Narysować i opisać elementy wykresu pudełkowego dla obserwacji: 8,5,17,18,9,4,17,16,12 2. Narysować histogram dla obserwacji (przyjąć 5 przedziałów): 8,5,17,18,9,4,17,16,12,14,15,53. 3. Jeśli spojrzymy na histogram poniżej dla atrybutu „klasa” to: Ile atrybut „klasa” ma wartości? Jaka jest liczność poszczególnych wartości atrybutu :”klasa” ? 4. Jeśli spojrzymy na wykres pudełkowy dla atrybutu „b” to: Ile ma on wartości? Co powiemy o wartościach w stosunku do wartości atrybutu „klasa”? Czy atrybut „b” może być dobrym klasyfikatorem obiektów w systemie ? Odpowiedź uzasadnij.