Cw nr 1: Wprowadzenie do analizy danych, statystyka opisowa

Transkrypt

Cw nr 1: Wprowadzenie do analizy danych, statystyka opisowa
Laboratorium nr 1
CZĘŚĆ I : STATYSTYKA OPISOWA :
Zadanie1.
1. Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:
6,9,1,2,5,2,6,2,1,0,1,4,5,6,3,7,3,2,2,3,8,5,3,4,8,0,8,0,5,1,6,4,8,0,3,2
2.
3.
4.
5.
6.
7.
Jaka będzie moda dla zbioru: 3; 4; 5; 6; 7; 7; 7; 8; 8; 9 ?
Odp 7
A jaka dla zbioru ? 3; 4; 5; 6; 7; 7; 7; 8; 8; 8; 9 ?
Odp {7,8} albo 7.5
jaka będzie mediana dla 3; 4; 7; 2; 3; 7; 4; 2; 4; 7; 4 ?
Odp: 2; 2; 3; 3; 4; 4; 4; 4; 7; 7; 7
jaka będzie wartość średnia dla zbioru: 3; 4; 5; 7; 7; 8; 9; 9; 9
Odp 61/9 = 6.78
Jaki będzie rozstęp zbioru: 2; 3; 4; 6; 7; 7; 8; 9
Odp 9-2 = 7
Kwartyle: dla zbioru: 3; 4; 7; 2; 3; 7; 4; 2; 4; 7; 4 Najpierw sortujemy: 2; 2; 3; 3; 4; 4; 4; 4;7; 7; 7,
Mediana, q2 = 4, Q1 to wartość środkowa z danych: 2; 2; 3; 3; 4 a więc 3, Q3 to wartość srodkowa z
danych: 4; 4;7; 7; 7 a wiec 7, IRQ = q3-q1 = 7-3 = 4
Zadanie 2.
W pewnym szpitalu badano wagę noworodków przebywających na oddziale położniczym.
Uzyskano wagi (w kg): 3,7; 4,0; 3,5; 3,7; 2,5; 1,8; 3,5; 3,6; 2,9; 1,5; 4,5; 2,3; 1,6; 4,2; 3,2; 3,8; 2,5; 2,4;
3,7; 5,0; 3,4; 2,6; 2,8; 2,6; 4,1; 4,8; 3,0; 4,4; 3,0; 3,2.
a) Podaj najczęściej występującą wagę noworodka.
b) Podaj wagę środkową noworodka na tym oddziale.
c) Podaj rozstęp wyników tj. różnicę między największą a najmniejszą wagą.
d) Oblicz średnia wartość wagi noworodków.
e) Oblicz jaki procent liczby noworodków ma wagę powyżej 4 kg
Zadanie 3.
W pewnej firmie przeprowadzono ankietę dotyczącą liczby telefonów zgłaszających awarię u klientów w
ciągu ostatnich 6 miesiecy. Uzyskane wyniki są następujące:
Liczba
awarii
Liczba
klientów
0
1
2
3
4
5
35
25
15
10
10
5
Czy prawdą jest, że:



Średnia liczba zgłoszonych awarii wynosiła 1.3 ?
W badanej próbie najczęściej zgłaszano 2 awarie ?
50 % badanej grupy zgłosiło co najwyżej 1 awarię ?
CZĘŚĆ II : GRAFICZNA REPREZENTACJA DANYCH :
1. Narysować i opisać elementy wykresu pudełkowego dla obserwacji: 8,5,17,18,9,4,17,16,12
2. Narysować histogram dla obserwacji (przyjąć 5 przedziałów): 8,5,17,18,9,4,17,16,12,14,15,53.
3. Jeśli spojrzymy na histogram poniżej dla atrybutu „klasa” to:
 Ile atrybut „klasa” ma wartości?
 Jaka jest liczność poszczególnych wartości atrybutu :”klasa” ?
4. Jeśli spojrzymy na wykres pudełkowy dla atrybutu „b” to:



Ile ma on wartości?
Co powiemy o wartościach w stosunku do wartości atrybutu „klasa”?
Czy atrybut „b” może być dobrym klasyfikatorem obiektów w systemie ? Odpowiedź uzasadnij.

Podobne dokumenty