Statystyka opisowa. Wykład I. Elementy statystyki opisowej
Transkrypt
Statystyka opisowa. Wykład I. Elementy statystyki opisowej
Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Statystyka opisowa. Wykład I. Elementy statystyki opisowej Edward Kozłowski e-mail:[email protected] Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Spis treści 1 Elementy statystyku opisowej 2 Szereg rozdzielczy punktowy 3 Średnie klasyczne Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Elementy statystyku opisowej Definicja Statystyka jest to nauka o metodach badania prawidłowości występujących w zbiorowościach. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Elementy statystyku opisowej Definicja Statystyka jest to nauka o metodach badania prawidłowości występujących w zbiorowościach. Statystyka matematyczna zajmuje się opisywaniem i analizą zjawisk masowych za pomoca metod rachunku prawdopodobieństwa. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Elementy statystyku opisowej Definicja Statystyka jest to nauka o metodach badania prawidłowości występujących w zbiorowościach. Statystyka matematyczna zajmuje się opisywaniem i analizą zjawisk masowych za pomoca metod rachunku prawdopodobieństwa. Statystyka opisowa zajmuje się wstępnym opracowaniem próbki bez posługiwania się rachunkiem prawdopodobieństwa. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Metody statystyki: · opis statystyczny · wnioskowanie statystyczne Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Metody statystyki: · opis statystyczny · wnioskowanie statystyczne Opis statystyczny jest to liczbowy opis badanych zbiorowości: · opis tabelkowy (szeregi, tablice) · opis graficzny (wykresy) · opis parametryczny (charakterystyki liczbowe, parametry, średnie, dominanta, mediana). Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Metody statystyki: · opis statystyczny · wnioskowanie statystyczne Opis statystyczny jest to liczbowy opis badanych zbiorowości: · opis tabelkowy (szeregi, tablice) · opis graficzny (wykresy) · opis parametryczny (charakterystyki liczbowe, parametry, średnie, dominanta, mediana). Wnioskowanie statystyczne wykorzystuje się, gdy badaniu statystycznemu nie jest poddawana cała zbiorowość (tzw. populacja), tylko część tej zbiorowości wybrana na drodze losowania (tzw. próba losowa). Wnioskowanie statystyczne polega na uogólnieniu wyników otrzymanych w badaniu próby losowej na całą populację, z której ta próba pochodzi. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: metody analizy struktury zbiorowości Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: metody analizy struktury zbiorowości metody analizy współzależności Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: metody analizy struktury zbiorowości metody analizy współzależności metody analizy dynamiki (tzn. zmiana zjawisk w czasie). Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Właściwości wspólne (identyczne) jednostek statystycznych wchodzących w skład jednej zbiorowości, nazywamy cechami stałymi. Wyróżniamy trzy rodzaje cech stałych: · cecha rzeczowa – co lub kto jest przedmiotem badania · cecha przestrzenna – gdzie występują i skąd pochodzą jednostki badania · cecha czasowa – z jakiego okresu lub momentu pochodzą jednostki badani Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Właściwości wspólne (identyczne) jednostek statystycznych wchodzących w skład jednej zbiorowości, nazywamy cechami stałymi. Wyróżniamy trzy rodzaje cech stałych: · cecha rzeczowa – co lub kto jest przedmiotem badania · cecha przestrzenna – gdzie występują i skąd pochodzą jednostki badania · cecha czasowa – z jakiego okresu lub momentu pochodzą jednostki badani Cechy zmienne – to właściwości, którymi różnią się poszczególne jednostki statystyczne. Wyróżniamy następujące rodzaje cech zmiennych: · cechy jakościowe – (opisowe/niemierzalne) nie dają się zmierzyć, lecz tylko pisać słownie · cecha (liczbowe lub mierzalne) dają się zmierzyć, wynik pomiaru wyrażamy za pomocą liczb w odpowiednich wymiarach (jednostkach) Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Klasyfikacja badań Ze względu na regularność przeprowadzanych badań statystycznych wyróżniamy: badania ciągłe Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Klasyfikacja badań Ze względu na regularność przeprowadzanych badań statystycznych wyróżniamy: badania ciągłe badania okresowe Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Klasyfikacja badań Ze względu na regularność przeprowadzanych badań statystycznych wyróżniamy: badania ciągłe badania okresowe badania doraźne Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: – określenie przedmiotu badania (zbiorowości statystycznej) – określenie zakresu badania (cech zmiennych) – określenie metody działania (pełne lub częściowe). Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: – określenie przedmiotu badania (zbiorowości statystycznej) – określenie zakresu badania (cech zmiennych) – określenie metody działania (pełne lub częściowe). obserwacje statystyczne polegają na gromadzeniu informacji o cechach zmiennych u wszystkich jednostek zbiorowości (badania pełne lub w próbie – badanie częściowe). Uzyskany w ten sposób zbiór danych nazywamy materiałem statystycznym. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: – określenie przedmiotu badania (zbiorowości statystycznej) – określenie zakresu badania (cech zmiennych) – określenie metody działania (pełne lub częściowe). obserwacje statystyczne polegają na gromadzeniu informacji o cechach zmiennych u wszystkich jednostek zbiorowości (badania pełne lub w próbie – badanie częściowe). Uzyskany w ten sposób zbiór danych nazywamy materiałem statystycznym. opracowanie i prezentacja wyników obserwacji statystycznej polega na gromadzeniu surowego materiału, który następnie jest opracowywany (celowi temu służy podporządkowanie danych klasyfikacja cech zmiennych) i odpowiednio prezentowany (w formie szeregów, tablic lub wykresów). Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: – określenie przedmiotu badania (zbiorowości statystycznej) – określenie zakresu badania (cech zmiennych) – określenie metody działania (pełne lub częściowe). obserwacje statystyczne polegają na gromadzeniu informacji o cechach zmiennych u wszystkich jednostek zbiorowości (badania pełne lub w próbie – badanie częściowe). Uzyskany w ten sposób zbiór danych nazywamy materiałem statystycznym. opracowanie i prezentacja wyników obserwacji statystycznej polega na gromadzeniu surowego materiału, który następnie jest opracowywany (celowi temu służy podporządkowanie danych klasyfikacja cech zmiennych) i odpowiednio prezentowany (w formie szeregów, tablic lub wykresów). analiza statystyczna wykorzystuje metody opisów statystycznych i metody wnioskowania statystycznego do wykrycia prawidłowości (lub nieprawidłowości) występujących w danej zbiorowości. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Szereg rozdzielczy Definicja Szeregiem rozdzielczym – nazywamy uporządkowany i pogrupowany materiał statystyczny. Niech x1 , ..., xn będzie n−elementową próbką, gdzie n <= 30 oraz elemnty powtarzają się. Jako klasy definiujemy rózne elementy z tej próby. Liczbę elementów próbki zawartych i i−tej klasie nazywamy liczebnością i k P oznaczany jako nj . Oczywiście nj = n. j=1 Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Otrzymany szereg przedstawiamy w postaci histogramu, gdzie na osi poziomej zaznaczamy klasy xj , j = 1, ..., k, a na osi pionowej liczebność nj . Na osi pionowej czasami zaznaczamy częstotliwość wj = nj n vj = wj b lub procenty Łącząc punkty o współrzędnych (x1 − b, 0) , (x1 , w1 ) , (x2 , w2 ) , ..., (xk , wk ) , (xk + b, 0) lub (1 − b, 0) , (x1 , v1 ) , (2 , v2 ) , ..., (xk , vk ) , (xk + b, 0) otrzymujemy łamaną częstości. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Przykład 1. Dla populacji 5.3, 5.2, 5.7, 5.6, 5.6, 5.5, 5.4, 5.1, 5.5, 5.7, 5.6, 5.6, 5.6, 5.6, 5.6, 5.4, 5.6, 5.5, 5.1, 5.2, 5.4, 5.3 utwórz szereg rozdzielczy, narysuj histogram i łamaną częstości. Rozwiązanie. Zatem szereg rozdzielczy jest postaci xi ni wi 1 5.1 2 0.09 2 5.2 2 0.09 3 5.3 2 0.09 4 5.4 3 0.14 5 5.5 3 0.14 6 5.6 8 0.36 7 P 5.7 2 0.09 22 1 Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Rysunek: Histogram. Rysunek: Łamana częstości. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Szereg rozdzielczy przedziałowy Rozstępem badanej cechy X nazywamy różnicę R = xmax − xmin gdzie xmax i xmin oznaczają odpowiednio wartość największą i najmniejszą w próbce. Przy większej liczebności próbki (n 30) wartości próbki grupujemy w klasy (przedziału o jednakowej długości, gdzie zakładamy że wartości znajdujące się w danej klasie są identyczne ze środkiem tej klasy). Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Liczbę klas k ustalamy w zależności od liczebności próby √ k ¬ ln n, k ≈ 1 + 3.322 ln n, k ≈ n Długość klasy określamy jako b≈ R k (przybliżenie z nadmiarem, czyli bk R). Punkty stanowiące granice klas ustala się zwykle z dokładnością do 12 α, gdzie α− oznacza dokładność. Klasy ustalamy jako 1 1 xmin − α + bj, xmin − α + b (j + 1) 2 2 gdzie j = 0, ..., k − 1. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Jeżeli liczebność n 30 (dokonujemy podziału na klasy) to dokonuje się grupowania, w wyniku którego otrzymujemy szereg rzdzielczy, pary liczb: środki klas x̄j oraz liczebność nj . Sposób w jaki liczebności są rozłożone w poszczególnych klasach nazywamy rozkładem liczebności badanej cechy. Otrzymany szereg przedstawiamy w postaci histogramu, gdzie na osi poziomej zaznaczamy środki klas x̄j , j = 1, ..., k (lub granice klas x̄j − 12 b, x̄j + 21 b ) a na osi pionowej liczebność nj . Na osi pionowej czasami zaznaczamy częstotliwość wj = nj n vj = wj b lub procenty Łącząc punkty o współrzędnych (x̄1 − b, 0) , (x̄1 , w1 ) , (x̄2 , w2 ) , ..., (x̄k , wk ) , (x̄k + b, 0) lub (x̄1 − b, 0) , (x̄1 , v1 ) , (x̄2 , v2 ) , ..., (x̄k , vk ) , (x̄k + b, 0) otrzymujemy łamaną częstości. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Przykład 2. Zapotrzebowanie na dobro (w tys. szt.) w kolejnych miesiącach I.2006 – VI.2008 kształtowało się na poziomie: 53, 54, 57, 50, 68, 49, 59, 62, 54, 55, 52, 52, 55, 47, 53, 61, 64, 54, 57, 59, 53, 58, 59, 51, 49, 45, 47, 52, 50, 51. Utwórz szereg rozdzielczy, narysuj histogram i łamaną częstości. Rozwiązanie. Dla powyższej próbki mamy xmin = 45 √ oraz xmax = 68 natomiast rozstęp R = 23. Jako liczbę klas k = 6 k ≈ 30 , natomiast długość klasy b = 4 b ≈ 23 a dokładność przyjmujemy α = 1 (ponieważ wyniki mamy 6 z dokładnością do wartości jednostkowych). Zgodnie z powyższym szereg rozdzielczy jest postaci klasy xi ni wi 1 (44.5; 48.5) 46.5 3 0.1 2 (48.5; 52.5) 50.5 9 0.3 3 (52.5; 56.5) 54.5 8 0.27 4 (56.5; 60.5) 58.5 6 0.2 5 (60.5; 64.5) 62.5 3 0.1 6 (64.5; 68.5) 66.5 1 0.03 P 30 Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Rysunek: Histogram. Rysunek: Łamana częstości. Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Średnie klasyczne Średnią arytmetyczną liczb x1 , ..., xn nazywamy n x̄ = 1X xi n i=1 lub średnią arytmetyczną warzoną k x̄ = 1X xi ni n i=1 gdzie ni − liczebość wyniku (lub klasy) xi . Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Średnią geometryczną dodatnich liczb liczb x1 , ..., xn nazywamy v u n uY √ n xi = n x1 · ... · xn ḡ = t i=1 lub średnią geometryczną ważoną v u k q uY n ḡ = t xni i = n xn1 1 · ... · xnnk i=1 gdzie ni − liczebość wyniku (lub klasy) xi . Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Średnią harmoniczną liczb x1 , ..., xn różnych od zera nazywamy h̄ = n !−1 k !−1 1X 1 n i=1 xi lub średnią harmoniczną warzoną h̄ = 1 X ni n i=1 xi gdzie ni − liczebość wyniku (lub klasy) xi . Edward Kozłowski Elementy statystyki opisowej Elementy statystyku opisowej Szereg rozdzielczy punktowy Średnie klasyczne Przykład 3. Średnia arytmetyczna dla zbiorowości z przykładu 1 xi ni xi ni 1 46.5 3 139.5 2 50.5 9 454.5 3 54.5 8 436 4 58.5 6 351 5 62.5 3 187.5 6 66.5 P 66.5 1 30 1635 wynosi 1635 x̄ = = 54.5 30 Edward Kozłowski Elementy statystyki opisowej