ĆWICZENIA nr 2
Transkrypt
ĆWICZENIA nr 2
ĆWICZENIA nr 2 Cel zajęć: Wprowadzenie podstawowych pojęć statystycznych, wskazanie różnic pomiędzy próbą danych a populacją, pomiędzy zmienną ciągłą a zmienną skokową, sporządzanie szeregów rozdzielczych oraz histogramów dla danej próby. Wprowadzenie teoretyczne Celem badań statystycznych jest opis zjawisk zachodzących w zbiorowisku zwanym populacją generalną lub krócej – populacją. W skład populacji wchodzą elementy (np. osobniki) jednego rodzaju, np. populację zdefiniowaną „każdy element jest zwierzęciem” będą stanowiły wszystkie zwierzęta. W celu uzyskania wniosków dotyczących badanej populacji, należy zmierzyć jej cechy będące przedmiotem zainteresowania. Jest to czynność niezwykle pracochłonna, a często wręcz niemożliwa do wykonania. W związku z tym, wnioskowanie przeprowadza się na podstawie części populacji, czyli na próbie. Populacją próbną (próbą) nazywamy skończony zbiór elementów pobranych z populacji generalnej. Pobrana próba powinna być reprezentatywna, czyli powinna w jak najlepszy sposób oddawać strukturę badanej populacji. Najprostszym typem próby reprezentatywnej jest próba losowa prosta. Otrzymuje się ją wtedy, gdy każdy element populacji ma taką samą szansę trafienia do próby, a wybór elementów jest losowy. Drugim, często stosowanym typem próby jest próba pobierana systematycznie. W tym przypadku elementy nie są wybierane losowo, lecz z góry określony sposób, np. co dziesiąty element. Wstępnym opracowaniem próby, bez posługiwania się rachunkiem prawdopodobieństwa, zajmuje się statystyka opisowa. Badane cechy populacji mogą być zmiennymi ciągłymi albo dyskretnymi. Zmienna ciągła może przyjmować wszystkie wartości z określonego przedziału (np. waga noworodka). Zmienna, która przyjmuje tylko niektóre wartości liczbowe to zmienna dyskretna (skokowa), np. liczba dzieci. Niech x1, x2,…, xn będzie n-elementową próbą z badanej populacji. n jest wówczas liczebnością próby, czyli liczbą obserwacji w próbie. Maksimum (xmax) próby jest największa wartość spośród obserwacji. Minimum (xmin) próby jest najmniejsza wartość spośród obserwacji. Rozstępem próby jest różnica pomiędzy maksimum a minimum próby: R = xmax – xmin. Jeżeli mamy do czynienia z dużą próbą, można na jej podstawie zaprezentować rozkład empiryczny cechy. Dokonuje się tego tworząc szereg rozdzielczy. Uzyskuje się go dzieląc dane na klasy, czyli przedziały, które najczęściej są jednakowej długości. Istnieje wiele metod ustalania liczby klas (k). Zaleca się określanie liczby klas na podstawie poniższej tabeli. n k 30 – 60 6–8 60 – 100 7 – 10 100 – 200 9 – 12 200 – 500 11 – 17 500 - 1500 16 - 25 Poznawszy liczebności klas, można obliczyć częstości występowania poszczególnych wartości. Częstości te charakteryzują rozkład empiryczny cechy w populacji. Graficzne przedstawienie szeregu rozdzielczego nazywamy histogramem. Zadania 1. Podać trzy przykłady populacji oraz prób pobranych z tych populacji. 2. Określić, które z poniższych zmiennych to zmienne ciągłe, a które to zmienne skokowe: • liczba mieszkańców Wrocławia, • zużycie wody na jednego mieszkańca Wrocławia, • wzrost studentów Wydziału Biologii i Hodowli Zwierząt UP, • liczba oczek wyrzucona kostką do gry, • waga jaja zielononóżki kuropatwianej, • liczba kobiet w ciąży mieszkających w województwie dolnośląskim. 3. Wykonać 30 rzutów sześcienną kostką do gry i zapisać wynik każdego z nich. Przyjąć k = 6. Sporządzić szereg rozdzielczy dla cechy liczba wyrzuconych oczek. Narysować histogram. 4. Z populacji generalnej pobrano 50-elementową próbę i przebadano ze względu na cechę X. Otrzymano następujące wyniki: 3.6, 5, 4, 4.7, 5.2, 5.9, 4.5, 5.3, 5.5, 3.9, 5.6, 3.5, 5.4, 5.2, 4.1, 5, 3.1, 5.8, 4.8, 4.4, 4.6, 5.1, 4.7, 3, 5.5, 6.1, 3.8, 4.9, 5.6, 6.1, 5.9, 4.2, 6.6, 5.3, 4.5, 4.9, 4, 5.2, 3.3, 5.4, 4.7, 6.4, 5.1, 3.4, 5.2, 6.2, 4.4, 4.3, 5.8, 3.7. Sporządzić szereg rozdzielczy oraz histogram.