STATYSTYKA

Transkrypt

STATYSTYKA
STATYSTYKA
Badania związków pomiędzy temperaturą powietrza a temperaturami wód źródła i studni w
rejonie rzeki Skawa dokonano w oparciu o 3 okresy pięcioletnie: 1971-75, 1982-86, 1987-91 oraz dwa
pojedyncze lata 1969 ( rok charakteryzujący się najmniejszą sumą opadów ) i 1974 ( największa suma
opadów rocznych ). Obliczeń dokonano dla średnich miesięcznych tak więc dla okresów wieloletnich
mamy do czynienia z próbami dużymi ( 48 -elementowymi ) a dla jednorocznych z próbami małymi
(12 – elementowymi ).
1. Dla potrzeb ćwiczenia dokonamy analizy danych z ostatniego okresu pięcioletniego
Arkusz2 oraz z roku 1974 Arkusz1.
2.
Estymacja punktowa charakterystyk. Próby statystyczne pobiera się celem
przybliżania informacji o całej populacji. Tak więc obliczając charakterystyki na
podstawie próby otrzymujemy przybliżenie (estymację) charakterystyk całej populacji.
Otwórz: Dane/ Analiza/Analiza danych. Następnie wybierz statystyki opisowe i wypełnij
pola:
• Wejście – zakres danych które będziemy analizować, w szczególności zakres
wejściowy to komórki w których są zawarte dane – trzy kolumny. Jeżeli zaznaczasz
wraz z tytułami zaznacz stosowną opcje.
• Wyjście – wyniki analizy: tu wskazujemy jakiego rodzaju wyniki chcemy uzyskać i
gdzie je umieścić:
i. Gdzie?: Obliczone wartości będą prezentowane w formie tabeli. Należy
wskazać miejsce w którym Excel ma umieścić obliczoną tabelę. Możemy
wskazać komórkę w zakresie wyjściowym (od tego miejsca Excel umieści
tabelę z wynikami) lub nowy arkusz, nowy skoroszyt.
ii. Co obliczyć? Z pozostałych opcji zaznacz tylko Statystyki podsumowujące –
otrzymasz wartość średnią i inne statystyki – upewnij się, że znasz znaczenie
każdej z nich.
3. Wszystkie obliczone w punkcie drugim charakterystyki stanowią wartość przybliżoną stosownych
charakterystyk dla całej populacji. Na przykładzie wartości średniej dokonamy estymacji
przedziałowej.
Oznacza to, że chcemy znaleźć przedział do którego wartość średnia całej
populacji należy z pewnym prawdopodobieństwem.
4. Środkiem przedziału ufności jest estymator punktowy, a długość przedziału jest ustalana przy
pomocy poziomu ufności.
Poniżej wyników z poprzedniego punktu oblicz poziom ufności dla wartości średniej.
Postępuj jak w punkcie poprzednim, ale zamiast statystyk podsumowujących na końcu
zaznacz poziom ufności 95%. Poniżej oblicz dla 99%.
Czym jest poziom ufności? Szacuje, że na np. 95% wartość średnia populacji nie różni się
od wartości obliczonej z próby o więcej niż poziom ufności. Przykład:
Niech średnia obliczona wynosi 5, 95% poziom ufności wynosi 2, a 99% - 3.
Wówczas faktyczna wartość średnia na 95% zawiera się w przedziale (3,7) a na 99% w
przedziale (2,8).
Oblicz przedziały ufności dla wartości średnich.
5. W Arkuszu2 umieszczone są dane dla okresu pięcioletniego. Wykonaj punkt 2 dla tych
danych.
6. Szereg rozdzielczy i histogram.
Wykonaj histogram tylko dla temperatury powietrza okresu 5-cioletniego: Dane/
Analiza/Analiza danych. Następnie wybierz histogram.
• Zakres komórek: to zakres danych (jednego typu czyli w tym przypadku tylko
temperatury powietrza)
• Zakres zbioru pozostaw pusty (wyjaśnienie tego pola punkt 5a)
• Wskaż zakres wyjściowy (znaczenie analogiczne jak poprzednio)
• zaznacz wykres wyjściowy.
Powstanie tabela która stanowi szereg rozdzielczy. Jak ją rozumieć?
Jak rozumieć tabele?
temperatura powietrza Częstość
-11,2742
1
Wartości ≤ od -11,2742 jest jedna
-7,2871
0
Wartości z przedziału (-11,2742; -7,2871] nie ma
-3,3
4
Wartości w przedziale (-7,2871; -3,3] jest 4
0,687097
11
((
4,674194
11
((
8,66129
9
((
12,64839
9
((
Więcej
15
Wartości większych od 12,64839 jest 15
Zwróć uwagę, że przedziały są lewostronnie otwarte a prawostronnie domknięte. Jest to kwestia
pewnej umowy.
5a. Przedziały klasowe zostały ustalone automatycznie. Możemy narzucić określone przedziały
klasowe. Aby przedziały wznosiły np. (-12,-10], (-10,-8],…..(16,18] należy wypełnić dowolny blok
komórek liczbami -12,-10,….,16,18 a następnie tworząc szereg rozdzielczy lub histogram w opcji
zakres zbioru wskazać ten blok komórek. Stwórz nowe: szereg rozdzielczy i histogram z tak
ustalonymi przedziałami klasowymi poniżej. Poeksperymentuj z pozostałymi opcjami. W
szczególności zaznaczając Pareto na wykresie przedziały będą posortowane wg częstości.