LEKCJA 3 – ostatnia lekcja statystyki :)

Transkrypt

LEKCJA 3 – ostatnia lekcja statystyki :)
LEKCJA 3 – ostatnia lekcja statystyki :)
(część 2/3)
Dzisiejsza lekcja będzie nieco bardziej zwarta, aby usprawnić pracę :). Aby jednak móc się ich
dobrze nauczyć zacznijmy od małej powtórki skal :)
SKALE POMIAROWE
Skale pomiarowe dzielą się na dwie grupy – skale jakościowe i skale ilościowe. Dzięki skalom
jakościowym możemy uporządkować wartości, które są niepoliczalne. Czyli jeśli mamy małe ZOO –
hipopotama, żyrafę, pigmejkę (to taka mała małpka) i nieświszczuka, to możemy je ustawić koło
siebie, albo jakoś wymieszać, ale każde z tych stworzeń stanowi odrębną całość. Nie ma żadnej
płynności w przechodzeniu między hipopotamem na nieświszczukiem, po prostu są odrębne
elementy i basta :) . Taki stan nazywamy skalą nominalną (albo kategorialną).
Skale jakościowe:
- Skala nominalna (kategorialna)
(np. kobieta, mężczyzna, Polska, Papua Nowa Gwinea, nieświszczuk)
Drugą skalą jakościową jest skala rangowa. Używamy jej wtedy, gdy zbiór naszych elementów
nadal nie ma między sobą żadnego przejścia, dalej elementy są odrębne, ale któryś jest
ważniejszy. Stosuje się to np. przy określeniu wykształcenia – podstawowe, średnie, wyższe.
Widzimy tutaj, że jest jakaś gradacja – coś jest niżej, coś wyżej, da się to uporządkować. Podobnie
byłoby z zachmurzeniem na niebie (średnie, umiarkowane) itd. Jest to skala rangowa (inaczej
nazywana porządkową).
- Skala rangowa (porządkowa)
(np. wykształcenie – podstawowe, średnie, wyższe; zachmurzenie – średnie,
umiarkowane...)
Drugą grupą skal są skale ilościowe. Występujące tam elementy są mierzalne i mogą być
nałożone na osi, występuje w nich ciągłość – np. gdy temperatura wzrasta, możemy ją pomierzyć
co 0,001°C albo jeszcze drobniej ;) . I wiemy, że gdy do temperatury 0°C dodamy 10°C to
będziemy mieć 10°C. Nic się nie zmienia, tylko coś wzrasta albo maleje. Gdybyśmy chcieli
zastosować dodawanie do skali nominalnej, albo rangowej, to nic by się nie stało, dodawanie by
nie zadziałało – dwie pigmejki nie dadzą nam żyrafy.
Pierwszą ze skal ilościowych jest skala przedziałowa (interwałowa). Występujące w niej
przedziały są takie same (czyli na termometrze odległość między każdym stopniem Celsjusza jest
taka sama), ale nie istnieje tutaj zero bezwzględne. Zero w temperaturze jest umowne – ludzie
umówili się, że gdy woda zaczyna zamarzać, to będzie 0°C. Ale już na skali Farenheita wymyślono,
że gdy woda zamarza będą 32°F. Zero stopni Farenheita oznacza temperaturę mieszaniny wody i
lodu z salmiakiem lub solą, ot taka ciekawostka ;) . Widzimy więc, że tutaj zero nic nie oznacza –
jest to tylko umowa.
Skale ilościowe:
- Skala przedziałowa (interwałowa)
(np. stopnie Celsjusza – nie ma zera bezwzględnego, zero jest umowne)
Ostatnią skalą jest skala ilorazowa (stosunkowa). W tej skali w przeciwieństwie do skali
ilościowej istnieje zero bezwzględne (czyli stan, gdy czegoś po prostu nie ma). W ten sposób 0
Kelvinów oznacza stan w którym cząsteczki się nie ruszają. Gdy mierzymy czas wybuchu wulkanu i
wulkan jednak nie wybuchł, wtedy nasz pomiar wynosi zero. Gdy roślinka ma wzrost 0mm,
oznacza to że nie wyrosła. Gdyby ktoś z nas miał wzrost równy zero, po prostu by go nie było.
Śmieszne ;)
1/6
- Skala ilorazowa (stosunkowa)
(np. stopnie Kelvina, wzrost, czas – jest zero bezwzględne, które obiektywnie
oznacza brak czegoś)
Nauczenie się tych skal jest ważne, bo skale występują w założeniach testów :) . Ale skale są tylko
cztery i proste, więc spokojnie się nauczysz :)
Gdy byłem mały, w TV nadawana była bajka - „Sigma i Pi. Przybysze z Matplanety”. Nie wiem,
czemu mi się to skojarzyło, ale pozwolę sobie umieścić poniżej oba stwory ;)
Gdyby ktoś podczas odpoczynku od ciągłej nauki, chciał obejrzeć sobie tę bajkę, polecam – niezła
jazda ;) http://www.youtube.com/watch?v=ZhLd7HPMDPQ
KTÓRY TEST MA ILE STOPNI SWOBODY?
Czasami podczas egzaminu pada pytanie o ilość stopni swobody dla któregoś z testów.
Nigdy nie pada pytanie o to, czym są stopnie swobody, ale gdyby ktoś z Was chciał zaspokoić
swoją ciekawość, to fachowa definicja brzmi tak:
Liczbę stopni swobody można utożsamiać z liczbą niezależnych zmiennych losowych, które
wpływają na wynik.
lub:
Jest to ilość elementów, które mogą się swobodnie zmieniać.
Niestety żadnej z tych definicji nie rozumiem na tyle, aby móc ją jakoś rozszerzyć, czy wytłumaczyć
;) . Przyjmijmy po prostu, że stopnie swobody to wartość, którą trzeba znać, aby móc odnaleźć w
tablicach odpowiednią wartość krytyczną :) . Stopnie swobody oznaczamy jako df (degrees of
freedom).
Zwarty zestaw powtórkowy:
● Test t-Studenta dla jednej populacji:
df = n – 1
(n to ilość wszystkich elementów, np. wszystkich ocen)
2/6
● Test t-Studenta dla dwóch prób/populacji niezależnych (wariancje homogeniczne):
df = n1 + n2 – 2
(n1 to liczebność pierwszej próby, n2 to liczebność drugiej próby. Dlatego odejmujemy 2, bo
w każdej z prób odejmowalibyśmy 1, a teraz są dwie próby, więc odejmujemy 2 od
wszystkich wszystkich elementów :) )
● Test t-Studenta dla dwóch populacji niezależnych (wariancje heterogeniczne)
df < n1 + n2 – 2
(nie wiem, czemu taki znak, a nie = , ale tak znalazłem w notatkach, więc chyba trzeba
zaufać...)
● Test t-Studenta dla dwóch prób zależnych
df = n – 1
● Test Fishera (Analiza wariancji)
W tym teście mamy dwa rodzaje stopni swobody – wewnątrzgrupowe i międzygrupowe:
Stopnie swobody międzygrupowe = k – 1 (czasem oznaczane jako f1)
(gdzie k to ilość kategorii)
Stopnie swobody wewnątrzgrupowych = n – k (czasem oznaczane jako f2)
(n to liczebność całkowita, k to ilość kategorii)
● Test r-Pearsona
df = n - 2
● Test Chi kwadrat
- dla testu zgodności:
df = k – 1
(gdzie k to ilość wszystkich możliwych kategorii – np. w rzucie monetą są 2 kategorie (orzeł i
reszka), przy rzucie kostką jest 6 kategorii...)
- dla testu niezależności:
df = (k – 1) * (l – 1)
(gdzie k to ilość kategorii w rzędzie, a l to ilość kategorii w kolumnie)
3/6
ZAŁOŻENIA TESTÓW – c.d.
A teraz po kolei wszystkie założenia, aby mieć super ściągę:
● test t-Studenta dla jednej populacji:
- poziom istotności alfa zakładany subiektywnie (to już pamiętamy ;) )
- zmienna X musi być mierzalna (czyli mieć skalę przedziałową lub stosunkową)
- musi mieć rozkład normalny
- próba reprezentatywna (to znaczy, jeśli w populacji jest 50% kobiet, w naszej próbie też ma tak
być)
- na koniec warto powiedzieć o hipotezie zerowej, ale... to już było na poprzedniej lekcji ;) .
Zostawiam miejsce, abyś mogła/mógł przepisać odpowiednią hipotezę z notatek :P
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…............…........…........…........…........…........…........….........
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
(zapisz słownie)
● test t-Studenta dla dwóch prób/populacji (wariancje homogeniczne):
- poziom istotności alfa zakładany subiektywnie (jak zwykle ;) )
- zmienna X musi być mierzalna (czyli mieć skalę przedziałową lub stosunkową)
- obie próby są niezależne (czyli nie ma ani jednego ludzika w grupie A i grupie B jednocześnie)
- rozkład w obu próbach/populacjach normalny
- wariancje są homogeniczne (jak sama nazwa wskazuje)
- liczebność obu prób jest taka sama
- Hipoteza zerowa:
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…............…........…........…........…........…........…........….........
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
(zapisz słownie)
● test t-Studenta dla dwóch prób/populacji (wariancje heterogeniczne):
szczerze mówiąc to ten wzór to taki mały kundelek i jest bardzo rzadko spotykany i rzadko padają
o niego pytania. Nie przywiązuj do niego tak dużej wagi jak do pozostałych ;)
Aczkolwiek założenia możesz sobie powtórzyć – są takie same jak w powyższym teście z wyjątkiem
punktu mówiącego o wariancjach – w tym wypadku są heterogeniczne (różne).
● test t-Studenta dla prób zależnych:
- poziom istotności alfa .............................. .............................. :)
- obie próby są mierzalne (czyli skala .............................. lub .............................. )
- obie próby mają rozkład normalny
- próby są zależne (czyli badamy dokładnie tych samych ludzi np. przed koncertem i po koncercie)
- Hipoteza zerowa:
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…............…........…........…........…........…........…........….........
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
(zapisz słownie)
4/6
● test F-Fishera:
- poziom istotności …...... .............................. .............................. :)
- wariancje w próbach są homogeniczne
- liczebności prób (czyli dzieci, które karmimy) są równe
- próby duże, niezależne
- Hipoteza zerowa:
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…............…........…........…........…........…........…........….........
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
(zapisz słownie)
● test r-Pearsona:
- X i Y są mierzalne, czyli skala .............................. lub ..............................
- homoscedastyczność wariancji rozkładów (naucz się tego wyrażenia!)
- poziom istotności alfa zakładany ….......................
- Hipoteza zerowa:
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…............…........…........…........…........…........…........….........
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
(zapisz słownie)
I teraz bardzo ważne:
Koniecznie zapamiętaj, że X dla każdego Y ma rozkład normalny, a Y dla każdego X ma rozkład
normalny :) . Pani Aranowska nazywa to „nasypem kolejowym” ;)
● Test Chi kwadrat:
- używamy dla zmiennych o skali nominalnej (czyli niemierzalnej!!!!) - np. orzeł/reszka, rzut kostką
- poziom istotności zakładany subiektywnie :)
- Hipoteza zerowa:
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…............…........…........…........…........…........…........….........
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
…........…........…........…........…........…........…........…........…........…........…........…........….............
(zapisz słownie)
To wszystkie (albo 99%) założeń, które trzeba znać do każdego z testów. Jeśli nauczycie się
wszystkiego (wszystkich lekcji, wzorków, wykresów, hipotez), wtedy zdanie macie
gwarantowane :)
Pozostaje tylko jeden czynnik, który może Wam bardzo przeszkodzić – Wasz własny stres. Obawa
przed tym, że coś się nie uda, trema itd. I tylko wtedy, gdy uda się ją pokonać, będziecie mogli w
pełni wykorzystać całą wiedzę. Celowo wrzucam na koniec dwa zdjęcia, abyście mogli się zacząć
oswajać z p.Aranowską ;) . Każdy musi znaleźć swoją metodę, aby pokonać stres – możecie
wyobrażać sobie przed snem p.Aranowską, która śmiesznie tańczy, możecie wyobrażać sobie, że
jest Waszą Babcią, albo, że egzamin to tak naprawdę przyjście do niej na herbatkę ;) . Możesz
wyobrażać sobie, że jest w stroju Sigmy z bajki, którą wrzuciłem kilka stron wcześniej, albo,
cokolwiek, byle pozytywnego – ważne aby pokonać strach :) . A jeśli zacznie Was cieszyć jej
widok, wtedy na żywo na pewno będzie łatwiej :) . Popatrz na jej zdjęcie i uśmiechnij się :D
5/6
Trzymam za Ciebie kciuki :) .
Ostatnia część lekcji będzie już tylko formalnością i nie będzie miała praktycznie nic odkrywczego :)
. Do egzaminu jeszcze kupa czasu :) . Powtarzaj wszystko ile wlezie :)
Uśmiechnij się Króliku ;p
6/6

Podobne dokumenty