STATYSTYKA OPISOWA
Transkrypt
STATYSTYKA OPISOWA
STATYSTYKA OPISOWA Znaczenie podstawowych miar Pytanie wieczoru 1: Ile zarabiają dyrektorzy w działach sprzedaŜy? Victoria Kamasa www.logic.amu.edu.pl Średnia zarobków dyrektorów sprzedaŜy wynosi 12 161 PLN. Victoria Kamasa www.logic.amu.edu.pl PYTANIA: Jak obliczono tę średnią? Czy dyrektorzy to generalnie bogaci ludzie? Czy moŜna określić ile zarabia jakiś konkretny dyrektor? Czy moŜna obliczyć średnią płeć dyrektorów? ;) Victoria Kamasa www.logic.amu.edu.pl Jak obliczono tę średnią? Średnią arytmetyczną liczymy z dobrze znanego wzoru: Czyli dodajemy do siebie wartości wszystkich obserwacji i dzielimy otrzymaną sumę przez liczbę przeprowadzonych obserwacji. Victoria Kamasa www.logic.amu.edu.pl Czy dyrektorzy to generalnie bogaci ludzie? Trudno powiedzieć… BO jeśli: – Zbadano 100 osób – 10 z nich zarabia 103 610 zł TO cała reszta zarabia jedynie 2 000 zł Inny przykład WNIOSEK: Średnia arytmetyczna jest bardzo wraŜliwa na wartości skrajne. Victoria Kamasa www.logic.amu.edu.pl Czy moŜna określić ile zarabia jakiś konkretny dyrektor? NIE! BO jeśli: – – – – Zbadano 100 osób 30 z nich zarabia 8 000 zł 30 z nich zarabia 20 000 zł 40 z nich zarabia 9 402, 50 zł TO średnia nadal wynosi 12 161 zł WNIOSEK: Średnia arytmetyczna jest wartością abstrakcyjną; moŜe być róŜna od wszystkich dokonanych pomiarów. Victoria Kamasa www.logic.amu.edu.pl Czy moŜna obliczyć średnią płeć dyrektorów? NIE! BO Średnią arytmetyczną moŜna obliczać jedynie dla wartości liczbowych Victoria Kamasa www.logic.amu.edu.pl ŚREDNIA – podsumowanie wartość obliczana ze wzoru: Jest wraŜliwa na wartości skrajne Jest wartością abstrakcyjną MoŜe być obliczana tylko dla wartości liczbowych (w pewnym uproszczeniu) Victoria Kamasa www.logic.amu.edu.pl Problemy ze średnią pomaga rozwiązywać ODCHYLENIE STANDARDOWE. Obliczane jest z wzoru: A więc jest (w uproszczeniu): Średnią róŜnicą między średnią arytmetyczną a poszczególnymi wynikami. Victoria Kamasa www.logic.amu.edu.pl ODCHYLENIE STANDARDOWE - cd Czy odchylenie s = 1000 jest duŜe? gdy xśr=4000 – TAK, gdy xśr=40 mln - NIE Czy odchylenie s = 20 jest duŜe? gdy xśr= 60 – TAK, gdy xśr=2000 - NIE Czy odchylenie s = 0,04 jest duŜe? gdy xśr= 0,2 – TAK, gdy xśr=5 - NIE Odpowiedź: ZaleŜy od wysokości średniej Victoria Kamasa www.logic.amu.edu.pl ODCHYLENIE STANDARDOWE - cd DLATEGO: Aby określić, czy odchylenie jest duŜe (czyli, czy uzyskane wartości znajdują się w pobliŜu, czy daleko od obliczanej średniej) MoŜna posłuŜyć się współczynnikiem zmienności Im wyŜszy współczynnik, tym średnia GORZEJ określa badaną próbę Victoria Kamasa www.logic.amu.edu.pl Proszę ustawić się wg wzrostu, a następnie wybrać osobę, której wzrost będzie MEDIANĄ dla grupy. Victoria Kamasa www.logic.amu.edu.pl MEDIANA zarobków wśród dyrektorów wynosi: 8 250zł MODA zarobków wśród dyrektorów wynosi: 7 500 zł. Victoria Kamasa PYTANIA: • W jakim przedziale mieszczą się zarobki większości dyrektorów? • Ile zarabia „przeciętny” dyrektor? • Czy prawie wszyscy dyrektorzy to bogaci ludzie? • Czy większość dyrektorów to bogaci ludzie? • Czy zarobki dyrektorów róŜnią mocno róŜnią się od siebie? •Jakie zarobki są najczęstsze wśród dyrektorów? www.logic.amu.edu.pl MEDIANA Definicja: „Jest to wartość cechy poniŜej i powyŜej, której znajduje się dokładnie połowa obserwacji” (Sambor 1990) Victoria Kamasa www.logic.amu.edu.pl Na jakie pytania moŜna odpowiedzieć na podstawie MEDIANY: W jakim przedziale mieszczą się zarobki większości dyrektorów? PowyŜej 8 250zł Czy większość dyrektorów to bogaci ludzie? Jeśli 8 250zł oznacza człowieka bogatego, to TAK CZYLI moŜna powiedzieć coś o połowie badanej grupy I wyciągnąć z tego wnioski Victoria Kamasa www.logic.amu.edu.pl Czego NIE MOśNA stwierdzić na podstawie MEDIANY: Ile zarabia „przeciętny” dyrektor? BO z bycia w środku nie wynika bycie „przeciętnym” Czy prawie wszyscy dyrektorzy to bogaci ludzie? BO nie wiemy NIC o całości badanej grupy Czy zarobki dyrektorów róŜnią mocno róŜnią się od siebie? BO nie wiemy NIC o całości badanej grupy Jakie zarobki są najczęstsze wśród dyrektorów? BO to co jest w środku nie musi być najbardziej popularne Victoria Kamasa www.logic.amu.edu.pl MODA (dominanta) Definicja: „Jest to najczęstsza wartość cechy (…) jest to ta wartość obserwacji, której odpowiada maksymalna liczebność” (Sambor 1990) Victoria Kamasa www.logic.amu.edu.pl Na jakie pytania moŜna odpowiedzieć na podstawie DOMINANTY: Ile zarabia „przeciętny” dyrektor? 7 500 zł BO „przeciętny” to znaczy taki, jaki występuje najczęściej Jakie zarobki są najczęstsze wśród dyrektorów? 7 500 zł BO dominanta oznacza właśnie wartość występującą najczęściej Victoria Kamasa www.logic.amu.edu.pl Czego NIE MOśNA stwierdzić na podstawie DOMINANTY: W jakim przedziale mieszczą się zarobki większości dyrektorów? Czy większość dyrektorów to bogaci ludzie? BO najczęstsza wartość wcale nie musi dotyczyć większości Czy prawie wszyscy dyrektorzy to bogaci ludzie? BO jeśli nie wiemy nic o większości, to tym bardziej o prawie wszystkich Czy zarobki dyrektorów róŜnią mocno róŜnią się od siebie? BO nie wiemy nic o całości grupy Victoria Kamasa www.logic.amu.edu.pl Pytanie wieczoru 2: Jak oceniana jest subiektywna częstość występowania słów PISTOLET , MAMA I DBAĆ w języku polskim? (Imiołczyk 1984) Victoria Kamasa www.logic.amu.edu.pl KTO WIE CO: KaŜda grupa losuje dwie wartości – jedną „swoją” – na jej podstawie odpowiada na pytania, drugą „cudzą” do której zadaje pytania Zadaniem grupy jest sformułowanie jak największej liczby trafnych pytań, na które moŜna odpowiedzieć na podstawie „cudziej” wartości Za kaŜde dobre pytanie grupa dostaje 1 pkt Za kaŜde błędne pytanie - -1pkt Grupa otrzymująca pytanie – jak odpowie dobrze – 1 pkt; jak odpowie na pytanie, na które nie ma informacji w ich wartości - -1pkt Pytania zadawane są po kolei Wygrywa grupa, która dostanie najwięcej punktów Victoria Kamasa www.logic.amu.edu.pl KaŜda z badanych osób ocenia częstość występowania podanego wyrazu w mowie w skali od 1 do 7 gdzie: 1 – wyraz nie uŜywany nigdy lub nieznany 2 – wyraz uŜywany bardzo rzadko 3 – wyraz uŜywany rzadko 4 – wyraz uŜywany niezbyt często / niezbyt rzadko 5 – wyraz uŜywany często 6 – wyraz uŜywany bardzo często 7 – wyraz uŜywany stale Victoria Kamasa www.logic.amu.edu.pl Uzyskane wyniki: słowo MAMA Xśr 6,37 Mo 7 Me 7 DBAĆ 4,12 4 4 PISTOLET 2,83 2 3 1 – wyraz nie uŜywany nigdy lub nieznany 2 – wyraz uŜywany bardzo rzadko 3 – wyraz uŜywany rzadko Victoria Kamasa www.logic.amu.edu.pl 4 – wyraz uŜywany niezbyt często / niezbyt rzadko 5 – wyraz uŜywany często 6 – wyraz uŜywany bardzo często 7 – wyraz uŜywany stale PODSUMOWANIE ŚREDNIA – obejmuje wszystkie pomiary, jest wartością abstrakcyjną. Jaka jest długość (iloczas) głoski A w języku polskim? MEDIANA – wartość środkowa, oznacza wartość, która znajduje się dokładnie w środku wszystkich pomiarów. Jaką ilość słów opanowuje się w ciągu pierwszego roku nauki języka obcego? DOMINANTA (wartość modalna) – oznacza wartość, na którą przypada najwięcej obserwacji. Jakie znaczenie jest najczęściej kojarzone ze słowem SIATKA? Victoria Kamasa www.logic.amu.edu.pl BIBLIOGRAFIA: Imiołczyk, J. 1984, Prawdopodobieństwo subiektywne wyrazów. Podstawowy słownik frekwencyjny języka polskiego. Poznań. Han, J. 2006, Wynagrodzenia w działach sprzedaŜy w 2006 roku. www.pracuj.pl Hammerl, R., Sambor, J., Statystyka dla językoznawców, Warszawa 1990 Victoria Kamasa www.logic.amu.edu.pl