komputerowo wspomagana analiza danych

Transkrypt

komputerowo wspomagana analiza danych
czyli
komputerowo wspomagana
analiza danych
prowadzący: Marek Sobolewski
konsultacje: poniedziałek 13.00-14.30,
czwartek 11.30-13.00 (p. L-341A)
strona internetowa: www.msobolew.sd.prz.edu.pl
czyli
wprowadzenie
w tematykę zajęć
Organizacja zajęć
Wykłady: 15 godz.
Laboratoria: 30 godz.
Warunki zaliczenia przedmiotu:
1. Obecność
wykładów!).
na
zajęciach
(dotyczy
laboratoriów
i
2. Uzyskanie pozytywnej oceny z projektu zaliczeniowego,
dotyczącego zastosowania metod analizy danych do
zbadania wskazanego zjawiska społeczno-gospodarczego.
3. Egzamin będzie miał formę pisemną – odbędzie się w
laboratorium komputerowym (czas trwania ok. 45 min.).
Przykładowe zadania będzie można wkrótce znaleźć na
mojej stronie internetowej – inne zadania będą
prezentowane na wykładach.
Tematyka zajęć
1. Modelowanie i prognozowanie – wprowadzenie w
tematykę zajęć. Podstawowe metody prezentacji danych
oraz wnioskowania statystycznego.
2. Graficzne metody analizy danych. Analiza zależności
pomiędzy dwiema cechami statystycznymi.
3. Analiza danych czasowych. Indeksy dynamiki. Trendy
liniowe i nieliniowe.
4. Wykorzystanie modeli regresji w prognozowaniu na
podstawie danych czasowych. Estymacja nieliniowa.
5. Metody wyrównywania wykładniczego w prognozowaniu
szeregów czasowych. Analiza sezonowości zjawisk w
czasie.
6. Wybrane metody statystycznych analiz
wielowymiarowych. Metody automatyzacji pracy z
programem STATISTICA.
Program STATISTICA
Większość obliczeń i prezentacji graficznych wykonywać będziemy za
pomocą programu STATISTICA (9.0) – specjalistycznego narzędzia
analizy danych.
Program STATISTICA jest zainstalowany w pracowniach, ponadto
licencja, którą posiada Wydział Zarządzania, uprawnia studentów
do posługiwania się programem na komputerach domowych.
Informacje o sposobie uzyskania wersji instalacyjnej programu
STATISTICA znajdują się na stronie (hasło do ściągnięcia:
kmi2011):
http://kmiwe.portal.prz.edu.pl/do-pobrania/
Część obliczeń i analiz wykonywać będziemy także za pomocą
arkusza kalkulacyjnego Excel.
Czy korzystamy z prognoz?
Czy sami ich dokonujemy?
• zawierając umowę ubezpieczeniową (w ramach III filaru) dokonujemy
nieformalnej prognozy długoterminowej, dotyczącej rozmaitych aspektów
naszego życia, dotyczących np. zarobków, stanu zdrowia lub też realnej
wartości
świadczeń
wypłacanych
przez
ZUS
(co ciekawsze firmy ubezpieczeniowe czynią to samo, tyle że w odniesieniu
do całej populacji i za pomocą formalnych metod statystycznych - tzw.
statystyka aktuarialna)
• planując wyjazd na narty korzystamy z prognoz dotyczących pogody (co
więcej, na podstawie doświadczenia wieloletniego sami takich prognoz
dokonujemy, twierdząc, iż: „w grudniu warunki śnieżne w Beskidach są
zwykle nienajlepsze a w lutym i marcu znakomite”)
Czy korzystamy z prognoz?
Czy sami ich dokonujemy?
• decydując się na kupno takiego a nie innego typu samochodu
uwzględniamy specyfikę naszych „potrzeb komunikacyjnych” w ciągu
najbliższych kilku lat - ponadto uwzględniamy aktualne i przyszłe
możliwości finansowe
• wyjeżdżając do pracy na 20 min. przed jej rozpoczęciem bierzemy pod
uwagę wcześniejsze doświadczenia, które pozwalają przyjąć, iż czas
przejazdu z jednego końca Rzeszowa na drugi wynosi nieco ponad
kwadrans
Przegląd wybranych definicji pojęcia „prognozy”
wg Z. Czerwińskiego: „...sąd o zajściu określonego zdarzenia w czasie
określonym z dokładnością do momentu (punktu) lub okresu (przedziału) czasu,
należącego do przyszłości.”
wg Z. Hellwiga: „...sąd, którego prawdziwość jest zdarzeniem losowym, przy czym
prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla celów
praktycznych.”
wg M. Cieślak: „...sąd o następujących własnościach:
- sformułowany z wykorzystaniem dorobku nauki;
- odnoszący się do określonej przyszłości;
- weryfikowalny empirycznie;
- niepewny, ale akceptowalny.”
wg A. Smoluka: „...wnioskowanie o rzeczach niedostępnych bezpośredniemu
poznaniu, przeszkodą może być czas, przestrzeń lub jeszcze coś innego.”
wg H. Steinhausa: „...[prognozą można nazwać] zarówno przepowiednię
meteorologiczną, jak i szacowanie zawartości kruszcu w podziemiu obszaru”
wg A. Zeliasia: „...prognozowanie to racjonalne, naukowe przewidywanie
przyszłych zdarzeń”
Sposoby przewidywania przyszłości
(poznawania nieznanego)
• Przewidywania racjonalne - są oparte na potocznie rozumianym
doświadczeniu, lecz nie używa się w nich metod naukowych.
• Przewidywania naukowe - oparte na regułach naukowych, które
charakteryzują się ścisłością, precyzją i powtarzalnością.
• Przewidywania nieracjonalne - wróżby, proroctwa, przepowiednie.
Prognozy naukowe
Oparte o metody ilościowe:
matematyczno-statystyczne
Oparte o metody
niematematyczne
Wyjaśnienie pojęcia „symulacja”
Ponieważ tematyka zajęć będzie dotyczyła szeroko rozumianych
ilościowych metod prognozowania, więc każda próba wnioskowania o
nieznanej rzeczywistości (przyszłości) będzie oparta na pewnym
uproszczonym modelu opisującym najważniejsze aspekty badanego
problemu.
Zanim więc zaistnieje możliwości dokonania rzetelnej prognozy
konieczne jest znalezienie „najlepszego” modelu, który opisywałby
zgromadzone dane empiryczne. Słowo „modelowanie” zastępowane
jest czasami terminem „symulacja” i stąd nazwa przedmiotu.
Gwoli ścisłości należałby dodać, iż właściwsza wydawałby się kolejność:
„symulacja i prognoza” (jeszcze lepiej: „modelowanie i prognozowanie”).
Dodatkowe spostrzeżenia
Prognozy mogą dostarczać informacji - ukierunkowywać pewne działania, mogą
też pełnić funkcje aktywizujące - ostrzegawcze. Warto sobie uświadomić, że choć
w sensie metodologicznym oczekujemy od prognoz przede wszystkim
sprawdzalności, to nie zawsze jest to oczekiwane z praktycznego punktu widzenia.
Jeżeli dokonamy prognozy, z której będzie wynikać, iż przy obecnej polityce rządu
nastąpi znaczący wzrost bezrobocia, to akurat ostatnią rzeczą której byśmy od niej
oczekiwali będzie jej trafność.
Niektóre prognozy mogą mieć właściwość „samospełnienia się” (mit o Edypie).
Prognoza ekonomiczna, która będzie zapowiadała wzrost cen jakiegoś towaru
może do niego doprowadzić z powodu znaczącego wzrostu popytu, generowanego
przez klientów kupujących „na zapas”. Mieliśmy przykład takiego zjawiska tuż
przed wejściem Polski do Unii Europejskiej, gdy bez wyraźnej przyczyny, z dnia
na dzień rosły ceny cukru.
Często używa się klasyfikacji prognoz, w których niewiedza jest spowodowana jest
czynnikiem czasowym, na krótko-, średnio- i długoterminowe. Należy mieć
świadomość, iż w przypadku zjawisk demograficznych prognoza pięcioletnia
będzie miała charakter krótkoterminowej, podczas gdy ten sam horyzont czasowy
w odniesieniu do kursów akcji wydaje się niewyobrażalnie odległy.
Obszary zastosowania metod statystycznych
(metod analizy danych)
• badania marketingowe
• reklama
• telemetria
• sondaże opinii publicznej
• analizy makroekonomiczne (prognozy długoterminowe)
• statystyka regionalna i międzynarodowa (analiza porównawcza)
• analiza biorównoważności (leki generyczne)
• medycyna (skuteczność metod terapeutycznych i profilaktycznych)
• ochrona zdrowia (monitorowanie i planowanie kosztów)
• ubezpieczenia
• prognozowanie kursów akcji i walut
• socjologia
• analiza jakości i poziomu życia
• edukacja (kontrola wyników nauczania)
• kontrola jakości
• badania naukowe (antropologia, antropometria, archeologia,...)
Prognozowanie - znamię naszych czasów?
Prognozowanie stało się konieczne i możliwe dopiero z nadejściem epoki
cywilizacji informacyjnej. Bezprecedensowe przyspieszenie tempa zmian,
z jakim mamy do czynienia w ostatnich kilkudziesięciu (a szczególnie
kilkunastu latach) zmusiło ludzi do podjęcia prób przewidywania
przyszłości, w kontekście konsekwencji jakie te zmiany mogą wywołać.
K. Boulding: „Świat dzisiejszy... jest tak różny od świata, w którym ja się
urodziłem, jak tamten był różny od czasów Juliusza Cezara. Mówiąc z
grubsza, urodziłem się w środkowym okresie historii człowieka. Prawie tyle
samo wydarzyło się, odkąd ja się urodziłem, co na przestrzeni całego okresu
poprzedzającego moment moich urodzin.”
Prognozowanie - znamię naszych czasów?
A. Toffler: „...gdyby ostatnie 50 tysięcy lat istnienia człowieka podzielić na
odcinki życia wynoszące około 62 lata, to okazałoby się, że mieliśmy już 800
takich odcinków. Z tych ośmiuset pełne 650 przeżyliśmy w jaskiniach.
Zaledwie w ostatnich 70 takich odcinkach udało się człowiekowi nawiązać
faktyczną łączność pomiędzy jednym a drugim okresem życia - co stało się
możliwe dzięki pismu. Zaledwie w ostatnich 6 odcinkach po raz pierwszy
udostępniono człowiekowi słowo drukowane w skali masowej. Zaledwie w
ostatnich 4 - możliwym stało się odmierzanie czasu z jako taką
dokładnością. Zaledwie w ciągu ostatnich 2 - ktoś gdzieś posłużył się
silnikiem elektrycznym.”
Telefon komórkowy w powszechnym użytku, to 0,2 takiego odcinka
czasowego, niewiele krócej lub dłużej korzystamy z tak ogromną
intensywnością z komputerów osobistych, internetu, aparatów
cyfrowych.
Schemat dokonywania prognoz
Pojawienie się problemu praktycznego
Zebranie wszelkich istotnych danych empirycznych
i informacji o rozważanym zjawisku
Stworzenie modelu opisującego specyfikę rozważanego zjawiska
Sprawdzenie poprawności otrzymanego modelu
Poszerzenie wiedzy o rozważanym zjawisku
Dokonanie prognozy poprzez wstawienie
do modelu nowych danych wejściowych
Wątpliwości…
zastrzeżenia natury naukowej...
Z. Czerwiński: „Brak uniwersalnych, niezmiennych w czasie praw, jak
również brak dokładnego rozpoznania aktualnego stanu obiektów
ekonomicznych wyklucza istnienie niezawodnych metod prognozowania. Nie
da się też - bez arbitralnych założeń - wskazać metod dających prognozy
prawdopodobne (w ścisłym, a nie jakościowym i intuicyjnym tylko tego słowa
znaczeniu).”
...i metafizycznej
M. Bułhakow: „Przepraszam - powiedział nieznajomy - po to, żeby czymś
kierować, trzeba bądź co bądź mieć dokładny plan, obejmujący jakiś możliwie
przyzwoity okres czasu. Pozwoli więc pan, że go zapytam, jak człowiek może
czymkolwiek kierować, skoro pozbawiony jest nie tylko możliwości planowania
na choćby śmiesznie krótki czas, no, powiedzmy tysiąc lat, ale nie może
ponadto ręczyć, co się z nim samym stanie następnego dnia?” [Mistrz i
Małgorzata]
Skuteczność prognoz (warunki)
Podstawowym warunkiem skuteczności prognoz jest:
stabilność modelowanego zjawiska w czasie i przestrzeni
Uwaga 1: Wydaje się, iż można wysnuć tezę o większej stabilności
zjawisk naturalnych i co za tym idzie, można spodziewać się dużej
sprawdzalności prognoz w medycynie, biologii, demografii a nieco
mniejszej w socjologii. Zjawiska par excellance ekonomiczne (często
wręcz „wirtualne”) jak na przykład kursy akcji, walut są bardzo
niestabilne i jako takie stwarzają duże problemy podczas tworzenia
prognoz.
Uwaga 2: Wspomnieć tu należy, że związki między dwoma bardzo
dynamicznymi zjawiskami mogą mieć charakter stały - na przykład
trudno przewidzieć wahania stopy bezrobocia i natężenie zjawiska
przestępczości. Jednakże relacje pomiędzy bezrobociem a
przestępczością mogą być ściśle określone.
Literatura
Podstawowe podręczniki:
Hydzik P., Sobolewski M., Komputerowa analiza danych społeczno-gospodarczych,
Oficyna Wydawnicza Politechniki Rzeszowskiej, Rzeszów 2007.
Prognozowanie gospodarcze. Metody i zastosowania, pod red. nauk. Cieślak M., PWN,
Warszawa 1997.
Dittmann P., Metody prognozowania sprzedaży w przedsiębiorstwie, Wydawnictwo
Akademii Ekonomicznej we Wrocławiu, 1998.
Zeliaś A., Teoria prognozy, PWE, Warszawa 1997.
Aczel D.A., Statystyka w zarządzaniu, PWN, Warszawa 2000.
Koronacki J., Mielniczuk J., Statystyka dla studentów kierunków technicznych i
przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa 2000.
Dobosz M., Wspomagana komputerowo analiza danych, Akademicka Oficyna
Wydawnicza EXIT, Warszawa 2001.
Stanisz A., Przystępny kurs statystyki z wykorzystaniem pakietu Statistica PL na
przykładzie danych z medycyny. Tom I i II. StatSoft Polska, Kraków 2000.
Literatura
Inne wykorzystane materiały:
Z. Czerwiński, Jeszcze raz o prognozach, Przestrzenno-czasowe modelowanie zjawisk
społeczno-gospodarczych, Wyd. AE Kraków, 2000.
Świat i Polska 2005. Prognozy, analizy, opinie. The Economist/Polityka, grudzień-luty
2005.
Kinsella K., Velkoff V.A., An Aging World: 2001, US. Census Bureau, Washington 2002.
Toffler A., Szok przyszłości, Wydawnictwo Zyska i S-ka, Poznań 2004.
Fukuyama F., Koniec człowieka, Wydawnictwo Znak, Kraków 2004.
Dziękuję za uwagę
Temat następnego wykładu to:
Tabelaryczne i graficzne metody opisu
danych oraz wnioskowanie
statystyczne z zastosowaniem
programu STATISTICA

Podobne dokumenty