1 Projekt nr 2 dla uczestników kursu Program R

Transkrypt

1 Projekt nr 2 dla uczestników kursu Program R
1
Projekt nr 2 dla uczestników kursu Program R
Drugi projekt dotyczy wizualizacji danych pochodzących z projektu Diagnoza Społeczna
(http://www.diagnoza.com/, na tej stronie znajdują się dokładne informacje dotyczące tych
danych). Dane zapisane w formacie Rdata i inne pomocnicze materiały znajdują się na stronie
http://biecek.pl/R/diagnoza/.
• diagnozaGD.Rdata i diagnozaGD.txt, komplet danych o gospodarstwach domowych oraz
opisy dla kolejnych kolumn,
• diagnozaOS.Rdata i diagnozaOS.txt, komplet danych o osobach biorących udziałów projekcie, oraz opis kolumn ze zbioru danych,
• diagnozaWybrane1.Rdata i diagnozaWybrane1.txt, podzbiór danych do ćwiczeń na laboratoria, wybrane kolumny ze zbioru diagnozaOS.Rdata,
• kwestionariusze* - formularze kwestionariuszy dla 5 przeprowadzonych badań.
Co należy zrobić?
W ramach projektu należy wykonać wizualizacje na podstawie ww. zbioru danych. Wizualizacja
powinna być wykonana w dwóch formach, jedna czarnobiała zapisana w pliku pdf o wymiarach
formatu A3, druga przygotowana do wydruku w kolorze zapisana w formacie pliku pdf o wymiarach formatu A4. Obie wizualizacje powinny przedstawiać te same zależności, w tym samym
układzie, ale mogą różnić się wyborem parametrów graficznych takich jak linie pomocnicze,
szerokość/typy linii, wielkość/typy punktów itp.
Do dnia 16 XII do godziny 23:59 należy wysłać maila o tytule [Projekt II Program R] na
adres [email protected]. Do maila powinny być dołączone dwa pliki w formacie
pdf z wizualizacjami w odpowiednim rozmiarze oraz plik z kodem źródłowym R użytym do
wykonania wizualizacji.
Na zajęcia w dniu 17 XII należy przynieść wydrukowane wizualizacje, jedną w formacie A3
czarnobiałą, jedną w formacie A4 wydrukowaną w kolorze. Każda wizualizacja będzie przedstawiona przez autorów w (maksymalnie) 5 minutowej prezentacji. Wizualizacje będą oceniane
tak przez prowadzącego jak i przez innych studentów.
Wizualizacje powinny w prawym dolnym rogu przedstawiać imiona i nazwiska autorów.
Co będzie oceniane?
Do zaliczenia projektu należy przygotować wizualizację, w której przedstawiony będzie przynajmniej jeden wykres pokazujący dynamikę zmian w czasie określonego czynnika, przynajmniej
jeden wykres pokazujący zależność pomiędzy dwiema lub więcej zmiennymi jakościowymi, przynajmniej jeden wykres pokazujący zależność pomiędzy dwiema lub więcej zmiennymi ilościowymi. Należy wybrać odpowiednie parametry do wersji kolorowej/b&w i do wersji dużej/małej.
Do otrzymania dobrej oceny należy dodatkowo: wybrać interesującą historię do przedstawienia, upewnić się, że wizualizacje są czytelne tak w kolorze jak i w wersji czarno-białej,
uczynić wizualizację łatwą w interpretacji bez konieczności dodatkowego opisu, przedstawić
dane w elegancki sposób.
Na co zwrócić uwagę?
Można wybierać dowolne zmienne ze zbiorów danych o gospodarstwach i o osobach. Wybranie
zmiennych spoza zbioru danych diagnozaWybrane1.Rdata, będzie mile widziane.
W zależności od formatu A3 i A4 należy dobrać odpowiednią szerokość linii.
W zależności od możliwości użycia kolorów należy rozważyć wybór typów linii (kropkowana/kreskowana/ciągła) oraz typów punktów (różne kształty, ten sam kształt).
Powodzenia!
Przemysław Biecek

Podobne dokumenty