Informatyka w selekcji Ćwiczenie nr 1 1. Wczytad do pakietu R trzy

Transkrypt

Informatyka w selekcji Ćwiczenie nr 1 1. Wczytad do pakietu R trzy
Informatyka w selekcji
Ćwiczenie nr 1
1. Wczytad do pakietu R trzy pliki zamieszczone na stronie http://theta.edu.pl
a) Dane fenotypowe
b) Dane genotypowe
c) Mapa genetyczna
2. Jakie informacje zawarte są w tych plikach?
3. Ile mamy osobników w pliku z danymi fenotypowymi?
4. Potomkami ilu buhajów są zamieszczone tam krowy?
5. W którym stadzie jest najwięcej krów?
6. Sporządzid wykres obrazujący podział krów na stada?
7. Przedstawid statystyki opisane dla cech fenotypowych (wydajnośd mleczna,
zawartośd procentowa białka i tłuszczu w mleku). Za statystyki opisowe będziemy
uważad średnią, odchylenie standardowe i medianę oraz wartośd minimalną i
maksymalną.
8. Co mogą oznaczad wartości ‘99999’ w numeracji zwierząt?
9. Przekodowad numery ‘99999’ na ‘0’.
10. Krowy z którego stada dają średnio najwięcej mleka?
11. Krowy po którym buhaju dają mleko ‘najlepszej’ jakości?
12. Utworzyd dodatkową kolumnę oznaczającą płed osobnika.
13. Dla danych fenotypowych sporządzid wykres typu ‘boxplot’ i sprawdzid czy istnieją w
zbiorze danych obserwacje odstające.
14. Narysowad funkcję gęstości rozkładu każdej z rozważanych cech fenotypowych. Czy
na podstawie wykresów można wysnud wnioski na temat normalności tych
zmiennych? W jaki sposób można połączyd wykres histogramu i gęstości rozkładu?
15. Ile alleli ma każdy z markerów?
16. Dla każdego osobnika i każdego markera wyznaczyd genotypy?
17. Dla każdego z genotypów zamienid wartości znakowe na liczbowe tzn. genotyp AA na
wartośd -1, genotyp AB na wartośd 0 oraz genotyp BB na wartośd 1.
18. Wyznaczyd częstości występowania danego genotypu.
19. Utworzyd plik, który w kolejnych wierszach będzie miał następujące informacje: ilośd
wszystkich osobników, ilośd wszystkich markerów oraz średnią wydajnośd mleka.
Zapisad utworzony plik na dysku.
20. Połączyd dane z plików: dane fenotypowe i dane genotypowe. Czy połączone dane
można przechowywad w macierzy?
21. Jakie są zalety ramki danych?

Podobne dokumenty