średnich do badania zmienności somaklonalnej
Transkrypt
średnich do badania zmienności somaklonalnej
Wykorzystanie grupowania metodą k-średnich w ocenie zmienności somaklonalnej żyta ozimego Secale cerale L. Robert Pietrzykowski, Monika Rakoczy-Trojanowska, Wojciech Zieliński Streszczenie. Praca jest kontynuacją doświadczeń nad zmiennością somaklonalną żyta Secale cerale L. Wykorzystano grupowanie metodą k-średnich w celu uzyskania odpowiedzi czy somaklony R1 różnią się od linii matecznej oraz czy różnicują się ze względu na zastosowany regulator wzrostu w pożywce indukcyjnej, na której otrzymano rośliny R0 Wstęp Ostatnio coraz większego znaczenia nabierają metody biotechnologiczne. Jedną z nich jest uzyskiwanie nowych form w wyniku zmienności somaklonalnej. Wykazano, ze zmienność somaklonalna może być przydatną metodą poprawy cech użytkowych u wielu gatunków roślin, a także zarejestrowano kilkanaście nowych odmian pochodzących z materiałów otrzymanych w kulturze in vitro. W Katedrze Genetyki. Hodowli i Biotechnologii Roślin SGGW od kilku lat prowadzone są badania nad zmiennością somaklonalną żyta ozimego (Secale cerale L.), które doprowadziły do uzyskania szeregu nowych fenotypów (Rakoczy-Trojanowska i in. 1996). Praca niniejsza ma za zadanie odpowiedzieć na pytanie, czy rośliny w somaklonach pokolenia R1 różnią się od roślin kontrolnych (linia mateczna) oraz czy rodzaj regulatora wzrostu w pożywce na której regenerowano rośliny R0 wpływa na zmienność ich potomstwa - pokolenie R1 . W pracy wykorzystano grupowanie metodą k-średnich w celu uzyskania odpowiedzi na powyższe pytanie. Materiał doświadczalny Materiał roślinny stanowiły dwie grupy somaklonów R1 uzyskane w wyniku samozapylenia roślin zregenerowanych z niedojrzałych zarodków wysokowsobnej linii L318, wyhodowanej w KGHiBR: S1 i S2. Pierwsza, licząca 15 somaklonów została otrzymana z roślin zregenerowanych na pożywce zawierającej 2.4-D (oznaczane tutaj jako L1, . . . , L18 oraz linia mateczna K) i druga licząca 17 somaklonów (oznaczane jako A1, . . . , A20 oraz linia mateczna KD) z roślin zregenerowanych na pożywce zawierającej DICAMBA. W doświadczeniu użyto dwóch rodzajów pożywek, aby stwierdzić, czy auksyna DICAMBA może być czynnikiem zwiększającym zakres i częstość zmian somaklonalnych, co między innymi sugerował Bregitzer (Bregitzer i in. 1998). Procedura regeneracji oraz adaptacji roślin do warunków uprawy polowej była taka sama jak opisano poprzednio (Rakoczy Trojanowska, Malepszy 1995). Rośliny w somaklonach analizowano pod względem następujących cech (w nawiasach podano skrótowe oznaczenia cech): wysokość roślin (wys), krzewistość ogólna (krzog), krzewistość produktywna (krzpr), długość kłosa (dlkl), liczba kłosków/kłos (lkl), liczba ziarniaków w kłosie (lzkl), masa ziarniaków w kłosie (mzkl), masa tysiąca ziarniaków (m1000z). Szczegółową charakterystykę danych znajdzie Czytelnik we wcześniejszych pracach (Pietrzykowski i in. 1997). Wszystkie somaklony pochodzące z linii L318 i oznaczone jako L1 do L17 oraz A1 do A20 obserwowano w dwóch latach. W roku 1994 uprawiano potomstwo regenerantów otrzymanych na pożywce z 2.4-D (linie oznaczane jako L1 do L17), a w roku 1997 prowadzono obserwacje na somaklonach pochodzących z roślin zregenerowanych na pożywce DICAMBA (oznaczone jako A1 do A20). W każdym roku łącznie z roślinami doświadczalnymi uprawiano po trzydzieści roślin kontrolnych w tych samych warunkach klimatyczno-glebowych. Charakterystyki wszystkich cech dotyczących kłosów dokonywano na podstawie średniej z pomiarów trzech pierwszych kłosów pozostawionych do wolnego zapylenia. Linie mateczne K i KD są takie same, lecz ze względu na to, że doświadczenie było prowadzone w dwóch latach obie wzięto do analizy. Opis metody Niech X1 , X2 , . . . , Xn będą zaobserwowanymi obiektami p cechowymi, tzn. Xi = (Xi1 , . . . , Xip ), i = 1, . . . , N . Zakładamy, że obiekty pochodzą z pewnej nieznanej liczby k populacji. Na podstawie zebranych danych chcemy zidentyfikować liczbę k oraz ”przydzielić” posiadane obiekty do poszczególnych populacji. Do osiągnięcia tego celu zastosujemy metodę grupowania k-średnich obserwacji. Poniżej metoda ta zostanie pokrótce opisana, a w następnym paragrafie pokażemy jej aplikację w omawianym problemie genetycznym. Niech J = {I1 , . . . , Ik } będzie podziałem zbioru {1, . . . , N } na k rozłącznych podzbiorów. Liczby w zbiorze I1 traktujemy jako numery obserwowanych obiektów pochodzących z pierwszej populacji, liczby w zbiorze 1 I2 – numery obiektów z drugiej populacji, itd. Zakładając, że liczba k populacji jest ustalona szukamy ”najlepszego” podziału. Spośród wszystkich podziałów J za najlepszy uznamy ten, dla którego zróżnicowanie międzygrupowe w stosunku do zróżnicowania wewnątrzgrupowego będzie największe. Niech X̄Ii = 1 X Xj , ki j∈Ii gdzie ki oznacza ilość elementów zbioru Ii . Jako miernik zróżnicowania międzygrupowego przyjmiemy SAJ = k 1X kXIi − X̄J k2 , k i=1 Pk gdzie X̄J = k1 i=1 X̄Ii jest ”środkiem ciężkości” proponowanego podziału. Symbol kXk oznacza normę euPp klidesową wektora X = (X1 , . . . , Xp ) tzn. kXk2 = i=1 Xi2 . Miernikiem zróżnicowania wewnątrzgrupowego będzie k 1X 1 X SEJ = kXj − X̄Ii k2 . k i=1 ki j∈Ii Niech f (k) = max J SAJ SEJ . Szukamy takiego k, które zminimalizuje wartość funkcji f (k), przy czym poszukiwanie ograniczamy do przedziału (2, N/3). To ostatnie ograniczenie wynika stąd, że w przypadku przyjęcia k większego od N/3 uzyskujemy grupy złożone z co najwyżej dwóch obserwacji. ........ .... ................ ......... ..... ........ ..... .... . . . ... . . . ... . . . ... .... ..... .... ...... . . . . ..... ..... .................. ...... ............ ...... ... ................. ..... . . .. . . . . . . . . . . ........................ ... ... ... .. . ... ... ... .. . ... ......... ......... ... ......... ... ......... ............... .. . ................ .. ................ .. ................ ............... 2 3 4 5 6 7 8 9 10 11 Ilość skupień k Rysunek 1. Wykres wartości funkcji f (k) W analizowanym przykładzie występuje p = 8 cech oraz N = 32 obiekty. Szukając minimum funkcji f (k) uzyskano najmniejszą wartość dla k = 5 skupień (rysunek 1). Wykorzystując grupowanie metodą k-średnich z opcją maksymalizowania odległości między skupieniami podzielono badane somaklony na 5 skupień. W konsekwencji uzyskano następujący podział somaklonów linii oznaczonej jako A1 do A20 i L1 do L17 oraz form matecznych: Skupienie 1 L6, forma mateczna K Skupienie 2 L1, L8, L9, L10, L11, L16, L17 Skupienie 3 L2, L3, L5, L7, L12, L14, L15 Skupienie 4 A2, A19, forma mateczna KD Skupienie 5 A1, A3, A4, A5, A6, A7, A8, A9, A11, A14, A15, A16, A17, A18, A20 2 Forma mateczna KD, która była kontrolą dla linii zregenerowanej na DICAMBA, znalazła się w czwartym skupieniu z dwoma somaklonami A2 i A19, natomiast forma mateczna K, która była kontrolą dla linii zregenerowanej na 2.4-D w skupieniu pierwszym z somaklonem L6. Reszta somaklonów zarówno linii oznaczonej jako A1 do A20 oraz linii oznaczonej jako L1 do L17 znalazła się w pozostałych skupieniach. Możemy zatem stwierdzić, że większość somaklonów wykazywała większą zmienność niż formy mateczne. Widać również, że somaklony oznaczone jako L1 do L17 znalazły się w oddzielnych skupieniach niż somaklony oznaczone jako A1 do A20, czyli możemy na tej podstawie wyrokować, że hormon użyty w pożywce wpływa inaczej na regeneracje zarodków. Można by również pokusić się o stwierdzenie, ze DICAMBA daje mniejsze zróżnicowanie dla linii ponieważ somaklony znalazły się tylko w jednym skupieniu (skupienie piąte), natomiast somaklony oznaczone jako L1 do L17 znalazły się w większej liczbie skupień (skupienie drugie i trzecie) Wnioski Wykorzystując grupowanie metodą k-średnich maksymalizując odległości między skupieniami odpowiedzieliśmy na pytanie, czy dwa zastosowane hormony wpływają inaczej na zmienność somaklonalną. Możemy wstępnie powiedzieć, że zastosowanie auksyny DICAMBA daje inne efekty niż 2.4-D, ponieważ wszystkie somaklony oznaczone jako A1 do A20 znalazły się w innych skupieniach niż somaklony oznaczone jako L1 do L17. Dalsza analiza mogłaby prowadzić do określenia czy odległości pomiędzy oraz wewnątrz skupień są istotne. Wykracza to jednak poza ramy tej pracy. Literatura cytowana Bregitzer P., Halbert S. E., Lemaux P. G. 1998: Somaclonal variation in the progeny of transgenic barley. Theory Appl. Genet. 96, 421-425 Pietrzykowski R., Rakoczy-Trojanowska M., Zieliński W. 1997 Wykorzystanie wielowymiarowych metod statystycznych do oceny zmienności somaklonalnej u żyta ozimego Secale cereale L. Hodowla Roślin, Poznań, Listopad 19-20, Materiały I Krajowej Konferencji, 1, 171-174 Rakoczy-Trojanowska M., Pietrzykowski R., Malepszy S. 1996: Somaclonal variation of some quantitative traits of rye Secale cereale L. EUCARPIA Internat. Symp. on Rye Breeding and Genetics, Univ. Hohenheim, Germany, Jun. 27-29, Vorträge für Pflanzenzüchtung. 35, 58-59 Rakoczy Trojanowska M., Malepszy S. 1995: Genetic factors influencing regeneration ability in rye (Secale cereale L.) I. Immature embryos. Euphytica, 83, 233-239 3