średnich do badania zmienności somaklonalnej

Transkrypt

średnich do badania zmienności somaklonalnej
Wykorzystanie grupowania metodą k-średnich w ocenie zmienności somaklonalnej
żyta ozimego Secale cerale L.
Robert Pietrzykowski, Monika Rakoczy-Trojanowska, Wojciech Zieliński
Streszczenie. Praca jest kontynuacją doświadczeń nad zmiennością somaklonalną żyta Secale cerale L.
Wykorzystano grupowanie metodą k-średnich w celu uzyskania odpowiedzi czy somaklony R1 różnią się od
linii matecznej oraz czy różnicują się ze względu na zastosowany regulator wzrostu w pożywce indukcyjnej,
na której otrzymano rośliny R0
Wstęp
Ostatnio coraz większego znaczenia nabierają metody biotechnologiczne. Jedną z nich jest uzyskiwanie nowych form w wyniku zmienności somaklonalnej. Wykazano, ze zmienność somaklonalna może być przydatną
metodą poprawy cech użytkowych u wielu gatunków roślin, a także zarejestrowano kilkanaście nowych odmian
pochodzących z materiałów otrzymanych w kulturze in vitro. W Katedrze Genetyki. Hodowli i Biotechnologii Roślin SGGW od kilku lat prowadzone są badania nad zmiennością somaklonalną żyta ozimego (Secale
cerale L.), które doprowadziły do uzyskania szeregu nowych fenotypów (Rakoczy-Trojanowska i in. 1996).
Praca niniejsza ma za zadanie odpowiedzieć na pytanie, czy rośliny w somaklonach pokolenia R1 różnią się
od roślin kontrolnych (linia mateczna) oraz czy rodzaj regulatora wzrostu w pożywce na której regenerowano
rośliny R0 wpływa na zmienność ich potomstwa - pokolenie R1 . W pracy wykorzystano grupowanie metodą
k-średnich w celu uzyskania odpowiedzi na powyższe pytanie.
Materiał doświadczalny
Materiał roślinny stanowiły dwie grupy somaklonów R1 uzyskane w wyniku samozapylenia roślin zregenerowanych z niedojrzałych zarodków wysokowsobnej linii L318, wyhodowanej w KGHiBR: S1 i S2. Pierwsza,
licząca 15 somaklonów została otrzymana z roślin zregenerowanych na pożywce zawierającej 2.4-D (oznaczane
tutaj jako L1, . . . , L18 oraz linia mateczna K) i druga licząca 17 somaklonów (oznaczane jako A1, . . . , A20
oraz linia mateczna KD) z roślin zregenerowanych na pożywce zawierającej DICAMBA. W doświadczeniu
użyto dwóch rodzajów pożywek, aby stwierdzić, czy auksyna DICAMBA może być czynnikiem zwiększającym
zakres i częstość zmian somaklonalnych, co między innymi sugerował Bregitzer (Bregitzer i in. 1998). Procedura regeneracji oraz adaptacji roślin do warunków uprawy polowej była taka sama jak opisano poprzednio
(Rakoczy Trojanowska, Malepszy 1995). Rośliny w somaklonach analizowano pod względem następujących
cech (w nawiasach podano skrótowe oznaczenia cech): wysokość roślin (wys), krzewistość ogólna (krzog),
krzewistość produktywna (krzpr), długość kłosa (dlkl), liczba kłosków/kłos (lkl), liczba ziarniaków w kłosie
(lzkl), masa ziarniaków w kłosie (mzkl), masa tysiąca ziarniaków (m1000z). Szczegółową charakterystykę
danych znajdzie Czytelnik we wcześniejszych pracach (Pietrzykowski i in. 1997). Wszystkie somaklony pochodzące z linii L318 i oznaczone jako L1 do L17 oraz A1 do A20 obserwowano w dwóch latach. W roku
1994 uprawiano potomstwo regenerantów otrzymanych na pożywce z 2.4-D (linie oznaczane jako L1 do L17),
a w roku 1997 prowadzono obserwacje na somaklonach pochodzących z roślin zregenerowanych na pożywce
DICAMBA (oznaczone jako A1 do A20). W każdym roku łącznie z roślinami doświadczalnymi uprawiano po
trzydzieści roślin kontrolnych w tych samych warunkach klimatyczno-glebowych. Charakterystyki wszystkich
cech dotyczących kłosów dokonywano na podstawie średniej z pomiarów trzech pierwszych kłosów pozostawionych do wolnego zapylenia. Linie mateczne K i KD są takie same, lecz ze względu na to, że doświadczenie
było prowadzone w dwóch latach obie wzięto do analizy.
Opis metody
Niech X1 , X2 , . . . , Xn będą zaobserwowanymi obiektami p cechowymi, tzn. Xi = (Xi1 , . . . , Xip ), i =
1, . . . , N . Zakładamy, że obiekty pochodzą z pewnej nieznanej liczby k populacji. Na podstawie zebranych
danych chcemy zidentyfikować liczbę k oraz ”przydzielić” posiadane obiekty do poszczególnych populacji.
Do osiągnięcia tego celu zastosujemy metodę grupowania k-średnich obserwacji. Poniżej metoda ta zostanie
pokrótce opisana, a w następnym paragrafie pokażemy jej aplikację w omawianym problemie genetycznym.
Niech J = {I1 , . . . , Ik } będzie podziałem zbioru {1, . . . , N } na k rozłącznych podzbiorów. Liczby w zbiorze
I1 traktujemy jako numery obserwowanych obiektów pochodzących z pierwszej populacji, liczby w zbiorze
1
I2 – numery obiektów z drugiej populacji, itd. Zakładając, że liczba k populacji jest ustalona szukamy
”najlepszego” podziału. Spośród wszystkich podziałów J za najlepszy uznamy ten, dla którego zróżnicowanie
międzygrupowe w stosunku do zróżnicowania wewnątrzgrupowego będzie największe. Niech
X̄Ii =
1 X
Xj ,
ki
j∈Ii
gdzie ki oznacza ilość elementów zbioru Ii . Jako miernik zróżnicowania międzygrupowego przyjmiemy
SAJ =
k
1X
kXIi − X̄J k2 ,
k i=1
Pk
gdzie X̄J = k1 i=1 X̄Ii jest ”środkiem ciężkości” proponowanego
podziału. Symbol kXk oznacza normę euPp
klidesową wektora X = (X1 , . . . , Xp ) tzn. kXk2 = i=1 Xi2 . Miernikiem zróżnicowania wewnątrzgrupowego
będzie
k
1X 1 X
SEJ =
kXj − X̄Ii k2 .
k i=1 ki
j∈Ii
Niech
f (k) = max
J
SAJ
SEJ .
Szukamy takiego k, które zminimalizuje wartość funkcji f (k), przy czym poszukiwanie ograniczamy do
przedziału (2, N/3). To ostatnie ograniczenie wynika stąd, że w przypadku przyjęcia k większego od N/3
uzyskujemy grupy złożone z co najwyżej dwóch obserwacji.
........
.... ................
.........
.....
........
.....
....
.
.
.
...
.
.
.
...
.
.
.
...
....
.....
....
......
.
.
.
.
.....
.....
..................
......
............
......
...
.................
.....
.
.
..
.
.
.
.
.
.
.
.
.
.
........................
...
...
...
..
.
...
...
...
..
.
...
.........
.........
...
.........
...
.........
...............
..
.
................
..
................
..
................
...............
2
3
4
5
6
7
8
9
10
11
Ilość skupień k
Rysunek 1. Wykres wartości funkcji f (k)
W analizowanym przykładzie występuje p = 8 cech oraz N = 32 obiekty. Szukając minimum funkcji f (k)
uzyskano najmniejszą wartość dla k = 5 skupień (rysunek 1). Wykorzystując grupowanie metodą k-średnich
z opcją maksymalizowania odległości między skupieniami podzielono badane somaklony na 5 skupień. W
konsekwencji uzyskano następujący podział somaklonów linii oznaczonej jako A1 do A20 i L1 do L17 oraz
form matecznych:
Skupienie 1 L6, forma mateczna K
Skupienie 2 L1, L8, L9, L10, L11, L16, L17
Skupienie 3 L2, L3, L5, L7, L12, L14, L15
Skupienie 4 A2, A19, forma mateczna KD
Skupienie 5 A1, A3, A4, A5, A6, A7, A8, A9, A11, A14, A15, A16, A17, A18, A20
2
Forma mateczna KD, która była kontrolą dla linii zregenerowanej na DICAMBA, znalazła się w czwartym
skupieniu z dwoma somaklonami A2 i A19, natomiast forma mateczna K, która była kontrolą dla linii zregenerowanej na 2.4-D w skupieniu pierwszym z somaklonem L6. Reszta somaklonów zarówno linii oznaczonej
jako A1 do A20 oraz linii oznaczonej jako L1 do L17 znalazła się w pozostałych skupieniach. Możemy zatem
stwierdzić, że większość somaklonów wykazywała większą zmienność niż formy mateczne. Widać również, że
somaklony oznaczone jako L1 do L17 znalazły się w oddzielnych skupieniach niż somaklony oznaczone jako
A1 do A20, czyli możemy na tej podstawie wyrokować, że hormon użyty w pożywce wpływa inaczej na regeneracje zarodków. Można by również pokusić się o stwierdzenie, ze DICAMBA daje mniejsze zróżnicowanie
dla linii ponieważ somaklony znalazły się tylko w jednym skupieniu (skupienie piąte), natomiast somaklony
oznaczone jako L1 do L17 znalazły się w większej liczbie skupień (skupienie drugie i trzecie)
Wnioski
Wykorzystując grupowanie metodą k-średnich maksymalizując odległości między skupieniami odpowiedzieliśmy na pytanie, czy dwa zastosowane hormony wpływają inaczej na zmienność somaklonalną. Możemy
wstępnie powiedzieć, że zastosowanie auksyny DICAMBA daje inne efekty niż 2.4-D, ponieważ wszystkie
somaklony oznaczone jako A1 do A20 znalazły się w innych skupieniach niż somaklony oznaczone jako L1
do L17. Dalsza analiza mogłaby prowadzić do określenia czy odległości pomiędzy oraz wewnątrz skupień są
istotne. Wykracza to jednak poza ramy tej pracy.
Literatura cytowana
Bregitzer P., Halbert S. E., Lemaux P. G. 1998: Somaclonal variation in the progeny of transgenic barley.
Theory Appl. Genet. 96, 421-425
Pietrzykowski R., Rakoczy-Trojanowska M., Zieliński W. 1997 Wykorzystanie wielowymiarowych metod
statystycznych do oceny zmienności somaklonalnej u żyta ozimego Secale cereale L. Hodowla Roślin, Poznań,
Listopad 19-20, Materiały I Krajowej Konferencji, 1, 171-174
Rakoczy-Trojanowska M., Pietrzykowski R., Malepszy S. 1996: Somaclonal variation of some quantitative
traits of rye Secale cereale L. EUCARPIA Internat. Symp. on Rye Breeding and Genetics, Univ. Hohenheim,
Germany, Jun. 27-29, Vorträge für Pflanzenzüchtung. 35, 58-59
Rakoczy Trojanowska M., Malepszy S. 1995: Genetic factors influencing regeneration ability in rye (Secale
cereale L.) I. Immature embryos. Euphytica, 83, 233-239
3

Podobne dokumenty