Nieparametryczna identyfikacja systemów
Transkrypt
Nieparametryczna identyfikacja systemów
Nieparametryczna identy…kacja systemów W÷odzimierz Greblicki Instytut Cybernetyki Technicznej, Politechnika Wroc÷awska opublikowano w: Archiwum Automatyki i Robotyki, tom XXXVI, zeszyt 2, str. 277-290, 1991 Streszczenie tod estymacji funkcji regresji, a potem ich zastosowania by÷y spowodowane pewnymi, powaz· nymi niekiedy niedostatkami metod parametrycznych. Te ostatnie wymagaja¾ jak wiadomo dość sporej informacji apriorycznej. Dla przyk÷adu, jeśli identy…kuje sie¾ charakterystyk¾e systemu statycznego na podstawie obserwacji jego sygna÷ów wejściowych i wyjściowych, to nalez· y juz· przed eksperymentem wiedzieć, z· e nalez· y ona do pewnej, znanej rodziny funkcji. Rodzina ta musi ponadto dać sie¾ przedstawić w postaci parametryczej, co oznacza, z· e jednoznaczne określenie funkcji nalez· acej ¾ do niej jest równoznaczne ustaleniu wektora parametrów o znanym i ograniczonym wymiarze. Problem identy…kacji parametrycznej polega zatem na estymacji rzeczywistej wartości wektora parametrów. Typowa jest tutaj sytuacja, gdy o nieznanej charakterystyce wiadomo, z· e jest wielomianem znanego stopnia, a identy…kacja polega na estymacji jego wspó÷czynników. Wydaje sie¾ jednak, z· e zadania praktyczne, w których nie dysponuje sie¾ niestety wiedza¾ o badanym obiekcie na tyle szeroka, ¾ z· e umoz· liwi÷oby to przedstawienie problemu w postaci parametryczej. Moz· na wtedy stosować metody nieparametryczne, gdyz· nie wymagaja¾ one tak znacznej informacji apriorycznej. Pozwalaja¾ one identy…kować nieznana¾ charakterystyk¾e tzn. otrzymywać algorytmy zbiez· ne do niej nawet wtedy, gdy jej postać funkcyjna jest zupe÷nie nieznana i wiadomo o niej zaledwie, z· e jest np. ca÷kowalna z kwadratem. Algorytmy proponowane przez podejście nieparametryczne, czyli algorytmy nieparametryczne sa¾ zatem skutecznym narzedziem ¾ w sytuacjach, gdy wstepna ¾ informacja o systemie jest znikoma. Warto podkreślić takz· e, z· e nie nalez· y ich traktować jako konkurencyjne wibec tych, które otrzymuje sie¾ w ramach metod parametrycznych. W istotny jednak sposób poszerzaja¾ one nasze moz· liwości poznawcze. Pozwalaja¾ one bowiem identy…kować systemy nieliniowe przy bardzo ubogiej informacji apriorycznej, gdy klasyczne podejście parametryczne zawodzi. Ze wzgledu ¾ na brak publikacji na ten temat w jezyku ¾ polskim i jednocześnie spore zainteresowanie w literaturze obcojezycznej, ¾ niniejsza praca ma W pracy przedstawiono nieparametryczne algorytmy estymacji funkcji regresji oraz zastosowano je do identy…kacji systemów sterowania. Podano podstawowe ich w÷asności takie jak zbiez· ność i szybkość tej zbiez· ności. Omówiono nastepnie ¾ nieparametryczne algorytmy identy…kacji pewnej klasy nieliniowych systemów dynamicznych i przedstawiono wyniki dotyczace ¾ ich zbiez· ności. Praca jest przede wszystkim prezentacja¾ metod nieparametrycznych pod katem ¾ ich zastosowań w identy…kacji i omawia rezultaty otrzymane do tej pory w tym zakresie. 1 Wstep ¾ Nieparametryczne metody wnioskowania statystycznego, które moz· na wykorzystać w identy…kacji systemów sterowania sa¾ przedmiotem badań od stosunkowo nied÷ugiego czasu. Pierwsze prace na ten temat pojawi÷y sie¾ w czasopismach poświeco¾ nych statystyce matematycznej w po÷owie lat sześćdziesiatych, ¾ Nadaraya [2], Watson [32], i dotyczy÷y nieparametrycznej estymacji funkcji regresji. Na poczatku ¾ lat siedemdziesiatych ¾ zauwaz· ono, z· e ich rezultaty moz· na bezpośrednio wykorzystać do identy…kacji charakterystyk statycznych, Greblicki [8,9,10]. Znaczniejsze zainteresowanie metodami nieparametrycznymi przynosi nastepne ¾ dziesiecio¾ lecie, Devroye [1], Devroye i Wagner [2,3], Greblicki i Krzyz· ak [13], Greblicki, Krzyz· ak i Pawlak [14], Greblicki i Pawlak [15, 18], Silverman [30], Stone [31], a g÷ównym obszarem ich zastosowań staje sie¾ rozpoznawanie. Istotniejsza¾ próba¾ zastosowania tego narzedzia ¾ dla potrzeb identy…kacji by÷o rozwiazanie problemu optymalnego modelowania systemu bed ¾ acego ¾ kaskadowym po÷aczeniem ¾ podsystemów statycznych, Greblicki i Krzyz· ak [12]. Kolejne zagadnienie, do rozwiazania którego zastosowano metody nieparametryczne, to identy…kacja pewnej klasy nieliniowych systemów dynamicznych nazywanych systemami Hammersteina, Greblicki [11], Greblicki i Pawlak [16,17,19,20]. Pojawienie sie¾ i rozwój nieparametrycznych me1 2.2 charakter informacyjny i przegladowy. ¾ 2 Omówimy teraz dwa czesto ¾ stosowane nieparametryczne algorytmy estymacji m(u) tzn. algorytm z jadrem ¾ i algorytm ortogonalny. Zauwaz· my, z· e jako przybliz· enia licznika i mianownika w u÷amku (3) moz· na przyjać ¾ odpowiedno: Identy…kacja systemu statycznego 2.1 Algorytmy identy…kacji Wprowadzenie 1 2h Rozpatrzymy teraz zadanie identy…kacji systemu statycznego, rys. 1. u+h Z ·Z ¸ yf (v; y)dy dv u¡h oraz 1 2h u+h Z f(v)dv; u¡h (4) gdzie h jest pewna¾ dodatnia¾ liczba. ¾ Przez f(:; :) Un oznaczyliśmy ÷aczn ¾ a¾ gestość ¾ prawdopodobieństwa Yn wejścia i wyjścia. Wyrazenia podane w (4) daja¾ · m sie¾ ÷atwo oszacować na podstawie danych pomiarowych. Oznaczajac ¾ bowiem przez Iu zbiór wszystkich i 2 f1; 2; : : : ; ng, dla których jUi ¡ uj · h, moz· na jako nieobcia¾z· one oszacowania tych wyraz· eń Rys. 1. Identy…kowany system statyczny przyjać ¾ odpowiednio: W systemie tym: 1 X 1 X Yi oraz Ui : (5) Yn = m(Un ) + Zn ; (1) 2nh i2I 2nh i2I Zn u gdzie Un i Yn sa¾ odpowiednio wejściem i wyjściem, a Zn zak÷óceniem pomiarowym. Un i Zn sa¾ zmiennymi losowymi. Poniewaz· o funkcji m zak÷adamy, z· e jest mierzalna w sensie Borela, takz· e Yn jest zmienna¾ losowa. ¾ Ponadto sygna÷ wejściowy jest stacjonarnym bia÷ym szumem tzn. dla n 6= m zmienne losowe Un i Um sa¾ niezalez· ne i maja¾ jednakowe rozk÷ady. Podobnie zak÷ócenie jest stacjonarnym bia÷ym szumem, a jego wartość średnia jest równa zero. Przyjmujemy takz· e, z· e sygna÷ wejściowy i szum pomiarowy sa¾ procesami stochastycznie wzajemnie niezalez· nymi. Za÷oz· enia powyz· sze obowiazuj ¾ a¾ w ca÷ej pracy i nie bad ¾ a¾ powtarzane w podawanych w niej twierdzeniach. Zadanie identy…kacji polega na wnioskowaniu o nieznanej charakterystyce m na podstawie obserwacji niezalez· nych par (U1 ; Y1 ) ; : : : ; (Un ; Yn ). Zauwaz· ajac, ¾ z· e m(u) = E fYn jUn = ug Oznaczajac: ¾ K(u) = u ½ 1=2; dla juj · 1 0; dla juj > 1; (6) moz· na z kolei wyraz· enia w (5) przepisać w nastepu¾ jacej ¾ postaci: µ ¶ µ ¶ n n 1 X u ¡ Ui u ¡ Ui 1 X Yi K oraz K : nh i=1 h nh i=1 h (7) Poniewaz· powyz· sze wielkości przyjeliśmy ¾ jako oszacowania tych w (4), które sa¾ z kolei przybliz· eniami g(u) i f(u), to estymator nieznanego m(u) de…niujemy nastepuj ¾ aco: ¾ µ ¶ n u ¡ Ui 1 X Yi K nh i=1 h ¶ : µ n 1 X u ¡ Ui K (2) nh i=1 h moz· na stwierdzić, z· e z punktu widzenia statystyki matematycznej problem polega na estymacji funkcji regresji. Zak÷adajac ¾ teraz istnienie gestości ¾ prawdopodobieństwa sygna÷u wejściowego moz· emy stwierdzić, z· e: Jest oczywiste, z· e aby zapewnić zbiez· ność powyz· szego wyraz· enia do m(u) nalez· y wspó÷czynnik h uzalez· nić od liczby pomiarów n. Prowadzi to do nastepuj ¾ acej ¾ de…nicji estymatora: µ ¶ n 1 X u ¡ Ui Yi K m(u) = g(u)=f (u); (3) nh(n) i=1 h(n) m ^ n (u) = (8) µ ¶ ; n gdzie g(u) = m(u)f (u). Przez f oznaczyliśmy 1 X u ¡ Ui K gestość ¾ prawdopodobieństwa zmiennej losowej Un . nh(n) i=1 h(n) Podajac ¾ róz· ne oszacowania wyraz· eń znajdujacych ¾ sie¾ w liczniku i mianowniku u÷amka (3) otrzymuje gdzie K jest tzw. jadrem ¾ estymatora, sie¾ rózne algorytmy identy…kacji nieparametrycz- fh(n); 1; 2; : : :g ciagiem ¾ liczb dodatnich. Donej. puszczajac ¾ stosowanie innych funkcji K, a nie 2 tylko tej zde…niowanej wzorem (6), otrzymuje sie¾ moz· emy ÷atwo sprawdzić, z· e ca÷a¾ klase¾ algorytmów nazywana¾ w literaturze n X estymatorem z jadrem. ¾ Yi kN(n) (u; Ui ) Algorytm, który przedstawimy teraz wykorzyk=0 m ~ n (u) = n ; stuje szeregi ortogonalne i dlatego nazywany jest X ortogonalnym. Za÷ózmy, z· e f'k ; k = 0; 1; 2; : : :g kN(n) (u; Ui ) jest uk÷adem funkcji ortonormalnych na ca÷ej prok=0 stej. Niech: gdzie kN jest tzw. jadrem ¾ szeregu ortogonalnego. 1 1 Dla uk÷adu trygonometrycznego, kN jest jadrem ¾ X X g(u) » ak 'k (u) oraz f (u) » bk 'k (u) Dirichleta, gdy natomiast system ortonormalny jest k=0 k=0 typu wielomianowego, jadro ¾ to moz· na ÷atwo wyrazić w znacznie prostszej obliczeniowo postaci jeśli co oznacza, z· e : skorzysta sie¾ z wzoru Christo¤ela-Darboux. Z Z ak = m(u)f (u)'k (u)du i bk = f (u)'k (u)du: 2.3 Zbie·zność algorytmów identy…kacji Jako przybliz· enie g(u) i f(u), czyli wyraz· eń stojacych ¾ odpowiednio w liczniku i mianowniku Podstawowy problem jaki sie¾ teraz pojawia to zbiez· ność przedstawionych powyz· ej algorytmów idenu÷amka (3) przyjmiemy teraz: ty…kacji do nieznanej charakterystyki. W odnieN(n) N(n) sieniu do algorytmu z jadrem ¾ nalez· y odpowiedzieć X X ak 'k (u) oraz bk 'k (u); na pytanie w jaki sposób wybrać ciag ¾ fh(n)g oraz k=0 k=0 jadro ¾ K. Wobec algorytmu otrogonalnego wy÷ania sie¾ zagadnienie wyboru funkcji ortogonalnych i cigdzie fN (n); n = 1; 2; : : :g jest pewnym ciagiem ¾ agu ¾ fN (n)g. O zagadnieniach tych traktuje szereg liczb naturalnych. Jest oczywiste, z· e wspó÷- prac. Zaczniemy od twierdzenia dotyczacego ¾ algoczynniki a0 ; a1 ; : : : oraz b0 ; b1 ; : : : rozwinieć ¾ ortogo- rytmu z jadrem. ¾ nalnych sa¾ nieznane, Zauwaz· ajac ¾ jednak, z· e ak = EfY1 'k (U1 )g oraz bk = Ef'k (U1 )g, moz· na podać Twierdzenie 1. Za÷óz· my, z· e nastepuj ¾ ace ¾ nieobcia¾z· one ich estymatory: Z m2 (u)f (u)du < 1 i EZ12 < 1: (10) n n X 1 1X Yi 'k (Ui ) oraz ~bk = ' (Ui ): a ~k = n i=1 n i=1 k Niech K bedzie ¾ nieujemna¾ funkcja¾ mierzalna¾ w sensie Borela taka, ¾ z· e: W rezultacie otrzymujemy nast¾epujacy ¾ algorytm Z identy…kacji: K(u)du = 1; m ~ n (u) = n X a ~k 'k (u) k=0 N(n) X : (9) Jez· eli ~bk 'k (u) jujK(u) ! 0, gdy juj ! 1. n n h(n) ! 0 oraz nh(n) ! 1; k=0 to Stosujac ¾ róz· ne uk÷ady funkcji otrogonalnych otrzyn muje sie¾ rózne wersje algorytmu (9). Jako uk÷ad ten m ^ n (u) ! m(u) w/g prawdopodobieństwa moz· na przyjać ¾ np. rodzine¾ funkcji Hermite’a. Jeśli w kaz· dym punkcie u 2 (¡1; 1), w którym sygna÷ wejściowy jesr ograniczony, to moz· na stosozarówno charakterystyka m jak i gestość ¾ f sa¾ wać uk÷ady ortogonalne na odcinku, czyli np. uk÷ad ci ag÷e ¾ oraz jednocześnie f(u) > 0. trygonometryczny lub wielomiany Legendre’a. Pomimo, z· e zasady konstrukcji estymatorów (8) i ^ (9) sa¾ ca÷kowicie róz· ne, istnieje miedzy ¾ nimi pewne Dowód. Oznaczmy przez g^n (u) i fn (u) wyraz· enia stojace ¾ odpowiednio w liczniku i mianowniku podobieństwo. Oznaczjac ¾ bowiem wyraz· enia (8). Oczywiście N µ ¶ Z X u¡v 1 'k (u)'k (v); kN (u; v) = E^ gn (u) = K g(v)dv: h(n) h(n) k=0 3 z· ada ¾ sie¾ aby jego rozk÷ad prawdopodobieństwa posiada÷ gestość, ¾ aczkolwiek moz· e być ona zupe÷nie dowolna. A teraz uwaga dotyczaca ¾ specy…kacji punktów, w których algorytm zbiega sie¾ do nieznanej charakterystyki. Zauwaz· my, z· e jeśli gestość ¾ f jest ciag÷a, ¾ to algorytm jest zgodny w kaz· dym punkcie, w którym charakterystyka m jest ciag÷a ¾ a gestość ¾ dodatnia. Zwróćmy jednak uwage, ¾ z· e charakterystyka nie musi być bynajmniej funkcja¾ wszedzie ¾ ciag÷ ¾ a, ¾ moz· e to być np. charakterystyka typu przekaźnikowego. Twierdzenie 1 moz· na ÷atwo wzmocnić, aczkolwiek wymaga÷oby to stosowania bardziej zaawansowanych narzedzi. ¾ Stosujac ¾ np. technik¾e obcieć ¾ moz· na wykazać, z· e za÷oz· enia (1) mo ¾ przez R z· na zastapić mniej ograniczajacy ¾ warunek jm(u)jf (u)du < 1 i EjZ1 j < 1, Devroye [1], Greblicki, Krzyz· ak i Pawlak [14]. W pracy tej zak÷adamy, z· e rozk÷ad sygna÷u wejściowego jest na tyle regularny, z· e istnieje jego gestość. ¾ Z za÷oz· enia tego moz· na zrezygnować, gdyz· okazuje sie, ¾ z· e algorytm zbiega sie¾ do nieznanej charakterystyki takz· e przy dowolnym rozk÷adzie sygna÷u wejściowego nawet takim, który gestości ¾ nie posiada, Devroye [1], Devoye i Wagner [3], Greblicki, Kzyz· ak i Pawlak [14], Stone [31]. Twierdzenie 1 daje spora¾ swobode¾ w wyborze jadra ¾ K i ciagu ¾ liczbowego fh(n)g. Jest oczywiste, z· e wybór ten ma wp÷yw na szybkość z jaka¾ algorytm sie¾ zbiega. Krytyczny okazuje sie¾ tutaj wybór ciagu ¾ liczbowego, gdyz· wp÷yw jadra ¾ na te¾ szybkość jest niewielki. Moz· na wykazać, z· e jeśli zarówno m jak i f sa¾ w punkcie u dwukrotnie róz· niczkowalne oraz h(n) = c1 n¡1=5 , c1 > 0, to: Zbiez· ność powyz· szego do g(u), gdy h(n) zda¾z· a do zera, jest przedmiotem twierdzeń analizy matematycznej. Korzystajac ¾ np. z Twierdzenia 9.9 z ksia¾z· ki Wheedena i Zygmunda [33] wnioskujemy, z· e, poniewaz· g jest funkcja¾ ca÷kowalna, ¾ wyraz· enie powyz· sze zbiega sie¾ do g(u) w kaz· dym punkcie ciag÷o¾ ści funkcji g. Z kolei var [^ gn (u)] · µ ¶¸ 1 u ¡ U1 = var Y K · 1 nh2 (n) h(n) · µ ¶ ¸ Z k var [Z1 ] u¡v K f (v)dv nh(n) h(n) h(n) µ ¶ Z 1 u¡v + K m2 (v)f (v)dv; h(n) h(n) gdzie k = supu K(u). Korzystajac ¾ ponownie ze wspomnianego powyz· ej twierdzenia dochodzimy do wniosku, z· e wyraz· enie w nawiasach kwadratowych zbiega sie¾ do var [Z1 ] f (u) + m2 (u)f(u), gdy h(n) da¾z· y do zera. Zbiez· ność ta ma miejsce w kaz· dym punkcie u, w którym zarówno m jak i f sa¾ ciag÷e. ¾ Wykazaliśmy zatem, z· e: n E(^ gn (u) ¡ g(u))2 ! 0 w kaz· dym punkcie u, w którym zarówno m jak i f sa¾ ciag÷e. ¾ Powtarzajac ¾ powyz· sze rozumowanie w odniesieniu do f (u) moz· na ÷atwo sprawdzić, z· e n E(f^n (u) ¡ f(u))2 ! 0 w kaz· dym punkcie ciag÷ości ¾ funkcji f. Z tego co pokazaliśmy oraz de…nicji estymatora wynika teza, co kończy dowód. Istnieje wiele funkcji spe÷niajacych ¾ warunki Twierdzenia 1, które moz· na przyjać ¾ jako jadro ¾ estymatora. Oto kilka przyk÷adów: ½ 1 ¡juj 1 ¡ juj; dla juj · 1 a) c) e ; 0; dla juj > 1; 2 1 1 2 b) p e¡u =2 ; d) : ¼(1 + u2 ) 2¼ P fjm ^ n (u) ¡ m(u)j > "jm(u)jg · d1 n¡4=5 dla kaz· dego " > 0, gdzie d1 jest pewna¾ liczba¾ niezalez· na¾ od n, Greblicki i Krzyz· ak [13]. Rezultat ten moz· e stanowić pewna¾ rekomendacje¾ odnośnie do wyboru ciagu ¾ liczbowego. Jeśli chodzi o algorytm ortogonalny, to róz· ne jego wersje otrzymywane przez wykorzystanie róz· nych uk÷adów ortogonalnych wymagaja¾ róz· nych sposobów analizy. Majac ¾ zatem na uwadze ograniczoność miejsca poprzestaniemy na algorytmie z uk÷adem Hermite’a. Jak wiadomo, w uk÷adzie tym: 1 ¡u2 =2 'k (u) = p Hk (u); p e k 2 k! ¼ Jeśli jako ciag ¾ liczbowy przyjać ¾ h(n) = cn¡® , to warunki (11) sa¾ spe÷nione dla 0 < ® < 1. Zauwaz· my, z· e jedynym za÷oz· eniem Twierdzenia 1 odnoszacym ¾ sie¾ do informacji wstepnej ¾ o nieznanym systemie jest (10). Wymaga ono aby istnia÷ drugi moment Em2 (U1 ) sygna÷u pojawiajacego ¾ sie¾ bezpośrednio za elementem o nieznanej charakterystyce oraz aby zak÷ócenie pomiarowe posiada÷o skończona¾ wariancje. ¾ Nie wymagana jest przy tym z· adna znajomość funkcyjnego kszta÷tu nieznanej charakterystyki. Odnośnie do sygna÷u wejściowego, gdzie: dk ¡u2 e duk jest k-tym wielomianem Hermite’a. Dla przyk÷adu, H0 (u) = 1, H1 (u) = ¡2u, H2 (u) = 4u2 ¡ 2, H3 (u) = ¡8u2 + 12u, itd. 2 Hk (u) = eu 4 ¾ algorytmu z wielowymiarowym uk÷aTwierdzenie 2. Za÷óz· my, z· e spe÷nione jest za÷o- z wyjatkiem dem trygonometrycznym, niczego na ten temat nie z· enie (10), Jeśli f; g 2 Lp , p > 1, oraz wiadomo. n n Duz· e zainteresowanie budzi b÷ad ¾ ca÷kowy, a nie N (n) ! 1 oraz N (n)=n2 ! 0; (12) tylko punktowy, do którego ograniczyliśmy sie¾ tuto dla algorytmu wykorzystujacego ¾ uk÷ad Her- taj, gdyz· podaje on globalna¾ ocen¾e jakości algomite’a rytmu. Do b÷edu ¾ ca÷kowego wrócimy omawiajac ¾ rezultaty eksperymentu numerycznego. Badana n m ~ n (u) ! m(u) w/g prawdopodobieństwa jest takz· e zbiez· ność z prawdopodobieństwem 1 oraz inne typy zbiez· ności probabilistycznej. Otrzymyw kaz· dym punkcie u 2 (¡1; 1), w którym wane w literaturze rezultaty dotycza¾ takz· e specy…zarówno charakterystyka m jak i gestość ¾ f sa¾ kacji punktów, w których algorytmy sa¾ zbiez· ne. W róz· niczkowalne i jednocześnie f(u) > 0. tej pracy stwierdziliśmy np. zbiez· ność w punktach ciag÷ości, ¾ czy róz· niczkowalności nieznanej charakDowód powyz· szego twierdzenia moz· na znaleźć w terystyki. Znane sa¾ wyniki o zbiez· ności w prawie pracy Greblicki i Pawlak [15]. Trzeba dodać, z· e wszystkich, wed÷ug odpowiednich miar, punktach. podobnie jak mia÷o to miejsce wobec Twierdzenia Stosuje sie¾ takz· e róz· ne pochodne wersje przed1 takz· e i w Twierdzeniu 2 za÷oz· enie (10) moz· na stawionych powyz· ej algorytmów. Odnośnie do alos÷abić, Greblicki i Pawlak [15]. gorytmu z jadrem ¾ warto wspomnieć o jego wersjach Warto w tym miejscu zwrócić uwage¾ na to, z· e rekurencyjnych, Devroye i Wagner [2], Greblicki i zbiory punktów określone ptzrz Twierdzenia 1 i 2, Krzyz· ak [13], Greblicki i Pawlak [18]. w których algorytm z jadrem ¾ i algorytm ortogoWarto odnotować próbe¾ zastosowania algorytnalny z uk÷adem Hermite’a zbiegaja¾ sie, ¾ sa¾ róz· ne. mów ortogonalnych do estymacji zmieniajacej ¾ sie¾ w Jez· eli np. sygna÷ wejściowy ma rozk÷ad normalny, czasie funkcji regresji, czyli inaczej mówiac ¾ do idento zgodnie z Twierdzeniem 1 algorytm z jadrem ¾ ty…kacji obiektu niestacjonarnego, Greblicki, Rutjest zbiez· ny do m(u) w kaz· dym punkcie ciag÷ości ¾ kowska i Rutkowski [21]. m. Twierdzenie 2 zapewnia natomiast w tej syObszerny i szczegó÷owy przeglad ¾ wyników uzytuacji zbiez· ność algorytmu otrogonalnego jedynie skanych w dziedzinie nieparametryczej estymacji w punktach rózniczkowalności m. Róz· nica ta nie funkcji regresji oraz gestości ¾ prawdopodobienstwa jest przypadkowa i wystepuje ¾ takz· e przy korzysta- zawiera ksiaz· ka Prakasy Rao [24]. Moz· na w niej niu z innych uk÷adów ortogonalnych, gdyz· ma g÷eb¾ znaleźć bogaty wykaz publikacji wydanych do 1980 sze przyczyny. roku dotyczacych ¾ nie tylko estymacji jako takiej Odnośnie do szybkości zbiez· ności rozwaz· nego al- lecz takz· e zastosowań. gorytmu wiadomo, z· e jeśli m oraz f sa¾ dwukrotnie rózniczkowalne, to przy spe÷nieniu pewnych dodatkowych za÷oz· eń: 3 Identy…kacja systemów dy- namicznych P fjm ~ n (u) ¡ m(u)j > "jm(u)jg · d2 n¡4=5 ; £ ¤ " > 0, d2 > 0, gdy tylko N (n) = c2 n1=2 , gdzie c2 > 0, natomiast [:] oznacza cześć ¾ ca÷kowita, ¾ Greblicki i Pawlak [15]. Zauwaz· my, z· e szybkość powyz· sza posiada rzad ¾ n¡4=5 , czyli ten sam jaki ma algorytm z jadrem. ¾ Warto dodać, z· e obserwacja ta powtarza sie takz· e dla algorytmów korzystajacych ¾ z innych uk÷adów ortogonalnych. 2.4 Podejście nieparametryczne zastosowano takz· e do identy…kacji pewnej klasy nieliniowych systemów dynamicznych. Obejmuje ona systemy określane jako systemy Hammersteina, a które nazw¾e zawdzieczaj ¾ a¾ temu, z· e ich zachowanie opisuje sie¾ funkcjona÷em Hammersteina. Zn Un Uwagi Wn m Powyz· ej podano jedynie podstawowe w÷asności zaprezentowanych algorytmów identy…kacji. Ograniczono sie¾ przy tym do jednowymiarowego wejscia. O ile mody…kacja algorytmu z jadrem ¾ na przypadek wielu wejść i dalsza analiza nie stanowia¾ powaz· nej trudności, to nie mozna niestety tego powiedzieć o algorytmie ortogonalnym. Jak do tej pory, podsystem dynamiczny Vn Rys. 2. Identy…kowany system Hammersteina W systemie takim, rys. 2, Wn = m(Un ); 5 Yn gdzie m jest nieznana¾ nieliniowa¾ charakterystyka. ¾ postać: Podsystem liniowy opisywany jest nastepuj ¾ acym ¾ równaniem stanu: ½ Xn+1 Yn = AXn + bWn = cT Xn + Zn ; gdzie Xn jest wektorem stanu, Zn szumem pomiarowym, Yn wyjściem systemu, T oznacza transpozycje. ¾ A, b, oraz c sa¾ nieznane, lecz wiadomo, z· e A jest macierza, ¾ której wszystkie wartości w÷asne lez· a¾ wewnatrz ¾ ko÷a jednostkowego. Podobnie jak poprzednio, sygna÷ wejściowy jest stacjonarnym bia÷ym szumem losowym określonym tym razem dla n = : : : ; ¡1; 0; 1; : : :. Odnośnie do zak÷óceń pomiarowych zak÷adamy, z· e maja¾ skończona¾ wariancje. ¾ Nieznana charakterystyka m spe÷nia nastepuj ¾ ace ¾ za÷oz· enie: Yi K (14) natomiast algorytm ortognalny zachowuje postać (9) z ta¾ róz· nica, ¾ z· e teraz: n a ~k = n 1X 1X Yi 'k (Ui¡1 ) oraz ~bk = ' (Ui¡1 ): n i=1 n i=1 k Trzeba tutaj zwrócić uwage¾ na zasadnicza¾ róz· nice¾ pomiedzy ¾ sytuacja¾ obecna, ¾ a ta¾ z która¾ mieliśmy do czynienia przy identy…kacji systemu statycznego. Wtedy wnioskowaliśmy na podstawie stochastycznie niezalez· nych par (U1 ; Y1 ) ; (U2 ; Y2 ) ; : : :, natomiast teraz identy…kujemy majac ¾ pary zalez· ne (U0 ; Y1 ) ; (U1 ; Y2 ) ; : : :. Sa¾ one zalez· ne, gdyz· zmienne losowe Y1 ; Y2 ; : : : sa¾ zalez· ne, poniewaz· sa¾ wyjściem systemu dynamicznego. Obecny problem sprowadza sie¾ do poprzedniego, gdy A = 0, tzn. gdy liniowy podsystem dynamiczny redukuje sie¾ do opóźnienia o jedna¾ chwile. ¾ Wspomniana powyz· ej zalez· ność obserwowanych par powoduje pojawienie sie¾ dodatkowych trudności analitycznych i dlatego ograniczymy sie¾ jedynie do stwierdzenia, z· e rezultaty dotyczace ¾ algorytmu (8) podane w Twierdzeniu 1 mozna powtórzyć dla estymatora (14), Greblicki i Pawlak [16, 17]. Pewnym zaskoczeniem jest, z· e wystapienie ¾ zalez· ności pomiedzy ¾ obserwacjami nie powoduje zmniejszenia rzedu ¾ szybkości zbiez· ności. Moz· na wykazać, z· e teza Twierdzenia 2 dotyczaca ¾ algorytmu ortogonalnego z systemem Hermite’a pozostaje s÷uszna takz· e i teraz, Greblicki [11]. Szybkość zbiez· ności takz· e nie ulega pogorszeniu. Do tej pory procesy fUn g i fYn g by÷y określone dla n = : : : ; ¡1; 0; 1; : : : i by÷y przy tym stacjonarne. Interesujaca ¾ jest takz· e sytuacja, gdy procesy te de…niowane sa¾ dla n = 0; 1; : : :, tzn. gdy nie maja¾ one w chwili zerowej z· adnej historii. Proces fYn g jest teraz niestacjonarny, pomimo, z· e proces wejściowy i system jako taki sa¾ stacjonarne. ×atwo spostrzec, z· e teraz jm(u)j · c1 + c2 juj; dla pewnych c1 oraz c2 . Dzieki ¾ temu zadanie jest prawid÷owo sformu÷owane w tym sensie, z· e Xn bed ¾ ace ¾ suma¾ nieskończonego szeregu zmiennych losowych jest takz· e zmienna¾ losowa. ¾ Jest oczywiste, z· e za÷oz· enie to nie jest w z· adnym przypadku zwiazane ¾ z przedstawiona¾ poniz· ej metoda¾ identy…kacji. Zadanie polega na identy…kacji obydwu podsystemów na podstawie obserwacji wejścia i wyjscia ca÷ego systemu tzn. na podstawie (U0 ; Y0 ) ; (U1 ; Y1 ) ; : : :. Poniewaz· odpowiedź impulsowa¾ podsystemu liniowego moz· na ÷atwo estymować metodami korelacyjnymi, ograniczymy sie¾ do identy…kacji podsystemu nieliniowego. Zauwaz· my, z· e E fYn+1 jUn = ug = ®m(u) + ¯; µ ¶ u ¡ Ui¡1 h(n) m ^ n (u) = i=1n µ ¶ ; X u ¡ Ui¡1 K h(n) i=1 n X (13) gdzie ® = cT b oraz ¯ = cT AEXn . Za÷óz· my chwilowo, z· e gestość ¾ sygna÷u wejściowego jest funkcja¾ parzysta, ¾ a nieznana charakterystyka nieparzysta. ¾ Wówczas EXn = 0 i w rezultacie ¯ = 0. Do przypadku ¯ 6= 0 wrócimy później. Estymacja funkcji regresji (11) prowadzi zatem do wykrycia ®m(u), gdzie ® jest nieznana¾ liczba. ¾ Nie jest to jednak specy…czna¾ w÷asnościa¾ prezentowanej metody, lecz cecha¾ ogólna¾ wynikajac ¾ a¾ z szeregowej struktury identy…kowanego systemu. Kaz· dy bowiem algorytm konstruowany przy przyjetych ¾ w pracy za÷oz· eniach wstepnych ¾ o systemie posiadać moz· e jedynie zdolność estymacji nieznanej charakterystyki z dok÷adnościa¾ do nieznanego mnoz· nika, którym w naszym przypadku jest ®. Algorytm z jadrem ¾ przyjmuje teraz nastepuj ¾ ac ¾ a¾ E fYn+1 jUn = ug = ®m(u) + ¯ n ; gdzie ¯ n = cT AEXn , przy czym EXn = An x0 , gdzie x0 jest poczatkowym ¾ wektorem stanu. Zak÷adamy przy tym, z· e wektor ten nie charakteru losowego. Okazuje sie, ¾ z· e algorytm z jadrem ¾ zachowuje sie¾ poprawnie takz· e i w tej sytuacji, Greblicki i Pawlak [19]. 6 Ze wzgledów ¾ obliczeniowych wygodnie jest niekiedy stosować rekurencyjne wersje algorytmu (14), Greblicki i Pawlak [20]. De…niuje sie¾ je nastepu¾ jaco: ¾ oraz cokolwiek, wiadomo o ich zachowaniu sie¾ dla niewielkiej liczby obserwacji. W tym obszarze musimy sie¾ jedynie zadowolić wynikami badań symulacyjnych. Poniz· ej podamy wyniki eksperymentu numerycznego, w którym zbadano zachowanie sie¾ dwóch algorytmów, przy pomocy których estymowano charakterystyke nieliniowa¾ w systemie Hammersteina. W systemie tym charakterystyka ta jest funkcja¾ nieciag÷ ¾ a¾ i jest zde…niowana nastepuj ¾ aco: ¾ 8 < 0:4; dla 0:5 < u 0; dla ¡ 0:5 < u < 0:5 m(u) = : ¡0:4; dla u < ¡0:5: µ ¶ n X 1 u ¡ Ui¡1 Yi K h(i) h(i) i=1 0 mn (u) = n µ ¶ X 1 u ¡ Ui¡1 K h(i) h(i) i=1 ¶ u ¡ Ui¡1 h(i) m00n (u) = i=1n µ ¶ : X u ¡ Ui¡1 K h(i) i=1 n X Yi K µ Ponadto Xn jest skalarem, przy czym Xn+1 = 0:2 ¢ Xn + Zn . Sygna÷ wejściowy ma rozk÷ad równomierny na odcinku (¡1; 1), a zak÷ocenie na odcinku ×atwo sprawdzić, z· e m0n (u) = L0n (u)=Mn0 (u), gdzie (¡0:5; 0:5). Pierwszy z estymatorów, to algorytm z jadrem, ¾ przy czym jako jadro ¾ przyjeto ¾ (6). Jako 0 0 drugi zastosowano algorytm ortogonalny z uk÷adem Ln (u) = Ln¡1 (u) · µ ¶ ¸trygonometrycznym. 1 u ¡ Un¡1 1 Yn K ¡ L0n¡1 (u) + n h(n) h(n) oraz 35 algorytm 1000 X MISE 0 Mn0 (u) = Mn¡1 (u) · µ ¶ ¸ 1 u ¡ Un¡1 1 0 K ¡ Mn¡1 (u) ; + n h(n) h(n) 30 przy czym L00 (u) = M00 (u) = 0. Alternatywna formu÷a rekurencyjna, która¾ podamy dla drugiego z przedstawionych powyz· ej algorytmów identy…kacji, jest nastepuj ¾ aca: ¾ ¶ µ u ¡ Un¡1 00 00 Ln (u) = Ln¡1 (u) + Yn K h(n) 20 00 Mn00 (u) = Mn¡1 (u) + K u ¡ Un¡1 h(n) ¶ z j•drem 25 15 10 5 oraz µ trygonometryczny 0 0 ; 100 200 n 300 400 przy czym L000 (u) = M000 (u) = 0. Przez L00n (u) i Rys. 3. Zalez· ność b÷edu ¾ ca÷kowego od liczby Mn00 (u) oznaczyliśmy odpowiednio licznik i mianowobserwacji nik we wzorze de…niujacym ¾ algorytm. Wrócimy teraz do za÷oz· enia dotyczacego ¾ ¯. JeJakość kaz· dego z nich oceniano biorac ¾ pod uwage¾ z· eli ¯ 6= 0, to moz· na jednak w pewnych sytuacjach średni, ca÷kowy b÷ ad ¾ kwadratowy (MISE): estymować ®m(u). Jeśli bowiem m(0) = 0, co jest jak sie¾ wydaje czestym ¾ przypadkiem, to jako algo0:8 Z rytm identy…kacji moz· na przyjać ¾ m ^ n (u) ¡ m ^ n (0). E (mn (u) ¡ m(u))2 du; Jest oczywiste, z· e proponowany algorytm zbiega sie¾ ¡0:8 do ®m(u), jeśli tylko m ^ n (0) zda¾z· a do m(0). przy czym jako mn (u) przyjmowano kolejno kaz· dy z dwóch algorytmów. Jakość oceniano na odcinku bed ¾ acym ¾ cześci ¾ a¾ przedzia÷u (¡1; 1). UczyPodane w pracy rezultaty analizy teoretycznej do- niono tak, aby nie dyskwali…kowć z góry estymatycza¾ w÷asności asymptotycznych. Niewiele, jeśli tora trygonometrycznego. Jak bowiem wiadomo, 4 Przyk÷ad numeryczny 7 maja¾ z regu÷y rzad ¾ n¡1 . Z drugiej jednak strony, algorytmy nieparametryczne sa¾ pod wzgledem obliczeniowym nieporównanie szybsze od parametrycznych otrzymywanych np. metoda¾ najmniejszych kwadratów, która wymaga czasoch÷onnego odwracania macierzy. Róz· nica ta staje sie tym bardziej istotna im wiekszy ¾ jest wymiar nieznanego wektora parametrów. Wydaje sie, ¾ z· e na koniec mozna stwierdzić, z· e nieparametryczne metody estymacji sa¾ istotna¾ propozycja¾ ze strony statystyki matematycznej, która¾ warto wykorzystać i rozwijać dla potrzeb identy…kacji systemów nieliniowych. rozwiniecia ¾ trygonometryczne nie zachowuja¾ sie¾ poprawnie na końcach odcinka. B÷ad ¾ szacowano empirycznie na podstawie niezalez· nych realizacji. Jako liczbe¾ obserwacji przyjmowano kolejno 25; 50; 100; 200; 300 i 500. Jeśli chodzi o estymator z jadrem, ¾ to dla kaz· dego z powyz· szych n wybrano eksperymentalnie takie h(n), które minimalizuje nasz b÷ad ¾ ca÷kowy. Podobnie postapiono ¾ z algorytmem trygonometrycznym, z ta¾ róz· nica, ¾ z· e tym razem wybierano optymalne N (n). W ten sposób, dla kaz· dego z estymatorów otrzymano, dla podanych powyz· ej n, najmniejszy, moz· liwy do uzyskania b÷ad ¾ ca÷kowy, a wyniki przedstawiono na rys. 3. Narzucajacym ¾ sie¾ spostrzez· eniem jest to, z· e otrzymane wykresy sa¾ bardzo podone, gdyz· zaobserwowane róz· nice w znacznym stopniu mieszcza¾ sie¾ w granicach b÷edu ¾ spowodowanego empirycznym charakterem przyk÷adu. Wydaje sie¾ wiec, ¾ z· e podane wyz· ej wyniki analizy teoretyczej i przedstawione rezultaty przyk÷adu symulacyjnego sk÷aniaja¾ do wniosku o bardzo podobnym zachowaniu sie¾ obydwu algorytmów zarówno dla ma÷ych jak i duz· ych n. 5 Bibliogra…a [1] L. Devroye. On the almost everywhere convergence of nonparametric regression function estimates. Annals of Statistics, 9:1310– 1319, 1981. [2] L.P. Devroye, T.J. Wagner. On the L1convergence of kernel estimators of regression functions with aplication in discrimination. Z. Wahrsch. Verv. Gebiete, 51:15–25, 1980. Uwagi końcowe [3] L.P. Devroye, T.J. Wagner. Distribution-free consistency results in nonparametric discrimination, regression function estimation. Annals of Statistics, 9:231–239, 1980. W niniejszej pracy ograniczyliśmy sie¾ do dwóch typów algorytmów nieparametrycznych. Trzeba jednak stwierdzić, z· e bada sie¾ ich znacznie wiecej, ¾ a najpopularniejsze z nich wydaja¾ sie¾ splajnowy, Silverman [30], i najbliz· szy sasiad, ¾ Stone [31]. Czynione sa¾ takz· e próby powiazania ¾ podejścia nieparametrycznego z metoda¾ najmniejszych kwadratów, Rafaj÷owicz [26]. Tutaj omawialiśmy systuacje, ¾ w której system pobudzany jest sygna÷em losowym. Badane sa¾ takz· e algorytmy identy…kujace ¾ nieznana¾ charakterystyk¾e obiektu statycznego w przypadku, gdy wejście jest natury deterministycznej, Ga÷kowski i Rutkowski [4], Georgiev [5, 6], Georgiev i Greblicki [7], Priestley i Chao [23], Schuster i Yakowitz [29]. Czynione sa¾ próby zastosowania ich do identy…kacji systemów opisywanych równaniami o pochodnych czastkowych, ¾ Rafaj÷owicz [25], a takz· e niestacjonarnych, Rutkowski [27, 28]. Na zakończenie nalez· a÷oby jeszcze raz stwierdzić, z· e metody nieparametryczne stwarzaja¾ moz· liwości identy…kacji systemów w warunkach daleko posunietego ¾ braku informacji wstepnej ¾ o badanym systemie. Jest przy tym oczywiste, z· e zap÷acić trzeba za to pewna¾ cene, ¾ która¾ jest wolniejsza ich zbiez· ność. Jak podaliśmy, szybkość, która¾ zapewniaja¾ one przy dwukrotnie rózniczkowalnej charakterystyce, jest rzedu ¾ n¡4=5 . Metody parametryczne [4] T. Ga÷kowski, L. Rutkowski. Nonparametric recovery of multivariate function with applications to system identi…cation. Proc. IEEE, 73:942–943, 1985. [5] A. Georgiev. On the recovery of functions, their derivatives from imperfect measurements. IEEE Transactions on Systems, Man„ Cybernetics, SMC-14:900–904, 1984. [6] A. Georgiev. Asymptotic properties of the multivariate Nadaraya-Watson regression estimate: The …xed design case. Statistics, Probability Letters, 7:35–40, 1989. [7] A. Georgiev, W. Greblicki. Nonparametric function recovering from noisy observations. Journal of Statistical Planning, Inference, 13:1–14, 1986. [8] W. Greblicki. Nieparametryczna identy…kacja charakterystyk statycznych. Podstawy Sterowania, 3(1):11–18, 1973. [9] W. Greblicki. Identy…kacja statyczna metoda¾ szeregów ortogonalnych. Podstawy Sterowania, 4(1):3–12, 1974. 8 [10] W. Greblicki. Nonparametric system identi…- [22] E. Nadaraya. On regression estimators. Thecation by orthogonal series. Problems of Conory Probab. Appl., 9:157–159, 1964. trol, Information Theory, 8(1):67–73, 1979. [23] M.B. Priestley, M.T. Chao. Nonparametric function …tting. J. Royal Statistical Society, [11] W. Greblicki. Nonparametric orthogonal se34:385–392, 1972. ries identi…cation of Hammerstein systems. International Journal of Systems Science, [24] B.L.S. Prakasa Rao. Nonparametric Func20(12):2355–2367, 1989. tional Estimation. Academic Press, Orlando, 1983. [12] W. Greblicki, A. Krzyz· ak. Nonparametric identi…cation of a memoryless system with a [25] E. Rafaj÷owicz. Nonparametric algorithm cascade structure. International Journal of Syfor identi…cation of weakly nonlinear static stems Science, 10(11):1301–1310, 1979. distributed-parameter systems. Systems, Control Letters, 4:91–96, 1984. [13] W. Greblicki, A. Krzyz· ak. Asymptotic properties of kernel estimates of a regresion func- [26] E. Rafaj÷owicz. Nonparametric orthogonal setion. Journal of Statistical Planning, Inferies estimators of regression: A class attaining rence, 4:81–90, 1980. the optimal convergence rate in L2 . Statistics, Probability Letters, 5:219–224, 1987. [14] W. Greblicki, A. Krzyz· ak, M. Pawlak. Distribution-free pointwise consistency of ker- [27] L. Rutkowski. On-line identi…cation of timenel regression estimate. Annals of Statistics, varying systems by nonparametric technique. 12(4):1570–1575, 1985. IEEE Transactions on Automatic Control, AC-27:228–230, 1982. [15] W. Greblicki, M. Pawlak. Fourier and Hermite series estimates of regression functions. [28] L. Rutkowski. Nonparametric identi…cation of quasi-stationary systems. Systems, Control Annals of the Institute of Statistical MathemaLetters, 6:33–35, 1985. tics, 37(3, Part A):443–454, 1985. [16] W. Greblicki, M. Pawlak. Identi…cation of di- [29] E. Schuster, S. Yakowitz. Contribution to the theory of nonparametric regression with apscrete Hammerstein systems using kernel replication to system identi…cation. Annals of gression estimates. IEEE Transactions on Statistics, 7:139–149, 1979. Automatic Control, AC-31(1):74–77, January 1986. [30] B.W. Silverman. Some aspects of the spline smoothing approach to non-parametric regres[17] W. Greblicki, M. Pawlak. Hammerstein sysion curve …tting. Annals of Statistics, 47:1– stem identi…cation by non-parametric regres52, 1984. sion estimation. International Journal of Control, 45(1):343–354, 1987. [31] C.J. Stone. Consistent nonparametric regression. Annals of Statistics, 47:595–645, 1977. [18] W. Greblicki, M. Pawlak. Necessary and suf…cient consistency conditions for a recursive [32] G.S. Watson. Smooth regression analysis. Sankernel regression estimate. Journal of Multikhyā, Ser. A, 26:359–372, 1964. variate Analysis, 23(1):67–76, 1987. [33] R.L. Wheeden, A. Zygmund. Measure, Inte[19] W. Greblicki, M. Pawlak. Nonparamegral. Dekker, New York, 1977. tric identi…cation of Hammerstein systems. IEEE Transactions on Information Theory, IT-35(2):409–418, March 1989. [20] W. Greblicki, M. Pawlak. Recursive identi…cation of Hammerstein systems. Journal of the Franklin Institute, 326(4):461–481, 1989. [21] W. Greblicki, D. Rutkowska, L. Rutkowski. An orthogonal series estimate of time-varying regression. Annals of the Institute of Statistical Mathematics, 35(2, Part A):215–228, 1983. 9