Pobierz artykuł PDF
Transkrypt
Pobierz artykuł PDF
PRZEGLD PODEJ STOSOWANYCH DO INTEGRACJI WIEDZY W PROCESIE BUDOWY MODELI ROZMYTYCH IZABELA REJER Uniwersytet Szczeciski Streszczenie Celem niniejszego artykułu jest dokonanie przegldu metod stosowanych do integracji wiedzy eksperckiej z wiedz wydobyt z danych pomiarowych w procesie budowy modelu rozmytego opisujcego działanie pewnego systemu rzeczywistego. W artykule zostan wskazane podstawowe powody koniecznoci wykonywania takiej integracji oraz zostan zaprezentowane metody słuce do przeprowadzenia tego zadania. W kocowej czci artykułu zostanie wskazana potrzeba opracowania nowych metod, takich, które w przeciwiestwie do metod istniejcych bd pozwalały na przezwycienie niedogodnoci wynikajcych z budowy modeli rozmytych opartych jedynie na danych pomiarowych bd na wiedzy eksperckiej. Słowa kluczowe: integracja wiedzy, model rozmyty, wiedza ekspercka, dane pomiarowe, modele typu szara-skrzynka. 1. Wprowadzenie Zarówno modele rozmyte budowane na podstawie zbioru danych pomiarowych jak i modele rozmyte budowane przy wykorzystaniu wiedzy eksperckiej maj specyficzne dla siebie wady i zalety. Model ekspercki jest modelem przyblionym, ale obowizujcym w całej dziedzinie analizowanej zalenoci, natomiast model zbudowany na podstawie zbioru danych pomiarowych jest modelem dokładnym, ale wiarygodnym tylko w pewnym, cile okrelonym fragmencie dziedziny. Wynika z tego, e aby zwikszy precyzj rozmytych modeli eksperckich naley do nich dołczy wiedz zawart w danych pomiarowych i analogicznie, eby poszerzy zakres stosowalnoci modeli rozmytych opracowanych na podstawie zbioru danych pomiarowych naley dołczy do nich wiedz eksperck. Celem niniejszego artykułu jest dokonanie przegldu metod stosowanych obecnie w procesie integracji wiedzy eksperckiej z wiedz wydobyt z danych pomiarowych. W zwizku z tym w kolejnych sekcjach artykułu zostan opisane kolejno: wady i zalety modeli budowanych przy wykorzystaniu tylko jednego ródła wiedzy (sekcja 2), metody stosowane obecnie w procesie integracji wiedzy pochodzcej z wspomnianych powyej ródeł (sekcja 3) oraz przyczyny powodujce, e metody te nie nadaj si do budowy modeli rozmytych jednoczenie wiarygodnych w całej dziedzinie analizowanej zalenoci oraz generujcych dokładne wyniki w regionie pokrytym przez dane pomiarowe (sekcja 4). 2. Modele eksperckie a modele oparte na danych pomiarowych Modele rozmyte budowane w całoci w oparciu o wiedz eksperta maj dwie podstawowe zalety zwikszajce zaufanie uytkowników do generowanych przez nie wyników: POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ Seria: Studia i Materiały, nr 14, 2008 59 modele te s kompletne i wiarygodne w całej przestrzeni opisywanych przez nie zalenoci, modele te dotycz tylko fizycznie moliwych obszarów dziedziny modelowanej zalenoci, co wynika z tego, e ekspert nie jest w stanie poda reguł dla stanów nie mogcych wystpi w rzeczywistoci. Z drugiej strony jednak, modele eksperckie maj równie dwie podstawowe wady, które powoduj, e w przypadku wystpienia odpowiednich moliwoci praktycznych twórcy modeli rozmytych sigaj po automatyczne metody generowania reguł na podstawie zbioru przykładów opisujcych analizowan zaleno. Pierwsz z nich jest konieczno wczeniejszego pozyskania wiedzy od ekspertów dziedzinowych, co jest procesem bardzo praco- i czasochłonnym. Czasochłonno i pracochłonno procesu akwizycji wiedzy eksperckiej wynika z tego, e u podstaw zachowania si złoonych systemów rzeczywistych moe istnie wiele setek czy tysicy reguł, które ekspert musi sformułowa na podstawie swojego dowiadczenia. W zwizku z tym, w przypadku najprostszych nawet systemów, proces akwizycji wiedzy moe trwa wiele dni czy tygodni. Pracochłonno procesu akwizycji wiedzy wynika równie z koniecznoci wielokrotnego korygowania reguł podawanych przez eksperta, zwłaszcza w przypadku systemów złoonych, charakteryzujcych si tym, e wiedza ekspercka je opisujca jest bardzo trudna do prawidłowej formalizacji. Naturalnie, dua pracochłonno procesu akwizycji wiedzy pociga za sob wysokie koszty tego procesu. Poza wysok praco- i czasochłonnoci procesu akwizycji wiedzy, modele eksperckie charakteryzuje równie ta niedogodno, e w przypadku zalenoci o wysokim stopniu nieliniowoci mog one generowa wyniki o niszej dokładnoci, anieli odpowiadajce im modele oparte na danych pomiarowych. Wskazana cecha modeli eksperckich jest skutkiem tego, e człowiek-ekspert ma ograniczone moliwoci rozrónienia rónych stanów opisujcych analizowane przez niego zmienne. Jak pokazuj eksperymenty przeprowadzone przez J. M. Mendela [8], człowiek jest w stanie poprawnie rozróni bardzo niewielk liczb stanów – ju w przypadku 5 słów opisujcych poszczególne stany badanej zmiennej, definicje numeryczne kolejnych słów mog w pewnym stopniu zachodzi na siebie. Oznacza to, e przy wikszej liczbie stanów słowa je definiujce staj si w pewnym stopniu nierozrónialne. Ekspert jest wic w stanie wzgldnie jednoznacznie okreli zakres przynaleny do danego słowa tylko w przypadku bardzo niewielkiej liczby słów. Naturalnie, ograniczona liczba rónych stanów rozrónianych przez eksperta nie ma wpływu na precyzj odwzorowania przy zalenociach o niskim stopniu nieliniowoci, ale w przypadku zalenoci charakteryzujcych si wysokim stopniem nieliniowoci czsto prowadzi do zmniejszenia precyzji modelu rozmytego. Zarówno pierwsz, jak i drug z wskazanych powyej niedogodnoci budowy modelu rozmytego na podstawie wiedzy eksperckiej mona w znacznym stopniu ograniczy uwzgldniajc w budowanym modelu nie tylko wiedz eksperck, lecz równie wiedz pozyskan ze zbioru przykładów opisujcych analizowan zaleno. Teoretycznie wydawa by si mogło, e z uwagi na wymienione wady modelu eksperckiego, budowa modelu eksperckiego w przypadku posiadania zbioru danych pomiarowych opisujcych analizowan zaleno jest w ogóle pozbawiona sensu. Model rozmyty zbudowany na podstawie zbioru danych pomiarowych jest bowiem bardziej dokładny od modelu eksperckiego i wymaga znacznie mniejszego nakładu pracy – zwizanego jedynie z koniecznoci zgromadzenia zestawu danych pomiarowych oraz zastosowania odpowiedniej procedury optymalizacyjnej. W praktyce jednak okazuje si, e czsto jako zbioru danych pomiarowych nie jest wystarczajca do automatycznego opracowania modelu rozmytego generujcego wiarygodne wyniki w całej fizycznie moliwej dziedzinie analizowanej relacji. Najczciej okazuje − − 60 Izabela Rejer Integracja baz reguł w modelu rozmytym si, e opracowany model jest co prawda modelem o wysokim stopniu dokładnoci, ale generuje wyniki zgodne z rzeczywistoci jedynie w bardzo niewielkim fragmencie dziedziny analizowanej zalenoci. Przyczyny wystpowania takiej sytuacji zostały wyjanione poniej. Podstawowym faktem podkrelanym w literaturze naukowej podnoszcej problemy wystpujce w procesie modelowania jest to, e modele wygenerowane automatycznie na podstawie zbioru danych pomiarowych mog by stosowane w praktyce jedynie w zakresie ograniczonym przez dane wchodzce w skład tego zbioru [9]. Twierdzenie to nie dotyczy jedynie tych modeli, co do których istnieje pewno, e ich posta funkcyjna jest stała w całej dziedzinie i których parametry zostały wyznaczone przy wykorzystaniu metod optymalizacji globalnej. Z czego wynika ten ograniczony zakres stosowalnoci modeli zbudowanych na podstawie danych pomiarowych? Przede wszystkim z tego, e prawo rzdzce badan zalenoci jest znane tylko w tym obszarze, który jest pokryty próbkami pomiarowymi. Zgodnie z tym, powierzchnia modelu moe by optymalizowana tylko w tym zakresie. Zadaniem postawionym w procesie modelowania jest wic znalezienie takich parametrów modelu, które pozwol na uzyskanie jak najdokładniejszego dopasowania powierzchni modelu do danych pomiarowych. Z uwagi na to, e w przypadku budowy modeli silnie nieliniowych nie istnieje analityczna procedura optymalizacyjna, dobór wartoci parametrów jest prowadzony przy wykorzystaniu procedur iteracyjnych [5]. W trakcie działania tych procedur parametry modelu s stopniowo korygowane, co powoduje, e powierzchnia modelu dopasowuje si coraz dokładniej do danych pomiarowych. Oczywicie, optymalizowane s tylko te fragmenty powierzchni modelu, w obrbie których znajduj si dane pomiarowe analizowanej zalenoci. Fragmenty powierzchni modelu pozbawione próbek pomiarowych nie s optymalizowane, poniewa w odniesieniu do nich nie mona zastosowa adnego kryterium optymalizacyjnego. Z powyszego wynika, e aby opracowa model analizowanej zalenoci wany w całej jej fizycznie moliwej dziedzinie, konieczne jest dysponowanie danymi pomiarowymi pokrywajcymi cał t dziedzin. Spełnienie tego warunku jest jednak niesłychanie trudne z uwagi na to, e: − niezbdne jest zgromadzenie olbrzymiej liczby danych pomiarowych, − zgromadzone dane musz w odpowiedni sposób pokrywa dziedzin analizowanej zalenoci. Zgromadzenie wystarczajcej liczby danych jest bardzo trudne, zwłaszcza w przypadku zalenoci wielowymiarowych, z uwagi na to, e liczba danych pomiarowych koniecznych do utrzymania stałej gstoci pokrycia próbkami pomiarowymi pełnej dziedziny problemu ronie wykładniczo wraz ze wzrostem liczby zmiennych wejciowych [6]. Oznacza to, e dodanie do modelu kadej kolejnej zmiennej objaniajcej powoduje logarytmiczny spadek gstoci pokrycia dziedziny zjawiska danymi pomiarowymi. Wskazane zjawisko powoduje, e nawet kiedy analizowana zaleno jest umiejscowiona w przestrzeni tylko kilku zmiennych objaniajcych, to liczba próbek pomiarowych niezbdnych do opracowania jej modelu wiarygodnego w całej fizycznie moliwej dziedzinie moe wynosi kilkadziesit tysicy (zakładajc równomierny rozkład próbek w całej dziedzinie). Zgromadzenie tak duej liczby danych jest bardzo trudne, czasami nawet niemoliwe z uwagi na to, e w kracowych przypadkach wymagana liczba danych moe po prostu nie istnie (biorc na przykład pod uwag zalenoci makroekonomiczne analizowane w przekroju miesicznym, zgromadzenie nawet 100 próbek danych dotyczcych analizowanego szeregu czasowego moe nie by moliwe, choby z uwagi na wymaganie zachowania stacjonarnoci szeregu). Chocia postulat zgromadzenia odpowiedniej liczby danych pomiarowych wydaje si by trudny do spełnienia, to znacznie trudniejsze jest spełnienie warunku pokrycia danymi pomiarowymi POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ Seria: Studia i Materiały, nr 14, 2008 61 pełnej dziedziny analizowanej zalenoci. Jest to wynikiem tego, e w przypadku zalenoci rzeczywistych praktycznie nie spotyka si sytuacji, e kady moliwy stan wektora zmiennych objaniajcych bdzie wystpował z tak sam czstotliwoci. Najczciej jest tak, e pewne zestawy podobnych stanów wystpuj bardzo czsto, inne natomiast - bardzo rzadko. Efektem tego jest wystpowanie w dziedzinie modelowanej zalenoci pustych stref – to jest stref pozbawionych próbek pomiarowych. Std te, bez wzgldu na liczb zgromadzonych danych, nigdy nie ma pewnoci, e model zbudowany na ich podstawie bdzie działał prawidłowo w całej fizycznie moliwej dziedzinie. 3. Integracja wiedzy eksperckiej z danymi pomiarowymi Najczciej spotykanym w literaturze podejciem do integracji wiedzy zawartej w danych pomiarowych z wiedz eksperck jest uwzgldnianie w modelu pewnych zewntrznych faktów ustalonych na podstawie wiedzy zdroworozsdkowej, wynikajcych z ogólnie znanych praw matematycznych, ekonomicznych, społecznych itp. albo wynikajcych z charakterystyki analizowanej zalenoci. Fakty te przyjmuj z reguły posta ogranicze eksperckich nakładanych na zmienne, bd parametry modelu [7]. W przypadku klasycznych modeli matematycznych budowanych dla dobrze poznanych procesów lub systemów, fakty te mog by równie wprowadzane do modelu na etapie wyboru jego postaci analitycznej. W ten sposób zostaje zidentyfikowana pewna ogólna struktura modelu, której parametry s nastpnie strojone na postawie danych pomiarowych. W przypadku modelowania zalenoci o charakterze liniowym (oraz pewnych nielicznych zalenoci o charakterze nieliniowym, spełniajcych okrelone wymagania), strojenie parametrów modelu odbywa si poprzez zastosowanie dobrze znanych metod optymalizacyjnych, natomiast w przypadku modelowania zalenoci o charakterze nieliniowym (zwłaszcza silnie nieliniowym), strojenie parametrów musi najczciej zosta przeprowadzone przy wykorzystaniu podejcia znanego pod nazw modelowania czarnej-skrzynki. Budowa modeli typu czarna-skrzynka (ang. black-box) jest jednym z dwóch podstawowych podej do procesu modelowania wyrónianych w literaturze przedmiotu. Modele typu czarnaskrzynka, to modele budowane w całoci na podstawie danych pomiarowych, bez uycia wgldu fizycznego czy werbalnego w modelowany problem. Charakterystyczne dla tego rodzaju modeli jest to, e ich struktura wybierana jest z rodziny modeli bdcych uniwersalnymi aproksymatorami funkcji, a ich parametry nie maj fizycznej czy werbalnej interpretacji – s one tak strojone, eby dopasowa model do danych pomiarowych najlepiej jak to moliwe [7]. Podejciem umiejscowionym niejako na drugim biegunie procesu modelowania jest podejcie postulujce budow modeli typu biała-skrzynka (ang. white-box) [3]. Modele typu biała-skrzynka, nazywane inaczej modelami mechanistycznymi (ang. mechanistic models), to modele budowane w całoci na postawie praw fizycznych. Przykładem tego rodzaju modeli s modele opracowywane na podstawie funkcji matematycznych opisujcych prawa fizyczne, zgodnie z którymi działa analizowany system, na które nakładane s dodatkowo znane z góry ograniczenia. Do grupy modeli typu biała-skrzynka zaliczane s równie modele identyfikowane w całoci na podstawie wiedzy eksperckiej, czyli modele odzwierciedlajce prawa rzdzce analizowan zalenoci zdefiniowane przez eksperta dziedzinowego. Do łczenia, w modelu opisujcym zalenoci o silnie nieliniowym charakterze, wiedzy wynikajcej z praw fizycznych z wiedz zawart w danych pomiarowych wykorzystywane s dwa podejcia: podejcie, którego wynikiem jest model typu szara-skrzynka (ang. grey-box) oraz podej- 62 Izabela Rejer Integracja baz reguł w modelu rozmytym cie, którego wynikiem jest model semi-mechanistyczny (ang. semi-mechanistic model). Modele budowane przy pomocy obu podej stanowi niejako łcznik midzy modelami typu czarnaskrzynka oraz modelami typu biała-skrzynka. Tradycyjne podejcie do modelowania na zasadzie szarej-skrzynki zakłada, e struktura modelu jest zadana z góry jako sparametryzowana funkcja matematyczna, która (przynajmniej czciowo) jest oparta na wiedzy fizycznej [3, 7]. Posta analityczna modelu jest wic, przynajmniej w czci, traktowana jako składnik wiedzy zadanej apriori. Poza ni wiedza fizyczna jest reprezentowana poprzez ograniczenia nakładane na zmienne i parametry modelu. Tym co jest nieznane i co musi zosta ustalone przy wykorzystaniu zasad modelowania typu czarna-skrzynka s optymalne bd suboptymalne wartoci parametrów modelu. Czasami pojcie modelu typu szara-skrzynka jest odnoszone równie do modeli w całoci opartych na wiedzy eksperckiej, a nastpnie korygowanych przy pomocy zbioru danych pomiarowych. Teoretycznie moliwe jest tutaj równie podejcie odwrotne, tzn. budowa modelu w całoci opartego na danych pomiarowych, a nastpnie skorygowanie go wiedz eksperck. W praktyce jednak podejcie takie rzadko kiedy jest stosowane, w zwizku z czym w literaturze brak jest przykładów tego rodzaju modeli. Podczas kiedy modele typu szara-skrzynka s modelami o w miar jednolitej strukturze, to modele semi-mechanistyczne najczciej charakteryzuj si struktur blokow [1, 3]. Model semimechanistyczny jest to model, którego ogólna struktura zostaje zdefiniowana w kategoriach struktury białej-skrzynki, czyli przy wykorzystaniu wiedzy fizycznej o modelowanej zalenoci. Do modelu tego dołczony jest szereg modeli typu czarna-skrzynka, których zadaniem jest modelowanie tych fragmentów modelu podstawowego, które nie mog zosta ustalone apriori. Najczciej kolejne modele typu czarna-skrzynka wykorzystywane s do estymacji kolejnych, niemoliwych do ustalenia na podstawie wiedzy fizycznej, parametrów modelu. Modele semi-mechanistyczne nazywane s czsto w literaturze modelami hybrydowymi. Zupełnie innym podejciem do integracji wiedzy eksperckiej z wiedz wydobyt z danych pomiarowych jest podejcie polegajce na bezporedniej integracji reguł wygenerowanych automatycznie na podstawie zbioru danych pomiarowych z regułami pobranymi od eksperta dziedzinowego. Charakterystyczn cech modeli budowanych poprzez zastosowanie metod bazujcych na tym podejciu jest to, e ich podstaw jest zestaw baz wiedzy, z których cz stanowi bazy zawierajce reguły opracowane na podstawie danych pomiarowych, a cz – bazy zawierajce reguły eksperckie. W literaturze proponowane s dwa podstawowe podejcia do budowy modelu integrujcego reguły pochodzce z tych baz. Podejcie pierwsze postuluje współistnienie w modelu wszystkich baz wiedzy przez cały okres jego stosowania. Wybór bazy odpowiedniej dla zadanej sytuacji decyzyjnej odbywa si poprzez zastosowanie reguł nadrzdnych, tak zwanych meta-reguł, uzaleniajcych wybór bazy od wartoci pewnych zmiennych opisujcych analizowane zjawisko lub wartoci funkcji celu decydenta. [10]. Podejcie drugie natomiast polega na stworzeniu jednej bazy reguł, łczcej w sobie reguły pochodzce z rónych baz. Bardzo czsto w podejciu tym do stworzenia modelu zawierajcego optymaln baz reguł wykorzystywane s algorytmy genetyczne, w których osobnikami s poszczególne zbiory reguł, a funkcja przystosowania jest zdefiniowana tak, eby oceni jako kadego zbioru reguł w populacji [13]. W trakcie wykonywania operacji genetycznych reguły s wymieniane pomidzy zbiorami, tworzc w ten sposób coraz to nowe bazy reguł. Algorytm koczy prac w momencie uzyskania bazy reguł spełniajcej zadane przez uytkownika kryterium modelowania. POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ Seria: Studia i Materiały, nr 14, 2008 63 Kolejn, całkowicie odmienn technik modelowania, wykorzystujc w procesie modelowania zarówno wiedz eksperck, jak i wiedz pozyskan z danych pomiarowych s sieci Bayes’a (ang. Bayesian Belief Network – BBN) [12]. Sie Bayes’a jest graficzn technik probabilistyczn stosowan do modelowania sieci przyczynowych. Jej zadaniem jest przewidywanie prawdopodobiestw wystpienia wielokrotnych zdarze dyskretnych, stanowicych wzły modelu, połczonych przy pomocy skierowanego acyklicznego grafu, którego łuki odzwierciedlaj zbiór relacji przyczynowych wystpujcych midzy zdarzeniami poprzednimi i nastpnymi, definiowanych poprzez prawdopodobiestwa warunkowe istniejce pomidzy zdarzeniami [12]. Dla kadego wzła okrelony jest rozkład prawdopodobiestwa warunkowego. W przypadku wartoci dyskretnych, funkcja prawdopodobiestwa warunkowego zapisywana jest w tabeli przedstawiajcej prawdopodobiestwa przyjcia poszczególnych wartoci przez wzeł nastpny, w zalenoci od kolejnych z moliwych wartoci wzła poprzedniego. Prawdopodobiestwa wzłów nie majcych adnych wzłów poprzednich ustalane s apriori (na podstawie wiedzy eksperckiej), a prawdopodobiestwa wzłów pozostałych ustalane s na podstawie danych pomiarowych. Dokonujc przegldu metod słucych do integracji wiedzy w modelu rozmytym, naley wspomnie równie w skrócie o metodach wykorzystywanych do integracji wiedzy pochodzcej od rónych ekspertów. Metody te bazuj najczciej na pewnym „urednieniu” wiedzy pobranej od kilku ekspertów, traktowanej zarówno w kategoriach parametrów funkcji przynalenoci zmiennych budowanego modelu, jak i w kategoriach typowych reguł eksperckich definiujcych prawa rzdzce analizowanym zjawiskiem. Jeeli chodzi o łczenie wiedzy o parametrach funkcji przynalenoci, to np. A. Cornelissen., J. van den Berg, W. Koops, i U. Kaymak proponuj cztery podejcia do wykonania tego zadania, dostosowane do czterech metod pozyskiwania wiedzy od pojedynczych ekspertów [4]. Generalnie, łczenie wiedzy polega tutaj na wyznaczeniu, w oparciu o redni arytmetyczn, wypadkowych wartoci pewnych szczególnych punktów znajdujcych si na powierzchni funkcji przynalenoci. Z kolei, jeeli chodzi o integracj reguł pobranych od kilku ekspertów, to np. J. Booker i L. McNamara proponuj podejcie, które moe zosta wykorzystane do ustalenia wspólnych dla kilku ekspertów czci przesłankowych reguł, polegajce na iteracyjnym rozszerzaniu i zawaniu obszarów obowizywania kolejnych reguł poprzez dzielenie si przez poszczególnych ekspertów ogóln wiedz o problemie [2]. Agregacja konkluzji reguł pochodzcych od rónych ekspertów moe zosta natomiast przeprowadzona przy wykorzystaniu waonych rednich arytmetycznych [12]. 4. Uwagi kocowe Analizujc przegld podej stosowanych w procesie integracji wiedzy wydobytej z danych pomiarowych i wiedzy eksperckiej, przedstawiony w poprzednim punkcie mona by wycign wniosek, e proces integracji wiedzy jest procesem dobrze poznanym i jego dalsza analiza nie przyniesie korzyci poznawczych. Takie rozumowanie nie byłoby jednak zasadne, poniewa w rzeczywistoci adne z wymienionych podej nie pozwala na zbudowanie modelu łczcego w sobie zalety podstawowe zalety modelu eksperckiego i modelu wygenerowanego automatycznie na podstawie danych pomiarowych, to jest generowanie wiarygodnych wyników w pełnej fizycznie moliwej dziedzinie (model ekspercki) oraz generowanie dokładnych wyników w regionie dziedziny pokrytym przez dane pomiarowe (model oparty na danych pomiarowych). Na przykład modele typu szara-skrzynka oraz modele semi-mechanistyczne s budowane wtedy, kiedy konieczne jest połczenie wiedzy eksperckiej oraz wiedzy zadanej w postaci praw fi- 64 Izabela Rejer Integracja baz reguł w modelu rozmytym zycznych dotyczcej jednego aspektu procesu modelowania (najczciej ustalenia postaci funkcyjnej modelu) z wiedz zawart w danych pomiarowych dotyczc innego aspektu procesu modelowania (najczciej ustalenia wartoci parametrów modelu). Std, celem obu podej jest umoliwienie budowy modelu, który bez wiedzy jednego lub drugiego rodzaju: mógłby w ogóle nie by moliwy do stworzenia, albo generowałby wyniki o bardzo niskiej precyzji (w przypadku zastosowania tylko wiedzy fizycznej), albo charakteryzowałby si niewielkim obszarem stosowalnoci (w przypadku zastosowania tylko wiedzy zawartej w danych pomiarowych). Odnoszc si z kolei do metod postulujcych integracj wiedzy poprzez budow całociowego modelu opartego na jednym rodzaju wiedzy i skorygowanie go wiedz drugiego rodzaju, to naley zauway, e metody te s co prawda stosunkowo proste do przeprowadzenia, ale ich podstawow wad, znacznie zmniejszajc ich przydatno praktyczn, jest problem przetrwania wiedzy stanowicej podstaw procesu modelowania, powodujcy: zmniejszenie wiarygodnoci wyników generowanych przez te modele (w przypadku korekty modelu eksperckiego próbkami pomiarowymi) lub zmniejszenie dokładnoci wyników generowanych przez te modele (w przypadku korekty modelu opracowanego na podstawie danych pomiarowych wiedz eksperck). Równie metody polegajce na stworzeniu jednej bazy wiedzy poprzez wybór reguł z wielu baz wiedzy nie pozwalaj na zbudowanie modelu łczcego w sobie zalety obu omawianych typów modeli, poniewa nie poruszaj problematyki ustalenia właciwych obszarów oddziaływania kolejnych reguł. Właciwych, to znaczy takich, które pokrywaj cał fizycznie moliw przestrze analizowanego zjawiska. Z powyszego wynika, e pomimo i w literaturze dotyczcej integracji wiedzy pochodzcej z rónych ródeł mona znale kilka podej do przeprowadzenia procesu integracji, to jednak adne z nich nie pozwala w sposób bezporedni na opracowanie modelu integrujcego wiedz eksperck z wiedz wydobyt ze zbioru danych pomiarowych w taki sposób, aby opracowany model jednoczenie był wiarygodny w całej dziedzinie analizowanej zalenoci oraz generował dokładne wyniki w regionie pokrytym przez dane pomiarowe. Std, pojawia si tutaj wyrana potrzeba opracowania nowych metod integracji wiedzy, metod które bd pozwalały na połczenie w jednym modelu rozmytym reguł eksperckich i reguł wygenerowanych na podstawie zbioru danych pomiarowych w taki sposób, eby w czci dziedziny pokrytej danymi pomiarowymi obowizywały reguł wygenerowane na podstawie tych danych, natomiast w czci pozostałej – reguły eksperckie. Jedna z metod pozwalajcych na wykonanie postawionego zadania została zaprezentowana przez autork niniejszego artykułu w [11]. POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ Seria: Studia i Materiały, nr 14, 2008 65 Bibliografia 1. Abonyi J., Babuka R, Verbrudden H. B., Szeifert F.: Incorporating Prior Knowledge in Fuzzy Model Identification. W: International Journal of Systems Science, vol. 31, no. 5, p. 657-667, 2000. 2. Booker J. M., McNamara L. A.: Solving black box computetion problems using expert knowledge theory and methods. W: Reliability Engineering & System Safety, 85, 2004. 3. Braake H. A. B., Roubos J.A., Babuska R.: Semi-mechanistic modeling and its application to biochemical processes. W: Fuzzy Logic Control: Advances in Applications, pages 205--226, London, UK, 1999. 4. Cornelissen A. M. G., van den Berg J., Koops W. J., Kaymak U.: Elicitation of expert knowledge for fuzzy evaluation of agricultural production systems. W: Agriculture Ecosystems & Environment 95, 2003. 5. Gutenbaum J.: Modelowanie matematyczne systemów. Exit, Warszawa, 2003. 6. Klsk P.: Metoda nadawania podanych własnoci ekstrapolacyjnych neuronowym i rozmytym modelom systemów wielowymiarowych. Rozprawa doktorska, Politechnika Szczeciska, Wydział Informatyki, Szczecin, 2005. 7. Lindskog P.: Fuzzy Identification from a Grey Box Modeling Point of View. W: Fuzzy Model Identification, red. H. Hellendoorn, D. Driankov, pages 3-50. SpringerVerlag, 1997. 8. Mendel J. M.: An architecture for making judgements using computing with words. W: International Journal of Applied Mathematics and Computer Science, vol. 12, no. 3, p. 325-335, 2002. 9. Niederliski A.: Polynomial and neural input-output models for control – a comparison. W: Proceedings on Fourth International Symposium on Methods and Models in Automation and Robotics, Midzyzdroje, August 1997. 10. Pham T. T., Chen G.: Some applications of fuzzy logic in rule-based expert systems. W: Expert Systems, September 2002, vol. 19, no. 4. 11. Rejer I.: Integration of fuzzy rule bases. W: Polish Journal of Environmental Studies, Vol. 16, No. 5B, HARD, Olsztyn, 2007 Olsztyn, 2007. 12. Stiber N. A., Small M. J., Pantazidou M.: Site-Specific Updating and Aggregation of Bayesian Belief Network Models for Multiple Experts. W: Risk Analysis, Vol. 24, No. 6, 2004. 13. Wang Ch., Hong T., Tseng S.: Integrating membership functions and fuzzy rule sets from multiple knowledge sources. W: Fuzzy Sets and Systems No. 112, 2000. 66 Izabela Rejer Integracja baz reguł w modelu rozmytym METHODS USED FOR KNOWLEDGE INTEGRATION IN A FUZZY MODEL Summary The aim of this article is to present methods which are used in the process of integrating expert knowledge and knowledge acquired from a data set describing a behavior of an analyzed system. The article gives main reasons of such integration, by pointing drawbacks of fuzzy models based only on an expert knowledge or on a set of data points, and shows why standard methods are not able to overcome all of these drawbacks. Keywords: knowledge integration, fuzzy model, expert knowledge, meta-rules, gray-box models. Izabela Rejer [email protected] Uniwersytet Szczeciski, ul. Mickiewicza 64, Szczecin