Podstawowe systemy wnioskowania sztucznej inteligencji
Transkrypt
Podstawowe systemy wnioskowania sztucznej inteligencji
POLITECHNIKA RZESZOWSKA im. Ignacego Łukasiewicza Wydział Budowy Maszyn i Lotnictwa Katedra Awioniki i Sterowania Podstawowe systemy wnioskowania sztucznej inteligencji Urszula SOWA Seminarium Dyplomowe 2001/2002 LOTNICTWO - PILOTAŻ 1. Wstęp W procesie podejmowania decyzji zależy nam na tym, aby podjęta decyzja była optymalna. Wyznaczenie optymalnej decyzji polega na wyborze, ze zbioru dopuszczalnych rozwiązań za pomocą określonego algorytmu, takiej decyzji która przyjmuje wartość ekstremalną. Procesy decyzyjne prowadzone są w dwóch różnych sytuacjach. Pierwsza jest wtedy, gdy znany jest model badanego obiektu decyzyjnego. Druga zaś dotyczy sytuacji, gdy rozważania prowadzone są w oparciu o wiedzę o obiekcie i sposobu jego sterowania w postaci zadań określających własności obiektu. Jeśli taki zestaw zadań jest precyzyjny i spełnia określone reguły może posłużyć on do zbudowania programu komputerowego imitującego działanie eksperta. komputer Algorytm decyzyjny Informacje Symptomy Obserwacje decyzje Obiekt decyzyjny decydent Rys1. System podejmowania decyzji Decydent to najczęściej człowiek, bądź też komputer w systemach automatycznego sterowania. W procesie podejmowania decyzji jest on często wspomagany przez komputer, który to podpowiada decydentowi możliwe warianty rozwiązań, tak aby mógł on podjąć ostateczną decyzję. Taki system nazywamy systemem wspomagania decyzji. Są to systemy informacyjne, które mogą wspomagać nie tylko sterowanie ale i zarządzanie, projektowanie, diagnostykę medyczną i techniczną czy też prace badawcze. Systemy zajmujące się wspomaganiem człowieka lub komputera w podejmowaniu decyzji nazwano U. Sowa Podstawowe systemy wnioskowania sztucznej inteligencji US - 1 ogólnie Sztuczną Inteligencją. Wg Felgerbauna „sztuczna inteligencja” jest dziedziną informatyki dotyczącą metod i technik wnioskowania symbolicznego przez komputer oraz symbolicznej reprezentacji wiedzy stosowanej podczas takiego wnioskowania. 2. Systemy eksperckie Są to programy komputerowe przeznaczone do rozwiązywania specjalistycznych problemów wymagających profesjonalnej ekspertyzy. Aby jednak dany program mógł być nazwany eksperckim musi on spełniać dwa podstawowe założenia : 1. Założenie o specjalnej budowie systemu eksperckiego 2. Założenie o przeznaczeniu – profesjonalna ekspertyza Interfejs uzytkownika Maszyna wnioskuj¹ca Baza wiedzy X Baza wiedzy Y Rys.2 Ogólna struktura SE Gdzie „baza wiedzy” jest zbiorem definicji, faktów pojęć i relacji miedzy nimi oraz reguł wnioskowania. Baza wiedzy może zawierać : 1. bazę tekstów, 2. bazę danych, 3. bazę faktów 4. bazę reguł, 5. bazę modeli, 6. bazę wiedzy zdroworozsądkowej. Maszyna wnioskująca jest to oprogramowanie, który służy do manipulowania bazą wiedzy w celu analizy i rozwiązania zadanych systemowi problemów. Wykorzystuje fakty i reguły wnioskowania z bazy wiedzy, aby dojść do nowych konkluzji.. Interfejs użytkownika natomiast służy do komunikacji użytkownika z systemem. Podstawową zaletą systemu jest to, że pracuje szybko i jest konsekwentny przy wyciąganiu wniosków. Poza tym są bardziej niezawodne niż ludzie, są przydatne do celów szkoleniowych . Wadą natomiast jest ich nieelastyczność. Systemy eksperckie oferują zwykle kilka dopuszczalnych rozwiązań, które uszeregowane zgodnie z pewnymi kryteriami i pozwalają na rozwiązywanie problemów na tyle złożonych że ich rozwiązanie przekracza bądź też przysparza ludziom problemów. U. Sowa Podstawowe systemy wnioskowania sztucznej inteligencji US - 2 Głównymi właściwościami systemu jest złożoność, autoanaliza oraz zdolność do rozbudowy bazy wiedzy, przy czym wprowadzany jest tzw. kontroler w celu zapobiegnięcia wprowadzenie reguł sprzecznych z już istniejącymi. Złożoność czyli liczebność reguł . Jeśli system ma 300 reguł to jest to system mały, od 300 do 2000 to system średni, natomiast ponad 2000 to system duży, z tym że nie stosuje się baz o większej liczbie reguł niż 10000. Przez autoanalizę rozumiane jest udzielenie użytkownikowi uzasadnienia wykreowanego rozwiązania 2.1 Proces tworzenia systemu eksperckiego Aby przystąpić do tworzenia systemy trzeba najpierw uzyskać odpowiedzi na kilka pytań 1. czy budowa SE jest zasadna ? 2. i czy jest w ogóle możliwa ? odpowiedź TAK zachodzi gdy problem nie jest zbyt trudny ale i nie trywialny ,oraz że rozwiązanie w postaci symbolicznej a nie w postaci algorytmicznej nas satysfakcjonuje. Jeśli odpowiedz na zadane pytania jest pozytywna czyli można przystąpić do następnego etapu twórczego jakim jest zdefiniowanie zadań systemu. Następnie przechodzimy do budowy baz wiedzy tzn. pozyskiwania wiedzy od ekspertów w danej dziedzinie. Na tym etapie dokonujemy również wyboru metody rozporządzania wiedzą oraz narzędzi do budowy systemu. Organizacja i kodowanie wiedzy, nie kończy jednak procesu budowy , ponieważ musi jeszcze nastąpić testowanie i weryfikacja systemu. Narzędzia jakie są wykorzystywane przy budowie SE można podzielić na cztery grupy: 1. systemy szkieletowe – są to systemy z pustą bazą danych, 2. języki SE, 3. języki programowania symbolicznego, 4. języki algorytmiczne. a. Podział systemów eksperckich Ze względu na przeznaczenie dzielimy na: 1. systemy doradcze- (advisery) – prezentują one rozwiązania dla użytkownika, które użytkownik może odrzucić i zażądać innego rozwiązania, 2. podejmujące decyzje bez kontroli człowieka (dictorial) stosowane są do sterowania obiektami gdzie udział człowieka jest utrudniony lub niemożliwy, 3. systemy krytykujące – (critical) dokonują analizy problemu i przedstawiają rozwiązania, a następnie komentują przyjęte rozwiązanie. Ze względu na to co uzyskujemy na wyjście SE dzielimy na systemy: 1. diagnozy – ocena stanu istniejącego na podstawie posiadanych danych, 2. prognozy – przewidywanie stanu przyszłego na podstawie istniejących danych, 3. planu - opis stanu, do których należy dążyć i w jaki sposób tego dokonać. Ze względu na metodę procesu wnioskowania wyróżniamy SE: 1. z logiką dwuwartościową , 2. z logiką wielowartościową , 3. z logiką rozmytą . Ze względu na metodę reprezentacji wiedzy wyróżniamy SE działające w oparciu o : 1. reguły, 2. wektory wiedzy, 3. sieci semantyczne, 4. ramy, 5. sztuczne sieci neuronowe, 6. algorytmy genetyczne. 3. Mechanizmy wnioskowania U. Sowa Podstawowe systemy wnioskowania sztucznej inteligencji US - 3 3.1 Wnioskowanie Wyróżnić tu można wnioskowanie progresywne czyli wnioskowanie na przód, oraz wnioskowanie regresywne czyli wnioskowanie wstecz. Pierwsze metoda polega na generowaniu nowych faktów, na podstawie dostępnych reguł i faktów, tak długo aż wśród wygenerowanych faktów znajdzie się podstawowy cel lub nie można zastosować więcej reguł. Powoduje to zwiększenie bazy faktów co jest zjawiskiem korzystnym w bazie wiedzy o małej liczbie faktów. Wnioskowanie wstecz polega natomiast na wykazaniu prawdziwości hipotezy głównej na podstawie prawdziwości przesłanek. Charakteryzuje się mniejsza liczbą generowanych nowych faktów , oraz zazwyczaj krótszym czasem wnioskowania niż przy wnioskowaniu w przód. Wadą jest brak możliwości równoczesnego dowodzenia kilku hipotez. Wyróżnia się jeszcze jeden typ wnioskowania, a mianowicie wnioskowanie mieszane. Polega ono na przełączaniu pomiędzy wnioskowaniem „w przód” i „wstecz” na podstawie wskazań dotyczących priorytetów wyboru rodzaju wnioskowania . a. Uczenie indukcyjne Metoda ta polega na stworzeniu tzw. drzewa decyzyjnego . Drzewo decyzyjne jest to graf, którego korzeń utworzony jest przez wybrany atrybut, a poszczególne gałęzie reprezentują wartości tego atrybutu. Na następnych poziomach znajdują się kolejne atrybuty, zaś na najniższym poziomie węzły charakteryzują poszczególne klasy. Zagadnienie optymalnego drzewa decyzyjnego rozwiązuje się za pomocą entropii pewnego elementowego zbioru. Entropia jest to pewna miara informacji zawartej w zjawisku, która w przypadkowy sposób może przyjmować n-stanów. Drzewo decyzyjne może być traktowane jako źródło informacji generujące informacje o przynależności do klasy danego obiektu. b. Maszyna wnioskująca działająca na zbiorach rozmytych. Maszyna wnioskująca w takich systemach działa na podstawie tzw. wnioskowania rozmytego, które można przeprowadzić dzięki odpowiedniej reprezentacji wiedzy opisującej dany problem za pomocą zbiorów rozmytych. System wnioskowania rozmytego składa się z trzech zasadniczych bloków: 2. blok fuzyfikacji - rozmywanie, 3. blok inferencji – wnioskowania, 4. blok dyfuzyfikacji –wyostrzania y* X* zmienne ilosciowe Blok fuzyfikacji zb.A' rozmyte Blok inferencj zb.B' rozmyte Blok defuzyfikacji Baza regul rozmytych obszar zmiennych lingwistycznych jakosciowych relacje rozmyte Rys. 3 Schemat wnioskowania rozmytego W bloku fuzyfikacji następuje obliczanie stopnia przynależności wartości nierozmytych poszczegól- U. Sowa Podstawowe systemy wnioskowania sztucznej inteligencji US - 4 nych wejść do zbioru rozmytego opisanego odpowiednimi funkcjami przynależności związanych z tymi wejściami. Następuje przetwarzanie zmiennych ilościowych na pojęcia lingwistyczne wyrażone w postaci zbiorów rozmytych. W bloku inferencji następuje łączenie przesłanek z odpowiednimi faktami i wybranie rozwiązania optymalnego . W bloku dyfyzyfikacji następuje wyliczenie na podstawie funkcji przynależności wyjścia nie rozmytej wartości ostrej (wartość liczbowa). a. Wnioskowanie za pomocą miar rozmytych. Miara rozmyta przypisuje do każdego zbioru ostrego określonego na uniwersum stopień dowodu lub wiary, że dany element uniwersum należy do tego zbioru. Miara rozmyta zdefiniowana jest przez funkcję g: P(X) → [0,1] Gdzie: X – uniwersum, P(X) – zbiór wszystkich podzbiorów uniwersum, Miara rozmyta składa się z dwóch miar : 1. Przekonania 2. Domniemania Są one opisywane za pomocą funkcji m : P(X) → [0,1] i m(∅) = 0 i Σ m(A) =1 Gdzie: M(A) – stopień dowodu lub wiary, że dany element uniwersum X należy do zb.A i tylko do niego W przypadku gdy wszystkie elementy ogniskowe są zbiorami jednoelementowymi miara przekonania i miara domniemania łączą się tworząc miarę prawdopodobieństwa opisaną funkcją rozkładu prawdopodobieństwa. W przypadku gdy elementy ogniskowe są zagnieżdżone otrzymujemy specjalne podklasy dla miary przekonania miarę konieczności, dla miary domniemania miarę możliwości. Są one zdefiniowane odpowiednio przez funkcję rozkładu konieczności i funkcję rozkładu możliwości. Miary rozmyte Miara domniemania Miara możliwości Miara przekonania Miara prawdopodobieństwa Miara konieczności Rys.4 Schemat miary rozmytej. 3.5 Sztuczne sieci neuronowe Sztuczne sieci neuronowe można traktować jako nowoczesne systemy obliczeniowe, które przetwarzają informacje, wzorując się na zjawiskach zachodzących w mózgu człowieka. Podstawową zaletą SSN jest przetwarzanie równoległe informacji z całkowitą odpornością na błędy wynikające z równoległości. Wykorzystuje się do tego rozległe pokłady powiązań neuronowych. Dodatkową zaletą jest zdolność do uczenia się sieci i uogólnienia nabytej wiedzy. Ponieważ, budowa sztucznego neuronu jest wzorowana na biologicznym neuronie zapamiętywanie i uczenie się polega na U. Sowa Podstawowe systemy wnioskowania sztucznej inteligencji US - 5 zmianie struktury i siły połączeń synaptycznych między neuronami. Synapsy często używane ulegają wzmocnieniu. X1 w1 X2 . . . . Xn w2 f(net) y wn Rys.5 Model sztucznego neuronu Gdzie: X1...... Xn – sygnały wejściowe neuronu, y – sygnał wyjściowy neuronu, w1.......wn – wagi połączeń, net - łączne pobudzenie neuronu, f(net) - funkcja aktywacji. Neuron wykonuje najpierw operacje sumowania swoich ważonych wejść w celu wyznaczenia łącznego pobudzenia, a następnie nieliniową operację f(net) zgodnie ze swoją funkcją aktywacji. Zazwyczaj na jedno z wejść podany jest sygnał –1 z wagą równą wartości progowej. Rozróżniamy cztery funkcje aktywacji: 1. Bipolarna funkcja ciągła 2. Unipolarna funkcja ciągła 3. Bipolarna funkcja binarna (dyskretna) 4. Unipolarna funkcja binarna (dyskretna) Ze względu na sposoby połączenia neuronów między sobą i ich wzajemne współdziałanie SSN dzielimy na : 1. Sieci jednokierunkowe - w sieci tej następuje przepływ sygnałów w jednym kierunku 2. Sieci ze sprzężeniem zwrotnym – sygnały wyjściowe neuronów tworzą jednocześnie wektory wejściowe sieci dla następnego cyklu obliczeniowego. a. Algorytm genetyczne Stanowi wzorowaną na naturalnej ewolucji metodę rozwiązywania problemów, głównie zagadnień optymalizacyjnych. Algorytmy genetyczne są procedurami poszukiwania opartymi na mechanizmie doboru naturalnego i dziedziczenia. Korzystają z ewolucyjnej zasady przetwarzają osobników najlepiej przystosowanych. Algorytmy genetyczne różnią się od tradycyjnych metod optymalizacji z powodu innej zasady przetwarzania i wnioskowania. Przy kodowaniu parametrów algorytmy genetyczne nie przetwarzają bezpośrednich parametrów zadania, ale ich zakodowaną postać. Działania na populacji prowadzone są poprzez prowadzenie poszukiwań wychodząc nie z pojedynczego punktu lecz z pewnej ich populacji. Podczas realizacji zadań algorytmy genetyczne korzystają jedynie z funkcji celu, a nie z jej pochodnych lub innych pomocniczych informacji. Gdzie funkcja celu ma postać funkcji przystosowania, czyli stanowi miarę przystosowania danego osobnika w populacji. U. Sowa Podstawowe systemy wnioskowania sztucznej inteligencji US - 6 START INICJACJA - WYBÓR POCZATKOWEJ POPULACJI OCENA PRZYSTOSOWANIA CHROMOSOMÓW POPULACJI WARUNEK ZATRZYMANIA NIE TAK WYPROWADZENI E NAJLEPSZEGO CHROMOSOMU SELEKCJA CHROMOSOMÓW STOP ZASTOSOWANIE OPERATOROW GENETYCZNYCH UTWORZENIE NOWEJ POPULACJI Rys. 6 . Klasyczny algorytm genetyczny . 1. 2. 3. 4. 5. 6. U. Sowa Inicjacja polega na losowym wyborze zadanej liczby chromosomów czyli osobników reprezentowanych przez ciągi kodowe o określonej długości. Ocena przystosowania polega na obliczaniu wartości funkcji przystosowania dla każdego chromosomu z tej populacji. Zakłada się, że funkcja przystosowania przyjmuje zawsze wartości nieujemne a ponad to, że rozwiązany problem optymalizacji jest problemem poszukiwania maksimum. Sprawdzenie warunku zatrzymania . W zagadnieniach optymalizacji zatrzymanie następuje po uzyskaniu zadanej wartości optymalnej. Ewentualnie z określoną dokładnością, może też zostać zatrzymany po upływie określonego czasu działania. Selekcja chromosomów ma na celu wybranie na podstawie obliczonych funkcji przystosowania tych chromosomów, które będą brały udział w tworzeniu potomków dla następnego pokolenia. Utworzenie nowej populacji – chromosomy otrzymane w wyniku działania operatorów genetycznych na chromosomach tymczasowej populacji rodzicielskiej wchodzą w skład nowej populacji(populacja bieżąca) dla danej iteracji algorytmu genetycznego. Wyprowadzenie najlepszego chromosomu następuje po wybraniu chromosomu o największej funkcji przystosowania. Podstawowe systemy wnioskowania sztucznej inteligencji US - 7 4. Podsumowanie Jak wynika z powyższej pracy systemy wnioskowania mogą mieć różne rozwiązania, ale każde z nich dąży do wyboru optymalnego rozwiązania. Rozwiązanie to, nie zawsze musi być przyjęte przez decydenta, który zawsze może poprosić o ponowne rozwiązanie zadania. Niektóre z systemów pozwalają decydentowi na bierne uczestnictwo w tworzonych rozwiązaniach, przez udzielanie uzasadnień podjętych kroków, nie tylko globalnie ale i na każdym poziomie jego tworzenia. Dobór odpowiedniej metody wnioskowania będzie zależał, od przeznaczenia danego systemu. W lotnictwie stosowany jako układ wspomagania pilota, stosowany na różnych poziomach decyzyjnych pozwala na przede wszystkim zaoszczędzenie czasu w czasie lotu i wyeliminowanie błędów wynikających z teoretycznego nie doszkolenia załogi. Systemy obrazowania informacji , dobierane są indywidualnie do potrzeb producenta. Mogą one być wyświetlane na ekranach umieszczanych na kokpicie, w postaci wypowiadanych podpowiedzi, w formie sygnalizacji. Literatura 1. 2. 3. U. Sowa Chwiałkowska Ewa . ”Sztuczna inteligencja w systemach eksperckich”. Wydawnictwo „MIKOM” Warszawa 1991r. Mulawka Jan. „Systemy ekspertowe” . Wydawnictwo Naukowo –Techniczne . Warszawa 1995r. Alicja Miechowicz –Rolka . Wykłady z „Podstawy systemów eksperckich” Podstawowe systemy wnioskowania sztucznej inteligencji US - 8