Podstawowe systemy wnioskowania sztucznej inteligencji

Transkrypt

Podstawowe systemy wnioskowania sztucznej inteligencji
POLITECHNIKA RZESZOWSKA
im. Ignacego Łukasiewicza
Wydział Budowy Maszyn i Lotnictwa
Katedra Awioniki i Sterowania
Podstawowe systemy wnioskowania sztucznej inteligencji
Urszula SOWA
Seminarium Dyplomowe 2001/2002
LOTNICTWO - PILOTAŻ
1. Wstęp
W procesie podejmowania decyzji zależy nam na tym, aby podjęta decyzja była optymalna.
Wyznaczenie optymalnej decyzji polega na wyborze, ze zbioru dopuszczalnych rozwiązań za pomocą określonego algorytmu, takiej decyzji która przyjmuje wartość ekstremalną.
Procesy decyzyjne prowadzone są w dwóch różnych sytuacjach. Pierwsza jest wtedy, gdy znany jest
model badanego obiektu decyzyjnego. Druga zaś dotyczy sytuacji, gdy rozważania prowadzone są w oparciu o
wiedzę o obiekcie i sposobu jego sterowania w postaci zadań określających własności obiektu. Jeśli taki zestaw
zadań jest precyzyjny i spełnia określone reguły może posłużyć on do zbudowania programu komputerowego
imitującego działanie eksperta.
komputer
Algorytm decyzyjny
Informacje
Symptomy
Obserwacje
decyzje
Obiekt decyzyjny
decydent
Rys1. System podejmowania decyzji
Decydent to najczęściej człowiek, bądź też komputer w systemach automatycznego sterowania. W procesie podejmowania decyzji jest on często wspomagany przez komputer, który to podpowiada decydentowi
możliwe warianty rozwiązań, tak aby mógł on podjąć ostateczną decyzję. Taki system nazywamy systemem
wspomagania decyzji. Są to systemy informacyjne, które mogą wspomagać nie tylko sterowanie ale i zarządzanie, projektowanie, diagnostykę medyczną i techniczną czy też prace badawcze.
Systemy zajmujące się wspomaganiem człowieka lub komputera w podejmowaniu decyzji nazwano
U. Sowa
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 1
ogólnie Sztuczną Inteligencją. Wg Felgerbauna „sztuczna inteligencja” jest dziedziną informatyki dotyczącą metod i technik wnioskowania symbolicznego przez komputer oraz symbolicznej reprezentacji wiedzy stosowanej
podczas takiego wnioskowania.
2. Systemy eksperckie
Są to programy komputerowe przeznaczone do rozwiązywania specjalistycznych problemów wymagających profesjonalnej ekspertyzy. Aby jednak dany program mógł być nazwany eksperckim musi on spełniać dwa
podstawowe założenia :
1. Założenie o specjalnej budowie systemu eksperckiego
2. Założenie o przeznaczeniu – profesjonalna ekspertyza
Interfejs uzytkownika
Maszyna wnioskuj¹ca
Baza wiedzy X
Baza wiedzy
Y
Rys.2 Ogólna struktura SE
Gdzie „baza wiedzy” jest zbiorem definicji, faktów pojęć i relacji miedzy nimi oraz reguł wnioskowania.
Baza wiedzy może zawierać :
1. bazę tekstów,
2. bazę danych,
3. bazę faktów
4. bazę reguł,
5. bazę modeli,
6. bazę wiedzy zdroworozsądkowej.
Maszyna wnioskująca jest to oprogramowanie, który służy do manipulowania bazą wiedzy w celu analizy i rozwiązania zadanych systemowi problemów. Wykorzystuje fakty i reguły wnioskowania z bazy wiedzy,
aby dojść do nowych konkluzji..
Interfejs użytkownika natomiast służy do komunikacji użytkownika z systemem.
Podstawową zaletą systemu jest to, że pracuje szybko i jest konsekwentny przy wyciąganiu wniosków.
Poza tym są bardziej niezawodne niż ludzie, są przydatne do celów szkoleniowych . Wadą natomiast jest ich
nieelastyczność.
Systemy eksperckie oferują zwykle kilka dopuszczalnych rozwiązań, które uszeregowane zgodnie z
pewnymi kryteriami i pozwalają na rozwiązywanie problemów na tyle złożonych że ich rozwiązanie przekracza
bądź też przysparza ludziom problemów.
U. Sowa
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 2
Głównymi właściwościami systemu jest złożoność, autoanaliza oraz zdolność do rozbudowy bazy wiedzy, przy czym wprowadzany jest tzw. kontroler w celu zapobiegnięcia wprowadzenie reguł sprzecznych z już
istniejącymi. Złożoność czyli liczebność reguł . Jeśli system ma 300 reguł to jest to system mały, od 300 do
2000 to system średni, natomiast ponad 2000 to system duży, z tym że nie stosuje się baz o większej liczbie reguł niż 10000. Przez autoanalizę rozumiane jest udzielenie użytkownikowi uzasadnienia wykreowanego rozwiązania
2.1 Proces tworzenia systemu eksperckiego
Aby przystąpić do tworzenia systemy trzeba najpierw uzyskać odpowiedzi na kilka pytań
1. czy budowa SE jest zasadna ?
2. i czy jest w ogóle możliwa ?
odpowiedź TAK zachodzi gdy problem nie jest zbyt trudny ale i nie trywialny ,oraz że rozwiązanie w postaci
symbolicznej a nie w postaci algorytmicznej nas satysfakcjonuje. Jeśli odpowiedz na zadane pytania jest pozytywna czyli można przystąpić do następnego etapu twórczego jakim jest zdefiniowanie zadań systemu. Następnie przechodzimy do budowy baz wiedzy tzn. pozyskiwania wiedzy od ekspertów w danej dziedzinie. Na tym
etapie dokonujemy również wyboru metody rozporządzania wiedzą oraz narzędzi do budowy systemu. Organizacja i kodowanie wiedzy, nie kończy jednak procesu budowy , ponieważ musi jeszcze nastąpić testowanie i
weryfikacja systemu. Narzędzia jakie są wykorzystywane przy budowie SE można podzielić na cztery grupy:
1. systemy szkieletowe – są to systemy z pustą bazą danych,
2. języki SE,
3. języki programowania symbolicznego,
4. języki algorytmiczne.
a.
Podział systemów eksperckich
Ze względu na przeznaczenie dzielimy na:
1. systemy doradcze- (advisery) – prezentują one rozwiązania dla użytkownika, które użytkownik może
odrzucić i zażądać innego rozwiązania,
2. podejmujące decyzje bez kontroli człowieka (dictorial) stosowane są do sterowania obiektami gdzie
udział człowieka jest utrudniony lub niemożliwy,
3. systemy krytykujące – (critical) dokonują analizy problemu i przedstawiają rozwiązania, a następnie
komentują przyjęte rozwiązanie.
Ze względu na to co uzyskujemy na wyjście SE dzielimy na systemy:
1. diagnozy – ocena stanu istniejącego na podstawie posiadanych danych,
2. prognozy – przewidywanie stanu przyszłego na podstawie istniejących danych,
3. planu - opis stanu, do których należy dążyć i w jaki sposób tego dokonać.
Ze względu na metodę procesu wnioskowania wyróżniamy SE:
1. z logiką dwuwartościową ,
2. z logiką wielowartościową ,
3. z logiką rozmytą .
Ze względu na metodę reprezentacji wiedzy wyróżniamy SE działające w oparciu o :
1. reguły,
2. wektory wiedzy,
3. sieci semantyczne,
4. ramy,
5. sztuczne sieci neuronowe,
6. algorytmy genetyczne.
3. Mechanizmy wnioskowania
U. Sowa
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 3
3.1 Wnioskowanie
Wyróżnić tu można wnioskowanie progresywne czyli wnioskowanie na przód, oraz wnioskowanie regresywne czyli wnioskowanie wstecz.
Pierwsze metoda polega na generowaniu nowych faktów, na podstawie dostępnych reguł i faktów,
tak długo aż wśród wygenerowanych faktów znajdzie się podstawowy cel lub nie można zastosować więcej reguł. Powoduje to zwiększenie bazy faktów co jest zjawiskiem korzystnym w bazie wiedzy o małej liczbie faktów.
Wnioskowanie wstecz polega natomiast na wykazaniu prawdziwości hipotezy głównej na podstawie
prawdziwości przesłanek. Charakteryzuje się mniejsza liczbą generowanych nowych faktów , oraz zazwyczaj
krótszym czasem wnioskowania niż przy wnioskowaniu w przód. Wadą jest brak możliwości równoczesnego
dowodzenia kilku hipotez.
Wyróżnia się jeszcze jeden typ wnioskowania, a mianowicie wnioskowanie mieszane. Polega ono na przełączaniu pomiędzy wnioskowaniem „w przód” i „wstecz” na podstawie wskazań dotyczących priorytetów wyboru
rodzaju wnioskowania .
a.
Uczenie indukcyjne
Metoda ta polega na stworzeniu tzw. drzewa decyzyjnego . Drzewo decyzyjne jest to graf, którego korzeń
utworzony jest przez wybrany atrybut, a poszczególne gałęzie reprezentują wartości tego atrybutu. Na następnych poziomach znajdują się kolejne atrybuty, zaś na najniższym poziomie węzły charakteryzują poszczególne
klasy. Zagadnienie optymalnego drzewa decyzyjnego rozwiązuje się za pomocą entropii pewnego elementowego zbioru. Entropia jest to pewna miara informacji zawartej w zjawisku, która w przypadkowy sposób może
przyjmować n-stanów. Drzewo decyzyjne może być traktowane jako źródło informacji generujące informacje
o przynależności do klasy danego obiektu.
b. Maszyna wnioskująca działająca na zbiorach rozmytych.
Maszyna wnioskująca w takich systemach działa na podstawie tzw. wnioskowania rozmytego, które można
przeprowadzić dzięki odpowiedniej reprezentacji wiedzy opisującej dany problem za pomocą zbiorów rozmytych.
System wnioskowania rozmytego składa się z trzech zasadniczych bloków:
2. blok fuzyfikacji - rozmywanie,
3. blok inferencji – wnioskowania,
4. blok dyfuzyfikacji –wyostrzania
y*
X*
zmienne ilosciowe
Blok fuzyfikacji
zb.A' rozmyte
Blok inferencj
zb.B' rozmyte
Blok defuzyfikacji
Baza regul rozmytych
obszar zmiennych lingwistycznych jakosciowych
relacje rozmyte
Rys. 3 Schemat wnioskowania rozmytego
W bloku fuzyfikacji następuje obliczanie stopnia przynależności wartości nierozmytych poszczegól-
U. Sowa
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 4
nych wejść do zbioru rozmytego opisanego odpowiednimi funkcjami przynależności związanych z tymi wejściami. Następuje przetwarzanie zmiennych ilościowych na pojęcia lingwistyczne wyrażone w postaci zbiorów
rozmytych.
W bloku inferencji następuje łączenie przesłanek z odpowiednimi faktami i wybranie rozwiązania optymalnego .
W bloku dyfyzyfikacji następuje wyliczenie na podstawie funkcji przynależności wyjścia nie rozmytej
wartości ostrej (wartość liczbowa).
a.
Wnioskowanie za pomocą miar rozmytych.
Miara rozmyta przypisuje do każdego zbioru ostrego określonego na uniwersum stopień dowodu lub wiary,
że dany element uniwersum należy do tego zbioru.
Miara rozmyta zdefiniowana jest przez funkcję g: P(X) → [0,1]
Gdzie:
X
– uniwersum,
P(X)
– zbiór wszystkich podzbiorów uniwersum,
Miara rozmyta składa się z dwóch miar :
1. Przekonania
2. Domniemania
Są one opisywane za pomocą funkcji m : P(X) → [0,1] i m(∅) = 0 i Σ m(A) =1
Gdzie:
M(A) – stopień dowodu lub wiary, że dany element uniwersum X należy do zb.A i tylko do niego
W przypadku gdy wszystkie elementy ogniskowe są zbiorami jednoelementowymi miara przekonania i miara domniemania łączą się tworząc miarę prawdopodobieństwa opisaną funkcją rozkładu prawdopodobieństwa.
W przypadku gdy elementy ogniskowe są zagnieżdżone otrzymujemy specjalne podklasy dla miary przekonania
miarę konieczności, dla miary domniemania miarę możliwości. Są one zdefiniowane odpowiednio przez funkcję
rozkładu konieczności i funkcję rozkładu możliwości.
Miary rozmyte
Miara domniemania
Miara
możliwości
Miara przekonania
Miara prawdopodobieństwa
Miara konieczności
Rys.4 Schemat miary rozmytej.
3.5 Sztuczne sieci neuronowe
Sztuczne sieci neuronowe można traktować jako nowoczesne systemy obliczeniowe, które przetwarzają
informacje, wzorując się na zjawiskach zachodzących w mózgu człowieka.
Podstawową zaletą SSN jest przetwarzanie równoległe informacji z całkowitą odpornością na błędy wynikające z równoległości. Wykorzystuje się do tego rozległe pokłady powiązań neuronowych.
Dodatkową zaletą jest zdolność do uczenia się sieci i uogólnienia nabytej wiedzy. Ponieważ, budowa
sztucznego neuronu jest wzorowana na biologicznym neuronie zapamiętywanie i uczenie się polega na
U. Sowa
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 5
zmianie struktury i siły połączeń synaptycznych między neuronami. Synapsy często używane ulegają
wzmocnieniu.
X1
w1
X2
.
.
.
. Xn
w2
f(net)
y
wn
Rys.5 Model sztucznego neuronu
Gdzie:
X1...... Xn – sygnały wejściowe neuronu,
y
– sygnał wyjściowy neuronu,
w1.......wn – wagi połączeń,
net
- łączne pobudzenie neuronu,
f(net)
- funkcja aktywacji.
Neuron wykonuje najpierw operacje sumowania swoich ważonych wejść w celu wyznaczenia łącznego
pobudzenia, a następnie nieliniową operację f(net) zgodnie ze swoją funkcją aktywacji. Zazwyczaj na jedno z
wejść podany jest sygnał –1 z wagą równą wartości progowej.
Rozróżniamy cztery funkcje aktywacji:
1. Bipolarna funkcja ciągła
2. Unipolarna funkcja ciągła
3. Bipolarna funkcja binarna (dyskretna)
4. Unipolarna funkcja binarna (dyskretna)
Ze względu na sposoby połączenia neuronów między sobą i ich wzajemne współdziałanie SSN dzielimy na :
1. Sieci jednokierunkowe - w sieci tej następuje przepływ sygnałów w jednym kierunku
2. Sieci ze sprzężeniem zwrotnym – sygnały wyjściowe neuronów tworzą jednocześnie wektory wejściowe sieci dla następnego cyklu obliczeniowego.
a.
Algorytm genetyczne
Stanowi wzorowaną na naturalnej ewolucji metodę rozwiązywania problemów, głównie zagadnień optymalizacyjnych. Algorytmy genetyczne są procedurami poszukiwania opartymi na mechanizmie doboru naturalnego
i dziedziczenia. Korzystają z ewolucyjnej zasady przetwarzają osobników najlepiej przystosowanych.
Algorytmy genetyczne różnią się od tradycyjnych metod optymalizacji z powodu innej zasady przetwarzania i wnioskowania. Przy kodowaniu parametrów algorytmy genetyczne nie przetwarzają bezpośrednich parametrów zadania, ale ich zakodowaną postać. Działania na populacji prowadzone są poprzez prowadzenie poszukiwań wychodząc nie z pojedynczego punktu lecz z pewnej ich populacji. Podczas realizacji zadań algorytmy
genetyczne korzystają jedynie z funkcji celu, a nie z jej pochodnych lub innych pomocniczych informacji. Gdzie
funkcja celu ma postać funkcji przystosowania, czyli stanowi miarę przystosowania danego osobnika w populacji.
U. Sowa
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 6
START
INICJACJA - WYBÓR
POCZATKOWEJ
POPULACJI
OCENA PRZYSTOSOWANIA CHROMOSOMÓW
POPULACJI
WARUNEK
ZATRZYMANIA
NIE
TAK
WYPROWADZENI
E NAJLEPSZEGO
CHROMOSOMU
SELEKCJA
CHROMOSOMÓW
STOP
ZASTOSOWANIE
OPERATOROW
GENETYCZNYCH
UTWORZENIE
NOWEJ
POPULACJI
Rys. 6 . Klasyczny algorytm genetyczny .
1.
2.
3.
4.
5.
6.
U. Sowa
Inicjacja polega na losowym wyborze zadanej liczby chromosomów czyli osobników reprezentowanych przez ciągi kodowe o określonej długości.
Ocena przystosowania polega na obliczaniu wartości funkcji przystosowania dla każdego chromosomu
z tej populacji. Zakłada się, że funkcja przystosowania przyjmuje zawsze wartości nieujemne a ponad
to, że rozwiązany problem optymalizacji jest problemem poszukiwania maksimum.
Sprawdzenie warunku zatrzymania . W zagadnieniach optymalizacji zatrzymanie następuje po uzyskaniu zadanej wartości optymalnej. Ewentualnie z określoną dokładnością, może też zostać zatrzymany
po upływie określonego czasu działania.
Selekcja chromosomów ma na celu wybranie na podstawie obliczonych funkcji przystosowania tych
chromosomów, które będą brały udział w tworzeniu potomków dla następnego pokolenia.
Utworzenie nowej populacji – chromosomy otrzymane w wyniku działania operatorów genetycznych
na chromosomach tymczasowej populacji rodzicielskiej wchodzą w skład nowej populacji(populacja
bieżąca) dla danej iteracji algorytmu genetycznego.
Wyprowadzenie najlepszego chromosomu następuje po wybraniu chromosomu o największej funkcji
przystosowania.
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 7
4. Podsumowanie
Jak wynika z powyższej pracy systemy wnioskowania mogą mieć różne rozwiązania, ale każde z nich
dąży do wyboru optymalnego rozwiązania. Rozwiązanie to, nie zawsze musi być przyjęte przez decydenta,
który zawsze może poprosić o ponowne rozwiązanie zadania. Niektóre z systemów pozwalają decydentowi
na bierne uczestnictwo w tworzonych rozwiązaniach, przez udzielanie uzasadnień podjętych kroków, nie
tylko globalnie ale i na każdym poziomie jego tworzenia. Dobór odpowiedniej metody wnioskowania będzie zależał, od przeznaczenia danego systemu.
W lotnictwie stosowany jako układ wspomagania pilota, stosowany na różnych poziomach decyzyjnych pozwala na przede wszystkim zaoszczędzenie czasu w czasie lotu i wyeliminowanie błędów wynikających z teoretycznego nie doszkolenia załogi.
Systemy obrazowania informacji , dobierane są indywidualnie do potrzeb producenta. Mogą one być
wyświetlane na ekranach umieszczanych na kokpicie, w postaci wypowiadanych podpowiedzi, w formie
sygnalizacji.
Literatura
1.
2.
3.
U. Sowa
Chwiałkowska Ewa . ”Sztuczna inteligencja w systemach eksperckich”. Wydawnictwo „MIKOM”
Warszawa 1991r.
Mulawka Jan. „Systemy ekspertowe” . Wydawnictwo Naukowo –Techniczne . Warszawa 1995r.
Alicja Miechowicz –Rolka . Wykłady z „Podstawy systemów eksperckich”
Podstawowe systemy wnioskowania sztucznej inteligencji
US - 8