konspekt wykładu

Transkrypt

konspekt wykładu
WYKŁAD 9
Reprezentacja wiedzy
Najbardziej pożądana cecha agenta ?
Inteligencja ↔ Użyteczność
! Inteligencja to zdolność do wykorzystania posiadanej wiedzy
do osiągania stojących przed systemem celów.
! brak inteligencji ≠ brak wiedzy
(brak inteligencji, to posiadanie wiedzy ale niemożność jej wykorzystania)
! osiągnięcie inteligencji bez posiadania wiedzy ?
Podstawą inteligentnego zachowania są procesy poszukiwania i
rozważania możliwych rozwiązań. Trzeba ustalić reprezentację:
• problemu – dziedziny,
• celów,
• ustalić strategię poszukiwania.
Przetwarzanie wiedzy:
! gromadzenie wiedzy, klasyfikacja, agregacja (uczenie)
! udostępnianie, wykorzystywanie (wnioskowanie)
3 rodzaje pamięci (model Act*, John Anderson, CMU)
• Długotrwała pamięć deklaratywna
(czysta wiedza – co wiadomo o obiekcie, jak powiązany ?)
W pamięci tej przechowywane są abstrakcyjne pojęcia, reguły
oraz łączące je relacje (sieć semantyczna + mechanizm asocjacji)
np. krotka opisująca dane personalne osoby w bazie relacyjnej
• Długotrwała pamięć proceduralna
(umiejętność – jak postępować ?)
wiedza zapisana niejawnie, trudna do przekazania i modyfikacji
np. algorytm sortowania zapisany w postaci programu
• Krótkotrwała pamięć robocza (cache)
−1−
Zastosowanie
Pamięć
deklaratywna
Pamięć
proceduralna
zapamiętanie
przypominanie
Dopasowanie
warunków
Wynik
Pamięć
robocza
Rezultaty działania
Zakodowane dane
Diagram ilustrujący strukturę modelu Act*
(rysunek z prezentacji prof. Wodzisława Ducha, http://www.phys.uni.torun.pl/~duch)
Najprostsza forma reprezentacji w postaci przestrzeni cech/stanów:
• opis problemu (np. wektor parametrów opisujących stan obiektu)
• opis sposobów transformacji (operatory transformujące stan)
Wartość atrybutu /cechy/parametru pojedynczego obiektu może być:
! ciągła (np. liczba rzeczywista, wzrost, cena towaru),
! quazi-ciągła
tzn. ciągła z dokładnością do ziarna dyskretyzacji (np. liczba rzeczywista
w komputerze, liczba całkowita, czas wyrażany w ilościach sekund/dni)
! dyskretna uporządkowana
kolejne wartości atrybutu tworzą ciąg uporządkowany (według pewnego
kryterium). Dla każdej pary wartości możemy określić ich relację.
Np. postać leku: płynna<półpłynna-maść<sypka-proszek<stała-tabletka.
Pora dnia: świt < rano < przedpołudnie < południe < popołudnie < . . .
! dyskretna częściowo uporządkowana
relacja uporządkowania jest określona tylko dla częściowo (tylko dla
niektórych par wartości) np. marki samochodów: (Trabant, Maluch) <
(Polonez, Łada) < (Opel, Wolkswagen) < (Porsche, Jaguar)
! dyskretna nieuporządkowana: atrybuty pozbawione jakichkolwiek
relacji porządkujących nie występują w praktyce, ale często te relacje są
bardzo słabe lub nieznane np. meble, gatunki filmów
−2−
Dodatkowe cechy atrybutów:
! informacja niepewna → prawdopodobieństwo, stochastyka
np. albo zdam egzamin albo nie zdam
! informacja niepełna → NULL,
np. znamy tylko fragment numeru rejestracyjnego, inicjały, itp
! informacja nieprecyzyjna → niepewność pomiarowa, statystyka
np. średnica opony 45cm ± 5mm
! informacja niewerbalna → niepewność lingwistyczna
np. interesujący, pompatyczny, skromny,
Rodzaje reprezentacji:
! reprezentacja parametryczna
2<5
! reprezentacja symboliczna x < y
! wiedza o własnościach obiektów (x < y) ⇒ (-x > -y)
! wiedza o relacjach (x " y ) # ( $ x % & y )
Klasyczna reprezentacja wiedzy
! logika dwuwartościowa
! rachunek zdań
! rachunek predykatów
Uniwersalne aproksymatory
- Reprezentacja "potencjałowa"
- Reprezentacja „rastrowa”
- Logika rozmyta, rozmyta reprezentacja i przetwarzanie
- Sieci neuronowe
−3−
Przykładowe problemy „praktyczne”:
1. Inteligentna „wyszukiwarka” informacji lub towarów
w zasobach sieci Internet:
! pojęcia: standard kodowania, litera, słowo, zadanie, akapit,
rozdział, dokument, odsyłacz, rysunek, tytuł, słowo kluczowe,
! opis dokumentu w sensie identyfikacji URI / URL
! opis zawartości dokumentu za pomocą wektora modelującego częstość występowania poszczególnych słów (termów),
oraz ewentualnie relacji pomiędzy tymi słowami w sensie
odległości technicznym lub znaczeniowym (ontologia)
! odległości pomiędzy dokumentami w sensie położenia
fizycznego (np. na tym samym serwerze, w tym samym
katalogu lub podkatalogu), odległości w sensie powiązań
odsyłaczami, odległości pomiędzy dokumentami w sensie
zawartości (semantyka) lub w sensie formatu reprezentacji
tej zwartości (pragmatyka).
2. Program asystenta organizacji czasu/miejsc spotkań osób
w dużych grupach zawodowych/towarzyskich
3. Asystent komunikacji z otoczeniem - odbioru (i sortowania)
poczty elektronicznej / SMS’ów / telefonów
4. Program osobistego agenta „turystycznego”
organizującego wyjazdy na wakacje
5. Program modelujący profil preferencji i upodobań człowieka
(użytkownika systemu), dla potrzeb wymiany informacji z innymi
systemami informatycznymi.
−4−