konspekt wykładu
Transkrypt
konspekt wykładu
WYKŁAD 9 Reprezentacja wiedzy Najbardziej pożądana cecha agenta ? Inteligencja ↔ Użyteczność ! Inteligencja to zdolność do wykorzystania posiadanej wiedzy do osiągania stojących przed systemem celów. ! brak inteligencji ≠ brak wiedzy (brak inteligencji, to posiadanie wiedzy ale niemożność jej wykorzystania) ! osiągnięcie inteligencji bez posiadania wiedzy ? Podstawą inteligentnego zachowania są procesy poszukiwania i rozważania możliwych rozwiązań. Trzeba ustalić reprezentację: • problemu – dziedziny, • celów, • ustalić strategię poszukiwania. Przetwarzanie wiedzy: ! gromadzenie wiedzy, klasyfikacja, agregacja (uczenie) ! udostępnianie, wykorzystywanie (wnioskowanie) 3 rodzaje pamięci (model Act*, John Anderson, CMU) • Długotrwała pamięć deklaratywna (czysta wiedza – co wiadomo o obiekcie, jak powiązany ?) W pamięci tej przechowywane są abstrakcyjne pojęcia, reguły oraz łączące je relacje (sieć semantyczna + mechanizm asocjacji) np. krotka opisująca dane personalne osoby w bazie relacyjnej • Długotrwała pamięć proceduralna (umiejętność – jak postępować ?) wiedza zapisana niejawnie, trudna do przekazania i modyfikacji np. algorytm sortowania zapisany w postaci programu • Krótkotrwała pamięć robocza (cache) −1− Zastosowanie Pamięć deklaratywna Pamięć proceduralna zapamiętanie przypominanie Dopasowanie warunków Wynik Pamięć robocza Rezultaty działania Zakodowane dane Diagram ilustrujący strukturę modelu Act* (rysunek z prezentacji prof. Wodzisława Ducha, http://www.phys.uni.torun.pl/~duch) Najprostsza forma reprezentacji w postaci przestrzeni cech/stanów: • opis problemu (np. wektor parametrów opisujących stan obiektu) • opis sposobów transformacji (operatory transformujące stan) Wartość atrybutu /cechy/parametru pojedynczego obiektu może być: ! ciągła (np. liczba rzeczywista, wzrost, cena towaru), ! quazi-ciągła tzn. ciągła z dokładnością do ziarna dyskretyzacji (np. liczba rzeczywista w komputerze, liczba całkowita, czas wyrażany w ilościach sekund/dni) ! dyskretna uporządkowana kolejne wartości atrybutu tworzą ciąg uporządkowany (według pewnego kryterium). Dla każdej pary wartości możemy określić ich relację. Np. postać leku: płynna<półpłynna-maść<sypka-proszek<stała-tabletka. Pora dnia: świt < rano < przedpołudnie < południe < popołudnie < . . . ! dyskretna częściowo uporządkowana relacja uporządkowania jest określona tylko dla częściowo (tylko dla niektórych par wartości) np. marki samochodów: (Trabant, Maluch) < (Polonez, Łada) < (Opel, Wolkswagen) < (Porsche, Jaguar) ! dyskretna nieuporządkowana: atrybuty pozbawione jakichkolwiek relacji porządkujących nie występują w praktyce, ale często te relacje są bardzo słabe lub nieznane np. meble, gatunki filmów −2− Dodatkowe cechy atrybutów: ! informacja niepewna → prawdopodobieństwo, stochastyka np. albo zdam egzamin albo nie zdam ! informacja niepełna → NULL, np. znamy tylko fragment numeru rejestracyjnego, inicjały, itp ! informacja nieprecyzyjna → niepewność pomiarowa, statystyka np. średnica opony 45cm ± 5mm ! informacja niewerbalna → niepewność lingwistyczna np. interesujący, pompatyczny, skromny, Rodzaje reprezentacji: ! reprezentacja parametryczna 2<5 ! reprezentacja symboliczna x < y ! wiedza o własnościach obiektów (x < y) ⇒ (-x > -y) ! wiedza o relacjach (x " y ) # ( $ x % & y ) Klasyczna reprezentacja wiedzy ! logika dwuwartościowa ! rachunek zdań ! rachunek predykatów Uniwersalne aproksymatory - Reprezentacja "potencjałowa" - Reprezentacja „rastrowa” - Logika rozmyta, rozmyta reprezentacja i przetwarzanie - Sieci neuronowe −3− Przykładowe problemy „praktyczne”: 1. Inteligentna „wyszukiwarka” informacji lub towarów w zasobach sieci Internet: ! pojęcia: standard kodowania, litera, słowo, zadanie, akapit, rozdział, dokument, odsyłacz, rysunek, tytuł, słowo kluczowe, ! opis dokumentu w sensie identyfikacji URI / URL ! opis zawartości dokumentu za pomocą wektora modelującego częstość występowania poszczególnych słów (termów), oraz ewentualnie relacji pomiędzy tymi słowami w sensie odległości technicznym lub znaczeniowym (ontologia) ! odległości pomiędzy dokumentami w sensie położenia fizycznego (np. na tym samym serwerze, w tym samym katalogu lub podkatalogu), odległości w sensie powiązań odsyłaczami, odległości pomiędzy dokumentami w sensie zawartości (semantyka) lub w sensie formatu reprezentacji tej zwartości (pragmatyka). 2. Program asystenta organizacji czasu/miejsc spotkań osób w dużych grupach zawodowych/towarzyskich 3. Asystent komunikacji z otoczeniem - odbioru (i sortowania) poczty elektronicznej / SMS’ów / telefonów 4. Program osobistego agenta „turystycznego” organizującego wyjazdy na wakacje 5. Program modelujący profil preferencji i upodobań człowieka (użytkownika systemu), dla potrzeb wymiany informacji z innymi systemami informatycznymi. −4−