Lista_5 logiczna analiza tekstu - Pierwsza

Transkrypt

Lista_5 logiczna analiza tekstu - Pierwsza
Edward Bryniarski
Logiczna analiza tekstu
Większość współczesnych środków informatycznych obsługujących Internet
wykorzystuje lepiej lub gorzej określone operacje i reguły logicznej analizy
tekstu. W tym kontekście, znajomość przez nauczycieli metod logicznej analizy
tekstu wydaje się być dobrze uzasadniona. Zapoznanie się z ta dziedzina można
rozpocząć od książki Witolda Marciszewskiego „Metody analizy tekstu
naukowego” (1981 r.). Chociaż praca ta była przygotowana dla wydawnictwa
jako poradnik, czy przewodnik po wskazanej w tytule książki dziedzinie
wiedzy, przeznaczony dla nauczycieli akademickich i studentów, to także
prezentowała nowatorskie idee oraz wytyczała nowe kierunki badań. Zwłaszcza
prekursorskie było zaproponowanie, jako głównego celu logicznej analizy
tekstu, badania logicznego związku pomiędzy tematem a rematem, tj.
pomiędzy tymi fragmentami tekstu, które reprezentują wiedzę potrzebną do
wyznaczenia innej wiedzy, a tymi fragmentami tekstu, które reprezentują
wiedzę wyznaczoną na podstawie tematu. Na podstwie wiedzy reprezentowanej
przez temat można pojąć i zrozumieć remat. Temat reprezentuje wiedzę o tym
czego dotyczy tekst. Mówi się, że tekst jest na temat. Remat reprezentuje to co o
temacie jest przedstawione przez tekst. Np. podmioty zdań są tematami, a
orzeczenia – rematami; w wypowiedzi „pisze, bo potrafi”, tematem jest „pisze”,
a rematem „bo potrafi”. W tym ujęciu, istotą poprawności logicznej jednostki
tekstu jest występowanie logicznego stosunku pomiędzy tematem i rematem.
Ten związek logiczny ustala się dokonując formalnego opisu relacji
określających zwartość tematyczną tekstów z danej dziedziny wiedzy, do której
należy analizowany tekst. Analizowane relacje zwane są relacjami
nawiązywania. Na podstawie tych relacji wyprowadzane są jedne teksty z
drugich, adekwatnie do wyznaczania jednej wiedzy przez drugą. W sensie
wyprowadzalności tekstów, w dowolnym wyprowadzeniu jedne teksty są
następnikami innych, w tym teksty wyprowadzane (rematy) są następnikami
tekstów (tematów), z którymi pozostają w relacji nawiązywania. Z tego
powodu, do badania struktury tematycznej tekstu można zastosować aparat
pojęciowy teorii krat. Ze względu na znaczenie pojęć tematu i rematu dla
analizy tekstu, postuluje się utworzenie teorii, którą autor omawianej pracy
proponuje nazwać logiczną teorią tekstu.
Wiedza i reprezentacja wiedzy,
Ludzie od zarania swoich dziejów poznają świat, w którym żyją oraz
przekształcają go kulturowo i cywilizacyjnie, przetwarzając w umyśle
informacje o ważnych dla ich życia obiektach, a wyniki przetwarzania
informacji wykorzystują w działaniu.
Informacją (w sensie W. R. Ashbego i N.Wienera) jest wszelkie ograniczenie
różnorodności obiektów do jakiejś klasy obiektów (typu obiektów)
posiadających pewne wyróżnione cechy i własności.
Wiedza jest informacją przetwarzaną w umysłach ludzi. Różne osoby potrafią
wskazać, czy wyodrębnić tę samą klasę obiektów (ograniczając różnorodność
obiektów do danej klasy), posługując się tymi samymi pojęciami i sądami:
pojęciami, będącymi wcześniej wyróżnionymi przez umysł klasami obiektów
oraz sądami, będącymi informacjami o związkach (relacjach) pomiędzy
obiektami ujętymi w tych pojęciach, a to indukuje odpowiednie związki
pomiędzy tymi pojęciami oraz w procesie uczenia prowadzi do powstania
nowych pojęć. Tak więc, pojęcia i sądy, którymi posługuje się dany człowiek,
składają się na jego wiedzę.
Dana grupa ludzi posiada wspólną wiedzę, jeśli posługuje się wspólnymi
pojęciami i sądami, tj. rozpoznaje te same klasy obiektów oraz te same relacje
pomiędzy obiektami.
Wiedzę o obiektach danego typu posiada ten, kto potrafi odnieść się do
obiektów danego typu w ramach dziedziny wiedzy ujmującej: wyróżnioną klasę
obiektów, cechy tych obiektów, operacje wykonywane na wyróżnionych
obiektach (pewne funkcje) i relacje pomiędzy tymi obiektami, pewne
„wzorcowe” obiekty, pozwalające wskazać inne obiekty rozważanego typu, a
niekiedy znana jest relacja zawierania się jednych obiektów w drugich.
Oczywiście, może być rozważana dziedzina wiedzy o obiektach, wśród których
są pojęcia, wtedy: klasy pojęć, cech, operacji na obiektach, relacji pomiędzy
obiektami są pojęciami ujętymi w ramach tej dziedziny, a relacją zawierania
obiektów jest zwykłe zawieranie klas. Dlatego słusznie jest wszystkie składniki
systemu wiedzy traktować jako pewne pojęcia. Z tego powodu, niekiedy
dziedziny wiedzy zwane są systemami pojęciowymi.
Dowolnej dziedzinie działalności ludzkiej odpowiada jakiś system wiedzy
wykorzystywanej w tej działalności. Np. działalności kucharskiej odpowiada
dziedzina wiedzy o przygotowywaniu potraw czy posiłków, a wykonywaniu
operacji na liczbach wymiernych odpowiada wiedza o liczbach wymiernych.
Nawet dla rozwiązania konkretnego problemu, potrzebne jest wykorzystanie
dziedziny wiedzy dostosowanej tylko do rozwiązania tego problemu.
Jak przetwarzana jest informacja, aby stać się wiedzą? Ograniczenie
różnorodności obiektów do pewnej klasy obiektów określających wiedzę polega
na tym, że obiekt zwany w informatyce agentem przypisuje (przyporządkowuje,
przydziela), poszczególnym obiektom z danej klasy (danego pojęcia) ten sam
obiekt zwany reprezentacją wiedzy (znakiem, daną, tekstem) w taki sposób,
aby udostępnienie człowiekowi tej reprezentacji wiedzy (znaku, tekstu)
umożliwiało rozpoznanie przez niego reprezentowanej wiedzy (oznaczonej,
opisanej wiedzy). Agentem może być dowolny umysł człowieka,
wykorzystujący w reprezentowaniu wiedzy neurologiczne i psychofizyczne
procesy, zwane procesami myślenia. Agentem może być także dowolny podmiot
społeczny czy gospodarczy oraz środek technologii informacyjnej
przetwarzający informację (komputer z oprogramowaniem, sieć komputerowa,
itp.).
Zgodnie z niektórymi wynikami badań psychologii poznawczej, pedagogiki,
kulturoznastwa, metodologii programowania, a nawet sztucznej inteligencji,
można wyróżnić trzy poziomy reprezentowania wiedzy:
reprezentowanie ikoniczne – obrazująca daną wiedzę środkami zmysłowymi:
wyobrażenia, wizualizacje, udźwiękowienie, mimika, aktywność ruchowa, opisy
wyobrażeń,
reprezentowanie symboliczne - schematyzacja reprezentacji ikonicznej czy
jej formalizacja, prowadząca do wzorów (formuł, schematów, instrukcji),
których
zastosowanie umożliwia uzyskanie danych jednoznacznie
wskazujących na reprezentowaną wiedzę (np. wykorzystanie wzorów
matematycznych do uzyskania poszukiwanego rozwiązania zadania
matematycznego, czy program komputerowy),
reprezentowanie interaktywne (enaktywne) – wykorzystanie reprezentacji
ikonicznej lub symbolicznej do określenia reguł decyzyjnych, których
zastosowanie polega na wykonywaniu operacji (algorytmów, instrukcji)
prowadzących do jednoznacznej identyfikacji reprezentowanej wiedzy, gdy
spełnione są określone warunki ustalone przez reprezentację ikoniczną lub
symboliczną (np. symulatory, instrukcje obsługi urządzeń technicznych, tablice
decyzyjne).
Zauważmy, że od reprezentacji ikonicznej do symbolicznej przechodzi się, gdy
występują luki
w reprezentowanej wiedzy, czy w sytuacji niejasnej
reprezentacji, co nazywamy problemem informatycznym. Natomiast do
reprezentacji interaktywnej przechodzi się dzięki możliwości sformułowania
reguł, umożliwiających wykonanie określonej operacji, gdy spełnione są
określone warunki. Dysponowanie reprezentacją interaktywną daje agentowi
minimalną informację umożliwiającą rozpoznanie reprezentowanej wiedzy w
całości. Proces ten nazywa się pojęciowaniem.
Konceptualizacja wiedzy
Pokazaliśmy już, że wiedza może być precyzyjnie rozpoznawana przez
ludzi, gdy jest precyzyjnie, w sposób powtarzalny i weryfikowalny
przedstawiana, symbolicznie wskazana i zgodnie z pewnymi regułami
przetwarzana, tj. reprezentowana. Taki proces nazywamy konceptualizacją
wiedzy, a do jej realizacji służą środki zwane multimediami, czy też
systemami multimedialnymi.
Tworzone są systemy multimedialne, które wiedzę o rzeczywistości
poznawczej człowieka reprezentują za pomocą języka naturalnego lub środków
informatycznych, np. w ramach systemów komputerowych, tj. w rzeczywistości
zwanej rzeczywistością wirtualną. Wiedza uzyskuje w ten sposób nowy
kontekst sytuacyjny, niespotykany we wcześniejszych epokach historycznych
– odniesienie wiedzy ludzkiej do jej reprezentacji komputerowej oraz do jej
zewnętrznego, maszynowego przetwarzania, poza umysłem człowieka. Kontekst
sytuacyjny jest tu zatem określony przez zespół mechanizmów wejścia i
wyjścia, które w swoim działaniu dążą docelowo do ustalenia izomorficznego
przyporządkowania (w potocznym rozumieniu - ustalającego zgodność)
pomiędzy pewnym podsystemem rzeczywistości wirtualnej, a poddziedziną
wiedzy (podsystemem rzeczywistości poznawczej). Do tego zespołu urządzeń
należą najczęściej: kamery cyfrowe, skanery, myszki, klawiatura komputera,
mikrofony, plotery, drukarki, ekrany monitorów komputerowych, głośniki,
okulary wyświetlające trójwymiarowy obraz, hydrauliczne symulatory ruchu,
itp.
Precyzując, system multimedialny możemy określić formułami:
system multimedialny :: = < dziedzina wiedzy,
system reprezentacji wiedzy,
kontekst sytuacyjny przyporządkowujący
wiedzy jej reprezentację>,.
gdzie
dziedzina wiedzy::=< Wszystkie możliwe przedmioty poznawalne,
relacja zawierania się przedmiotów,
cechy przedmiotów,
operacje na przedmiotach,
poznawalne cechy przedmiotów,
relacje pomiędzy przedmiotami,
elementarne przedmioty>.
System reprezentacji wiedzy występuje najczęściej jako system reprezentacji
językowej, w informatyce wykorzystującym język jakiejś dziedziny
matematyki, choć współcześnie coraz częściej spotykamy się z systemem
rzeczywistości wirtualnej.
System reprezentacji językowej dziedziny wiedzy::=
< wyrażenia - nazwy reprezentujące pojęcia oraz
zdania reprezentujące sądy dla danej dziedziny wiedzy,
relacja zawierania się wyrażeń,
funktory nazwotwórcze - operacje na wytworach,
funktory zdaniotwórcze – spójniki oraz kwantyfikatory,
wyróżnione wzorcowe nazwy i zdania >.
Wzory budowy wyrażeń reprezentacji językowej
przedstawimy w podrozdziale dotyczącym formalizacji.
dziedziny
wiedzy
System rzeczywistości wirtualnej ::= < wytwory systemu multimedialnego
– komponenty, kompozycje,
relacja zawierania się wytworów,
walory (cechy) wytworów,
konstrukcje - operacje na wytworach,
reguły kompozycji (wirtualne powiązania)
- relacje pomiędzy wytworami,
elementarne wytwory
- elementarne komponenty i kompozycje>.
Dziedzina wiedzy (rzeczywistość poznawcza), rzeczywistość wirtualna
oraz kontekst sytuacyjny realizowane są w systemach iteracyjnych, tj. w
interaktywnych systemach komunikowania się. Na dziedzinę wiedzy
(rzeczywistość poznawczą) składa się mnogość powiązanych ze sobą rzeczy przedmiotów, tj. tego na co skierowana jest aktywność poznającego podmiotu.
Człowiek jako podmiot poznający rzeczy, uczestnicząc w systemach
iteracyjnych wykonuje operacje na przedmiotach, rozpoznaje ich cechy i
uaktywnia zachodzenie relacji pomiędzy przedmiotami w taki sposób, że
poznanie pewnych wzorcowych, elementarnych przedmiotów umożliwia mu
identyfikację jako takich a nie innych pozostałych przedmiotów,
pośredniczących, czy też biorących udział w komunikacji pomiędzy
człowiekiem a człowiekiem oraz człowiekiem a przyrodą.
W systemie multimedialnym wytwarzane są różnorakie rzeczy – wytwory
systemu multimedialnego. Wzajemne powiązania tych wytworów składają się
na rzeczywistość wirtualną. Te, które powstają z innych w wyniku łączenia
elementarnych wytworów za pomocą konstrukcji nazywamy poprawnie
zbudowanymi lub konstruktami. Jeśli wchodzą w wirtualne powiązania za
pomocą reguł kompozycji, nazywamy je kompozycjami. Te wytwory do
których stosuje się konstrukcje, a które nie są kompozycjami nazywamy
komponentami. Konstruowanie jest to powstawanie wytworów z innych
wytworów poprzez zastosowanie do nich konstrukcji, natomiast komponowanie
to wyróżnienie za pomocą reguł kompozycji tych z pośród skonstruowanych
wytworów, do których stosują się te reguły. Ciąg faz konstruowania lub
komponowania danego wytworu nazywamy scenariuszem powstania tego
wytworu. Zbiór wszystkich wytworów zawartych w danym wytworze wraz z
relacją zawierania nazywamy budową tego wytworu. Wytwory są jednakowo
zbudowane, gdy ich budowy są izomorficzne, a jeśli są dodatkowo jednakowo
skonstruowane to są równokształtne. Ponadto, gdy części wytworów mają te
same walory i są jednakowo skomponowane, to są nierozróżnialne.
Równokształtność wytworów jest rozpoznawana przez mechanizmy systemu
multimedialnego, nie zależy więc od kontekstu sytuacyjnego. Do wytworów
poprawnie zbudowanych w systemie multimedialnym stosuje się zasadę
kompozycyjności, która głosi, że
KMPZ1. każdy wytwór, który powstał z danego komponentu przez
zastosowanie konstrukcji zmieniającej tylko walory tego komponentu jest
komponentem równokształtnym z nim,
KMPZ2. każde dwa jednakowo zbudowane komponenty, których wszystkie
odpowiadające sobie części mają te same walory, są równokształtne,
KMPZ3. jeżeli dwie kompozycje są równokształtne, to odpowiadające sobie
w tej równokształtności kompozycje w nich zawarte podlegają tym samym
regułom kompozycji, tj. są jednakowo skomponowane.
Do najprostszych systemów multimedialnych należą systemy powstałe w
bezpośrednim korzystaniu przez człowieka ze środka informatycznego. Ale
nawet w tak prostych przypadkach kontekst sytuacyjny, w którym
reprezentowana jest wiedza jest wynikiem stosunkowo złożonego
programowaniu multimedialnym, tj. projektowania środka informatycznego w
taki sposób, aby wyznaczone przez implementację algorytmu, określającego
korzystanie z tego środka, monitorowanie wyników realizacji algorytmu było
zgodne z rzeczywistością poznawczą. Wtedy, scenariusz jest reprezentacją
algorytmu w rzeczywistości wirtualnej. W szczególności, dla systemów
multimedialnych określonych przez języki programowania scenariuszami są
programy. Zwróćmy tu od razu uwagę na to, że w szerszym rozumieniu
scenariusze są reprezentacjami procedur realizowanych w rzeczywistości
wirtualnej, a procedury przetwarzania informacji za pomocą środków
informatycznych są algorytmami (gdzie procedury są wzorami czy schematami
zachowań obiektów, np. ciągi instrukcji wykonywanych przez człowieka lub
maszynę).
Przykład
Rozważmy zadanie: należy odmierzyć 4 l wody dwoma naczyniami – 5 l i 3 l.
Określmy system multimedialny wykorzystujący edytor grafiki (np. POWER
POINT) w ramach którego może być obrazowane wykonanie tego zadania.
Dziedzina wiedzy (system rzeczywistości poznawczej):
1. zbiór poznawanych przedmiotów – naczynia z wodą, naczynia, porcje wody
w naczyniach,
2. relacja zawierania się przedmiotów – w naczyniu z wodą zawiera się
naczynie oraz woda, w tym samym naczyniu z większą ilością wody zawiera
się to naczynie z mniejszą ilością, mniejsza ilość wody zawiera się w
większej ilości wody, przedmioty zawierają się w sobie,
3. poznawalne cechy przedmiotów - bycie naczyniem 0l (garnkiem lub
dzbankiem), lub garnkiem 5l, lub dzbankiem 3l,
4. operacje na przedmiotach - operacja przelewania całej znajdującej się
wody w większym naczyniu do mniejszego, podobnie operacja przelewania
całej wody z mniejszego naczynia do większego, operacja dopełniania
mniejszego naczynia wodą z większego naczynia, operacja dopełniania
większego naczynia woda z mniejszego naczynia, wylewanie całej wody z
naczyń, napełnianie wodą pustych naczyń,
5. relacje pomiędzy przedmiotami – warunek dopełniania jednego naczynia
wodą z drugiego naczynia, tj. w drugim naczyniu musi być wystarczająca
ilość wody do wypełnienia pierwszego naczynia, podobnie warunek
przelewania całej wody z jednego naczynia do drugiego, tj. w naczyniu do
którego przelewa się wodę musi być wystarczająco miejsca,
6. wyróżnione elementarne przedmioty – puste naczynia, 5l wody, 3l wody.
Kontekst – ilustrowanie treści zadania oraz reprezentowanie rzeczywistości
poznawczej za pomocą edytora grafiki.
System rzeczywistości wirtualnej:
1. wytwory systemu multimedialnego – komponenty, kompozycje – schematy
graficzne przedstawiające naczynia z wodą lub bez wody, prostokąty
reprezentujące litry wody (jeden prostokąt – jeden litr wody, rys. 1.1.1.3),
1 litr
1 litr
1 litr
1 litr
1 litr
1 litr
1 litr
2. relacja zawierania się wytworów – rysunki składają się z prostokątów
przedstawiających naczynia oraz prostokątów reprezentujących litry wody,
3. walory (cechy) wytworów – bycie większym niebieskim prostokątem, bycie
mniejszym niebieskim prostokątem,
4. konstrukcje - operacje na wytworach – skopiowanie szarego prostokąta tyle
razy, aby można było otrzymanymi w wyniku kopiowania prostokątami, po
ich odpowiednim przesunięciu, pokryć większy lub mniejszy niebieski
prostokąt, przenoszenie szarych prostokątów pokrywających niebieskie pola
z jednego pola do drugiego i układanie ich „jeden na drugim”, wypełnianie
wolnego pola, jednego z niebieskich prostokątów szarymi prostokątami
pokrywającymi pole drugiego prostokąta,
5. reguły kompozycji (wirtualne powiązania) - relacje pomiędzy wytworami –
warunki określające wykonanie wyżej opisanych operacji,
6. elementarne wytwory - elementarne komponenty i kompozycje – niebieskie
i szare prostokąty
Przykład
W edytorze grafiki scenariuszem wykonania zadania o odmierzaniu wody jest
ciąg rysunków
przedstawiających relacje wypełniania wodą naczyń i
wykonywane operacje na naczyniach (rys.).
Rys. Scenariusz wykonania zadania o odmierzaniu wody.Źródło: J. Kotyczka,
Programowanie logiczne w rozwiązywaniu zadań na poziomie szkolnym, Praca
Magisterska, Instytut Matematyki i Informatyki, Uniwersytet Opolski, Opole 2003.
JĘZYK IKONICZNY - KOMPONOWANIE OBRAZÓW.
Oglądając płótna obrazów nieraz zauważamy, że to co na nich „widać” zależy
od sposobu patrzenia, tj. od tego jak tworzymy te obrazy w umyśle. A więc, to
co przedstawia obraz (obraz jako tekst) zależy od tego z czego go
wyprowadzamy (zależy od zbioru faz wyprowadzenia tekstu-obrazu). Dobrze
ilustruje to Rys.1, pokazujący fazy tworzenia w umyśle obrazu ukazanego na
Rys.2. Na Rys.3 widzimy raz kształt kielicha, a raz dwie twarze zwrócone ku
sobie, w zależności od tego z jakich części tworzymy w umyśle rysunek. Na
Rys.4 widzimy zaś raz młodą kobietę, a raz starą. Podobnie ma się sprawa z
walorami np. z „bliżej czegoś” , „dalej czegoś”, gdy oglądając ikonę
przedstawiającą kąt zastosujemy do wierzchołka tego kąta konstrukt „bycia
bliżej”, to wyda on się nam bliżej, a gdy zastosujemy konstrukt „bycia dalej”, to
wyda się on dalej.
Rys.1
Rys.3
Rys.2
Rys.4
Powyższe przykłady
(źródło: [Lindsay, Norman]; [Szewczuk]) dobrze
motywują przyjęcie następujących definicji ikony i obrazu.
Definicja 2.1
A. Ikoną nazywamy uporządkowaną parę składającą się z tekstu należącego
do pewnej dziedziny konstruktu lub do zbioru jego wartości i scenariusza tego
tekstu (zbioru wszystkich faz wyprowadzenia tego tekstu). Pierwszy element
ikony nazywamy tekstem ikony, a elementy scenariusza fazami ikony.
B. Obrazem nazywamy uporządkowaną parę, której pierwszy element jest
tekstem będącym domknięciem swojego wyprowadzenia ze względu na wiązania
i walory tekstów, a drugi element jest scenariuszem tego tekstu (zbioru
wszystkich faz wyprowadzenia tego tekstu). Pierwszy element obrazu nazywamy
tekstem obrazu, a elementy scenariusza - fazami obrazu).
Rozważmy monitor, za pomocą którego obrazowane są realizacje procesów.
Niech system tekstowy tego monitora tworzy schematy realizacji procesów. Do
zbioru tekstów bazowych systemu tekstowego należą następujące obrazy: koło z
dużą literą B będące obrazem rozpoczęcia realizacji procesu (begin), koło z
dużą literą E będące obrazem zakończenia realizacji procesu (end), dowolne
linie zakończone strzałką będące obrazem drogi realizacji procesu, dowolne
linie rozgałęzione zakończone strzałkami („widły”) obrazujące alternatywne
drogi realizacji procesów, dowolne schodzące się linie zakończone strzałką
(„drzewa”) obrazujące połączenie alternatywnych dróg realizacji procesów.
Tekstem bazowym jest także tło, które jest częścią tylko samego siebie. Zbiorami
walorów są tu poszczególne wymienione typy obrazów bazowych, a reguły
tworzenia obrazu ilustrują poniższe przykładowe diagramy.
1. Zbiór tekstów bazowych
{
B
, E ,
,
,
, tło
2. Relacje budowania tekstów
tło
R0 :
B
E ,
B
E
R1 :
}
,
R2 :
R3 :
,
R4 :
gdzie,
R5 :
jest dowolnym obrazem
gdzie ukośna strzałka => oznacza zamianę wziętych w klamrę fragmentów
diagramu.
4. Wyprowadzenie obrazu A
Nr
fazy
Faza
Relacja
α1.
α2.
R2,α1
α3.
R3,α2,α1
α4.
R4,α3,α1
A=<
α4, { α1 , α2 , α3 , α4 } >
Formalizacja reprezentacji językowej dziedzin
formalnym języku logiki pierwszego rzędu
wiedzy
w
Dziedzinę wiedzy można reprezentować w języku naturalnym lub
sztucznym. Grupa osób przekazujących wiedzę z tej dziedziny za pomocą
wyrażeń języka ustala zazwyczaj konkretny język dla takiej komunikacji –
język danej dziedziny wiedzy (np., język elektroniki, język teorii mnogości,
logiki pierwszego rzędu, itp.). Dla każdego języka dziedziny wiedzy można
otrzymać nowe dziedziny wiedzy – dziedziny wiedzy o formułach - ogólnych
schematach budowy wyrażeń tego języka oraz o wartościach logicznych -
odniesieniach tych formuł do reprezentowanej przez wyrażenia wiedzy.
Otrzymana dziedzina wiedzy nazywana jest dziedzina wiedzy logicznej, a
reprezentacja symboliczna wiedzy logicznej nazywana jest formalizacją języka
dziedziny wiedzy.
Opis metody formalizacji tekstów języka dziedziny wiedzy ograniczymy do
metody formalizacji zdań, które może zawierać tylko nazwy, funktory
nazwotwórcze oraz funktory zdaniotwórcze. Zaczynamy od wyróżnienia w
wybranym zdaniu następujących jego składników:
1) zaimki nieokreślone: „ktoś”, „coś”, „jakiś”, itp., oznaczające dowolnie
ustalony przedmiot,
2) nazwy indywidualne, oznaczające indywidua, np. „ten człowiek”, „to
dziecko”, „miasto Warszawa”, „to co jest aktualnie liczone”, „człowiek,
o którym jest tu mowa”, „przedmiot, który mamy na uwadze”, „dowolnie
ustalony na czas rozważań przedmiot”, itp.
3) nazwy proste, które nie są tworzone z innych nazw, np. „dom”, „liczba”
4) funktory nazwotwórcze tworzące z nazw (zaimków) nowe nazwy
(zaimki), oznaczające operacje na nazwach i złożenia tych operacji,
5) nazwy złożone, zbudowane z nazw prostych za pomocą funktorów
nazwotwórczych, np. „wielki, biały stół”
6) zaimki złożone: „coś białego”, „jakaś liczba”, itp.
7) funktory zdaniotwórcze: zwroty typu „każde ... jest ...”, „...biegnie”,
itp. oraz spójniki zdaniowe „nieprawda, że...”, „...i...”, „...lub...”,
„jeżeli..., to...”, „...wtedy i tylko wtedy...”, a także zwroty kwantyfikujące
„każdy...spełnia warunek....”, „pewien... spełnia warunek...”, „
...identyczne z...”,
8) wyrażenia zdaniowe, które zbudowane są z wyróżnionych nazw za
pomocą wyróżnionych funktorów i te wyrażenia, które dają się tak
przeformułować, aby były zbudowane z wyróżnionych nazw i funktorów.
Następnie budujemy schematy (wzory, diagramy, tabele, itp. )1 wyróżnionych
wyrażeń zdaniowych języka danej dziedziny wiedzy tak, aby każdemu takiemu
schematowi, oddzielnie, odpowiadało jakieś wyrażenie tego języka. W
standardowej notacji logiki pierwszego rzędu formalizację możemy tego
dokonać następująco:
1) zmienne: x1, x2, x3, ... , reprezentują zaimki nieokreślone, np. wyrażenie
zdaniowe
„każdego dnia ktoś biegnie jakąś aleją parku jakiegoś miasta”
1
Należy zauważyć, że współcześnie formalizacji dokonuje się także np. w języku diagramów, tj. sieci
semantycznych i przestrzeni rozwiązań, posiadających strukturę grafów skierowanych. Por. R. Kowalski, Logika
w rozwiązywaniu zadań, Warszawa 1989, s. 33.
jest równoznaczne
„każdego dnia człowiek jakiś biegnie aleją parku jakąś miasta jakiegoś.”
a po zamianie zaimków na zmienne
„każdego dnia człowiek x1 biegnie aleją parku x2 miasta x3.”
2) stale: c1, c2, c3, ... , reprezentują nazwy indywidualne, np. wyrażenie
zdaniowe
„jakiś człowiek mieszka w mieście Warszawa”
c1
człowiek x1 mieszka w c1
3) dziedziny deklarowane (typy zmiennych): D1, D2, D3, ... , oznaczają
zakresy nazw prostych oraz zarazem używane są jako predykaty
jednoargumentowe w wyrażeniach postaci Di(xj), reprezentują więc nazwy
proste,
„każdego dnia człowiek biegnie w mieście”
D1
D2
D3
4) symbole funkcyjne: f11, f21, f31, ... , f1k, f2k, f3k, ... , reprezentują funktory
nazwotwórcze jeden, ..., k-argumentowe, ... , np.
człowiek x1 mieszka w c1
f11( x1 )
5) termy: niech t1, t2, t3, ..., reprezentują dowolne zaimki (proste i złożone) –
zmienne i stałe są termami, jeśli t1, t2, t3, ...,tk są termami, a fnk jest symbolem
funkcyjnym, to fnk(t1, t2, t3, ...,tk) jest termem, np. schemat w punkcie 4) jest
termem powstałym z symbolu funkcyjnego f12, termu f11(x1) oraz stałej c1
6) dziedziny: niech H1, H2, H3, ... oznaczają zakresy dowolnie ustalonych nazw
( reprezentują dowolne nazwy); dziedzinami są dziedziny deklarowane (np.
standardowe) oraz jeśli H1, H2, H3, ... , Hk są dziedzinami, , a fnk jest
symbolem funkcyjnym, to obraz H = fnk(H1, H2, H3, ...,Hk) jest dziedziną
wyznaczoną przez ten symbol, np. jeżeli dziedzina D1 reprezentuje nazwę
„człowiek”, a dziedzina D2 – nazwę „miasto”, natomiast symbol funkcyjny
f12 reprezentuje zwrot „... mieszkający w ...”, to obraz f12(D1,D2) jest
dziedziną reprezentującą wyrażenie nazwowe „ człowiek mieszkający w
mieście” ; wprowadzamu umowę:
piszemy dla dowolnej dziedziny H, że H(t), gdy t reprezentuje obiekt z
zakresu H, wtedy
H(x) ⇔ ∃x1... ∃xk ( x = fnk(x1, x2, x3, ...,xk) ∧ H1(x1) ∧ H2(x2) ∧ H3(x3) ∧ ...
∧ Hk(xk))
7) predykaty: P11, P21, P31, ... , P1k, P2k, P3k, ... , reprezentują funktory
zdaniotwórcze, tworzące z nazw albo zaimków wyrażenia zdaniowe, jedno,
..., k-argumentowe, ..., np.
człowiek x1 mieszka w c1
P12(
f11( x1 ) ,
c1)
Przyjmujemy umowę, że
Pnk(H1, H2, H3, ...,Hk) =df
∀x1... ∀xk (Pnk(x1, x2, x3, ...,xk) ⇒ H1(x1) ∧ H2(x2) ∧ H3(x3) ∧ ... ∧ Hk(xk))
8) stałe logiczne: ¬, ∧, ∨, ⇒, ⇔, ∀, ∃, =, reprezentują odpowiednio
wymienione spójniki zdaniowe i zwroty kwantyfikujące oraz identyczność;
spójniki zdaniowe: ¬ - „nieprawda, że...”, ∧ - „...i...”, ∨ - „...lub...”, ⇒ „jeżeli..., to...”, ⇔ - „...wtedy i tylko wtedy...”, a także zwroty
kwantyfikujące: ∀ - „każdy...spełnia warunek....”, ∃ - „pewien... spełnia
warunek...”, oraz identyczność: = - „ ...identyczne z...”;
9) Znaki techniczne: nawiasy i przecinki – reprezentują obszar wiązania przez
funktory składników tekstu, np. jeśli w napisie „A ∨ B ∧ C” nie umieścimy
nawiasów (. ), to nie wiadomo czy napis ten jest schematem jakiegokolwiek
zdania, gdyż nie reprezentuje wiedzy o tym, które ze zdań jest tu połączone
spójnikiem „lub”, a które spójnikiem „i”, chyba, że wcześniej ustalimy
kolejność łączenia przez spójniki logiczne (tzw. siłę wiązania); napis
„(P11(c1) ∨
P11(x1)) ∧ P21(c2)” jest schematem jakiegoś wyrażenia
zdaniowego,
10)
formuły atomowe: niech t1, t2, t3, ...,tk , tn są termami, a Pnk jest
predykatem, wtedy Pnk(t1, t2, t3, ...,tk) jest formułą atomową,
11)
formuły: deklaracje dziedzin, deklaracje predykatów, formuły atomowe
są formułami, niech A, i B są formułami oraz t i h termami, wtedy
formułami są ¬ (A), ( A) ∧ (B) , (A) ∨ (B), (A) ⇒ (B), ⇔, ∀xk (A), ∃xk (A) ,
t = h,
Zasady schematyzacji
W formalizacji tekstów języka danej dziedziny wiedzy wykorzystuje się
także następujące zasady schematyzacji:
Schemat 1. Dowolna część wyrażenia języka, która odnosi się do tej samej
wiedzy ma ten sam schemat.
Schemat 2. Każda schematyzacja wyrażenia zdaniowego poprzedzona jest
deklaracjami dziedzin i predykatów reprezentujących odpowiednio nazwy i
funktory zdaniotwórcze wiążące te nazwy w danym wyrażeniu zdaniowym.
x2
x3
x4
P13
P13
Jeżeli jakaś osoba pożyczy coś drugiej osobie, a ta pożyczy to trzeciej, to trzecia osoba może
to zwrócić pierwszej
P23
x1
Dziedziny:
D1 – osoba,
D2 – przedmioty pożyczane/zwaracane,
Predykaty:
P13 - .... pożyczy ..., ...,
P23 - .... zwróci ..., ...,
Deklaracje:
P13 (D1, D2, D1) – deklaracja reprezentuje wiedzę o tym, że osoba pożycza
przedmiot, osobie,
P23 (D1, D2, D1) - deklaracja reprezentuje wiedzę o tym, że osoba zwraca
przedmiot, osobie,
Schemat przykładowego wyrażenia zdaniowego ma postać
P13 (D1, D2, D1) ∧ P23 (D1, D2, D1) ∧ ((P13 (x1, x2, x3) ∧ P13 (x3, x2, x4)) ⇒ P23 (x4, x2, x1))
Środowisko dziedzin
Formuła
Powyższa formuła jest równoważna formule
D1(x1) ∧ D2(x2) ∧ D1(x3) ∧ D1(x4) ⇒ ((P13 (x1, x2, x3) ∧ P13 (x3, x2, x4)) ⇒ P23
(x4, x2, x1))
Schemat 3 Schematyzując wyrażenie, te same nazwy i zaimki nie poprzedzone
bezpośrednio zwrotami kwantyfikującymi oznaczamy za pomocą tych samych
symboli zmiennych, a jeżeli poprzedzone są bezpośrednio wyrażeniami
kwantyfikującymi, oznaczamy je różnymi wcześniej nie występującymi
zmiennymi.
Schemat 4 Jeżeli w prostym wyrażeniu zdaniowym (nie zawierającym
spójników zdaniowych) nazwy poprzedzone są bezpośrednio zwrotami
kwantyfikującymi, to 1) zwroty kwantyfikujące wraz z nazwami zastępujemy
różnymi, wcześniej nie występującymi zmiennymi, a stosowne znaki
kwantyfikatorów wraz z odpowiadającymi im zmiennymi wypisujemy na
początku formuły zgodnie z porządkiem wykonywanej schematyzacji, 2)
kwantyfikatory wiążą zmienne ograniczone do dziedzin argumentów
predykatów; np.
Każdy matematyk jest uczniem pewnego matematyka
∀
x1
P12
f1 1
∃
x2
P12(D1, f11(D1)) ∧ ∀x1∃x2 P12(f11( x1), x2)
lub przy użyciu kwantyfikatorów o ograniczonym zasięgu
∀(x1|D1(x1)) ∃(x2|D1(x2)) P12(f11( x1), x2),
gdzie D1 jest dziedziną reprezentującą matematyków, a f11(D1) jest dziedziną
reprezentującą uczniów matematyków.
Kwantyfikatory o ograniczonym zasięgu definiujemy następująco:
∀(x|D(x)) A =df ∀x (D(x) ⇒ A),
∃(x|D(x)) A =df ∃x (D (x) ∧ A)
Można udowodnić, że formuły uzyskane przy określeniu środowiska dziedzin są
równoważne tym, które stosują kwantyfikatory o ograniczonym zasięgu.
Schemat 5 We wszystkich schematach, w których występują kwantyfikatory,
każdy kwantyfikator musi wiązać inną zmienna, np. formuła ∀x1 P11(x1) ∨ ∃ x1
P11(x1) nie może być poprawnym schematem, ale formuła ∀x1 P11(x1) ∨ ∃ x2
P11(x2) może nim być.
Można także zmienne odnoszące się do różnych dziedzin oznaczać w
różny sposób, np. w notacji teoriomnogościowej zbiory oznacza się dużymi
literami a ich elementy małymi.
Złożoność uzyskanych napisów w tych schematyzacjach jest jednak znacznie
większa niż w proponowanej wyżej metodzie uwzględniającej wypisywanie
środowiska dziedzin, dlatego też ta metoda schematyzacji przyjęła się w
programowaniu logicznym.
Reprezentacja dziedzin wiedzy w języku dziedziny matematycznej
Formalizację języka
wybranej dziedziny wiedzy można otrzymać bez
stosowania metody formalizacji wyrażeń tego języka. Dokonuje się tego
budując język formalny dla matematycznej struktury reprezentującej daną
dziedzinę wiedzy, o ile taka struktura jest jednoznacznie określona w języku
teorii mnogości. Strukturę tę nazywa się zazwyczaj strukturą relacyjną.
Określenie takiej struktury nie jest możliwe bezpośrednio, gdy w dziedzinie
wiedzy występują pojęcia niejasne, nieostre czy dające się rozważać jedynie
jako kolekcje obiektów lub listy tych obiektów z niedokładnie określonym ich
występowania na liście, np. klasa młodych ludzi, klasa kamieni będących
elementami kopców kamieni, czy klasa niemowląt wymienionych na listach
rodzących się niemowląt. Niekiedy brak teoriomnogościowej interpretacji omija
się budując struktury relacyjne w nieklasycznych teoriach zbiorów: zbiorów
rozmytych, zbiorów przybliżonych czy multizbiorów. Jednak wymienione teorie
wybiegają daleko poza podstawowy zakres wiedzy logicznej reprezentowanej
komputerowo i dlatego nie będą w naszym cyklu wykładów rozważane.
1.1.4.1 Pojęcie zbioru
Przez zbiór (mnogość) będziemy rozumieć taki obiekt, który jest dokładnie
określony wtedy i tylko wtedy, gdy znana jest wiedza o przynależności do niego
każdego obiektu będącego jego elementem. Np. zbiorami są: zbiór znaczków
pocztowych z pewnej kolekcji, zbiór poszczególnych książek w bibliotece, zbiór
wszystkich liczb naturalnych, zbiór wszystkich trójkątów równobocznych na
płaszczyźnie itd.. Ale zbiorami nie są np.: dana kolekcja znaczków pocztowych,
biblioteka, drzewo czy krzesło, gdyż wyróżnienie ich części, z których się
składają te całości nie jest wystarczające do ich identyfikacji. Aby
identyfikować np. krzesło potrzebna jest wiedza o tym, jak połączone są ze sobą
jego części.
Zauważmy, że obiekt, który jest dokładnie określony przez wiedzę o tym,
żaden obiekt nie jest jego elementem jest też zbiorem. Zbiór ten nazywamy
zbiorem pustym. Zbiorem pustym jest np. zbiór wszystkich liczb naturalnych
mniejszych od zera. Ale zbiorem pustym nie jest np. punkt płaszczyzny, gdyż
chociaż spełniony jest warunek, że żaden obiekt nie jest jego elementem, to
warunek ten nie jest wystarczający do uzyskania odpowiedzi na pytanie, czy
dany punkt jest tym samym zbiorem co drugi, ze względu na różność punktów
(brak jednoznaczności) w geometrii Euklidesa.
Wiedza o najogólniejszych własnościach zbiorów stała się w XX wieku
podstawowym składnikiem wiedzy matematycznej. Po raz pierwszy została ona
przedstawiona w postaci dziedziny naukowej przez George’a cantora w latach
1871-1883. Teoria tej dziedziny wiedzy, za twórcę której uważany jest E.
Zermelo, uzyskała nazwę teorii mnogości. Jej główny rozwój przypada na
pierwszą połowę XX wieku.
1.1.4.2 Język algebry zbiorów
Rozważmy język dowolnej dziedziny wiedzy, w którym można nadać nazwy
zarówno wszystkim zbiorom obiektów branych pod uwagę w tej dziedzinie
wiedzy (nazwy pojęć) jak i elementom tych zbiorów (także zaimki imienne).
Rozszerzamy ten język o następujące nazwy i operacje (o ile, nie występują one
wcześniej w tym języku):
zbiór pusty – nazwa zbioru, do którego nie należy żaden obiekt danej dziedziny
wiedzy; w standardowej notacji zbiór ten oznaczamy symbolem: ∅,
zbiór pełny (uniwersum) – nazwa zbioru wszystkich branych pod uwagę w
danej dziedzinie wiedzy obiektów, które nie są zbiorami; w standardowej notacji
zbiory tego typu oznaczamy symbolami: U, U1, U2, U3, … ,
nie występujące wcześniej w języku nazwy zbiorów, które możemy zadać za
pomocą następujących wzorów (schematów, procedur):
a) zbiór składający się z < wymienianie nazw obiektów, z których składa
się zbiór>
b) ogół takich obiektów, które < sformułowanie własności, którą spełniają
te obiekty>.
W notacji matematycznej zwrot a) zapisujemy zazwyczaj następująco:
a’)
{ <nazwa>, <nazwa>, …}.
Np. napis {1, 2, 3, 5} jest nazwą złożoną zbioru składającego się z
wymienionych liczb. Zwrot b) w notacji matematycznej ma postać:
b’)
{x: <warunek, który spełniają obiekty x>} lub
{x | <warunek, który spełniają obiekty x}.
Np. napis {x: x∈R ∧ x>0 } jest nazwą ogółu takich obiektów, które są liczbami
rzeczywistymi i są dodatnie.
Dokonując formalizacji języka dziedziny wiedzy o zbiorach do ich
reprezentacji będziemy stosowali duże litery: A, B, C, …, X, Y, Z.
Dalej do języka wprowadzimy pewne operacje (o ile wcześniej ich tam już
nie było). Operacje te wymieniamy poniżej nadając im od razu standardowe
wyjaśnienie oraz podając standardową notację.
Operacja sumy dwóch zbiorów zadana jest zwrotem:
(u)
suma <nazwa pierwszego zbioru> i <nazwa drugiego zbioru>;
suma A i B =df A ∪ B lub A + B;
suma dwóch zbiorów jest to zbiór wszystkich takich obiektów, które należą do
pierwszego lub do drugiego zbioru.
Operacja iloczynu dwóch zbiorów zadana jest zwrotem:
(v)
iloczyn <nazwa pierwszego zbioru> i <nazwa drugiego zbioru>;
iloczyn A i B =df A ∩ B lub A • B;
iloczyn dwóch zbiorów jest to zbiór wszystkich takich obiektów, które należą do
pierwszego i do drugiego zbioru jednocześnie.
Operacja różnicy dwóch zbiorów zadana jest zwrotem:
(w)
różnica <nazwa pierwszego zbioru> i <nazwa drugiego zbioru>;
różnica A i B =df A / B lub A - B;
różnica dwóch zbiorów jest to zbiór wszystkich takich obiektów, które należą do
pierwszego zbioru a nie należną do drugiego zbioru.
Operacja dopełnienia zbioru zadana jest zwrotem:
(x)
dopełnienie <nazwa pierwszego zbioru>;
dopełnienie A =df A’ lub U / A;
dopełnienie danego zbioru jest to zbiór wszystkich takich obiektów, które należą
do zbioru pełnego a nie należą do danego zbioru.
Do języka dziedziny wiedzy wprowadzimy (o ile wcześniej tam ich nie
ma) trzy predykaty (nazwy relacji). Pierwszy z nich to predykat przynależności
zadany wzorem:
<nazwa tylko jednego obiektu ze zbioru pełnego> jest elementem < nazwa
zbioru obiektów ze zbioru pełnego>.
Zauważmy, że zwrot ten jest najczęściej równoznaczny ze zwrotami:
(1) <nazwa tylko jednego obiektu> jest <nazwa obiektów, których ogół
tworzy zbiór>,
(2) <nazwa tylko jednego obiektu> jest jednym(ą) spośród <nazwa w
liczbie mnogiej, która jest nazwą zbioru obiektów tego samego typu>,
(3) <nazwa tylko jednego obiektu> należy do <nazwa zbioru obiektów>.
Np. zdanie „Liczba jeden jest liczbą naturalną” jest równoznaczne ze zdaniem
„Liczba jeden jest elementem zbioru liczb naturalnych” i ze zdaniem „Liczba
jeden jest jedną spośród liczb ze zbioru liczb naturalnych” i ze zdaniem „Liczba
jeden należy do zbioru liczb naturalnych”. W notacji matematycznej zamiast „x
jest elementem A” piszemy: x∈A.
Drugi predykat, który wprowadzamy do danego języka dziedziny wiedzy
to predykat zawierania się zbiorów zadany wzorem:
<nazwa pierwszego zbioru> zawiera się w <nazwa drugiego zbioru> lub
<nazwa drugiego zbioru> zwiera <nazwa pierwszego zbioru>;
A zawiera się w B =df A ⊆ B lub A ⊂ B.
Zbiór pierwszy zawiera się drugim wtedy i tylko wtedy, gdy każdy element
pierwszego zbioru jest elementem drugiego zbioru.
Zwróćmy uwagę na to, że zwrot ten jest równoznaczny ze zwrotami:
(1) <nazwa pierwszego zbioru> jest zawarty w < nazwa drugiego zbioru>,
(2) <nazwa pierwszego zbioru> jest częścią <nazwa drugiego zbioru>,
(3) <nazwa pierwszego zbioru> jest podzbiorem <nazwa drugiego zbioru>,
(4) <nazwa pierwszego zbioru> jest < nazwa obiektów, których ogół jest
zbiorem>.
Np. zgodnie ze zwrotem (4) zbudowane jest zdanie „Człowiek jest istotą
rozumną”. Zdanie to jest równoznaczne zdaniu „Zbiór wszystkich ludzi zawiera
się w zbiorze istot rozumnych”.
Do język dziedziny wiedzy wprowadzimy też, o ile wcześniej tam go nie
było, dodatkowo predykat identyczności (równości) zbiorów. Będziemy go tu
rozumieć następująco: zbiór pierwszy to tyle samo co zbiór drugi (jest równy
drugiemu), gdy każdy obiekt jest elementem zbioru pierwszego wtedy i tylko
wtedy, gdy jest elementem zbioru drugiego.
Predykat identyczności dla zbiorów będzie oczywiście równoznaczny z
następującymi zwrotami:
(5) <nazwa pierwszego zbioru> to tyle samo co <nazwa drugiego zbioru>,
gdzie zastosowano ogólny schemat dla identyczności
<schemat pierwszej nazwy > = <schemat drugiej nazwy>,
(6) <nazwa pierwszego zbioru> jest identyczny z <nazwa drugiego zbioru>,
(7) <nazwa pierwszego zbioru> i <nazwa drugiego zbioru> są identyczne,
(8) <nazwa pierwszego zbioru> jest równy <nazwa drugiego zbioru>,
(9) <nazwa pierwszego zbioru> i <nazwa drugiego zbioru> są równe,
(10)
<nazwa pierwszego zbioru> jest <nazwa drugiego zbioru>,
(11)
<nazwa pierwszego zbioru> i <nazwa drugiego zbioru> są takie
same.
W rozważanym języku wyróżnimy teraz tylko te wyrażenia zdaniowe, które
dają się zbudować z
a) nazw zbiorów,
b) nazw ich elementów,
c) operacji: sumy dwóch zbiorów, iloczynu dwóch zbiorów, różnicy
dwóch zbiorów i dopełnienia zbioru,
d) predykatów: przynależności, zawierania się zbiorów i identyczności
zbiorów,
e) stałych logicznych: spójników i kwantyfikatorów.
Przyjmując wprowadzone schematy reprezentacji wiedzy o zbiorach i
standardową notację, otrzymujemy w ten sposób sformalizowany język tej
dziedziny wiedzy zwany językiem algebry zbiorów.
1.1.4.3 Wielosortowe struktury relacyjne
Rozszerzając język algebry zbiorów o symbole reprezentujące zbiory, zwane
rodzinami, których elementami mogą być zbiory, symbole uporządkowanych
wieloelementowych układów, produktów kartezjańskich oraz relacji i funkcji,
otrzymujemy język teorii mnogości. Zwróćmy najpierw uwagę na następujące
oznaczenia:
Układ uporządkowany (krotka)
<x1,x2> =df {{x1}, {x1, x2}},
<x1, x2, … xn, xn+1> =df <<x1, x2, … xn>, xn+1>,
Produkt (Iloczyn) kartezjański zbiorów
<x1, x2, … xn> ∈ A1×A2× … ×An = x1∈A1 ∧ x2∈A2 ∧… ∧ xn∈An.
n-argumentowa relacja R
R ⊆ A1×A2× … ×An i R≠∅.
n-argumentowa operacja lub funkcja f
f ⊆ A1×A2× … ×An+1 i f≠∅ oraz
gdy <x1, x2, … xn, y> ∈ f i <x1, x2, … xn, y’> ∈ f, to y = y’ .
Piszemy: y = f(x1, x2, … xn).
Niech U jest rodziną zbiorów pełnych (uniwersów), Rel jest rodziną relacji
określonych na produktach kartezjańskich niektórych z tych zbiorów pełnych,
Fun jest rodziną funkcji określonych na niektórych z tych zbiorów pełnych,
ponadto U0 jest zbiorem wyróżnionych elementów zbiorów pełnych, wtedy
czwórkę < U, Rel, Fun, U0> nazywamy wielosortową strukturą relacyjną.
Gdy jest tylko jeden zbiór pełny (uniwersum) to tę strukturę będziemy nazywać
krótko struktura relacyjną. Np. takie dziedziny wiedzy jak arytmetyka, czy
dziedziny wiedzy o algebrach są w matematyce określane jako struktury
relacyjne i zwane modelami dla teorii pierwszego rzędu (o modelach teorii
będziemy mówić na innych wykładach).
Uwaga: każdą wielosortową strukturę relacyjną możemy przekształcić w
strukturę relacyjną (jednosortową), sumując mnogościowo zbiory pełne
(uniwersa); zapis struktur wielosortowych stosujemy dlatego, że jest w
określeniu wielu dziedzin wiedzy bardziej precyzyjny niż znany w matematyce
zwykły zapis struktur relacyjnych. Ponadto: każda wielosortowa struktura
relacyjna jest dziedziną wiedzy, w której rodzina U jest zbiorem pojęć.
Przykładową wielosortową strukturą relacyjną jest dziedzina wiedzy dla zadania
1.1.1.1 o przelewaniu wody (patrz tablica decyzyjna 1.1.1.1):
U1 = {0, 1, 2, 3, 4, 5},
U2 = {0, 1, 2, 3},
R1 = {<x,y>∈U1×U2 : x≤5, y≤3} = U1×U2,
R2 = {<x,y>∈U1×U2 : x + y≤5},
R3 = {<x,y>∈U1×U2 : x + y≤3},
R4 = {<x,y>∈U1×U2: gdy po ciągu operacjach przelewania wody począwszy
od sytuacji S(0,0) następuje sytuacja S(x, y)},
f1 = {<x,y>∈U1×U1 : x=y},
f2 = {<x,y>∈U2×U2 : x=y},
f3 = {<u, v, y>∈ U1×U2×U2 : u + v = y i u + v ≤3},
f4 = {<u, v, x>∈ U1×U2×U1 : u + v = x i u + v ≤5},
f5 = {<u, v, y>∈ U1×U2×U2 : u + v – 5 = y},
f6 = {<u, v, x>∈ U1×U2×U1 : u + v – 3 = x},
U0 = {0, 3, 5}.
„Świat odmierzania wody” ma następującą wielosortową (dwusortową)
strukturę relacyjną:
<{U1, U2}, {R1, R2, R3, R4}. {f1, f2, f3, f4, f5, f6}, U0> .
Jeżeli należenie liczby x do uniwersów opiszemy odpowiednio wyrażeniami
D1(x) i D2(x), a poszczególne relacje oznaczymy symbolami predykatów
dwuargumentowych P12, P22, P32 oraz P42, funkcjom natomiast nadamy
oznaczenia symboli funkcyjnych: f11, f21, f32, f42, f52, f62, ponadto liczby ze
zbioru U0 oznaczymy symbolami c1, c2, c3, wtedy używając symboli spójników i
kwantyfikatorów, będziemy mogli napisać dowolną formalizację zdania,
którego elementarne składniki: nazwy, funktory nazwotwórcze i zdaniotwórcze
oraz wyróżnione nazwy indywidualne, reprezentują podstawowe składniki
wiedzy określonej przez powyższą wielosortową
strukturą relacyjną.
Otrzymujemy w ten sposób zbiór formuł rachunku kwantyfikatorów w notacji
standardowej, podanej wcześniej. W formalizacji możemy także stosować w
zapisie predykatów notację znaną w matematyce.
Np. formuły:
(w notacji rachunku kwantyfikatorów)
∀x1∀x2(D1(x1) ∧ D2(x2) ⇒ P12(x1,x2)),
∀x1∀x2 (P32(x1,x2) ⇒ P42(c1,f32(x1,x2))),
(w notacji dziedzin matematycznych)
∀x∀y(x∈ {0,1,2,3,4,5} ∧ y∈ {0,1 2.3}⇒ x≤5 ∧ y≤3),
(*)
∀x∀y (S(x,y) ∧ x + y ≤3 ⇒ S(0, x + y)),
są prawdziwe w opisanej strukturze relacyjnej. Pierwsza formuła głosi, że w
naczyniach mieszczą się jedynie takie ilości wody, które należą do uniwersów.
Druga głosi jedną z reguł przelewania wody, że jeśli suma ilości wody w
naczyniach nie przekracza trzech litrów, to można tak przelewać wodę z
pierwszego naczynia do drugiego (operacja f3), że w pierwszym naczyniu
otrzymamy 0 l wody (c1), a w drugim sumę litrów wody (f32(x1,x2) ).
Zauważmy, że wszystkie reguły wymienione w Tab. 1.1.1.1 można uzasadnić
formułami podobnymi do formuły (*), a ponadto stosować je jako reguły
służące do wyprowadzania innych formuł. W ten sposób wyprowadzenie stany
S(4,0) rozwiązania zadania o odmierzaniu wody może wyglądać następująco:
1.
2.
3.
4.
5.
6.
7.
8.
9.
S(0,0)
zał.
S(0,3)
reguła R1, operacja O1
S(3,0)
reguła R2, operacja O6
S(3,3)
reguła R1, operacja O1
S(5,1)
reguła R1, operacja O7
S(0,1)
reguła R1, operacja O3
S(1,0)
reguła R1, operacja O7
S(1,3)
reguła R1, operacja O1
S(4,0)
reguła R1, operacja O7
Co kończy wyprowadzenie S(4,0)
Analogiczną jak dla „Świata odmierzania wody” metodę formalizacji
możemy zastosować metodę formalizacji dla dowolnej struktury relacyjnej. Tak
prowadzona formalizacja daje język sformalizowany dla danej struktury
relacyjnej.
Reprezentowanie wiedzy o wartościach logicznych zdań – tabele
prawdziwościowe
Dotąd rozważaliśmy schematy zdań będące reprezentacjami wiedzy o
tym, w jaki sposób zdania złożone są zbudowane ze zdań prostych. Nie
interesowało nas, czy zdanie reprezentuje wiedzę o pewnym stanie rzeczy, czy
też nie, tzn., czy zdanie to jest prawdziwe w pewnej dziedzinie wiedzy (ma
wartość logiczną prawdy), czy nie (ma wartość logiczną fałszu). Nie była też
brana pod uwagę wiedza o tym, jaka jest zależność pomiędzy wartością logiczną
zdania złożonego utworzonego przy pomocy spójników ze zdań prostych a
wartościami logicznymi tych zdań.
Aby móc reprezentować tego rodzaju wiedzę, wartości prawdy i fałszu
oznaczymy, odpowiednio, symbolami 1 i 0.
W reprezentacji standardowej, będącej wynikiem formalizacji, wiedza o
zasadach określania wartości logicznej zdań złożonych jest zazwyczaj
przedstawiana za pomocą tabel prawdziwościowych , budowanych dla
schematów tych zdań. Tabele prawdziwościowe dla formuł są wzorami, według
których określamy wartość logiczną zdania złożonego w zależności od wartości
zdań składowych:
A
0
0
1
1
B
0
1
0
1
¬A
1
1
0
0
A∨B
0
1
1
1
A∧B
0
0
0
1
A⇒B
1
1
0
1
A⇔B
1
0
0
1
Tab. 1
Formuły, które są schematami tylko zadań prawdziwych nazywamy
tautologiami, a takie, które są schematami tylko zdań fałszywych nazywamy
kontrtautologiami.
To czy formuła jest tautologią czy nie możemy sprawdzić korzystając z
tabel prawdziwościowych. Np. każda formuła postaci (A ∧ (B ∨ C)) ⇒ (¬C ⇒
A) jest tautologią, gdyż na podstawie tabel prawdziwościowych można
wykazać, że przy dowolnych wartościach logicznych składowych A, B, C
formuła reprezentuje zadanie prawdziwe (Tab. 2)
Zauważmy, że na podstawie tabel prawdziwościowych dla spójników
zdaniowych dysponujemy następującą wiedzą:
• formuła ¬A jest tautologią, gdy dowolne zdanie o schemacie A jest
fałszywe, co oznacza, że A jest kontrtautologią,
• formuła A ∨ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ∨ B
co najmniej jedno ze zdań o schematach A, B jest prawdziwe, w
szczególności, gdy jedna z formuł A lub B jest tautologią,
• formuła A ∧ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ∧ B
oba zdania schematach A, B są prawdziwe, w szczególności, gdy obie
formuły A i B są tautologiami,
• formuła A ⇒ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ⇒
B, jeżeli zdanie o schemacie A jest prawdziwe, to zdanie o schemacie B jest
prawdziwe, w szczególności, jeżeli formuła A jest tautologią, to B jest też
tautologią,
• formuła A ⇔ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ⇔ B
oba zdania o schematach A, B mają tę samą wartość logiczną, w
szczególności, gdy obie formuły A i B są tautologiami lub kontrtautologiami,
A
B
C
B∨C
0
1
0
1
0
1
0
1
0
0
1
1
0
0
1
1
0
0
0
0
1
1
1
1
0
0
1
1
1
1
1
1
¬C A ∧ (B ∨ C
1
1
1
1
0
0
0
0
0
0
0
1
0
1
0
1
¬C ⇒
A
0
1
0
1
1
1
1
1
(A ∧ (B ∨ C)) ⇒ (¬C
⇒ A)
1
1
1
1
1
1
1
1
Tab. 2
Rozważmy teraz formuły poprzedzone kwantyfikatorami. Niech A(x) jest
dowolną formułą, w której x jest jedyną zmienną wolną. Oznaczmy zbiór
wszystkich zdań, których schematem jest ta formuła przez P, gdy wszystkie
zdnia tego zbioru są prawdziwe, przez F, gdy są fałszywe, a przez T, gdy
niektóre zdania tego zbioru są prawdziwe, a niektóre fałszywe. Wiedzę o
wartościach logicznych zdań, których schematem jest formuła ∀xA(x) lub
formuła ∃xA(x) reprezentuje tabela
A(x)
∀xA(x)
∃xA(x)
P
1
1
F
0
0
T
0
1
Tab. 3
Wiedzę reprezentowaną przez powyższą tabelę możemy też sformułować
następująco:
• jeżeli formuła ∀xA(x) jest schematem zdania prawdziwego, to formuła A(x)
jest schematem zdań wśród których każde zdanie jest prawdzie, np. zdanie o
schemacie A(c), gdzie wybór termu c nie zależy od formuły A(x), a jedynie
od dziedziny argumentu x, jest więc dowolny,
• jeżeli formuła ∃xA(x) jest schematem zdania prawdziwego, to formuła A(x)
jest schematem zdań wśród których co najmniej jedno zdanie jest prawdzie,
np. zdanie o schemacie A(c), gdzie wybór termu c zależy od formuły A(x) i
od dziedziny argumentu x, a więc może być dokonany tylko raz podczas
formalizacji tekstu,
• jeżeli formuła ¬∀xA(x) jest schematem zdania prawdziwego, to formuła
¬A(x) jest schematem zdań wśród których co najmniej jedno zdanie jest
prawdzie, np. zdanie o schemacie ¬A(c), gdzie wybór termu c zależy od
formuły A(x) i od dziedziny argumentu x, a więc może być dokonany tylko
raz podczas formalizacji tekstu,
• jeżeli formuła ¬∃xA(x) jest schematem zdania prawdziwego, to formuła
¬A(x) jest schematem zdań wśród których każde zdanie jest prawdzie, np.
zdanie o schemacie ¬A(c), gdzie wybór termu c nie zależy od formuły A(x),
a jedynie od dziedziny argumentu x, jest więc dowolny,
Wykorzystując powyższą wiedzę, sprawdzanie czy schemat danego zdania jest
tautologią można dokonywać na dwa sposoby:
1. zbadać, czy wartość logiczna prawdziwego zdania złożonego o danym
schemacie nie zależy od wartości logicznej zdań składowych – jest
sprawdzanie wprost,
2. zbadać, czy założenie, że zdanie złożone o danym schemacie ma wartość
logiczną fałszu, może prowadzić do sytuacji, w której zdanie przyjmuje dwie
różne wartości logiczne czy też, w której pewne zdanie i jego negacja są
jednocześnie prawdziwe lub jednocześnie fałszywe, tzn. zachodzi
sprzeczność – jest to sprawdzanie nie wprost.
Zauważmy, że sprawdzanie tautologiczności bazuje na wnioskowaniu, a opisane
zasady sprawdzania można precyzyjniej przedstawić w postaci następujących
schematów:
(NN)
(K)
¬¬A
A
A∧ B
A
(NK)
¬( A ∧ B)
¬A | ¬B
(A)
A∨ B
A| B
(C)
¬( A ∨ B )
¬A
(NA)
A⇒ B
¬A | B
(NC)
¬( A ⇒ B)
A
¬B
(EX)
∃xA( x)
A(c)
(NEX)
(ALL)
∀xA( x)
A(c)
(NALL)
¬∃xA( x)
¬A( x)
¬∀x( Ax)
¬A(c)
Gdzie znak „|” oznacza rozgałęzienie wywodu, a ograniczenia nałożone na
term są takie jak poprzednio.
Logicy w XX w. wykazali, że zaprezentowana tu wiedza o formalizacji
tekstów języków dziedzin wiedzy jest wystarczająca do sprawdzenia nie wprost
czy dowolna formuła jest tautologią, jest to tzw. metoda tabel analitycznych.
Metoda ta jest także skuteczna do badania poprawności rozumowań
prezentowanych w tekstach wyrażających wiedzę z dowolnych dziedzin oraz do
określenia szerokiej klasy formuł (tzw. klauzul hornowskich), dla których
możliwa jest automatyzacja rozumowań przez komputery. Tak rozumiana
automatyzacja jest przedmiotem programowania logicznego.
Elementy logicznej teorii tekstu
Podsumowując rozważania dotyczące formalizacji naszkicujemy, podając
listę stosownych definicji, aparat pojęciowy umożliwiający sformułowanie
logicznej teorii tekstu. Przez wiedzę będziemy rozumieć, jak poprzednio,
informację przetwarzaną przez umysł człowieka, a przez reprezentację wiedzy,
przedstawianie (kodowanie) wiedzy za pomocą różnorakich środków w ramach
systemów komunikacji międzyludzkiej. Reprezentacje wiedzy są więc tekstami.
Zrelatywizowanie reprezentacji wiedzy do dziedzin wiedzy prowadzi do
wyodrębnienia
tekstowych dziedzin wiedzy, a wyrażanie tych tekstów w
jakimś języku, do wyodrębnienia języka dziedziny wiedzy. Gdy wszystkie
równokształtne teksty reprezentują tę samą wiedzę ( w szczególności są pusto
spełnione), a równokształtność jest kongruencją w tekstowej dziedzinie wiedzy,
to tekstową dziedzinę wiedzy nazywamy systemem reprezentacji wiedzy.
Definicja 1
Strukturę relacyjną < U, U0, ε, R> nazywamy tekstową dziedziną wiedzy, gdy
U jest niepustym zbiorem wszystkich tekstów reprezentujących wiedzę z pewnej
dziedziny, U0 – wyróżnionym niepustym podzbiorem zbioru U zwanym bazą
tekstową, ε jest relacją częściowego porządku określoną na zbiorze U zwaną
relacją zawierania się tekstów, a R jest ustalonym zbiorem relacji określonych w
U zwanych relacjami nawiązywania tekstów.
Definicja 2
Niech TDW = < U, U0, ε, R> jest tekstową dziedziną wiedzy.
(a) Dwa teksty α,β∈U są równokształtne, gdy struktury relacyjne powstałe
przez obcięcie systemu TDW odpowiednio do zbiorów {t∈U : t ε α}, {t∈U
: t ε β} wszystkich tekstów zawartych w tekstach α,β są izomorficzne oraz
części tekstu α pozostają w tych samych relacjach w systemie TDW co ich
obrazy izomorficzne zawarte w tekście β.
(b) Tekst α jest wyprowadzalny ze zbioru tekstów X⊆U, co zapisujemy X |-
R
α, gdy istnieje taki tekst β, zwany wyprowadzeniem tekstu α ze zbiory X, i
istnieje taki ciąg tekstów α1, α2, ..., αn ∈ U, że spełnione są warunki
(1) teksty α1, α2, ..., αn zawarte są w tekście β,
(2) αn = α,
(3) dla dowolnych i≤n: bądź αi ∈ X, bądź istnieją takie i1, i2, ..., ik < i oraz
istnieje taka relacja r ∈ R, że <αi1, αi2, ..., αik,, αi> ∈ r
(4) β jest najmniejszym tekstem w <U, ε > spełniającym warunki (1)-(3).
(c) Ramą zbioru tekstów X⊆U nazywamy zbiór Fr(X) = {α∈U : X |- R α }
(d) Poprawnie zbudowanymi nazywamy teksty należące do zbioru Fr(U0).
(e) Dla dowolnych tekstów α, β ∈U,
α ≥ β wttw istnieje taki zbiór X tekstów, że β ∈ X i X |- R α, napis „α ≥ β”
czytamy: α nawiązuje do β, lub α jest następnikiem β,
(f) Dla dowolnego tekstu α∈U, zbiór Ex(α) = {t∈U :
t ε α} nazywamy
budową tekstu α.
(g) Tekst β jest rematem tekstu α wttw β ∈ Fr(U0), α ≠ β, β ∈ Ex(α) oraz nie
istnieje taki tekst t∈ Ex(α), że t≥β.
(h) Tekst t jest tematem tekstu α wttw t ∈ Fr(U0), α ≠ t, t ∈ Ex(α) oraz każdy
następnik t należący do Ex(α) jest rematem α.
(i) Dowolny tekst nazywamy jednostką tekstu, gdy posiada w swojej budowie
rematy i tematy oraz gdy ze zbioru wszystkich tematów tego tekstu
wyprowadzalny jest każdy z rematów.
Zauważmy, że dowolne wyprowadzenie tekstu poprawnie zbudowanego jest
jednostką tekstu. Ważne jest także stwierdzenie, że dla dowolnej tekstowej
dziedziny wiedzy TDW, w której wszystkie równokształtne teksty reprezentują
tę samą wiedzę, eżeli relacja „~” równokształtności tekstów jest kongruencją w
TDW, to struktura ilorazowa TDW/~ jest także tekstową dziedziną wiedzy.
Uzasadnione jest więc sformułowanie następującej definicji:
Definicja 3
Niech w tekstowej dziedzinie wiedzy TDW wszystkie równokształtne teksty
reprezentują tę sama wiedzę, a relacja „~” równokształtności tekstów jest
kongruencją w TDW. Wtedy strukturę ilorazową TDW/~ nazywamy systemem
reprezentacji
wiedzy,
relacje
nawiązywania
nazywamy
relacjami
konkatenacji, a o wyprowadzeniu danego tekstu mówimy,
konkatenacją
pewnego
ciągu
tekstów
określonego
przez
że jest
definicję
wyprowadzenia tekstu. Tekstami są typy tekstów równokształtnych.
Przyjmijmy dalej, że wiedza logiczna odnosi się do przetwarzania
informacji
we
wszechświecie
określającej
ogólną
budowę,
cechy,
przyporządkowania obiektów odnoszących się do danej dziedziny wiedzy oraz
relacje pomiędzy tymi obiektami .
Definicja 4
Język, w którym przedstawiamy schematycznie, za pomocą schematów, tj.
formuł, wzorów, planów, diagramów itp., wiedzę logiczną nazywamy językiem
sformalizowanym. Język ten jest określony przez cztery zbiory symboli < Al.,
Tr, Fm, W>, Al jest alfabetem, Tr – zbiorem termów, Fm – zbiorem formuł, a
W jest rodziną zbiorów formuł takich, że do każdego z tych zbiorów należą
formuły reprezentujące wiedzę o tej samej wartości logicznej. Alfabet składa
się z ze stałych i zmiennych indywiduowych, będących zarazem termami,
symboli funkcyjnych – wiążących stałe i zmienne w termy, predykatów –
wiążących stałe i zmienne w formuły, spójników – wiążących formuły w inne
formuły, kwantyfikatorów – wiążących zmienne i formuły w inne formuły oraz
symboli pomocniczych (np. nawiasów, ramek, kropek, linii, strzałek itd.).
Przykładem języka sformalizowanego jest język będący wynikiem
formalizacji (schematyzacji) języka dowolnej dziedziny wiedzy.
Definicja 5
Systemem reprezentacji wiedzy logicznej nazywamy system reprezentacji
wiedzy, w którym zbiorem tekstów bazowych jest zbiór wszystkich symboli
języka sformalizowanego, a zbiór relacji konkatenacji pozwala
1) wyróżnić wszystkie składniki języka sformalizowanego,
2) wyprowadzić formuły poprawnie zbudowane,
3) tworzyć teksty wywodów prowadzących od formuł o określonej wartości
logicznej do formuł o określonej wartości logicznej (niezmienniczość
wartości logicznych względem wywodów).

Podobne dokumenty