Lista_5 logiczna analiza tekstu - Pierwsza
Transkrypt
Lista_5 logiczna analiza tekstu - Pierwsza
Edward Bryniarski Logiczna analiza tekstu Większość współczesnych środków informatycznych obsługujących Internet wykorzystuje lepiej lub gorzej określone operacje i reguły logicznej analizy tekstu. W tym kontekście, znajomość przez nauczycieli metod logicznej analizy tekstu wydaje się być dobrze uzasadniona. Zapoznanie się z ta dziedzina można rozpocząć od książki Witolda Marciszewskiego „Metody analizy tekstu naukowego” (1981 r.). Chociaż praca ta była przygotowana dla wydawnictwa jako poradnik, czy przewodnik po wskazanej w tytule książki dziedzinie wiedzy, przeznaczony dla nauczycieli akademickich i studentów, to także prezentowała nowatorskie idee oraz wytyczała nowe kierunki badań. Zwłaszcza prekursorskie było zaproponowanie, jako głównego celu logicznej analizy tekstu, badania logicznego związku pomiędzy tematem a rematem, tj. pomiędzy tymi fragmentami tekstu, które reprezentują wiedzę potrzebną do wyznaczenia innej wiedzy, a tymi fragmentami tekstu, które reprezentują wiedzę wyznaczoną na podstawie tematu. Na podstwie wiedzy reprezentowanej przez temat można pojąć i zrozumieć remat. Temat reprezentuje wiedzę o tym czego dotyczy tekst. Mówi się, że tekst jest na temat. Remat reprezentuje to co o temacie jest przedstawione przez tekst. Np. podmioty zdań są tematami, a orzeczenia – rematami; w wypowiedzi „pisze, bo potrafi”, tematem jest „pisze”, a rematem „bo potrafi”. W tym ujęciu, istotą poprawności logicznej jednostki tekstu jest występowanie logicznego stosunku pomiędzy tematem i rematem. Ten związek logiczny ustala się dokonując formalnego opisu relacji określających zwartość tematyczną tekstów z danej dziedziny wiedzy, do której należy analizowany tekst. Analizowane relacje zwane są relacjami nawiązywania. Na podstawie tych relacji wyprowadzane są jedne teksty z drugich, adekwatnie do wyznaczania jednej wiedzy przez drugą. W sensie wyprowadzalności tekstów, w dowolnym wyprowadzeniu jedne teksty są następnikami innych, w tym teksty wyprowadzane (rematy) są następnikami tekstów (tematów), z którymi pozostają w relacji nawiązywania. Z tego powodu, do badania struktury tematycznej tekstu można zastosować aparat pojęciowy teorii krat. Ze względu na znaczenie pojęć tematu i rematu dla analizy tekstu, postuluje się utworzenie teorii, którą autor omawianej pracy proponuje nazwać logiczną teorią tekstu. Wiedza i reprezentacja wiedzy, Ludzie od zarania swoich dziejów poznają świat, w którym żyją oraz przekształcają go kulturowo i cywilizacyjnie, przetwarzając w umyśle informacje o ważnych dla ich życia obiektach, a wyniki przetwarzania informacji wykorzystują w działaniu. Informacją (w sensie W. R. Ashbego i N.Wienera) jest wszelkie ograniczenie różnorodności obiektów do jakiejś klasy obiektów (typu obiektów) posiadających pewne wyróżnione cechy i własności. Wiedza jest informacją przetwarzaną w umysłach ludzi. Różne osoby potrafią wskazać, czy wyodrębnić tę samą klasę obiektów (ograniczając różnorodność obiektów do danej klasy), posługując się tymi samymi pojęciami i sądami: pojęciami, będącymi wcześniej wyróżnionymi przez umysł klasami obiektów oraz sądami, będącymi informacjami o związkach (relacjach) pomiędzy obiektami ujętymi w tych pojęciach, a to indukuje odpowiednie związki pomiędzy tymi pojęciami oraz w procesie uczenia prowadzi do powstania nowych pojęć. Tak więc, pojęcia i sądy, którymi posługuje się dany człowiek, składają się na jego wiedzę. Dana grupa ludzi posiada wspólną wiedzę, jeśli posługuje się wspólnymi pojęciami i sądami, tj. rozpoznaje te same klasy obiektów oraz te same relacje pomiędzy obiektami. Wiedzę o obiektach danego typu posiada ten, kto potrafi odnieść się do obiektów danego typu w ramach dziedziny wiedzy ujmującej: wyróżnioną klasę obiektów, cechy tych obiektów, operacje wykonywane na wyróżnionych obiektach (pewne funkcje) i relacje pomiędzy tymi obiektami, pewne „wzorcowe” obiekty, pozwalające wskazać inne obiekty rozważanego typu, a niekiedy znana jest relacja zawierania się jednych obiektów w drugich. Oczywiście, może być rozważana dziedzina wiedzy o obiektach, wśród których są pojęcia, wtedy: klasy pojęć, cech, operacji na obiektach, relacji pomiędzy obiektami są pojęciami ujętymi w ramach tej dziedziny, a relacją zawierania obiektów jest zwykłe zawieranie klas. Dlatego słusznie jest wszystkie składniki systemu wiedzy traktować jako pewne pojęcia. Z tego powodu, niekiedy dziedziny wiedzy zwane są systemami pojęciowymi. Dowolnej dziedzinie działalności ludzkiej odpowiada jakiś system wiedzy wykorzystywanej w tej działalności. Np. działalności kucharskiej odpowiada dziedzina wiedzy o przygotowywaniu potraw czy posiłków, a wykonywaniu operacji na liczbach wymiernych odpowiada wiedza o liczbach wymiernych. Nawet dla rozwiązania konkretnego problemu, potrzebne jest wykorzystanie dziedziny wiedzy dostosowanej tylko do rozwiązania tego problemu. Jak przetwarzana jest informacja, aby stać się wiedzą? Ograniczenie różnorodności obiektów do pewnej klasy obiektów określających wiedzę polega na tym, że obiekt zwany w informatyce agentem przypisuje (przyporządkowuje, przydziela), poszczególnym obiektom z danej klasy (danego pojęcia) ten sam obiekt zwany reprezentacją wiedzy (znakiem, daną, tekstem) w taki sposób, aby udostępnienie człowiekowi tej reprezentacji wiedzy (znaku, tekstu) umożliwiało rozpoznanie przez niego reprezentowanej wiedzy (oznaczonej, opisanej wiedzy). Agentem może być dowolny umysł człowieka, wykorzystujący w reprezentowaniu wiedzy neurologiczne i psychofizyczne procesy, zwane procesami myślenia. Agentem może być także dowolny podmiot społeczny czy gospodarczy oraz środek technologii informacyjnej przetwarzający informację (komputer z oprogramowaniem, sieć komputerowa, itp.). Zgodnie z niektórymi wynikami badań psychologii poznawczej, pedagogiki, kulturoznastwa, metodologii programowania, a nawet sztucznej inteligencji, można wyróżnić trzy poziomy reprezentowania wiedzy: reprezentowanie ikoniczne – obrazująca daną wiedzę środkami zmysłowymi: wyobrażenia, wizualizacje, udźwiękowienie, mimika, aktywność ruchowa, opisy wyobrażeń, reprezentowanie symboliczne - schematyzacja reprezentacji ikonicznej czy jej formalizacja, prowadząca do wzorów (formuł, schematów, instrukcji), których zastosowanie umożliwia uzyskanie danych jednoznacznie wskazujących na reprezentowaną wiedzę (np. wykorzystanie wzorów matematycznych do uzyskania poszukiwanego rozwiązania zadania matematycznego, czy program komputerowy), reprezentowanie interaktywne (enaktywne) – wykorzystanie reprezentacji ikonicznej lub symbolicznej do określenia reguł decyzyjnych, których zastosowanie polega na wykonywaniu operacji (algorytmów, instrukcji) prowadzących do jednoznacznej identyfikacji reprezentowanej wiedzy, gdy spełnione są określone warunki ustalone przez reprezentację ikoniczną lub symboliczną (np. symulatory, instrukcje obsługi urządzeń technicznych, tablice decyzyjne). Zauważmy, że od reprezentacji ikonicznej do symbolicznej przechodzi się, gdy występują luki w reprezentowanej wiedzy, czy w sytuacji niejasnej reprezentacji, co nazywamy problemem informatycznym. Natomiast do reprezentacji interaktywnej przechodzi się dzięki możliwości sformułowania reguł, umożliwiających wykonanie określonej operacji, gdy spełnione są określone warunki. Dysponowanie reprezentacją interaktywną daje agentowi minimalną informację umożliwiającą rozpoznanie reprezentowanej wiedzy w całości. Proces ten nazywa się pojęciowaniem. Konceptualizacja wiedzy Pokazaliśmy już, że wiedza może być precyzyjnie rozpoznawana przez ludzi, gdy jest precyzyjnie, w sposób powtarzalny i weryfikowalny przedstawiana, symbolicznie wskazana i zgodnie z pewnymi regułami przetwarzana, tj. reprezentowana. Taki proces nazywamy konceptualizacją wiedzy, a do jej realizacji służą środki zwane multimediami, czy też systemami multimedialnymi. Tworzone są systemy multimedialne, które wiedzę o rzeczywistości poznawczej człowieka reprezentują za pomocą języka naturalnego lub środków informatycznych, np. w ramach systemów komputerowych, tj. w rzeczywistości zwanej rzeczywistością wirtualną. Wiedza uzyskuje w ten sposób nowy kontekst sytuacyjny, niespotykany we wcześniejszych epokach historycznych – odniesienie wiedzy ludzkiej do jej reprezentacji komputerowej oraz do jej zewnętrznego, maszynowego przetwarzania, poza umysłem człowieka. Kontekst sytuacyjny jest tu zatem określony przez zespół mechanizmów wejścia i wyjścia, które w swoim działaniu dążą docelowo do ustalenia izomorficznego przyporządkowania (w potocznym rozumieniu - ustalającego zgodność) pomiędzy pewnym podsystemem rzeczywistości wirtualnej, a poddziedziną wiedzy (podsystemem rzeczywistości poznawczej). Do tego zespołu urządzeń należą najczęściej: kamery cyfrowe, skanery, myszki, klawiatura komputera, mikrofony, plotery, drukarki, ekrany monitorów komputerowych, głośniki, okulary wyświetlające trójwymiarowy obraz, hydrauliczne symulatory ruchu, itp. Precyzując, system multimedialny możemy określić formułami: system multimedialny :: = < dziedzina wiedzy, system reprezentacji wiedzy, kontekst sytuacyjny przyporządkowujący wiedzy jej reprezentację>,. gdzie dziedzina wiedzy::=< Wszystkie możliwe przedmioty poznawalne, relacja zawierania się przedmiotów, cechy przedmiotów, operacje na przedmiotach, poznawalne cechy przedmiotów, relacje pomiędzy przedmiotami, elementarne przedmioty>. System reprezentacji wiedzy występuje najczęściej jako system reprezentacji językowej, w informatyce wykorzystującym język jakiejś dziedziny matematyki, choć współcześnie coraz częściej spotykamy się z systemem rzeczywistości wirtualnej. System reprezentacji językowej dziedziny wiedzy::= < wyrażenia - nazwy reprezentujące pojęcia oraz zdania reprezentujące sądy dla danej dziedziny wiedzy, relacja zawierania się wyrażeń, funktory nazwotwórcze - operacje na wytworach, funktory zdaniotwórcze – spójniki oraz kwantyfikatory, wyróżnione wzorcowe nazwy i zdania >. Wzory budowy wyrażeń reprezentacji językowej przedstawimy w podrozdziale dotyczącym formalizacji. dziedziny wiedzy System rzeczywistości wirtualnej ::= < wytwory systemu multimedialnego – komponenty, kompozycje, relacja zawierania się wytworów, walory (cechy) wytworów, konstrukcje - operacje na wytworach, reguły kompozycji (wirtualne powiązania) - relacje pomiędzy wytworami, elementarne wytwory - elementarne komponenty i kompozycje>. Dziedzina wiedzy (rzeczywistość poznawcza), rzeczywistość wirtualna oraz kontekst sytuacyjny realizowane są w systemach iteracyjnych, tj. w interaktywnych systemach komunikowania się. Na dziedzinę wiedzy (rzeczywistość poznawczą) składa się mnogość powiązanych ze sobą rzeczy przedmiotów, tj. tego na co skierowana jest aktywność poznającego podmiotu. Człowiek jako podmiot poznający rzeczy, uczestnicząc w systemach iteracyjnych wykonuje operacje na przedmiotach, rozpoznaje ich cechy i uaktywnia zachodzenie relacji pomiędzy przedmiotami w taki sposób, że poznanie pewnych wzorcowych, elementarnych przedmiotów umożliwia mu identyfikację jako takich a nie innych pozostałych przedmiotów, pośredniczących, czy też biorących udział w komunikacji pomiędzy człowiekiem a człowiekiem oraz człowiekiem a przyrodą. W systemie multimedialnym wytwarzane są różnorakie rzeczy – wytwory systemu multimedialnego. Wzajemne powiązania tych wytworów składają się na rzeczywistość wirtualną. Te, które powstają z innych w wyniku łączenia elementarnych wytworów za pomocą konstrukcji nazywamy poprawnie zbudowanymi lub konstruktami. Jeśli wchodzą w wirtualne powiązania za pomocą reguł kompozycji, nazywamy je kompozycjami. Te wytwory do których stosuje się konstrukcje, a które nie są kompozycjami nazywamy komponentami. Konstruowanie jest to powstawanie wytworów z innych wytworów poprzez zastosowanie do nich konstrukcji, natomiast komponowanie to wyróżnienie za pomocą reguł kompozycji tych z pośród skonstruowanych wytworów, do których stosują się te reguły. Ciąg faz konstruowania lub komponowania danego wytworu nazywamy scenariuszem powstania tego wytworu. Zbiór wszystkich wytworów zawartych w danym wytworze wraz z relacją zawierania nazywamy budową tego wytworu. Wytwory są jednakowo zbudowane, gdy ich budowy są izomorficzne, a jeśli są dodatkowo jednakowo skonstruowane to są równokształtne. Ponadto, gdy części wytworów mają te same walory i są jednakowo skomponowane, to są nierozróżnialne. Równokształtność wytworów jest rozpoznawana przez mechanizmy systemu multimedialnego, nie zależy więc od kontekstu sytuacyjnego. Do wytworów poprawnie zbudowanych w systemie multimedialnym stosuje się zasadę kompozycyjności, która głosi, że KMPZ1. każdy wytwór, który powstał z danego komponentu przez zastosowanie konstrukcji zmieniającej tylko walory tego komponentu jest komponentem równokształtnym z nim, KMPZ2. każde dwa jednakowo zbudowane komponenty, których wszystkie odpowiadające sobie części mają te same walory, są równokształtne, KMPZ3. jeżeli dwie kompozycje są równokształtne, to odpowiadające sobie w tej równokształtności kompozycje w nich zawarte podlegają tym samym regułom kompozycji, tj. są jednakowo skomponowane. Do najprostszych systemów multimedialnych należą systemy powstałe w bezpośrednim korzystaniu przez człowieka ze środka informatycznego. Ale nawet w tak prostych przypadkach kontekst sytuacyjny, w którym reprezentowana jest wiedza jest wynikiem stosunkowo złożonego programowaniu multimedialnym, tj. projektowania środka informatycznego w taki sposób, aby wyznaczone przez implementację algorytmu, określającego korzystanie z tego środka, monitorowanie wyników realizacji algorytmu było zgodne z rzeczywistością poznawczą. Wtedy, scenariusz jest reprezentacją algorytmu w rzeczywistości wirtualnej. W szczególności, dla systemów multimedialnych określonych przez języki programowania scenariuszami są programy. Zwróćmy tu od razu uwagę na to, że w szerszym rozumieniu scenariusze są reprezentacjami procedur realizowanych w rzeczywistości wirtualnej, a procedury przetwarzania informacji za pomocą środków informatycznych są algorytmami (gdzie procedury są wzorami czy schematami zachowań obiektów, np. ciągi instrukcji wykonywanych przez człowieka lub maszynę). Przykład Rozważmy zadanie: należy odmierzyć 4 l wody dwoma naczyniami – 5 l i 3 l. Określmy system multimedialny wykorzystujący edytor grafiki (np. POWER POINT) w ramach którego może być obrazowane wykonanie tego zadania. Dziedzina wiedzy (system rzeczywistości poznawczej): 1. zbiór poznawanych przedmiotów – naczynia z wodą, naczynia, porcje wody w naczyniach, 2. relacja zawierania się przedmiotów – w naczyniu z wodą zawiera się naczynie oraz woda, w tym samym naczyniu z większą ilością wody zawiera się to naczynie z mniejszą ilością, mniejsza ilość wody zawiera się w większej ilości wody, przedmioty zawierają się w sobie, 3. poznawalne cechy przedmiotów - bycie naczyniem 0l (garnkiem lub dzbankiem), lub garnkiem 5l, lub dzbankiem 3l, 4. operacje na przedmiotach - operacja przelewania całej znajdującej się wody w większym naczyniu do mniejszego, podobnie operacja przelewania całej wody z mniejszego naczynia do większego, operacja dopełniania mniejszego naczynia wodą z większego naczynia, operacja dopełniania większego naczynia woda z mniejszego naczynia, wylewanie całej wody z naczyń, napełnianie wodą pustych naczyń, 5. relacje pomiędzy przedmiotami – warunek dopełniania jednego naczynia wodą z drugiego naczynia, tj. w drugim naczyniu musi być wystarczająca ilość wody do wypełnienia pierwszego naczynia, podobnie warunek przelewania całej wody z jednego naczynia do drugiego, tj. w naczyniu do którego przelewa się wodę musi być wystarczająco miejsca, 6. wyróżnione elementarne przedmioty – puste naczynia, 5l wody, 3l wody. Kontekst – ilustrowanie treści zadania oraz reprezentowanie rzeczywistości poznawczej za pomocą edytora grafiki. System rzeczywistości wirtualnej: 1. wytwory systemu multimedialnego – komponenty, kompozycje – schematy graficzne przedstawiające naczynia z wodą lub bez wody, prostokąty reprezentujące litry wody (jeden prostokąt – jeden litr wody, rys. 1.1.1.3), 1 litr 1 litr 1 litr 1 litr 1 litr 1 litr 1 litr 2. relacja zawierania się wytworów – rysunki składają się z prostokątów przedstawiających naczynia oraz prostokątów reprezentujących litry wody, 3. walory (cechy) wytworów – bycie większym niebieskim prostokątem, bycie mniejszym niebieskim prostokątem, 4. konstrukcje - operacje na wytworach – skopiowanie szarego prostokąta tyle razy, aby można było otrzymanymi w wyniku kopiowania prostokątami, po ich odpowiednim przesunięciu, pokryć większy lub mniejszy niebieski prostokąt, przenoszenie szarych prostokątów pokrywających niebieskie pola z jednego pola do drugiego i układanie ich „jeden na drugim”, wypełnianie wolnego pola, jednego z niebieskich prostokątów szarymi prostokątami pokrywającymi pole drugiego prostokąta, 5. reguły kompozycji (wirtualne powiązania) - relacje pomiędzy wytworami – warunki określające wykonanie wyżej opisanych operacji, 6. elementarne wytwory - elementarne komponenty i kompozycje – niebieskie i szare prostokąty Przykład W edytorze grafiki scenariuszem wykonania zadania o odmierzaniu wody jest ciąg rysunków przedstawiających relacje wypełniania wodą naczyń i wykonywane operacje na naczyniach (rys.). Rys. Scenariusz wykonania zadania o odmierzaniu wody.Źródło: J. Kotyczka, Programowanie logiczne w rozwiązywaniu zadań na poziomie szkolnym, Praca Magisterska, Instytut Matematyki i Informatyki, Uniwersytet Opolski, Opole 2003. JĘZYK IKONICZNY - KOMPONOWANIE OBRAZÓW. Oglądając płótna obrazów nieraz zauważamy, że to co na nich „widać” zależy od sposobu patrzenia, tj. od tego jak tworzymy te obrazy w umyśle. A więc, to co przedstawia obraz (obraz jako tekst) zależy od tego z czego go wyprowadzamy (zależy od zbioru faz wyprowadzenia tekstu-obrazu). Dobrze ilustruje to Rys.1, pokazujący fazy tworzenia w umyśle obrazu ukazanego na Rys.2. Na Rys.3 widzimy raz kształt kielicha, a raz dwie twarze zwrócone ku sobie, w zależności od tego z jakich części tworzymy w umyśle rysunek. Na Rys.4 widzimy zaś raz młodą kobietę, a raz starą. Podobnie ma się sprawa z walorami np. z „bliżej czegoś” , „dalej czegoś”, gdy oglądając ikonę przedstawiającą kąt zastosujemy do wierzchołka tego kąta konstrukt „bycia bliżej”, to wyda on się nam bliżej, a gdy zastosujemy konstrukt „bycia dalej”, to wyda się on dalej. Rys.1 Rys.3 Rys.2 Rys.4 Powyższe przykłady (źródło: [Lindsay, Norman]; [Szewczuk]) dobrze motywują przyjęcie następujących definicji ikony i obrazu. Definicja 2.1 A. Ikoną nazywamy uporządkowaną parę składającą się z tekstu należącego do pewnej dziedziny konstruktu lub do zbioru jego wartości i scenariusza tego tekstu (zbioru wszystkich faz wyprowadzenia tego tekstu). Pierwszy element ikony nazywamy tekstem ikony, a elementy scenariusza fazami ikony. B. Obrazem nazywamy uporządkowaną parę, której pierwszy element jest tekstem będącym domknięciem swojego wyprowadzenia ze względu na wiązania i walory tekstów, a drugi element jest scenariuszem tego tekstu (zbioru wszystkich faz wyprowadzenia tego tekstu). Pierwszy element obrazu nazywamy tekstem obrazu, a elementy scenariusza - fazami obrazu). Rozważmy monitor, za pomocą którego obrazowane są realizacje procesów. Niech system tekstowy tego monitora tworzy schematy realizacji procesów. Do zbioru tekstów bazowych systemu tekstowego należą następujące obrazy: koło z dużą literą B będące obrazem rozpoczęcia realizacji procesu (begin), koło z dużą literą E będące obrazem zakończenia realizacji procesu (end), dowolne linie zakończone strzałką będące obrazem drogi realizacji procesu, dowolne linie rozgałęzione zakończone strzałkami („widły”) obrazujące alternatywne drogi realizacji procesów, dowolne schodzące się linie zakończone strzałką („drzewa”) obrazujące połączenie alternatywnych dróg realizacji procesów. Tekstem bazowym jest także tło, które jest częścią tylko samego siebie. Zbiorami walorów są tu poszczególne wymienione typy obrazów bazowych, a reguły tworzenia obrazu ilustrują poniższe przykładowe diagramy. 1. Zbiór tekstów bazowych { B , E , , , , tło 2. Relacje budowania tekstów tło R0 : B E , B E R1 : } , R2 : R3 : , R4 : gdzie, R5 : jest dowolnym obrazem gdzie ukośna strzałka => oznacza zamianę wziętych w klamrę fragmentów diagramu. 4. Wyprowadzenie obrazu A Nr fazy Faza Relacja α1. α2. R2,α1 α3. R3,α2,α1 α4. R4,α3,α1 A=< α4, { α1 , α2 , α3 , α4 } > Formalizacja reprezentacji językowej dziedzin formalnym języku logiki pierwszego rzędu wiedzy w Dziedzinę wiedzy można reprezentować w języku naturalnym lub sztucznym. Grupa osób przekazujących wiedzę z tej dziedziny za pomocą wyrażeń języka ustala zazwyczaj konkretny język dla takiej komunikacji – język danej dziedziny wiedzy (np., język elektroniki, język teorii mnogości, logiki pierwszego rzędu, itp.). Dla każdego języka dziedziny wiedzy można otrzymać nowe dziedziny wiedzy – dziedziny wiedzy o formułach - ogólnych schematach budowy wyrażeń tego języka oraz o wartościach logicznych - odniesieniach tych formuł do reprezentowanej przez wyrażenia wiedzy. Otrzymana dziedzina wiedzy nazywana jest dziedzina wiedzy logicznej, a reprezentacja symboliczna wiedzy logicznej nazywana jest formalizacją języka dziedziny wiedzy. Opis metody formalizacji tekstów języka dziedziny wiedzy ograniczymy do metody formalizacji zdań, które może zawierać tylko nazwy, funktory nazwotwórcze oraz funktory zdaniotwórcze. Zaczynamy od wyróżnienia w wybranym zdaniu następujących jego składników: 1) zaimki nieokreślone: „ktoś”, „coś”, „jakiś”, itp., oznaczające dowolnie ustalony przedmiot, 2) nazwy indywidualne, oznaczające indywidua, np. „ten człowiek”, „to dziecko”, „miasto Warszawa”, „to co jest aktualnie liczone”, „człowiek, o którym jest tu mowa”, „przedmiot, który mamy na uwadze”, „dowolnie ustalony na czas rozważań przedmiot”, itp. 3) nazwy proste, które nie są tworzone z innych nazw, np. „dom”, „liczba” 4) funktory nazwotwórcze tworzące z nazw (zaimków) nowe nazwy (zaimki), oznaczające operacje na nazwach i złożenia tych operacji, 5) nazwy złożone, zbudowane z nazw prostych za pomocą funktorów nazwotwórczych, np. „wielki, biały stół” 6) zaimki złożone: „coś białego”, „jakaś liczba”, itp. 7) funktory zdaniotwórcze: zwroty typu „każde ... jest ...”, „...biegnie”, itp. oraz spójniki zdaniowe „nieprawda, że...”, „...i...”, „...lub...”, „jeżeli..., to...”, „...wtedy i tylko wtedy...”, a także zwroty kwantyfikujące „każdy...spełnia warunek....”, „pewien... spełnia warunek...”, „ ...identyczne z...”, 8) wyrażenia zdaniowe, które zbudowane są z wyróżnionych nazw za pomocą wyróżnionych funktorów i te wyrażenia, które dają się tak przeformułować, aby były zbudowane z wyróżnionych nazw i funktorów. Następnie budujemy schematy (wzory, diagramy, tabele, itp. )1 wyróżnionych wyrażeń zdaniowych języka danej dziedziny wiedzy tak, aby każdemu takiemu schematowi, oddzielnie, odpowiadało jakieś wyrażenie tego języka. W standardowej notacji logiki pierwszego rzędu formalizację możemy tego dokonać następująco: 1) zmienne: x1, x2, x3, ... , reprezentują zaimki nieokreślone, np. wyrażenie zdaniowe „każdego dnia ktoś biegnie jakąś aleją parku jakiegoś miasta” 1 Należy zauważyć, że współcześnie formalizacji dokonuje się także np. w języku diagramów, tj. sieci semantycznych i przestrzeni rozwiązań, posiadających strukturę grafów skierowanych. Por. R. Kowalski, Logika w rozwiązywaniu zadań, Warszawa 1989, s. 33. jest równoznaczne „każdego dnia człowiek jakiś biegnie aleją parku jakąś miasta jakiegoś.” a po zamianie zaimków na zmienne „każdego dnia człowiek x1 biegnie aleją parku x2 miasta x3.” 2) stale: c1, c2, c3, ... , reprezentują nazwy indywidualne, np. wyrażenie zdaniowe „jakiś człowiek mieszka w mieście Warszawa” c1 człowiek x1 mieszka w c1 3) dziedziny deklarowane (typy zmiennych): D1, D2, D3, ... , oznaczają zakresy nazw prostych oraz zarazem używane są jako predykaty jednoargumentowe w wyrażeniach postaci Di(xj), reprezentują więc nazwy proste, „każdego dnia człowiek biegnie w mieście” D1 D2 D3 4) symbole funkcyjne: f11, f21, f31, ... , f1k, f2k, f3k, ... , reprezentują funktory nazwotwórcze jeden, ..., k-argumentowe, ... , np. człowiek x1 mieszka w c1 f11( x1 ) 5) termy: niech t1, t2, t3, ..., reprezentują dowolne zaimki (proste i złożone) – zmienne i stałe są termami, jeśli t1, t2, t3, ...,tk są termami, a fnk jest symbolem funkcyjnym, to fnk(t1, t2, t3, ...,tk) jest termem, np. schemat w punkcie 4) jest termem powstałym z symbolu funkcyjnego f12, termu f11(x1) oraz stałej c1 6) dziedziny: niech H1, H2, H3, ... oznaczają zakresy dowolnie ustalonych nazw ( reprezentują dowolne nazwy); dziedzinami są dziedziny deklarowane (np. standardowe) oraz jeśli H1, H2, H3, ... , Hk są dziedzinami, , a fnk jest symbolem funkcyjnym, to obraz H = fnk(H1, H2, H3, ...,Hk) jest dziedziną wyznaczoną przez ten symbol, np. jeżeli dziedzina D1 reprezentuje nazwę „człowiek”, a dziedzina D2 – nazwę „miasto”, natomiast symbol funkcyjny f12 reprezentuje zwrot „... mieszkający w ...”, to obraz f12(D1,D2) jest dziedziną reprezentującą wyrażenie nazwowe „ człowiek mieszkający w mieście” ; wprowadzamu umowę: piszemy dla dowolnej dziedziny H, że H(t), gdy t reprezentuje obiekt z zakresu H, wtedy H(x) ⇔ ∃x1... ∃xk ( x = fnk(x1, x2, x3, ...,xk) ∧ H1(x1) ∧ H2(x2) ∧ H3(x3) ∧ ... ∧ Hk(xk)) 7) predykaty: P11, P21, P31, ... , P1k, P2k, P3k, ... , reprezentują funktory zdaniotwórcze, tworzące z nazw albo zaimków wyrażenia zdaniowe, jedno, ..., k-argumentowe, ..., np. człowiek x1 mieszka w c1 P12( f11( x1 ) , c1) Przyjmujemy umowę, że Pnk(H1, H2, H3, ...,Hk) =df ∀x1... ∀xk (Pnk(x1, x2, x3, ...,xk) ⇒ H1(x1) ∧ H2(x2) ∧ H3(x3) ∧ ... ∧ Hk(xk)) 8) stałe logiczne: ¬, ∧, ∨, ⇒, ⇔, ∀, ∃, =, reprezentują odpowiednio wymienione spójniki zdaniowe i zwroty kwantyfikujące oraz identyczność; spójniki zdaniowe: ¬ - „nieprawda, że...”, ∧ - „...i...”, ∨ - „...lub...”, ⇒ „jeżeli..., to...”, ⇔ - „...wtedy i tylko wtedy...”, a także zwroty kwantyfikujące: ∀ - „każdy...spełnia warunek....”, ∃ - „pewien... spełnia warunek...”, oraz identyczność: = - „ ...identyczne z...”; 9) Znaki techniczne: nawiasy i przecinki – reprezentują obszar wiązania przez funktory składników tekstu, np. jeśli w napisie „A ∨ B ∧ C” nie umieścimy nawiasów (. ), to nie wiadomo czy napis ten jest schematem jakiegokolwiek zdania, gdyż nie reprezentuje wiedzy o tym, które ze zdań jest tu połączone spójnikiem „lub”, a które spójnikiem „i”, chyba, że wcześniej ustalimy kolejność łączenia przez spójniki logiczne (tzw. siłę wiązania); napis „(P11(c1) ∨ P11(x1)) ∧ P21(c2)” jest schematem jakiegoś wyrażenia zdaniowego, 10) formuły atomowe: niech t1, t2, t3, ...,tk , tn są termami, a Pnk jest predykatem, wtedy Pnk(t1, t2, t3, ...,tk) jest formułą atomową, 11) formuły: deklaracje dziedzin, deklaracje predykatów, formuły atomowe są formułami, niech A, i B są formułami oraz t i h termami, wtedy formułami są ¬ (A), ( A) ∧ (B) , (A) ∨ (B), (A) ⇒ (B), ⇔, ∀xk (A), ∃xk (A) , t = h, Zasady schematyzacji W formalizacji tekstów języka danej dziedziny wiedzy wykorzystuje się także następujące zasady schematyzacji: Schemat 1. Dowolna część wyrażenia języka, która odnosi się do tej samej wiedzy ma ten sam schemat. Schemat 2. Każda schematyzacja wyrażenia zdaniowego poprzedzona jest deklaracjami dziedzin i predykatów reprezentujących odpowiednio nazwy i funktory zdaniotwórcze wiążące te nazwy w danym wyrażeniu zdaniowym. x2 x3 x4 P13 P13 Jeżeli jakaś osoba pożyczy coś drugiej osobie, a ta pożyczy to trzeciej, to trzecia osoba może to zwrócić pierwszej P23 x1 Dziedziny: D1 – osoba, D2 – przedmioty pożyczane/zwaracane, Predykaty: P13 - .... pożyczy ..., ..., P23 - .... zwróci ..., ..., Deklaracje: P13 (D1, D2, D1) – deklaracja reprezentuje wiedzę o tym, że osoba pożycza przedmiot, osobie, P23 (D1, D2, D1) - deklaracja reprezentuje wiedzę o tym, że osoba zwraca przedmiot, osobie, Schemat przykładowego wyrażenia zdaniowego ma postać P13 (D1, D2, D1) ∧ P23 (D1, D2, D1) ∧ ((P13 (x1, x2, x3) ∧ P13 (x3, x2, x4)) ⇒ P23 (x4, x2, x1)) Środowisko dziedzin Formuła Powyższa formuła jest równoważna formule D1(x1) ∧ D2(x2) ∧ D1(x3) ∧ D1(x4) ⇒ ((P13 (x1, x2, x3) ∧ P13 (x3, x2, x4)) ⇒ P23 (x4, x2, x1)) Schemat 3 Schematyzując wyrażenie, te same nazwy i zaimki nie poprzedzone bezpośrednio zwrotami kwantyfikującymi oznaczamy za pomocą tych samych symboli zmiennych, a jeżeli poprzedzone są bezpośrednio wyrażeniami kwantyfikującymi, oznaczamy je różnymi wcześniej nie występującymi zmiennymi. Schemat 4 Jeżeli w prostym wyrażeniu zdaniowym (nie zawierającym spójników zdaniowych) nazwy poprzedzone są bezpośrednio zwrotami kwantyfikującymi, to 1) zwroty kwantyfikujące wraz z nazwami zastępujemy różnymi, wcześniej nie występującymi zmiennymi, a stosowne znaki kwantyfikatorów wraz z odpowiadającymi im zmiennymi wypisujemy na początku formuły zgodnie z porządkiem wykonywanej schematyzacji, 2) kwantyfikatory wiążą zmienne ograniczone do dziedzin argumentów predykatów; np. Każdy matematyk jest uczniem pewnego matematyka ∀ x1 P12 f1 1 ∃ x2 P12(D1, f11(D1)) ∧ ∀x1∃x2 P12(f11( x1), x2) lub przy użyciu kwantyfikatorów o ograniczonym zasięgu ∀(x1|D1(x1)) ∃(x2|D1(x2)) P12(f11( x1), x2), gdzie D1 jest dziedziną reprezentującą matematyków, a f11(D1) jest dziedziną reprezentującą uczniów matematyków. Kwantyfikatory o ograniczonym zasięgu definiujemy następująco: ∀(x|D(x)) A =df ∀x (D(x) ⇒ A), ∃(x|D(x)) A =df ∃x (D (x) ∧ A) Można udowodnić, że formuły uzyskane przy określeniu środowiska dziedzin są równoważne tym, które stosują kwantyfikatory o ograniczonym zasięgu. Schemat 5 We wszystkich schematach, w których występują kwantyfikatory, każdy kwantyfikator musi wiązać inną zmienna, np. formuła ∀x1 P11(x1) ∨ ∃ x1 P11(x1) nie może być poprawnym schematem, ale formuła ∀x1 P11(x1) ∨ ∃ x2 P11(x2) może nim być. Można także zmienne odnoszące się do różnych dziedzin oznaczać w różny sposób, np. w notacji teoriomnogościowej zbiory oznacza się dużymi literami a ich elementy małymi. Złożoność uzyskanych napisów w tych schematyzacjach jest jednak znacznie większa niż w proponowanej wyżej metodzie uwzględniającej wypisywanie środowiska dziedzin, dlatego też ta metoda schematyzacji przyjęła się w programowaniu logicznym. Reprezentacja dziedzin wiedzy w języku dziedziny matematycznej Formalizację języka wybranej dziedziny wiedzy można otrzymać bez stosowania metody formalizacji wyrażeń tego języka. Dokonuje się tego budując język formalny dla matematycznej struktury reprezentującej daną dziedzinę wiedzy, o ile taka struktura jest jednoznacznie określona w języku teorii mnogości. Strukturę tę nazywa się zazwyczaj strukturą relacyjną. Określenie takiej struktury nie jest możliwe bezpośrednio, gdy w dziedzinie wiedzy występują pojęcia niejasne, nieostre czy dające się rozważać jedynie jako kolekcje obiektów lub listy tych obiektów z niedokładnie określonym ich występowania na liście, np. klasa młodych ludzi, klasa kamieni będących elementami kopców kamieni, czy klasa niemowląt wymienionych na listach rodzących się niemowląt. Niekiedy brak teoriomnogościowej interpretacji omija się budując struktury relacyjne w nieklasycznych teoriach zbiorów: zbiorów rozmytych, zbiorów przybliżonych czy multizbiorów. Jednak wymienione teorie wybiegają daleko poza podstawowy zakres wiedzy logicznej reprezentowanej komputerowo i dlatego nie będą w naszym cyklu wykładów rozważane. 1.1.4.1 Pojęcie zbioru Przez zbiór (mnogość) będziemy rozumieć taki obiekt, który jest dokładnie określony wtedy i tylko wtedy, gdy znana jest wiedza o przynależności do niego każdego obiektu będącego jego elementem. Np. zbiorami są: zbiór znaczków pocztowych z pewnej kolekcji, zbiór poszczególnych książek w bibliotece, zbiór wszystkich liczb naturalnych, zbiór wszystkich trójkątów równobocznych na płaszczyźnie itd.. Ale zbiorami nie są np.: dana kolekcja znaczków pocztowych, biblioteka, drzewo czy krzesło, gdyż wyróżnienie ich części, z których się składają te całości nie jest wystarczające do ich identyfikacji. Aby identyfikować np. krzesło potrzebna jest wiedza o tym, jak połączone są ze sobą jego części. Zauważmy, że obiekt, który jest dokładnie określony przez wiedzę o tym, żaden obiekt nie jest jego elementem jest też zbiorem. Zbiór ten nazywamy zbiorem pustym. Zbiorem pustym jest np. zbiór wszystkich liczb naturalnych mniejszych od zera. Ale zbiorem pustym nie jest np. punkt płaszczyzny, gdyż chociaż spełniony jest warunek, że żaden obiekt nie jest jego elementem, to warunek ten nie jest wystarczający do uzyskania odpowiedzi na pytanie, czy dany punkt jest tym samym zbiorem co drugi, ze względu na różność punktów (brak jednoznaczności) w geometrii Euklidesa. Wiedza o najogólniejszych własnościach zbiorów stała się w XX wieku podstawowym składnikiem wiedzy matematycznej. Po raz pierwszy została ona przedstawiona w postaci dziedziny naukowej przez George’a cantora w latach 1871-1883. Teoria tej dziedziny wiedzy, za twórcę której uważany jest E. Zermelo, uzyskała nazwę teorii mnogości. Jej główny rozwój przypada na pierwszą połowę XX wieku. 1.1.4.2 Język algebry zbiorów Rozważmy język dowolnej dziedziny wiedzy, w którym można nadać nazwy zarówno wszystkim zbiorom obiektów branych pod uwagę w tej dziedzinie wiedzy (nazwy pojęć) jak i elementom tych zbiorów (także zaimki imienne). Rozszerzamy ten język o następujące nazwy i operacje (o ile, nie występują one wcześniej w tym języku): zbiór pusty – nazwa zbioru, do którego nie należy żaden obiekt danej dziedziny wiedzy; w standardowej notacji zbiór ten oznaczamy symbolem: ∅, zbiór pełny (uniwersum) – nazwa zbioru wszystkich branych pod uwagę w danej dziedzinie wiedzy obiektów, które nie są zbiorami; w standardowej notacji zbiory tego typu oznaczamy symbolami: U, U1, U2, U3, … , nie występujące wcześniej w języku nazwy zbiorów, które możemy zadać za pomocą następujących wzorów (schematów, procedur): a) zbiór składający się z < wymienianie nazw obiektów, z których składa się zbiór> b) ogół takich obiektów, które < sformułowanie własności, którą spełniają te obiekty>. W notacji matematycznej zwrot a) zapisujemy zazwyczaj następująco: a’) { <nazwa>, <nazwa>, …}. Np. napis {1, 2, 3, 5} jest nazwą złożoną zbioru składającego się z wymienionych liczb. Zwrot b) w notacji matematycznej ma postać: b’) {x: <warunek, który spełniają obiekty x>} lub {x | <warunek, który spełniają obiekty x}. Np. napis {x: x∈R ∧ x>0 } jest nazwą ogółu takich obiektów, które są liczbami rzeczywistymi i są dodatnie. Dokonując formalizacji języka dziedziny wiedzy o zbiorach do ich reprezentacji będziemy stosowali duże litery: A, B, C, …, X, Y, Z. Dalej do języka wprowadzimy pewne operacje (o ile wcześniej ich tam już nie było). Operacje te wymieniamy poniżej nadając im od razu standardowe wyjaśnienie oraz podając standardową notację. Operacja sumy dwóch zbiorów zadana jest zwrotem: (u) suma <nazwa pierwszego zbioru> i <nazwa drugiego zbioru>; suma A i B =df A ∪ B lub A + B; suma dwóch zbiorów jest to zbiór wszystkich takich obiektów, które należą do pierwszego lub do drugiego zbioru. Operacja iloczynu dwóch zbiorów zadana jest zwrotem: (v) iloczyn <nazwa pierwszego zbioru> i <nazwa drugiego zbioru>; iloczyn A i B =df A ∩ B lub A • B; iloczyn dwóch zbiorów jest to zbiór wszystkich takich obiektów, które należą do pierwszego i do drugiego zbioru jednocześnie. Operacja różnicy dwóch zbiorów zadana jest zwrotem: (w) różnica <nazwa pierwszego zbioru> i <nazwa drugiego zbioru>; różnica A i B =df A / B lub A - B; różnica dwóch zbiorów jest to zbiór wszystkich takich obiektów, które należą do pierwszego zbioru a nie należną do drugiego zbioru. Operacja dopełnienia zbioru zadana jest zwrotem: (x) dopełnienie <nazwa pierwszego zbioru>; dopełnienie A =df A’ lub U / A; dopełnienie danego zbioru jest to zbiór wszystkich takich obiektów, które należą do zbioru pełnego a nie należą do danego zbioru. Do języka dziedziny wiedzy wprowadzimy (o ile wcześniej tam ich nie ma) trzy predykaty (nazwy relacji). Pierwszy z nich to predykat przynależności zadany wzorem: <nazwa tylko jednego obiektu ze zbioru pełnego> jest elementem < nazwa zbioru obiektów ze zbioru pełnego>. Zauważmy, że zwrot ten jest najczęściej równoznaczny ze zwrotami: (1) <nazwa tylko jednego obiektu> jest <nazwa obiektów, których ogół tworzy zbiór>, (2) <nazwa tylko jednego obiektu> jest jednym(ą) spośród <nazwa w liczbie mnogiej, która jest nazwą zbioru obiektów tego samego typu>, (3) <nazwa tylko jednego obiektu> należy do <nazwa zbioru obiektów>. Np. zdanie „Liczba jeden jest liczbą naturalną” jest równoznaczne ze zdaniem „Liczba jeden jest elementem zbioru liczb naturalnych” i ze zdaniem „Liczba jeden jest jedną spośród liczb ze zbioru liczb naturalnych” i ze zdaniem „Liczba jeden należy do zbioru liczb naturalnych”. W notacji matematycznej zamiast „x jest elementem A” piszemy: x∈A. Drugi predykat, który wprowadzamy do danego języka dziedziny wiedzy to predykat zawierania się zbiorów zadany wzorem: <nazwa pierwszego zbioru> zawiera się w <nazwa drugiego zbioru> lub <nazwa drugiego zbioru> zwiera <nazwa pierwszego zbioru>; A zawiera się w B =df A ⊆ B lub A ⊂ B. Zbiór pierwszy zawiera się drugim wtedy i tylko wtedy, gdy każdy element pierwszego zbioru jest elementem drugiego zbioru. Zwróćmy uwagę na to, że zwrot ten jest równoznaczny ze zwrotami: (1) <nazwa pierwszego zbioru> jest zawarty w < nazwa drugiego zbioru>, (2) <nazwa pierwszego zbioru> jest częścią <nazwa drugiego zbioru>, (3) <nazwa pierwszego zbioru> jest podzbiorem <nazwa drugiego zbioru>, (4) <nazwa pierwszego zbioru> jest < nazwa obiektów, których ogół jest zbiorem>. Np. zgodnie ze zwrotem (4) zbudowane jest zdanie „Człowiek jest istotą rozumną”. Zdanie to jest równoznaczne zdaniu „Zbiór wszystkich ludzi zawiera się w zbiorze istot rozumnych”. Do język dziedziny wiedzy wprowadzimy też, o ile wcześniej tam go nie było, dodatkowo predykat identyczności (równości) zbiorów. Będziemy go tu rozumieć następująco: zbiór pierwszy to tyle samo co zbiór drugi (jest równy drugiemu), gdy każdy obiekt jest elementem zbioru pierwszego wtedy i tylko wtedy, gdy jest elementem zbioru drugiego. Predykat identyczności dla zbiorów będzie oczywiście równoznaczny z następującymi zwrotami: (5) <nazwa pierwszego zbioru> to tyle samo co <nazwa drugiego zbioru>, gdzie zastosowano ogólny schemat dla identyczności <schemat pierwszej nazwy > = <schemat drugiej nazwy>, (6) <nazwa pierwszego zbioru> jest identyczny z <nazwa drugiego zbioru>, (7) <nazwa pierwszego zbioru> i <nazwa drugiego zbioru> są identyczne, (8) <nazwa pierwszego zbioru> jest równy <nazwa drugiego zbioru>, (9) <nazwa pierwszego zbioru> i <nazwa drugiego zbioru> są równe, (10) <nazwa pierwszego zbioru> jest <nazwa drugiego zbioru>, (11) <nazwa pierwszego zbioru> i <nazwa drugiego zbioru> są takie same. W rozważanym języku wyróżnimy teraz tylko te wyrażenia zdaniowe, które dają się zbudować z a) nazw zbiorów, b) nazw ich elementów, c) operacji: sumy dwóch zbiorów, iloczynu dwóch zbiorów, różnicy dwóch zbiorów i dopełnienia zbioru, d) predykatów: przynależności, zawierania się zbiorów i identyczności zbiorów, e) stałych logicznych: spójników i kwantyfikatorów. Przyjmując wprowadzone schematy reprezentacji wiedzy o zbiorach i standardową notację, otrzymujemy w ten sposób sformalizowany język tej dziedziny wiedzy zwany językiem algebry zbiorów. 1.1.4.3 Wielosortowe struktury relacyjne Rozszerzając język algebry zbiorów o symbole reprezentujące zbiory, zwane rodzinami, których elementami mogą być zbiory, symbole uporządkowanych wieloelementowych układów, produktów kartezjańskich oraz relacji i funkcji, otrzymujemy język teorii mnogości. Zwróćmy najpierw uwagę na następujące oznaczenia: Układ uporządkowany (krotka) <x1,x2> =df {{x1}, {x1, x2}}, <x1, x2, … xn, xn+1> =df <<x1, x2, … xn>, xn+1>, Produkt (Iloczyn) kartezjański zbiorów <x1, x2, … xn> ∈ A1×A2× … ×An = x1∈A1 ∧ x2∈A2 ∧… ∧ xn∈An. n-argumentowa relacja R R ⊆ A1×A2× … ×An i R≠∅. n-argumentowa operacja lub funkcja f f ⊆ A1×A2× … ×An+1 i f≠∅ oraz gdy <x1, x2, … xn, y> ∈ f i <x1, x2, … xn, y’> ∈ f, to y = y’ . Piszemy: y = f(x1, x2, … xn). Niech U jest rodziną zbiorów pełnych (uniwersów), Rel jest rodziną relacji określonych na produktach kartezjańskich niektórych z tych zbiorów pełnych, Fun jest rodziną funkcji określonych na niektórych z tych zbiorów pełnych, ponadto U0 jest zbiorem wyróżnionych elementów zbiorów pełnych, wtedy czwórkę < U, Rel, Fun, U0> nazywamy wielosortową strukturą relacyjną. Gdy jest tylko jeden zbiór pełny (uniwersum) to tę strukturę będziemy nazywać krótko struktura relacyjną. Np. takie dziedziny wiedzy jak arytmetyka, czy dziedziny wiedzy o algebrach są w matematyce określane jako struktury relacyjne i zwane modelami dla teorii pierwszego rzędu (o modelach teorii będziemy mówić na innych wykładach). Uwaga: każdą wielosortową strukturę relacyjną możemy przekształcić w strukturę relacyjną (jednosortową), sumując mnogościowo zbiory pełne (uniwersa); zapis struktur wielosortowych stosujemy dlatego, że jest w określeniu wielu dziedzin wiedzy bardziej precyzyjny niż znany w matematyce zwykły zapis struktur relacyjnych. Ponadto: każda wielosortowa struktura relacyjna jest dziedziną wiedzy, w której rodzina U jest zbiorem pojęć. Przykładową wielosortową strukturą relacyjną jest dziedzina wiedzy dla zadania 1.1.1.1 o przelewaniu wody (patrz tablica decyzyjna 1.1.1.1): U1 = {0, 1, 2, 3, 4, 5}, U2 = {0, 1, 2, 3}, R1 = {<x,y>∈U1×U2 : x≤5, y≤3} = U1×U2, R2 = {<x,y>∈U1×U2 : x + y≤5}, R3 = {<x,y>∈U1×U2 : x + y≤3}, R4 = {<x,y>∈U1×U2: gdy po ciągu operacjach przelewania wody począwszy od sytuacji S(0,0) następuje sytuacja S(x, y)}, f1 = {<x,y>∈U1×U1 : x=y}, f2 = {<x,y>∈U2×U2 : x=y}, f3 = {<u, v, y>∈ U1×U2×U2 : u + v = y i u + v ≤3}, f4 = {<u, v, x>∈ U1×U2×U1 : u + v = x i u + v ≤5}, f5 = {<u, v, y>∈ U1×U2×U2 : u + v – 5 = y}, f6 = {<u, v, x>∈ U1×U2×U1 : u + v – 3 = x}, U0 = {0, 3, 5}. „Świat odmierzania wody” ma następującą wielosortową (dwusortową) strukturę relacyjną: <{U1, U2}, {R1, R2, R3, R4}. {f1, f2, f3, f4, f5, f6}, U0> . Jeżeli należenie liczby x do uniwersów opiszemy odpowiednio wyrażeniami D1(x) i D2(x), a poszczególne relacje oznaczymy symbolami predykatów dwuargumentowych P12, P22, P32 oraz P42, funkcjom natomiast nadamy oznaczenia symboli funkcyjnych: f11, f21, f32, f42, f52, f62, ponadto liczby ze zbioru U0 oznaczymy symbolami c1, c2, c3, wtedy używając symboli spójników i kwantyfikatorów, będziemy mogli napisać dowolną formalizację zdania, którego elementarne składniki: nazwy, funktory nazwotwórcze i zdaniotwórcze oraz wyróżnione nazwy indywidualne, reprezentują podstawowe składniki wiedzy określonej przez powyższą wielosortową strukturą relacyjną. Otrzymujemy w ten sposób zbiór formuł rachunku kwantyfikatorów w notacji standardowej, podanej wcześniej. W formalizacji możemy także stosować w zapisie predykatów notację znaną w matematyce. Np. formuły: (w notacji rachunku kwantyfikatorów) ∀x1∀x2(D1(x1) ∧ D2(x2) ⇒ P12(x1,x2)), ∀x1∀x2 (P32(x1,x2) ⇒ P42(c1,f32(x1,x2))), (w notacji dziedzin matematycznych) ∀x∀y(x∈ {0,1,2,3,4,5} ∧ y∈ {0,1 2.3}⇒ x≤5 ∧ y≤3), (*) ∀x∀y (S(x,y) ∧ x + y ≤3 ⇒ S(0, x + y)), są prawdziwe w opisanej strukturze relacyjnej. Pierwsza formuła głosi, że w naczyniach mieszczą się jedynie takie ilości wody, które należą do uniwersów. Druga głosi jedną z reguł przelewania wody, że jeśli suma ilości wody w naczyniach nie przekracza trzech litrów, to można tak przelewać wodę z pierwszego naczynia do drugiego (operacja f3), że w pierwszym naczyniu otrzymamy 0 l wody (c1), a w drugim sumę litrów wody (f32(x1,x2) ). Zauważmy, że wszystkie reguły wymienione w Tab. 1.1.1.1 można uzasadnić formułami podobnymi do formuły (*), a ponadto stosować je jako reguły służące do wyprowadzania innych formuł. W ten sposób wyprowadzenie stany S(4,0) rozwiązania zadania o odmierzaniu wody może wyglądać następująco: 1. 2. 3. 4. 5. 6. 7. 8. 9. S(0,0) zał. S(0,3) reguła R1, operacja O1 S(3,0) reguła R2, operacja O6 S(3,3) reguła R1, operacja O1 S(5,1) reguła R1, operacja O7 S(0,1) reguła R1, operacja O3 S(1,0) reguła R1, operacja O7 S(1,3) reguła R1, operacja O1 S(4,0) reguła R1, operacja O7 Co kończy wyprowadzenie S(4,0) Analogiczną jak dla „Świata odmierzania wody” metodę formalizacji możemy zastosować metodę formalizacji dla dowolnej struktury relacyjnej. Tak prowadzona formalizacja daje język sformalizowany dla danej struktury relacyjnej. Reprezentowanie wiedzy o wartościach logicznych zdań – tabele prawdziwościowe Dotąd rozważaliśmy schematy zdań będące reprezentacjami wiedzy o tym, w jaki sposób zdania złożone są zbudowane ze zdań prostych. Nie interesowało nas, czy zdanie reprezentuje wiedzę o pewnym stanie rzeczy, czy też nie, tzn., czy zdanie to jest prawdziwe w pewnej dziedzinie wiedzy (ma wartość logiczną prawdy), czy nie (ma wartość logiczną fałszu). Nie była też brana pod uwagę wiedza o tym, jaka jest zależność pomiędzy wartością logiczną zdania złożonego utworzonego przy pomocy spójników ze zdań prostych a wartościami logicznymi tych zdań. Aby móc reprezentować tego rodzaju wiedzę, wartości prawdy i fałszu oznaczymy, odpowiednio, symbolami 1 i 0. W reprezentacji standardowej, będącej wynikiem formalizacji, wiedza o zasadach określania wartości logicznej zdań złożonych jest zazwyczaj przedstawiana za pomocą tabel prawdziwościowych , budowanych dla schematów tych zdań. Tabele prawdziwościowe dla formuł są wzorami, według których określamy wartość logiczną zdania złożonego w zależności od wartości zdań składowych: A 0 0 1 1 B 0 1 0 1 ¬A 1 1 0 0 A∨B 0 1 1 1 A∧B 0 0 0 1 A⇒B 1 1 0 1 A⇔B 1 0 0 1 Tab. 1 Formuły, które są schematami tylko zadań prawdziwych nazywamy tautologiami, a takie, które są schematami tylko zdań fałszywych nazywamy kontrtautologiami. To czy formuła jest tautologią czy nie możemy sprawdzić korzystając z tabel prawdziwościowych. Np. każda formuła postaci (A ∧ (B ∨ C)) ⇒ (¬C ⇒ A) jest tautologią, gdyż na podstawie tabel prawdziwościowych można wykazać, że przy dowolnych wartościach logicznych składowych A, B, C formuła reprezentuje zadanie prawdziwe (Tab. 2) Zauważmy, że na podstawie tabel prawdziwościowych dla spójników zdaniowych dysponujemy następującą wiedzą: • formuła ¬A jest tautologią, gdy dowolne zdanie o schemacie A jest fałszywe, co oznacza, że A jest kontrtautologią, • formuła A ∨ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ∨ B co najmniej jedno ze zdań o schematach A, B jest prawdziwe, w szczególności, gdy jedna z formuł A lub B jest tautologią, • formuła A ∧ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ∧ B oba zdania schematach A, B są prawdziwe, w szczególności, gdy obie formuły A i B są tautologiami, • formuła A ⇒ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ⇒ B, jeżeli zdanie o schemacie A jest prawdziwe, to zdanie o schemacie B jest prawdziwe, w szczególności, jeżeli formuła A jest tautologią, to B jest też tautologią, • formuła A ⇔ B jest tautologią, gdy w dowolnym zdaniu o schemacie A ⇔ B oba zdania o schematach A, B mają tę samą wartość logiczną, w szczególności, gdy obie formuły A i B są tautologiami lub kontrtautologiami, A B C B∨C 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 0 0 0 0 1 1 1 1 0 0 1 1 1 1 1 1 ¬C A ∧ (B ∨ C 1 1 1 1 0 0 0 0 0 0 0 1 0 1 0 1 ¬C ⇒ A 0 1 0 1 1 1 1 1 (A ∧ (B ∨ C)) ⇒ (¬C ⇒ A) 1 1 1 1 1 1 1 1 Tab. 2 Rozważmy teraz formuły poprzedzone kwantyfikatorami. Niech A(x) jest dowolną formułą, w której x jest jedyną zmienną wolną. Oznaczmy zbiór wszystkich zdań, których schematem jest ta formuła przez P, gdy wszystkie zdnia tego zbioru są prawdziwe, przez F, gdy są fałszywe, a przez T, gdy niektóre zdania tego zbioru są prawdziwe, a niektóre fałszywe. Wiedzę o wartościach logicznych zdań, których schematem jest formuła ∀xA(x) lub formuła ∃xA(x) reprezentuje tabela A(x) ∀xA(x) ∃xA(x) P 1 1 F 0 0 T 0 1 Tab. 3 Wiedzę reprezentowaną przez powyższą tabelę możemy też sformułować następująco: • jeżeli formuła ∀xA(x) jest schematem zdania prawdziwego, to formuła A(x) jest schematem zdań wśród których każde zdanie jest prawdzie, np. zdanie o schemacie A(c), gdzie wybór termu c nie zależy od formuły A(x), a jedynie od dziedziny argumentu x, jest więc dowolny, • jeżeli formuła ∃xA(x) jest schematem zdania prawdziwego, to formuła A(x) jest schematem zdań wśród których co najmniej jedno zdanie jest prawdzie, np. zdanie o schemacie A(c), gdzie wybór termu c zależy od formuły A(x) i od dziedziny argumentu x, a więc może być dokonany tylko raz podczas formalizacji tekstu, • jeżeli formuła ¬∀xA(x) jest schematem zdania prawdziwego, to formuła ¬A(x) jest schematem zdań wśród których co najmniej jedno zdanie jest prawdzie, np. zdanie o schemacie ¬A(c), gdzie wybór termu c zależy od formuły A(x) i od dziedziny argumentu x, a więc może być dokonany tylko raz podczas formalizacji tekstu, • jeżeli formuła ¬∃xA(x) jest schematem zdania prawdziwego, to formuła ¬A(x) jest schematem zdań wśród których każde zdanie jest prawdzie, np. zdanie o schemacie ¬A(c), gdzie wybór termu c nie zależy od formuły A(x), a jedynie od dziedziny argumentu x, jest więc dowolny, Wykorzystując powyższą wiedzę, sprawdzanie czy schemat danego zdania jest tautologią można dokonywać na dwa sposoby: 1. zbadać, czy wartość logiczna prawdziwego zdania złożonego o danym schemacie nie zależy od wartości logicznej zdań składowych – jest sprawdzanie wprost, 2. zbadać, czy założenie, że zdanie złożone o danym schemacie ma wartość logiczną fałszu, może prowadzić do sytuacji, w której zdanie przyjmuje dwie różne wartości logiczne czy też, w której pewne zdanie i jego negacja są jednocześnie prawdziwe lub jednocześnie fałszywe, tzn. zachodzi sprzeczność – jest to sprawdzanie nie wprost. Zauważmy, że sprawdzanie tautologiczności bazuje na wnioskowaniu, a opisane zasady sprawdzania można precyzyjniej przedstawić w postaci następujących schematów: (NN) (K) ¬¬A A A∧ B A (NK) ¬( A ∧ B) ¬A | ¬B (A) A∨ B A| B (C) ¬( A ∨ B ) ¬A (NA) A⇒ B ¬A | B (NC) ¬( A ⇒ B) A ¬B (EX) ∃xA( x) A(c) (NEX) (ALL) ∀xA( x) A(c) (NALL) ¬∃xA( x) ¬A( x) ¬∀x( Ax) ¬A(c) Gdzie znak „|” oznacza rozgałęzienie wywodu, a ograniczenia nałożone na term są takie jak poprzednio. Logicy w XX w. wykazali, że zaprezentowana tu wiedza o formalizacji tekstów języków dziedzin wiedzy jest wystarczająca do sprawdzenia nie wprost czy dowolna formuła jest tautologią, jest to tzw. metoda tabel analitycznych. Metoda ta jest także skuteczna do badania poprawności rozumowań prezentowanych w tekstach wyrażających wiedzę z dowolnych dziedzin oraz do określenia szerokiej klasy formuł (tzw. klauzul hornowskich), dla których możliwa jest automatyzacja rozumowań przez komputery. Tak rozumiana automatyzacja jest przedmiotem programowania logicznego. Elementy logicznej teorii tekstu Podsumowując rozważania dotyczące formalizacji naszkicujemy, podając listę stosownych definicji, aparat pojęciowy umożliwiający sformułowanie logicznej teorii tekstu. Przez wiedzę będziemy rozumieć, jak poprzednio, informację przetwarzaną przez umysł człowieka, a przez reprezentację wiedzy, przedstawianie (kodowanie) wiedzy za pomocą różnorakich środków w ramach systemów komunikacji międzyludzkiej. Reprezentacje wiedzy są więc tekstami. Zrelatywizowanie reprezentacji wiedzy do dziedzin wiedzy prowadzi do wyodrębnienia tekstowych dziedzin wiedzy, a wyrażanie tych tekstów w jakimś języku, do wyodrębnienia języka dziedziny wiedzy. Gdy wszystkie równokształtne teksty reprezentują tę samą wiedzę ( w szczególności są pusto spełnione), a równokształtność jest kongruencją w tekstowej dziedzinie wiedzy, to tekstową dziedzinę wiedzy nazywamy systemem reprezentacji wiedzy. Definicja 1 Strukturę relacyjną < U, U0, ε, R> nazywamy tekstową dziedziną wiedzy, gdy U jest niepustym zbiorem wszystkich tekstów reprezentujących wiedzę z pewnej dziedziny, U0 – wyróżnionym niepustym podzbiorem zbioru U zwanym bazą tekstową, ε jest relacją częściowego porządku określoną na zbiorze U zwaną relacją zawierania się tekstów, a R jest ustalonym zbiorem relacji określonych w U zwanych relacjami nawiązywania tekstów. Definicja 2 Niech TDW = < U, U0, ε, R> jest tekstową dziedziną wiedzy. (a) Dwa teksty α,β∈U są równokształtne, gdy struktury relacyjne powstałe przez obcięcie systemu TDW odpowiednio do zbiorów {t∈U : t ε α}, {t∈U : t ε β} wszystkich tekstów zawartych w tekstach α,β są izomorficzne oraz części tekstu α pozostają w tych samych relacjach w systemie TDW co ich obrazy izomorficzne zawarte w tekście β. (b) Tekst α jest wyprowadzalny ze zbioru tekstów X⊆U, co zapisujemy X |- R α, gdy istnieje taki tekst β, zwany wyprowadzeniem tekstu α ze zbiory X, i istnieje taki ciąg tekstów α1, α2, ..., αn ∈ U, że spełnione są warunki (1) teksty α1, α2, ..., αn zawarte są w tekście β, (2) αn = α, (3) dla dowolnych i≤n: bądź αi ∈ X, bądź istnieją takie i1, i2, ..., ik < i oraz istnieje taka relacja r ∈ R, że <αi1, αi2, ..., αik,, αi> ∈ r (4) β jest najmniejszym tekstem w <U, ε > spełniającym warunki (1)-(3). (c) Ramą zbioru tekstów X⊆U nazywamy zbiór Fr(X) = {α∈U : X |- R α } (d) Poprawnie zbudowanymi nazywamy teksty należące do zbioru Fr(U0). (e) Dla dowolnych tekstów α, β ∈U, α ≥ β wttw istnieje taki zbiór X tekstów, że β ∈ X i X |- R α, napis „α ≥ β” czytamy: α nawiązuje do β, lub α jest następnikiem β, (f) Dla dowolnego tekstu α∈U, zbiór Ex(α) = {t∈U : t ε α} nazywamy budową tekstu α. (g) Tekst β jest rematem tekstu α wttw β ∈ Fr(U0), α ≠ β, β ∈ Ex(α) oraz nie istnieje taki tekst t∈ Ex(α), że t≥β. (h) Tekst t jest tematem tekstu α wttw t ∈ Fr(U0), α ≠ t, t ∈ Ex(α) oraz każdy następnik t należący do Ex(α) jest rematem α. (i) Dowolny tekst nazywamy jednostką tekstu, gdy posiada w swojej budowie rematy i tematy oraz gdy ze zbioru wszystkich tematów tego tekstu wyprowadzalny jest każdy z rematów. Zauważmy, że dowolne wyprowadzenie tekstu poprawnie zbudowanego jest jednostką tekstu. Ważne jest także stwierdzenie, że dla dowolnej tekstowej dziedziny wiedzy TDW, w której wszystkie równokształtne teksty reprezentują tę samą wiedzę, eżeli relacja „~” równokształtności tekstów jest kongruencją w TDW, to struktura ilorazowa TDW/~ jest także tekstową dziedziną wiedzy. Uzasadnione jest więc sformułowanie następującej definicji: Definicja 3 Niech w tekstowej dziedzinie wiedzy TDW wszystkie równokształtne teksty reprezentują tę sama wiedzę, a relacja „~” równokształtności tekstów jest kongruencją w TDW. Wtedy strukturę ilorazową TDW/~ nazywamy systemem reprezentacji wiedzy, relacje nawiązywania nazywamy relacjami konkatenacji, a o wyprowadzeniu danego tekstu mówimy, konkatenacją pewnego ciągu tekstów określonego przez że jest definicję wyprowadzenia tekstu. Tekstami są typy tekstów równokształtnych. Przyjmijmy dalej, że wiedza logiczna odnosi się do przetwarzania informacji we wszechświecie określającej ogólną budowę, cechy, przyporządkowania obiektów odnoszących się do danej dziedziny wiedzy oraz relacje pomiędzy tymi obiektami . Definicja 4 Język, w którym przedstawiamy schematycznie, za pomocą schematów, tj. formuł, wzorów, planów, diagramów itp., wiedzę logiczną nazywamy językiem sformalizowanym. Język ten jest określony przez cztery zbiory symboli < Al., Tr, Fm, W>, Al jest alfabetem, Tr – zbiorem termów, Fm – zbiorem formuł, a W jest rodziną zbiorów formuł takich, że do każdego z tych zbiorów należą formuły reprezentujące wiedzę o tej samej wartości logicznej. Alfabet składa się z ze stałych i zmiennych indywiduowych, będących zarazem termami, symboli funkcyjnych – wiążących stałe i zmienne w termy, predykatów – wiążących stałe i zmienne w formuły, spójników – wiążących formuły w inne formuły, kwantyfikatorów – wiążących zmienne i formuły w inne formuły oraz symboli pomocniczych (np. nawiasów, ramek, kropek, linii, strzałek itd.). Przykładem języka sformalizowanego jest język będący wynikiem formalizacji (schematyzacji) języka dowolnej dziedziny wiedzy. Definicja 5 Systemem reprezentacji wiedzy logicznej nazywamy system reprezentacji wiedzy, w którym zbiorem tekstów bazowych jest zbiór wszystkich symboli języka sformalizowanego, a zbiór relacji konkatenacji pozwala 1) wyróżnić wszystkie składniki języka sformalizowanego, 2) wyprowadzić formuły poprawnie zbudowane, 3) tworzyć teksty wywodów prowadzących od formuł o określonej wartości logicznej do formuł o określonej wartości logicznej (niezmienniczość wartości logicznych względem wywodów).