rozwiązania

Transkrypt

rozwiązania
Zadanie 1
X
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
frekwencja
WYSOKA
NISKA
WYSOKA
NISKA
WYSOKA
NISKA
WYSOKA
NISKA
WYSOKA
NISKA
a)
b)
c)
d)
Srednia_ocen
a
B
C
A
B
C
A
A
A
c
Liczba_nagród
C1
C3
C2
C3
C1
C3
C2
C3
C1
C3
W poszczególnych tygodniach działania systemu odpowiedzi na pytania były następujące:
T1 ={X1, X3, X7}
T5 ={X2, X4, X8, X3}
T2 ={X4, X8, X9, X10}
T6 ={X1, X3,X5, X7}
T3 ={X1, X2, X3, X5, X8}
T7 ={X1, X3, X7}
T4 ={X3, X5, X7}
Zakładając, że system S poddany został modyfikacji polegającej na umieszczaniu obiektów
będących odpowiedzią na zadawane pytania na górze kartoteki oraz przeszukiwaniu tylko
50% kartoteki bazy danych:
Napisz co to za modyfikacja oraz jakie zagrożenia się z nią wiążą
Napisz jak wyglądać będzie kartoteka wyszukiwawcza po 5 pytaniach
Przedstaw proces odpowiedzi na pytanie t= (frekwencja,wysoka)(średnia_ocen,B)
Jaka jest kompletność takiej odpowiedzi systemu ?
Przykładowe rozwiązanie
Odp. A. Chodzi o modyfikację listo prostych zwaną odcedzaniem. Patrząc na punkt B wiadomo, że nie będziemy zadawać
wszystkich pytań z listy i chcemy znać układ obiektów w kartotece wyszukiwawczej po 5 zadanych pytaniach, dlatego
najlepsze do tego celu będzie odcedzanie dynamiczne bądź hiperdynamiczne. Zagrożenia możliwe to w przypadku
przeszukiwania tylko 50% KW utrata kompletności odpowiedzi.
Odp. B. Biorąc pod uwagę odpowiedzi na pytania t1,t2,t3,t4 i t5 zmieniamy po każdym pytaniu kolejność obiektów w
kartotece wyszukiwawczej tak, że jeśli obiekt był odpowiedzią na pytanie to przechodzi o jedno miejsce w górę
kartoteki.
T0
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
T1
X1
X3
X2
X4
X5
X7
X6
X8
X9
X10
T2
X1
X3
X4
X2
X5
X7
X8
X9
X10
X6
T3
X1
X3
X2
X5
X4
X8
X7
X9
X10
X6
T4
X3
X1
X5
X2
X4
X7
X8
X9
X10
X6
T5
X3
X1
X2
X4
X5
X8
X7
X9
X10
X6
Więc po 5 zadanym pytaniu Kartoteka wyszukiwawcza jest następująca:
X
X3
X1
X2
X4
X5
X8
X7
X9
X10
X6
frekwencja
WYSOKA
WYSOKA
NISKA
NISKA
WYSOKA
NISKA
WYSOKA
WYSOKA
NISKA
NISKA
Srednia_ocen
C
a
B
A
B
A
A
A
c
C
Liczba_nagród
C2
C1
C3
C3
C1
C3
C2
C1
C3
C3
Odp. C. proces odpowiedzi na pytanie t= (frekwencja,wysoka)(średnia_ocen,B)
Zakładając że przeszukujemy tylko 50% kartoteki mamy do przeglądnięcia jedynie następujące obiekty:
X
X3
X1
X2
X4
X5
frekwencja
WYSOKA
WYSOKA
NISKA
NISKA
WYSOKA
Srednia_ocen
C
a
B
A
B
Liczba_nagród
C2
C1
C3
C3
C1
Zatem sprawdzamy kolejno opisy tych obiektów i fakt, czy iloczyn deskryptorów (frekwencja,wysoka)(średnia_ocen,B) zawiera się
w opisie analizowanego obiektu:
(frekwencja,wysoka)(średnia_ocen,B) ≤ tx3
(frekwencja,wysoka)(średnia_ocen,B) ≤ tx1
(frekwencja,wysoka)(średnia_ocen,B) ≤ tx2
(frekwencja,wysoka)(średnia_ocen,B) ≤ tx4
(frekwencja,wysoka)(średnia_ocen,B) ≤ tx5
Zatem skoro jedynie w opisie obiektu x5 zawiera się szukany iloczyn deskryptorów zapisujemy nazwę tego obiektu jako
znaczenie termu t:
(t) = {x5}
Odp. D: kompletność takiej odpowiedzi systemu wynosi 1 (100%) gdyż wyszukaliśmy wszystkie obiekty
relewantne z systemu. Jak do tego dojść ?
Sprawdzamy opisy wszystkich obiektów (a nie jedynie 50%) i szukamy obiektów zawierających w swoim opisie
szukany iloczyn deskryptorów. Okazuje się, że w całym systemie jedynie obiekt x5 zawiera taki iloczyn
deskryptorów. A zatem, przeglądając jedynie 50% kartoteki wyszukiwawczej uzyskaliśmy kompletną
odpowiedź – gdyż wyszukaliśmy wszystko co było do wyszukania.
Zadanie 2
1.
Dokonaj modyfikacji metody list prostych zwanej organizacją zwartą. Następnie przedstaw kartotekę wyszukiwawczą dla tej modyfikacji i
napisz algorytm słowny procesu wyszukiwania. Omów sposób wyszukiwania odpowiedzi na pytanie identyczne jak pytanie t2. Poniżej
przedstawiono reprezentację macierzową relacji: zbiór pytań – zbiór obiektów relewantnych:
t1 t2 t3 t4 t5
x1
1 0 1 1 1
x2
0 1 1 1 0
x3
1 0 1 0 1
x4
1 0 0 0 0
x5
1 0 1 0 0
Odp: Pamiętając, że organizacja zwarta ma na celu takie przeszeregowanie obiektów w którym obiekty stanowiące
odpowiedź na pytanie są układane obok siebie w kartotece (stanowią zwarty obszar „jedynek” w takiej macierzy)
zmieniamy kolejność obiektów z początkowej (widocznej w macierzy powyżej) na następującą:
x4
x5
x3
x1
x2
t1
1
1
1
1
0
t2
0
0
0
0
1
t3
0
1
1
1
1
t4
0
0
0
1
1
t5
0
0
1
1
0
Obiektom nadajemy nowe uporządkowanie:
x4
x5
x3
x1
x2
1
2
3
4
5
Więc kartoteka wyszukiwawcza będzie następująca:
NU
1
2
3
4
5
X
X4
X5
X3
X1
X2
a
..
..
..
..
..
b
..
..
..
..
..
…
..
..
..
..
..
Do tego dochodzi tablica adresowa:
t
t1
t2
t3
t4
t5
AP
1
5
2
4
3
AK
4
5
5
5
4
algorytm słowny procesu wyszukiwania
Jeśli pytanie należy do zestawu pytań, które tworzyły kartotekę (a więc jest to jedno z pytań t1..t5) to szukamy w tablicy adresowej danego termu i
pobieramy adres początku AP oraz końca AK bloku obiektów stanowiących odpowiedź na ten term. Następnie pobieramy z kartoteki
wyszukiwawczej nazwy obiektów. Jeśli pytanie zawiera w sobie któreś z pytań t1..t5 to także szukamy właściwego termu w tablicy adresowej i to
stanowi dla nas odpowiedź przybliżoną. Wybrany blok obiektów od AP do AK należy potem przeszukać w celu sprawdzenia czy pozostałe
deskryptory pytania zawierają się w obiektach odpowiedzi przybliżonej. Jeśli pytanie jest spoza zbioru t1..t5 to niestety konieczny jest przegląd
zupełny.
sposób wyszukiwania odpowiedzi na pytanie identyczne jak pytanie t2.
1. Szukamy t2 w tablicy adresowej:
t
t1
t2
t3
t4
t5
AP
1
5
2
4
3
AK
4
5
5
5
4
2. Pobieramy AP oraz AK:
AP = 5
AK = 5
3. Przechodzimy do Kartoteki wtórnej nowouporządkowanej i pobieramy właściwe nazwy obiektów (w tablicy
adresowej mieliśmy do dyspozycji jedynie tzw. Nowe adresy obiektów)
NU
1
2
3
4
5
X
X4
X5
X3
X1
X2
a
..
..
..
..
..
b
..
..
..
..
..
…
..
..
..
..
..
(t2) = {x2}
Zadanie 3
Dany jest system informacyjny:
Tytuł
Rodzaj
Reżyser
Rok produkcji
Budżet
Kraj
Pianista
Dramat
Roman Polański
niedawno
bardzo wysoki
Francja
Twin Peaks: Ogniu krocz ze
mną
Dramat
David Lynch
dawno
średni
Francja
Donnie Darko
Dramat
Richard Kelly
niedawno
średni
Stany Zjednoczone
Forrest Gump
Dramat
Robert Zemeckis
dawno
bardzo wysoki
Stany Zjednoczone
Wywiad z wampirem
Horror
Neil Jordan
dawno
bardzo wysoki
Stany Zjednoczone
Mulholland Drive
Dramat
David Lynch
niedawno
wysoki
Francja
Motyl i skafander
Dramat
Julian Schnabel
niedawno
wysoki
Francja
Efekt motyla
Thriller
J. Mackye Gruber
niedawno
wysoki
Stany Zjednoczone
Dzień Tryfidów
Science-fiction
Freddie Francis
bardzo dawno
niski
Wielka Brytania
Wysłannik piekieł
Horror
Clive Barker
bardzo dawno
średni
Wielka Brytania
Przedstaw kartotekę wyszukiwawczą dla metody list prostych z grupowaniem obiektów wiedząc, że najczęściej padają pytania dotyczące
rodzaju filmu. Uzasadnij jak wprowadzone przez Ciebie modyfikacje wpłyną na określone parametry: czas wyszukiwania i zajętość pamięci
? Następnie przedstaw proces wyszukiwania wszystkich bardzo starych.
Zadanie 3 próbujemy już zrobić naprawdę samodzielnie…