rozwiązania
Transkrypt
rozwiązania
Zadanie 1 X X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 frekwencja WYSOKA NISKA WYSOKA NISKA WYSOKA NISKA WYSOKA NISKA WYSOKA NISKA a) b) c) d) Srednia_ocen a B C A B C A A A c Liczba_nagród C1 C3 C2 C3 C1 C3 C2 C3 C1 C3 W poszczególnych tygodniach działania systemu odpowiedzi na pytania były następujące: T1 ={X1, X3, X7} T5 ={X2, X4, X8, X3} T2 ={X4, X8, X9, X10} T6 ={X1, X3,X5, X7} T3 ={X1, X2, X3, X5, X8} T7 ={X1, X3, X7} T4 ={X3, X5, X7} Zakładając, że system S poddany został modyfikacji polegającej na umieszczaniu obiektów będących odpowiedzią na zadawane pytania na górze kartoteki oraz przeszukiwaniu tylko 50% kartoteki bazy danych: Napisz co to za modyfikacja oraz jakie zagrożenia się z nią wiążą Napisz jak wyglądać będzie kartoteka wyszukiwawcza po 5 pytaniach Przedstaw proces odpowiedzi na pytanie t= (frekwencja,wysoka)(średnia_ocen,B) Jaka jest kompletność takiej odpowiedzi systemu ? Przykładowe rozwiązanie Odp. A. Chodzi o modyfikację listo prostych zwaną odcedzaniem. Patrząc na punkt B wiadomo, że nie będziemy zadawać wszystkich pytań z listy i chcemy znać układ obiektów w kartotece wyszukiwawczej po 5 zadanych pytaniach, dlatego najlepsze do tego celu będzie odcedzanie dynamiczne bądź hiperdynamiczne. Zagrożenia możliwe to w przypadku przeszukiwania tylko 50% KW utrata kompletności odpowiedzi. Odp. B. Biorąc pod uwagę odpowiedzi na pytania t1,t2,t3,t4 i t5 zmieniamy po każdym pytaniu kolejność obiektów w kartotece wyszukiwawczej tak, że jeśli obiekt był odpowiedzią na pytanie to przechodzi o jedno miejsce w górę kartoteki. T0 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 T1 X1 X3 X2 X4 X5 X7 X6 X8 X9 X10 T2 X1 X3 X4 X2 X5 X7 X8 X9 X10 X6 T3 X1 X3 X2 X5 X4 X8 X7 X9 X10 X6 T4 X3 X1 X5 X2 X4 X7 X8 X9 X10 X6 T5 X3 X1 X2 X4 X5 X8 X7 X9 X10 X6 Więc po 5 zadanym pytaniu Kartoteka wyszukiwawcza jest następująca: X X3 X1 X2 X4 X5 X8 X7 X9 X10 X6 frekwencja WYSOKA WYSOKA NISKA NISKA WYSOKA NISKA WYSOKA WYSOKA NISKA NISKA Srednia_ocen C a B A B A A A c C Liczba_nagród C2 C1 C3 C3 C1 C3 C2 C1 C3 C3 Odp. C. proces odpowiedzi na pytanie t= (frekwencja,wysoka)(średnia_ocen,B) Zakładając że przeszukujemy tylko 50% kartoteki mamy do przeglądnięcia jedynie następujące obiekty: X X3 X1 X2 X4 X5 frekwencja WYSOKA WYSOKA NISKA NISKA WYSOKA Srednia_ocen C a B A B Liczba_nagród C2 C1 C3 C3 C1 Zatem sprawdzamy kolejno opisy tych obiektów i fakt, czy iloczyn deskryptorów (frekwencja,wysoka)(średnia_ocen,B) zawiera się w opisie analizowanego obiektu: (frekwencja,wysoka)(średnia_ocen,B) ≤ tx3 (frekwencja,wysoka)(średnia_ocen,B) ≤ tx1 (frekwencja,wysoka)(średnia_ocen,B) ≤ tx2 (frekwencja,wysoka)(średnia_ocen,B) ≤ tx4 (frekwencja,wysoka)(średnia_ocen,B) ≤ tx5 Zatem skoro jedynie w opisie obiektu x5 zawiera się szukany iloczyn deskryptorów zapisujemy nazwę tego obiektu jako znaczenie termu t: (t) = {x5} Odp. D: kompletność takiej odpowiedzi systemu wynosi 1 (100%) gdyż wyszukaliśmy wszystkie obiekty relewantne z systemu. Jak do tego dojść ? Sprawdzamy opisy wszystkich obiektów (a nie jedynie 50%) i szukamy obiektów zawierających w swoim opisie szukany iloczyn deskryptorów. Okazuje się, że w całym systemie jedynie obiekt x5 zawiera taki iloczyn deskryptorów. A zatem, przeglądając jedynie 50% kartoteki wyszukiwawczej uzyskaliśmy kompletną odpowiedź – gdyż wyszukaliśmy wszystko co było do wyszukania. Zadanie 2 1. Dokonaj modyfikacji metody list prostych zwanej organizacją zwartą. Następnie przedstaw kartotekę wyszukiwawczą dla tej modyfikacji i napisz algorytm słowny procesu wyszukiwania. Omów sposób wyszukiwania odpowiedzi na pytanie identyczne jak pytanie t2. Poniżej przedstawiono reprezentację macierzową relacji: zbiór pytań – zbiór obiektów relewantnych: t1 t2 t3 t4 t5 x1 1 0 1 1 1 x2 0 1 1 1 0 x3 1 0 1 0 1 x4 1 0 0 0 0 x5 1 0 1 0 0 Odp: Pamiętając, że organizacja zwarta ma na celu takie przeszeregowanie obiektów w którym obiekty stanowiące odpowiedź na pytanie są układane obok siebie w kartotece (stanowią zwarty obszar „jedynek” w takiej macierzy) zmieniamy kolejność obiektów z początkowej (widocznej w macierzy powyżej) na następującą: x4 x5 x3 x1 x2 t1 1 1 1 1 0 t2 0 0 0 0 1 t3 0 1 1 1 1 t4 0 0 0 1 1 t5 0 0 1 1 0 Obiektom nadajemy nowe uporządkowanie: x4 x5 x3 x1 x2 1 2 3 4 5 Więc kartoteka wyszukiwawcza będzie następująca: NU 1 2 3 4 5 X X4 X5 X3 X1 X2 a .. .. .. .. .. b .. .. .. .. .. … .. .. .. .. .. Do tego dochodzi tablica adresowa: t t1 t2 t3 t4 t5 AP 1 5 2 4 3 AK 4 5 5 5 4 algorytm słowny procesu wyszukiwania Jeśli pytanie należy do zestawu pytań, które tworzyły kartotekę (a więc jest to jedno z pytań t1..t5) to szukamy w tablicy adresowej danego termu i pobieramy adres początku AP oraz końca AK bloku obiektów stanowiących odpowiedź na ten term. Następnie pobieramy z kartoteki wyszukiwawczej nazwy obiektów. Jeśli pytanie zawiera w sobie któreś z pytań t1..t5 to także szukamy właściwego termu w tablicy adresowej i to stanowi dla nas odpowiedź przybliżoną. Wybrany blok obiektów od AP do AK należy potem przeszukać w celu sprawdzenia czy pozostałe deskryptory pytania zawierają się w obiektach odpowiedzi przybliżonej. Jeśli pytanie jest spoza zbioru t1..t5 to niestety konieczny jest przegląd zupełny. sposób wyszukiwania odpowiedzi na pytanie identyczne jak pytanie t2. 1. Szukamy t2 w tablicy adresowej: t t1 t2 t3 t4 t5 AP 1 5 2 4 3 AK 4 5 5 5 4 2. Pobieramy AP oraz AK: AP = 5 AK = 5 3. Przechodzimy do Kartoteki wtórnej nowouporządkowanej i pobieramy właściwe nazwy obiektów (w tablicy adresowej mieliśmy do dyspozycji jedynie tzw. Nowe adresy obiektów) NU 1 2 3 4 5 X X4 X5 X3 X1 X2 a .. .. .. .. .. b .. .. .. .. .. … .. .. .. .. .. (t2) = {x2} Zadanie 3 Dany jest system informacyjny: Tytuł Rodzaj Reżyser Rok produkcji Budżet Kraj Pianista Dramat Roman Polański niedawno bardzo wysoki Francja Twin Peaks: Ogniu krocz ze mną Dramat David Lynch dawno średni Francja Donnie Darko Dramat Richard Kelly niedawno średni Stany Zjednoczone Forrest Gump Dramat Robert Zemeckis dawno bardzo wysoki Stany Zjednoczone Wywiad z wampirem Horror Neil Jordan dawno bardzo wysoki Stany Zjednoczone Mulholland Drive Dramat David Lynch niedawno wysoki Francja Motyl i skafander Dramat Julian Schnabel niedawno wysoki Francja Efekt motyla Thriller J. Mackye Gruber niedawno wysoki Stany Zjednoczone Dzień Tryfidów Science-fiction Freddie Francis bardzo dawno niski Wielka Brytania Wysłannik piekieł Horror Clive Barker bardzo dawno średni Wielka Brytania Przedstaw kartotekę wyszukiwawczą dla metody list prostych z grupowaniem obiektów wiedząc, że najczęściej padają pytania dotyczące rodzaju filmu. Uzasadnij jak wprowadzone przez Ciebie modyfikacje wpłyną na określone parametry: czas wyszukiwania i zajętość pamięci ? Następnie przedstaw proces wyszukiwania wszystkich bardzo starych. Zadanie 3 próbujemy już zrobić naprawdę samodzielnie…