STRUKTURA HIPERTEKSTU A STRUKTURA SYSTEMU WWW
Transkrypt
STRUKTURA HIPERTEKSTU A STRUKTURA SYSTEMU WWW
STRUKTURA HIPERTEKSTU A STRUKTURA SYSTEMU WWW Przemysław Kazienko Zakład Systemów Informacyjnych Wydział Informatyki i Zarz dzania Politechniki Wrocławskiej Hipertekst, struktura hipertekstu, system WWW, struktura systemu WWW, odsyłacze hipertekstowe. 1. WPROWADZENIE Idea hipertekstu została po raz pierwszy przedstawiona przez Vannevar Busha w 1945 roku [10]. Jednak e dynamiczny rozwój koncepcji hipertekstu nast pił dopiero w latach osiemdziesi tych i dziewi dziesi tych. Opracowano wtedy wiele modeli hipertekstu, jak np. Dexter [27], HDM [24], Proxhy [30], Microcosm [28] czy bardziej formalny - XHMBS [38]; nadal prowadzone s badania w tym zakresie. Napisanych zostało tak e du o ksi ek i artykułów w czasopismach naukowych, jak równie cyklicznie odbywaj si wielkie mi dzynarodowe konferencje z tej dziedziny, np. ACM International Hypertext Conference czy International WWW Conference. Jako szczególny przykład systemu hipertekstowego mo na wymieni system WWW, który wraz z poczt elektroniczn , jest najwa niejsz usług dost pn w sieci Internet. Ze wzgl du na swój dynamiczny rozwój system WWW stanowi pole badawcze wielu naukowców na całym wiecie. Do pocz tków lat dziewi dziesi tych badania z dziedziny hipertekstu ograniczały si głównie do modeli teoretycznych i prototypowych systemów autorskich. Obecnie mo na zaobserwowa olbrzymie zainteresowanie problemami, które wi si bezpo rednio z WWW. Dotyczy to zwłaszcza wyszukiwania i wydobywania informacji (ang. data mining), komunikacji u ytkownika z systemem i prezentacji danych (ang. user interface), modelowania zainteresowa u ytkowników i „personalizacji” systemu WWW (ang. user profile, user preference) oraz zarz dzania informacj udost pnian w systemie. 2. ELEMENTY STRUKTURY SYSTEMÓW HIPERTEKSTOWYCH System hipertekstowy jest zbiorem powi zanych ze sob dokumentów hipertekstowych. Składa si on z 2 zasadniczych elementów (rys. 1): • W złów zwanych tak e dokumentami lub ramkami (ang. node, document, frame) zawieraj cych zwykle tekstow porcj informacji. • Odsyłaczy, poł cze , linków (ang. link) tworz cych powi zania mi dzy poszczególnymi dokumentami lub nawet mi dzy cz ciami tego samego w zła. W zeł ródłowy (startowy) Odsyłacz B W zeł docelowy (ko cowy) Odsyłacz A Rys. 1. Elementy struktury systemu hipertekstowego. W schemacie przedstawionym na rys. 1 odsyłacz A ł czy dokument ródłowy (ang. source node) z dokumentem docelowym (ang. destination node), za odsyłacz B ró ne cz ci tego samego dokumentu. W zły prócz swojej tre ci tekstowej (w szczególnym przypadku, np. indeksu, jego cz tekstowa mo e by pusta) zawieraj tak e elementy odsyłaczy, tzn. przynajmniej ich punkt zaczepienia – startowy oraz cz prezentuj c odsyłacz u ytkownikowi - zwykle jest to nazwa w zła docelowego, do którego odsyłacz si odnosi. Jednostk informacji prezentowan jednorazowo u ytkownikowi jest wła nie w zeł w swej tre ci tekstowej wraz z wychodz cymi z niego odsyłaczami. W przypadku systemu WWW w zły nazywaj si stronami WWW (ang. pages). O strukturze hipertekstu przes dzaj odsyłacze, tj. miejsca ich umieszczenia w systemie, gdy bez nich przekształciłby si on w system linearny. Zbiór w złów i odsyłaczy tworzy system hipertekstowy (rys. 2). 2 3 4 1 5 6 7 System hipertekstowy Rys. 2. Struktura systemu hipertekstowego. W przykładowym systemie z rys. 2 niektóre dokumenty nie posiadaj odsyłaczy (3, 5, 7), a do niektórych one nie prowadz (4, 7). W zły 1, 4, 6 posiadaj odsyłacze prowadz ce na zewn trz systemu (linie przerywane), za do dokumentów 3 i 5 odsyłaj zewn trzne systemy. Dokument 7 nie posiada odsyłaczy i do niego nie prowadz odsyłacze. Taki dokument mo e istnie w systemie, cho jego u yteczno jest du o mniejsza. W w złach hipertekstowego systemu WWW (na stronach WWW) prócz tekstu wyst puj tak e inne media: d wi k, sekwencje wideo a przede wszystkim grafika – obrazy. Dlatego te w stosunku do niego bardziej adekwatnym okre leniem byłoby „hipermedialny”. Je eli chodzi o zawarto informacyjn systemu, to inne media pełni ogromnie wa n rol [17]. St d te w ostatnich latach, w dobie „społecze stwa informacyjnego”, mo na zaobserwowa olbrzymi rozwój technologii multimedialnych, w tym tak e systemu WWW. Istnienie innych mediów nie ma jednak zasadniczego znaczenia dla jego struktury. Elementy multimedialne, które nie s zwi zane z odsyłaczami nic nie wnosz do struktury systemu, za sytuacja, w której ródłem odsyłacza jest obraz (np. ikona) lub jego fragment (np. cz „klikowalnej” mapy) w zasadzie niczym si nie ró ni od tej, gdy pocz tkiem odsyłacza jest jego nazwa czyli tekst. Zreszt i tak na wielu stronach WWW istniej prócz odsyłaczy graficznych tak e odpowiadaj ce im odsyłacze tekstowe po to, aby umo liwi korzystanie ze stron równie u ytkownikom posiadaj cym jedynie tekstowe wersje przegl darek. Dotyczy to np. wi kszo ci przegl darek dla systemu UNIX. Wielu badaczy z dziedziny hipertekstu termin „hipertekstowy” i „hipermedialny” u ywa zamiennie [8]. Istniej systemy hipertekstowe (dotyczy to zwłaszcza systemu WWW), w których odsyłacze mog tak e prowadzi do ró nych cz ci tego samego dokumentu (patrz: dokumenty 2 i 6 na rys. 2). Mo na wymieni równie inne elementy struktury hipertekstowej, np. cie ka (ang. path) czyli droga, jak pokonuje u ytkownik poprzez w zły i odsyłacze, perspektywa czyli cało informacji jaka jest zawarta w zadanej cie ce [9] czy trasa (ang. tours) czyli sugerowana przez autorów cie ka [47]. W terminologii systemów hipertekstowych wykorzystywane jest tak e poj cie punktu zaczepienia, miejsce zakotwiczenia (ang. anchor) oznaczaj ce albo dokument ródłowy (punkt startowy odsyłacza) albo dokument docelowy (punkt ko cowy odsyłacza). Na rys. 1 startowe punkty zaczepienia oznaczone s czarnymi prostok tami w w le ródłowym. 3. RODZAJE SYSTEMÓW HIPERTEKSTOWYCH Ze wzgl du na sposób tworzenia mo na wyró ni zasadniczo dwa rodzaje systemów hipertekstowych: • Systemy autorskie – tworzone s przez jednego autora lub grup ci le współpracuj cych ze sob autorów. Słu one zwykle do zaprezentowania wiedzy z jakiej wybranej, w skiej dziedziny, w której s oni specjalistami. Autorskimi mo na nazwa np. ksi ki ukazuj ce si od kilku lat jako systemy hipertekstowe lub hipermedialne (np. [41]), czasami nawet bez formy drukowanej. Systemem autorskim b dzie tak e pojedynczy serwis WWW tworzony przez firm komercyjn , a słu cy np. do zaprezentowania oferty produkowanych wyrobów. Serwis taki jest opracowywany i utrzymywany przez jej pracowników lub przez wynaj t , inn , wyspecjalizowan firm . • Systemy otwarte – tworzone s przez wielu autorów, którzy ze sob nie współpracuj lub współpracuj bardzo mało. Mo na je zwykle tak e traktowa jako zbiór słabo zale nych od siebie systemów autorskich. Wa n ich cech jest stosunkowo du a elastyczno wykorzystywanego modelu i narz dzi. Zwykle w systemie otwartym istniej jedynie nieliczne sztywne reguły (w wypadku WWW b dzie to j zyk opisu strony - HTML) a ka dy z autorów mo e dodawa do tego swoje elementy. Innymi słowy - system jest otwarty, je li posiada jak najmniejsz liczb reguł i dopuszcza jak najwi cej elastyczno ci. Najwi kszym, hipertekstowym systemem otwartym jest WWW w sieci Internet. Ka dy mo e w nim stworzy i zaprezentowa swój system autorski. Wystarczy jedynie wykorzysta jedno z wielu umo liwiaj cych to narz dzi. Systemy autorskie charakteryzuj si spójno ci i dotycz jednego zagadnienia (jednej dziedziny wiedzy, jednej firmy), za odsyłacze mi dzy dokumentami tworzone s przez autorów rozwa nie i najcz ciej odzwierciedlaj powi zania tre ciowe mi dzy dokumentami. Tych cech nie musz posiada systemy otwarte. Powi zania mi dzy dokumentami czasami bywaj w nich przypadkowe a nawet pozbawione wyra nego zwi zku, np. odsyłacze reklamowe na rys. 5. Na rys. 2 został przedstawiony prosty, otwarty system hipertekstowy, w którym istniej powi zania (narysowane lini przerywan ) z innymi systemami hipertekstowymi lub innymi cz ciami wi kszego systemu. Przykładem takiego systemu mo e by w sieci WWW pojedynczy serwis informacyjny. Posiada on zwykle wyró nion stron główn (domow , pocz tkow ). Serwis taki utrzymywany jest np. przez jedn firm lub jedn osob . Cały system WWW mo na traktowa jako poł czenie takich pojedynczych serwisów informacyjnych (rys. 3). Poszczególne serwisy informacyjne mog , ale nie musz posiada powi za mi dzy sob . Strona główna (domowa) Strona główna (domowa) Serwis informacyjny WWW nr 1 Serwis informacyjny WWW nr 2 Strona główna (domowa) Serwis informacyjny WWW nr 3 Rys 3. Struktura systemu WWW. Lini przerywan zaznaczono odsyłacze ł cz ce poszczególne serwisy mi dzy sob . • • Ze wzgl du na umiejscowienie systemy hipertekstowe mo na podzieli na: Skupione – cały system znajduje si w jednym miejscu, np. na płycie CD lub pojedynczym serwerze plikowym w sieci lokalnej. Przykładowo mo na tutaj wymieni multimedialne firmowe systemy prezentacyjne oraz ksi ki wydane w formie papierowej i równocze nie w postaci komputerowego systemu hipertekstowego (np. [41]). Rozproszone – elementy systemu s rozproszone przede wszystkim poprzez sie komputerow , tzn. dokumenty znajduj si na ró nych, oddalonych od siebie komputerach. WWW jest wła nie przykładem takiego systemu. 4. RODZAJE W ZŁÓW W zły systemu hipertekstowego (dokumenty hipertekstowe) zawieraj porcj informacji, do której mog za pomoc odsyłaczy odwoływa si inne w zły. W systemie WWW w złem jest strona WWW. Niektórzy badacze z dziedziny hipertekstu wyró niaj ró ne rodzaje w złów, dziel c je najcz ciej na podstawie wzajemnych relacji, jakie zachodz pomi dzy zawarto ci informacyjn w złów. Mo na wi c wyró ni „rodzica” i „potomka”, „cało ” i „cz ”, „nast pc ” i „poprzednika”. Trigg w 1983 roku [45] dla potrzeb hipertekstowych dokumentów naukowych wyró nił dwa główne rodzaje tekstów tworz cych system hipertekstowy: • Tekst zwykły (ang. normal text) • Komentarz, uwagi (ang. comments and criticism) Zarówno ten podział jak i inne, stworzone dla potrzeb tradycyjnych systemów hipertekstowych, nie wydaje si odpowiedni dla systemu WWW, gdy nie uwzgl dnia jego specyfiki wynikaj cej z dynamiki i otwarto ci tego systemu. W systemie WWW z cał pewno ci mo na wymieni cztery rodzaje w złów, które w tradycyjnych systemach hipertekstowych albo w ogóle nie wyst puj albo nie s tak wyró nione. S to: • Strony główne, domowe (ang. home pages) b d ce „korzeniami” drzewiastych struktur pojedynczych serwisów WWW (patrz rys. 3). • Strony dynamiczne, których zawarto ulega zmianom wskutek działania u ytkownika lub pod wpływem zewn trznych okoliczno ci. • Strony narz dziowe umo liwiaj ce dost p do instalacji niezb dnego oprogramowania. Przykładowo mo e to by strona udost pniaj ca instalacj aplikacji do odtwarzania d wi ków „na ywo” (ang. real audio), która jest niezb dna przy słuchaniu radia przez sie Internet. • Bramki do innych usług. W systemie WWW w złami mog by tak e inne usługi dost pne w sieci Internet, np. poczta elektroniczna [34], transfer zbiorów – FTP [32], zdalny terminal – telnet [31] czy wej cia (bramki) do innych systemów, np. wirtualnej rzeczywisto ci VRML [14]. W tradycyjnych systemach hipertekstowych w zły maj zasadniczo statyczn , niezmienn posta . W systemie WWW istnieje wiele stron, których zawarto zmienia si dynamicznie, np.: • Strony zawieraj ce wyniki wyszukiwania np.: − wyszukiwarek internetowych (systemy wyszukiwania informacji na stronach WWW za pomoc słów kluczowych, np. Altavista - http://www.altavista.pl) − innych systemów np. bibliotecznych (zobacz: Katalogi biblioteki PWr http://www.bg.pwr.wroc.pl/www-szuk/szuk_baz.htm). • Strony zawieraj ce dynamiczne elementy pobierane z baz danych, których zawarto zmienia si w czasie [36]. • Strony umo liwiaj ce dost p do cz sto zmieniaj cej si tre ci gazet czy biuletynów, np. Rzeczpospolita (patrz rys. 4) a tak e udost pniaj ce online serwisy informacyjne, np. Reuters (http://www.reuters.pl) czy Giełda Papierów Warto ciowych (np. Serwis Giełdowy OLIMP - http://www.olimp.com.pl). Odsyłacze nawigacyjne umo liwiaj ce szybkie przemieszczanie si po całym serwisie Uszczegółowienie, tre wspomnianego tutaj artykułu Powi kszenie zdj cia pierwszej strony aktualnego wydania Przej cie do wypełniania obowi zkowego formularza Rys 4. Dynamiczna strona gazety Rzeczpospolita (http://www.rzeczpospolita.pl), której zawarto jest uaktualniana co najmniej raz dziennie. Oczywi cie mo na tak e wyró nia strony, mi dzy którymi zachodz ró nego rodzaju relacje i które, podobnie jak w tradycyjnych systemach hipertekstowych, tworz całe struktury - hierarchie, grafy. Na rys. 5 przedstawiony został przykładowy serwis informacyjny Inside Poland, który posiada struktur hierarchiczn . Od strony głównej odchodz 22 w zły ni szego poziomu, w tym m.in. Miasta. Dalej, „poni ej” Miast znajduj si kolejne w zły, w tym tak e ten umieszczony na rys. 5 - Zakwaterowanie. Cało składa si z 2 hierarchicznie zbudowanych serwisów: w j zyku polskim i angielskim. Bior c wi c pod uwag miejsce w strukturze informacyjnej serwisu, wzajemne relacje oraz analogie do stosunków panuj cych miedzy członkami rodziny, mo na wyodr bni nast puj ce rodzaje stron WWW: • Strony główne, strony domowe, korzenie hierarchii, pocz tki systemów, głowy rodziny. • Poprzednicy, rodzice – strony, które zawieraj inne strony podległe im w hierarchii. • Nast pcy, potomkowie – strony podlegaj ce innym stronom w hierarchii. • Strony równorz dne, rodze stwa – strony pozostaj ce na tym samym poziomie w hierarchii. • Strony duplikaty, bli niacy – strony o takiej samej zawarto ci informacyjnej, ale wyra onej w inny sposób, np. te same strony w ró nych j zykach (zobacz np. odsyłacz zmiany j zyka na rys. 6). • Strony skro ne, dalecy krewniacy - strony tego samego systemu, lecz odległe od siebie w hierarchii, niezwi zane blisko ze sob . • Strony po rednie lub obowi zkowe, po rednicy, np. strony z informacj prawn o dost pno ci nast pnej strony lub strony sprawdzaj ce uprawnienia, itp. • Komentarze, uzupełnienia, strony z pomoc . • Indeksy, spisy tre ci, listy. Nale y zauwa y , e wiele tego typu relacji mi dzy w złami hipertekstowego systemu WWW bardzo cz sto trudno wyodr bni , zwłaszcza w sposób automatyczny. Hierarchie i relacje mi dzy w złami najcz ciej nie s tak e prezentowane u ytkownikom. Nie widz c struktury serwisu u ytkownik gubi si w nim i nie bardzo wie czego mo e si spodziewa po wybraniu poszczególnych odsyłaczy. Systemy takie jak na rys. 5 i 6, które posiadaj widoczn hierarchi stron, s rzadko ci . Inny przykładowy serwis z rys. 4 nie ma ju tak oczywistej budowy hierarchicznej. Mo na w nim jedynie wyró ni pewne zorganizowane hierarchicznie podsystemy. Przykładem aktualnych prac badawczych maj cych na celu automatyczne wyodr bnianie hierarchii w serwisach WWW na podstawie analizy powi za mi dzy stronami jest system MAPA [20]. Odsyłacze do stron Odsyłacze do systemów poprzedzaj cych reklamodawców aktualn w hierarchii Odsyłacz do „akcji” rejestracji swojej strony w serwisie Powrót do strony głównej (korzenia hierarchii) Odsyłacz do strony autora serwisu Odsyłacze do stron mieszcz cych si poni ej w hierarchii Lista odsyłaczy do w złów na poziomie poni ej strony głównej Rys 5. Hierarchiczna struktura przykładowego serwisu WWW o Polsce Inside Poland (http://www.insidepoland.pl/pl/html/accommodation.html). Doj cie do tej strony mo liwe jest poprzez dwie cie ki prowadz ce od strony głównej: Miasta: Zakwaterowanie lub Podró e: Zakwaterowanie. Interesuj cy podział stron WWW dla potrzeb wyszukiwania informacji poprzez sortowanie odpowiedzi od wyszukiwarek internetowych (np. Altavista) został zaproponowany i zaimplementowany w systemie ARC przez Kleinberga, a potem przez zespół badawczy IBM [13, 35]. Polega on na automatycznym wyodr bnieniu z dokumentów zwracanych przez wyszukiwarki nast puj cych rodzajów stron WWW: • Strony autorytatywne (ang. authority pages) zawieraj ce du o informacji na jaki temat. Miernikiem tego czy strona jest autorytatywna jest to, e wiele stron koncentratorów posiada do niej odsyłacze. • Strony - koncentratory (ang. hub pages), które zawieraj du o odsyłaczy do stron autorytatywnych czyli takie, które s dobrym indeksem, magazynem punktów startowych dla u ytkownika w celu pozyskania informacji z wybranej dziedziny. Dobre koncentratory posiadaj wiele odsyłaczy do stron autorytatywnych. Podział ten uwzgl dnia jedynie struktur hipertekstu (wa na jest liczba odsyłaczy ł cz cych odpowiednie strony) i w ogóle nie obejmuje tre ci zawartej w dokumentach. Oczywi cie mo na domniemywa , e tre jest uwzgl dniona poprzez odsyłacze, które przecie zwykle ł cz porcje informacji powi zane ze sob znaczeniowo. Niestety istniej ce cz sto w systemie WWW odsyłacze nawigacyjne (patrz ni ej) fałszuj taki podział. 5. ODSYŁACZE W SYSTEMACH HIPERTEKSTOWYCH Elementem kluczowym systemów hipertekstowych s odsyłacze ł cz ce w zły mi dzy sob . Mog one pełni w systemie ró ne funkcje. Na odsyłacz składaj si nast puj ce elementy: • Typ odsyłacza • W zeł ródłowy, pocz tkowy. • W zeł docelowy, ko cowy. • Atrybuty odsyłacza, np. identyfikator i hasło dost pu do docelowej strony WWW. Mo na to wyrazi za pomoc formalizmu zaproponowanego przez Freia i Stiegera [23], w którym odsyłacz λ∈Λ składa si z nast puj cych elementów: λ = t λ , nλs , nλd , Aλ , cλ gdzie: t λ ∈ Tλ to typ odsyłacza, nλs ∈ N oznacza jego wynikowy w zeł odsyłacza, Aλ = {a1 , ródłowy w zeł, nλd ∈ N - , an } jest zbiorem atrybutów odsyłacza, cλ ∈ A* jest adnotacj , komentarzem do odsyłacza. 5.1. ROLA ODSYŁACZY HIPERTEKSTOWYCH Odsyłacze pełni w systemie hipertekstowym dwie podstawowe role (wg [24]): • „reprezentacyjn ” - ujmuj i prezentuj relacje mi dzy porcjami informacji w tek cie; • „nawigacyjn ” – obejmuj cie ki poruszania si u ytkownika po systemie. Czasami te dwie role przenikaj si nawzajem, czasem s rozdzielone. Mo e si na przykład zdarzy , e istniej ce zwi zki miedzy poszczególnymi rodzajami informacji umieszczonymi na ró nych stronach nie s odpowiednie dla konkretnej koncepcji nawigacji po systemie ustalonej przez autorów, a jednocze nie odsyłacze słu ce poruszaniu si ł cz ze sob dokumenty o słabych zwi zkach semantycznych. Nale y jednak zauwa y , e im bardziej znaczenie odsyłacza odzwierciedla oczywiste dla u ytkownika relacje, tym łatwiej temu u ytkownikowi porusza si po systemie z wykorzystaniem takich odsyłaczy. Bloomfield [9] twierdzi, e odsyłacze w swojej roli nawigacyjnej mog słu y do: • Przegl dania hipertekstu przez u ytkownika, przy czym rozró nia si tutaj przegl dania celowe (ang. purposeful browsing), w którym umo liwia ono wiadome dotarcie do informacji poszukiwanej przez u ytkownika i niecelowe (ang. aimless browsing), w którym u ytkownik nie posiada ci le sprecyzowanego celu, np. przegl da hipertekst dla zabawy. Rys. 4 zawiera przykład kilku tego typu odsyłaczy ułatwiaj cych jedynie poruszanie si po systemie (przyciski po lewej stronie). • Instruowania u ytkownika czyli prezentacji u ytkownikowi ci le okre lonej cie ki po systemie hipertekstowym. Wa nymi odsyłaczami tutaj s : „dokument nast pny”, „dokument poprzedni” oraz „pocz tek”. Tego typu interakcja wykorzystywana jest szczególnie cz sto w systemach prezentacyjnych (np. prezentacja o robotach w sieci Internet http://www.cs.washington.edu:80/research/projects/softbots/www/sld001.htm) jak równie w hipertekstowych systemach komputerowego wspomagania nauczania (CAL – Computer Assisted/Aided Learning) [1, 40], np. system StrathTutor [37]. Na ogólnym poziomie odsyłacze ł cz ze sob porcje informacji. W zwi zku z tym mog one (wg [15, 7]): • Ł czy odno niki (np. przypisy) z tekstem wła ciwym, przy czym zarówno odno niki oraz tekst tworz jedn cało [15], np. powi kszenia rysunków. • Ł czy komentarz z dokumentem wła ciwym [15]. • Ł czy dokumenty mi dzy sob . W ten sposób powstaje hierarchia dokumentów lub inna struktura, np. graf [15]. • Ł czy tekst z nast pnikiem (potomkiem, dzieckiem) [15]. • By powi zane z jak akcj [7], np. wysłanie wypełnionego formularza, rozpocz cie wyszukiwania, wygenerowanie indeksu, itd. • By raczej wnioskiem wynikaj cym z tre ci lub struktury ni bezpo rednio istniej ce w hipertek cie [7]. Ta ostatnia rola pokazuje, e teoretyczne modele hipertekstu uwzgl dniaj prócz odsyłaczy wprowadzonych do struktury przez autorów tak e te, które mog faktycznie nie istnie a w zwi zku z tym nie b d dost pne w trakcie przegl dania hipertekstu przez u ytkowników. Odsyłacze te jednak istniej w sposób wirtualny i ł cz porcje informacji zwi zane semantycznie. Tego rodzaju poł czenia hipertekstowe mog by udost pniane u ytkownikom w wyniku dynamicznego tworzenia hipertekstu, np. poprzez wyszukiwanie. Rozwi zanie takie zaproponował Golovschinsky w pracy [25]. W systemie WWW w zwi zku z otwart struktur oraz dynamik mo na wyró ni nast puj ce specyficzne zadania jakie spełniaj odsyłacze: • Akcja, np. uaktualnienie aktywnych danych, wyszukiwanie, wysłanie formularza, przej cie do innej usługi sieci Internet, np. napisania listu (zobacz np. odsyłacz rejestracji własnej strony z rys. 5 czy przej cie do wypełniania formularza z rys. 4). • Przeniesienie do stron domowych autorów stron (zobacz np. rys. 5). • Aktywne powi zania uaktualniaj ce zawarto całych stron lub ich cz ci, np. serwisy informacyjne, notowania giełdowe czy walutowe, statystyki, dost p do baz danych, wyszukiwanie. Zobacz np. stron z rys. 4, której zawarto zmienia si minimum raz dziennie. • Przej cie do innej cz ci tej samej strony (tego samego dokumentu) – nawigacja w ramach jednej, wi kszej strony podzielonej zakładkami. • Przej cie do innego systemu, np. strony domowej innej instytucji lub zewn trznego systemu wyszukiwania informacji (np. wyszukiwarki). • Przej cie do stron domowych firm umieszczaj cych reklamy (patrz np. rys. 5). • Przej cie do innej cz ci tego samego systemu czyli np. w ramach serwisu jednej firmy. Mo na tutaj wyró ni przemieszczenia: − „w dół” - do strony bardzie szczegółowej; − „w gór ” - do strony ogólniejszej; − „dalej” - do strony kontynuuj cej dany temat; − „wstecz” - powrót z kontynuacji; − „na pocz tek” - powrót do strony głównej (ang. home page); − „do innego tematu” – zupełnie inne zagadnienie wci w ramach tego samego systemu informacyjnego, np. na rys. 6 b dzie to przej cie do Centralnego Biura Maklerskiego CBM; − „do pomocy”, „do komentarza”, „do wyja nienia”, np. przej cie do systemu pomocy, słownika trudniejszych terminów, bli sze sprecyzowanie poj , w tym tak e np. powi kszenie rysunku (zobacz rys. 4 – powi kszenie zdj cia pierwszej strony gazety). • Przej cie do strony bli niaczej, np. takiej samej ale w innym j zyku lub na serwerze lustrzanym (kopii w innym miejscu). W wielu serwisach WWW mo na obecnie zaobserwowa d enie do umieszczania na stronach uproszczonej struktury danego systemu, b d cej czym w rodzaju indeksu odsyłaczy. Umo liwia to lepsz orientacje u ytkownika w systemie oraz zmniejsza poczucie jego zagubienia - odpowied na problem „zagubienia w hiperprzestrzeni” (ang. „lost in hyperspace”). Przykładowo na rys. 6 s to odsyłacze umieszczone w lewej cz ci a na rys. 5 w prawej cz ci oraz odsyłacze do stron umieszczonych na wy szych poziomach hierarchii serwisu (Miasta, strona główna). Problemem wizualizacji hierarchii istniej cych w serwisach WWW zajmuje si m.in. praca Duranda i Khana [20]. Aktualna strona Indeks, schemat systemu Przej cie do strony głównej Odsyłacz organizacyjny nie zwi zany z aktualn stron Uszczegółowienie informacji Przej cie do innej wersji j zykowej Dodatkowa inf.. o aktualnie Przej cie do innej cz ci tej pod wietl. odsyłaczu samej strony (na pocz tek) Rys 6. Przykładowa strona serwisu informacyjnego Wielkopolskiego Banku Kredytowego o rachunkach bankowych dla ludno ci (http://www.wbk.com.pl). W hierarchii tego serwisu b dzie to miejsce: Usługi Dla ludno ci Rachunki Bankowe. Cech charakterystyczn w systemie WWW s stosunkowo dobrze rozwini te mechanizmy umo liwiaj ce przemieszczanie si po systemie zgodnie z yczeniem u ytkownika a nie tylko autora hipertekstu. Słu temu ró nego rodzaju funkcje dost pne w przegl darkach internetowych, które s ci le zwi zane z konkretnym u ytkownikiem lub nawet konkretn „sesj ” jego pracy. Mo na tutaj wymieni : • Histori sesji czyli list kolejno odwiedzanych przez u ytkownika w złów – „ cie ka nawigacji”. Za pomoc tej historii u ytkownik mo e cofa si i wraca do dowolnego miejsca, które odwiedzał. W ramach tego mieszcz si tak e opcje takie, jak „wstecz” czy „dalej”. • Adresy stron WWW wpisywane „r cznie” przez u ytkownika umo liwiaj ce przeskok do dowolnego w zła w systemie WWW (w tym tak e historia poprzednio wpisanych adresów), do którego mo e nawet nie prowadzi aden odsyłacz z innych w złów. • Zakładki (ang. bookmarks) czyli hierarchicznie zbudowana baza wa nych dla u ytkownika adresów stron WWW. • Przej cie do strony startowej, od której przegl darka zawsze rozpoczyna prac . W systemie WWW u ytkownik ma wi c do dyspozycji nie tylko odsyłacze umieszczone w strukturze systemu przez autorów, ale tak e takie, które wynikaj z konkretnej systemie. cie ki przegl dania hipertekstu, a które mog nawet nie istnie w tym 5.2. TYPY ODSYŁACZY Wielu autorów bior c pod uwag dwie wcze niej wymienione zasadnicze role (reprezentacyjna i nawigacyjn ), jakie odgrywaj odsyłacze, rozró nia dwa główne typy poł cze hipertekstowych: • Znaczeniowe (ang. semantic) [22, 23], bazuj ce na tre ci (ang. content-based) [4], maj ce za zadanie wi za dokumenty mieszcz ce si w tej samej lub pokrewnej tematyce. Przykładowo na rys. 4 b dzie to odesłanie do powi kszenia rysunku lub pełnej tre ci wspomnianego na danej stronie artykułu. Na rys. 5 b d to odsyłacze do stron mieszcz cych si poni ej i powy ej w hierarchii serwisu informacyjnego. Wi ksza cz naukowców z dziedziny hipertekstu zajmuje si jedynie odsyłaczami znaczeniowymi. • Organizacyjne (ang. organizational) [4], odsyłaj ce (ang. referential) [22, 23], których celem jest lepsza (szybsza, łatwiejsza) nawigacja po systemie – zobacz np. listy odsyłaczy na rys. 4, 5, 6. Jeden z pierwszych podziałów odsyłaczy zaproponował Trigg w pracy [45]. Sklasyfikował on odsyłacze, jakie powinny by dost pne w naukowych dokumentach hipertekstowych. Był to wi c podział jedynie w ramach odsyłaczy znaczeniowych. Trigg podzielił wszystkie odsyłacze tego typu na 2 główne grupy: zwykłe (ang. normal links) i komentarze (ang. commentary links) zawieraj ce ł cznie 75 kategorii. Pierwsza grupa ma za zadanie ł czy ró ne cz ci jednej pracy naukowej. Mo na w niej wyró ni nast puj ce kategorie odsyłaczy: cytowania (ang. citations) czyli odsyłacze do cytowa umieszczonych w pracy, 5 dodatkowych podkategorii; tło (ang. background) okre laj ce bli ej kontekst naukowy pracy, np. odsyłacze do prac przekrojowych innych autorów; przyszłe prace (ang. future work) bli ej opisuj ce dalsze badania; odparcie zarzutów (ang. refutations) zgłoszonych przez innych autorów; poparcia (ang. support) wspieraj ce tezy wygłoszone przez innych; metodologie (ang. methodologies) opisuj ce przyj te metodologie; dane (ang. data) np. pochodz ce od innych autorów, na których opiera si praca; generalizacja (ang. generalize) i specjalizacja (ang. specialize) opisuj ca szczegóły lub elementy bardziej ogólne; elementy oderwane (ang. abstractions) i przykłady (ang. examples); formalizmy (ang. formalizations) i zastosowania (ang. applications); argumenty (ang. arguments) zawieraj ce 5 dodatkowych podkategorii; podsumowania (ang. summarizations) i szczegóły (ang. details) odnosz ce do bardziej ogólnych lub szczegółowszych opisów; inne spojrzenia (ang. alternate-views) opisuj ce pomysły naukowe w inny sposób; inne słowa (ang. rewrite) opisuj ce to samo za pomoc innych słów; wyja nienia (ang. explanations) dotycz ce pewnych cz ci w zła ródłowego; uproszczenia (ang. simpfications) i skomplikowania (ang. complications) odsyłaj ce do bardziej uproszczonego lub skomplikowanego spojrzenia na tekst ródłowy; uaktualnienia (ang. update) czyli odesłania do nowszych wersji tekstu; korekty (ang. corrections) czyli odesłania do poprawek; kontynuacje (ang. continuations) ł cz ce dwa w zły nast puj ce po sobie w obranym toku my lenia. Druga grupa kategorii odsyłaczy zaproponowanych przez Trigga obejmuje poł czenia z komentarzami i uwagami krytycznymi lub popieraj cymi, dotycz cymi pracy ródłowej. Dzieli si ona na nast puj ce kategorie: komentarze (ang. comments) – dwie podkategorie (krytyczne i popieraj ce), prace zwi zane (ang. related work, environment) – 7 podkategorii, postawione problemy (ang. problem posing) – 6 podkategorii, tezy (ang. thesis, points) – 11 podkategorii, argumenty (ang. arguments) czyli punkty popieraj ce wygłoszone tezy – 6 podkategorii, dane (ang. data) czyli np. dane dla eksperymentów – 6 podkategorii, style (ang. style) komentuj ce styl pisania pracy – 6 podkategorii. Inny wa ny podział odsyłaczy zaproponował De Rose [19] tworz c drzewo typów odsyłaczy (rys. 7). Uwzgl dnia on nast puj ce rodzaje odsyłaczy: • Rozwini te (ang. extensional), które, poniewa nie mog by wywnioskowane z tre ci dokumentów, s zapami tane bezpo rednio w systemie hipertekstowym. Conklin [15] nazywa je „odno nikowe” (ang. referential). S to odsyłacze najbardziej powszechne. De Rose dzieli je na pokrewne i zbiorcze. • Pokrewne, wzgl dne (ang. relational) odzwierciedlaj relacj 1 do 1 ł cz c np. dwa dokumenty o jednakowym znaczeniu i miejscu w hierarchii. Podzielone s one na dwie kategorie: skojarzone oraz komentujace. Odsyłacze Rozwini te (zapamietane) Pokrewne (1 do 1) Mocne (nie pami tane) Zbiorcze (1 do wielu) Skojarzone Komentuj ce Taksonomiczne Sekwencyjne (samowolne) (systematycz.) (nieuporz d.) (uporz dkow.) Wywołane (przez nazw ) Wyszukiwawcze Domy lne Izomorficzne (z tre ci) (przez nazw ) Rys 7. Hierarchia podziału typów odsyłaczy wg DeRose. • • Skojarzone, zwi zane (ang. association), samowolne (ang. arbitrary) oznaczaj odsyłacze dowolnie utworzone przez autora hipertekstu i niekoniecznie ł cz ce dokumenty posiadaj ce zwi zki tre ciowe. Garzotto [24] nazywa je odsyłaczami zastosowania (ang. application links). Wynikaj one z sugerowanej przez autora trasy przegl dania hipertekstu. Komentuj ce, przypisane (ang. annotative), systematyczne (ang. systematic), których zadaniem jest odsyłanie do informacji obja niaj cej tekst ródłowy, np. skierowanie do wyja nienia danego terminu w słowniku. • Zbiorcze (ang. inclusive), które ułatwiaj poruszanie si po hipertek cie i które przedstawiaj struktur systemu. S to np. indeksy (patrz rys. 4, 5, 6). Conklin [15] nazywa je „organizacyjnymi” (ang. organisational links). Podzielone s one na dwie kategorie: taksonomiczne oraz sekwencyjne. • Taksonomiczne, chaotyczne (ang. taxonomic), nieuporz dkowane (ang. unordered) ł cz ce z nieuporz dkowanym zbiorem w złów systemu, np. odsyłacze do przykładów pojawiaj cych si cz sto w systemie, w systemie WWW mog to by odsyłacze do usługi pisania listów poczty elektronicznej do twórców czy administratorów systemu (patrz rys. 5). • Sekwencyjne (ang. sequential), uporz dkowane (ang. ordered) czyli ułatwiaj ce poruszanie si po strukturze hipertekstu z wykorzystaniem uporz dkowanej listy odsyłaczy (patrz rys. 4, 5). • Mocne, intensywne, silne (ang. intensional), które wynikaj z tre ci dokumentów i z tego powodu nie musz by w sposób bezpo redni pami tane w systemie hipertekstowym. Nie s one projektowane i umieszczane w systemie przez autorów. Przykładem mog by tutaj powi zania poprzez słowa kluczowe. Odsyłacze mocne dziel si na wywołane oraz wyszukiwawcze. • Wywołane (ang. vocative) które przywołuj poszczególne elementy dokumentów poprzez nazwy. Dziel si one na domy lne oraz izomorficzne. • Domy lne, domniemane, ukryte, daj ce si wywnioskowa (ang. implicit) tzn. takie, które ł cz dokument ródłowy zawieraj cy nazw dokumentu ko cowego, np. opis słowa w słowniku. rozró ni • Izomorficzne, równopostaciowe (ang. isomorphic), które potrafi charakterystyczne nazwy wyst puj ce w dokumencie ródłowym i poł czy je z odpowiednim dokumentem ko cowym. Przykładem mo e tutaj by termin biblia, który wyst puje wielokrotnie w ró nych znaczeniach, za odpowiedni odsyłacz zawsze skieruje u ytkownika do wła ciwej biblii. • Wyszukiwawcze (ang. retrieval) czyli odsyłacze, które wywołuj mechanizmy wyszukiwania dokumentów z całej ich kolekcji. Baron i inni w pracy [4] zaproponowali odmienny podział odsyłaczy opartych na tre ci (znaczeniowych). Wyró niaj oni nast puj ce ich kategorie (tab. 1): • Semantyczne (ang. semantic) zwi zane z ró nym znaczeniem słów i odzwierciedlaj ce relacje: podobie stwa, przeciwie stwa, cz / cało . • Retoryczne (ang. rethorical) oparte na ró nych sposobach komunikacji mi dzyludzkiej, szczególnie na tej, która ma na celu przekonanie innych. Wszystkie wcze niej wymienione rodzaje odsyłaczy proponowane przez Trigga mieszcz si w kategorii retoryczne. Baron i inni dziel t grup na 5 typów: definicje, wyja nienia, kontynuacje, ilustracje, podsumowania. • Pragmatyczne (ang. pragmatic) wynikaj ce ze wzgl dów praktycznych i wyra aj ce relacje mi dzy tekstem i jego wykorzystaniem lub mi dzy tekstem a sytuacj w jakiej znajduje si u ytkownik aktualnie korzystaj cy z hipertekstu. Zostały tutaj wyodr bnione nast puj ce typy: ostrze enia, informacje wcze niej niezb dne (ang. pre-requisite), sposoby u ycia, przykłady. Semantyczne Podobie stwa Przeciwie stwa Cz /cało Retoryczne Pragmatyczne Definicje Ostrze enia Wyja nienia Wcze niej niezb dne Kontynuacje Sposoby u ycia Ilustracje Przykłady Podsumowania Tab 1. Rodzaje odsyłaczy znaczeniowych wyró nione przez Barona i innych [4]. Z przeprowadzonych bada wynika, e wymienione w tab. 1 odsyłacze znaczeniowe dodane do istniej cych organizacyjnych, je li posiadaj odpowiedni etykiet (nazw , wyja nienie) okre laj c odsyłacz i w zeł docelowy polepszaj efektywno przegl dania („nawigowania”) systemu hipertekstowego [4]. Klasyfikacja i podział odsyłaczy ma na celu ułatwienie tworzenia i korzystania (nawigacji) z systemu hipertekstowego. Jasne i zrozumiałe rodzaje widoczne podczas przegl dania polepszyłyby orientacj u ytkownika oraz informowałyby go o tym czego mo e si on spodziewa po wybraniu danego odsyłacza. W systemie WWW cz ciowo tak rol pełni nazwy oraz dodatkowe informacje wy wietlane przez przegl darki, np. w dolnej linii statusowej. Domy lnie tej w linii pojawia si adres URL (patrz ni ej) pobrany z aktualnie pod wietlonego odsyłacza (patrz rys. 6), ale autor strony mo e tam umieszcza tak e inne informacje. Podobn funkcj spełniaj ikonki sugeruj ce zawarto w zła docelowego odsyłacza, np. rysunek terminala mo e oznacza wywołanie usługi zdalnego terminala. 5.3. ATRYBUTY ODSYŁACZY W SYSTEMIE WWW Cech charakterystyczn systemu WWW jest sposób adresowania stron. Chc c umo liwi jednoznaczn identyfikacj usług sieci Internet (system WWW nie jest jedyn usług dost pn w tej sieci), stworzono specyfikacj „jednorodnego wskazania na zasoby” – URL (ang. Uniform Resource Locator) [5,6]. Odsyłacze w systemie WWW posługuj si adresami URL w celu wskazania przegl darce na w zeł docelowy. Adres URL składa si w uproszczeniu z nast puj cych elementów (do przykładu wykorzystano adres: „http://student:haseł[email protected]/zsi/dzialal/bad_nauk.html”): • Nazwy protokołu / usługi. W wypadku w zła docelowego b d cego tak e stron WWW (a nie inn usług ) b dzie to zawsze „http://”. • Identyfikatora i hasła dost pu do w zła docelowego, np. „student:hasełko@”. • Nazwy komputera – serwera WWW zawieraj cego tre dokumentu docelowego, np. „www.”. • Nazwy domeny internetowej, do której nale y serwer WWW, np. „zsi.pwr.wroc.pl”. • cie ki dost pu do kartoteki na serwerze, np. „/zsi/dzialal/”, „dzialal” jest podkartotek kartoteki „zsi”. • Nazwy zbioru zawieraj cego główn tre w zła docelowego odsyłacza, np. „bad_nauk.html”. Domena internetowa serwera WWW Serwer WWW nr 1 w domenie internetowej Kartoteka 1 na serwerze 1 Podkartoteka nr 1 kartoteki 1 Zbiór 1 (w zeł 1) w podkartotece 1 Serwer WWW nr 2 w domenie internetowej Kartoteka 2 na serwerze 1 Podkartoteka nr 2 kartoteki 1 Zbiór 2 (w zeł 2) w podkartotece 1 Rys. 8. Wybrane, hierarchicznie uło one elementy adresu URL u ywanego do okre lania w zła docelowego odsyłacza w systemie WWW. Elementy adresu URL w zła docelowego mo na nazwa atrybutami odsyłacza w systemie WWW. Tworz one struktur hierarchiczn – drzewo (patrz rys. 8), tzn. w danej domenie internetowej mo e istnie wiele serwerów WWW, na danym serwerze mo e istnie wiele kartotek. Ka da kartoteka mo e zawiera wiele podkartotek, a ka da z kartotek i podkartotek mo e posiada wiele zbiorów b d cych w złami systemu WWW. Struktura hierarchiczna odsyłacza bardzo cz sto odzwierciedla struktur hierarchiczn stron tworz cych serwis informacyjny, np. strony b d ce uszczegółowieniem (ni ej poło one w hierarchii serwisu) cz sto s umieszczane przez autorów w podkartotekach kartoteki, w której znajduje si strona ródłowa. Fakt ten mo na wykorzysta do automatycznej klasyfikacji odsyłaczy i stron. Je li np. odsyłacz prowadzi do strony na tym samym serwerze WWW, wtedy z du ym prawdopodobie stwem mo na domniemywa , e ten w zeł docelowy nale y do tego samego serwisu informacyjnego. Id c dalej, je li adres URL odsyłacza okre la podkartotek kartoteki, w której mie ci si w zeł ródłowy, wtedy mo na przypuszcza , e w zeł docelowy jest na ni szym poziomie w hierarchii danego systemu informacyjnego w stosunku do w zła ródłowego. Struktur hierarchiczn adresu URL wykorzystano m.in. do wyszukiwania przeniesionych stron, odnajdywania stron relewantnych do wybranej oraz odszukiwania osób w systemie WWW [44]. Innym, bardzo istotnym atrybutem odsyłacza w systemie WWW, jest tekst jaki pojawia si w przegl darce w miejscu zakotwiczenia odsyłacza oraz ten pojawiaj cy si w linii statusowej przy pod wietleniu myszk danego odsyłacza (patrz dolna linia na rys. 6). Najcz ciej jest to adres URL w zła docelowego ale mo e to by tak e dodatkowa, inna informacja tekstowa umieszczona w polu „A HREF” w kodzie ródłowym strony HTML. 6. PROBLEMY WYNIKAJ CE ZE STRUKTURY SYSTEMU WWW Z bada przeprowadzanych co pół roku przez Graphic, Visualization, & Usability Center's (GVU) na dziesi tkach tysi cy u ytkowników systemu WWW [26, 39] wynika, e najwi cej zastrze e maj u ytkownicy co do szybko ci pracy z systemem WWW (pierwsze miejsce w ród wszystkich, zasygnalizowanych kłopotów; zgłaszane przez 65% badanych u ytkowników). Drugie miejsce (58% u ytkowników) zajmuje problem niemo no ci poł czenia si z konkretnymi stronami, np. w wyniku wył czenia lub niesprawno ci serwerów czy elementów sieci Internet, nieaktualnych odsyłaczy, itp. Trzecie miejsce (47%) wi e si z wyszukiwaniem nowych stron WWW, które razem z problemem odnajdywania znanych stron, o których u ytkownik wie, e istniej , ale nie potrafi ich zlokalizowa (czwarte miejsce – 28%), daje ł cznie najwi kszy problem u ytkowników – wyszukiwanie informacji (75%). Innym, cz sto spotykanym w literaturze, problemem z dziedziny hipertekstu jest poczucie zagubienia w hiperprzestrzeni (ang. lost in hyperspace), jakie ma u ytkownik, nie wiedz c wła ciwie, w którym miejscu tego ogromnego systemu si aktualnie znajduje (wg bada NEC Research Institute przeprowadzonych w grudniu 1997r. liczba stron zaindeksowanych przez wyszukiwarki internetowe wynosi ok. 320 mln. stron). Badania [26, 39] jedynie cz ciowo potwierdzaj rzeczywist wag tego problemu, gdy s zgłaszane przez jedynie kilka procent u ytkowników (4-6%) i liczby te rokrocznie malej . Wydaje si , e przyczyn zmniejszaj cej si wagi problemu zagubienia w hiperprzestrzeni s : • Lepsza znajomo systemu WWW przez u ytkowników, jak równie wi ksza łatwo w posługiwaniu si komputerem w ogóle. • Umieszczanie przez autorów serwisów WWW indeksów odsyłaczy prezentuj cych struktur danego systemu, które s zawsze widoczne na ekranie. Cz sto tak e zaznaczona jest na nich aktualnie wy wietlana strona (zobacz np. rys. 5). cie k • Lepiej zorganizowane przegl darki zawieraj ce np. cał aktualn przegl dania z mo liwo ci cofania si i powrotu w dowolne miejsca tej cie ki. • Korzystanie przez autorów z „ram” (ang. frame) dost pnych w j zyku opisu strony HTML. Dzi ki temu mo liwe jest „zamro enie” cz ci przegl danej strony. Cz ta zwykle zawiera odsyłacze do innych wa nych działów danego serwisu informacyjnego i mimo pojawiania si zupełnie innych w złów w drugiej, zmiennej cz ci okna, zawsze jest dost pna. Prace z dziedziny odpowiedniej prezentacji u ytkownikowi struktury systemu, których jednym z celów jest zmniejszenie problemu zagubienia w hiperprzestrzeni, wci s jednak prowadzone np. [12, 20, 29]. Z odmiennym problemem borykaj si twórcy – autorzy i konserwatorzy systemów WWW. Musz oni poradzi sobie ze zmienno ci zasobów informacyjnych swoich systemów oraz tych, z którymi ich systemy s powi zane. Wynika z tego ci gła potrzeba uaktualniania i konserwacji. Mo na wi c wyró ni dwie podstawowe grupy problemów struktury systemu WWW: • Wyszukiwanie informacji. Wybrane problemy wyszukiwania informacji zawarte zostały w pracy [33], za szerok analiz mo liwo ci wyszukiwania obiektów multimedialnych w sieci WWW zaj to si m.in. w pracy [43]. • Zarz dzanie informacj . Zasadniczo wy ej wymienione problemy wynikaj przede wszystkim z dynamicznego rozwoju, otwarto ci oraz powszechno ci systemu WWW. Tych cech nie posiadały wcze niejsze, autorskie systemy hipertekstowe. W szczególno ci mo na wymieni nast puj ce przyczyny: • Zmienno w czasie. • Zło ono struktury, w tym tak e du a liczba poł cze mi dzy poszczególnymi serwisami informacyjnymi. • Du a wielko zasobów. Nie jest np. mo liwe umieszczenie w jednym dokumencie wszystkich odsyłaczy do stron relewantnych, gdy stron relewantnych mo e by bardzo du o. • Powielanie tych samych informacji. Te same strony, zwane „lustrzanymi” (ang. mirror pages), wyst puj jednocze nie w wielu miejscach (czasami jedynie z nieznacznie zmienion zawarto ci ), tzn. na ró nych serwerach (ang. mirror site). Kopiowane s one zwykle w celu przyspieszenia transferu danych dla u ytkowników znajduj cych si na ró nych kontynentach lub powstaj w wyniku reorganizacji i przenoszenia serwisów w inne miejsca. Zdarza si tak e, e te same strony znajduj si w ró nych kartotekach tego samego serwera, s to np. kopie zapasowe lub kolejne wersje tej samej strony. Chc c bli ej opisa przyczyny zmienno ci struktury systemu WWW w czasie czyli braku strukturalnej integralno ci systemu, nale ałoby wymieni : • zmiany nazw serwerów WWW, nazw katalogów na serwerze WWW oraz nazw plików; • zmiany umiejscowienia stron na serwerze (przesuni cia do innych katalogów); • brak synchronizacji uaktualnie mi dzy stronami „lustrzanymi”, tzn. kopiami strony na ró nych serwerach; • usuwanie stron, do których odnosz si odsyłacze; • podziały i poł czenia stron; • zmiany tytułów stron. Według bada przeprowadzonych Etzioni i Selberga [21] a 15% odsyłaczy podawanych jako odpowiedzi przez wyszukiwarki internetowe jest ju nieaktualna. Prawdopodobnie odsetek rzeczywistych, nieaktualnych odsyłaczy jest jeszcze wi kszy, gdy bazy danych z jakich korzystaj wyszukiwarki s nieustannie aktualizowane a odsyłacze na zwykłych strona WWW najcz ciej nie. Koniecznym staje si wi c wspomaganie procesów zarz dzania zmieniaj cymi si odsyłaczami oraz wspieranie autorów podczas tworzenia serwisów. Jednym z rozwi za jest automatyczne tworzenie i uaktualnianie odsyłaczy. W pracy [3] przeprowadzono dyskusj na temat wad i zalet odsyłaczy tworzonych „r cznie” oraz automatycznie. Creech [16] proponuje, aby specjalne narz dzia link-manager oraz web-walk informowały autorów serwisów WWW o koniecznych zmianach w odsyłaczach a nawet dokonywały za nich tych zmian. Davis w pracy [18] rozwa a problemy naruszenia integralno ci otwartych systemów hipertekstowych (w tym tak e WWW) oraz wady i zalety ró nych rozwi za tego problemu m.in. poprzez „naprawianie” odsyłaczy w czasie rzeczywistym lub utworzenie jednej bazy danych zawieraj cej elementy systemu (w zły i odsyłacze), która byłaby „serwerem elementów systemu”. Tak e Bieber i inni w pracy [8] proponuj stworzenie osobnej, zewn trznej bazy danych odsyłaczy. Jednym z rozwi za problemu zło ono ci struktury jest budowanie wirtualnych struktur [42] lub obszarów zainteresowa (ang. activity space) czyli wydzielenie fragmentów całego systemu WWW, które odpowiadaj potrzebom konkretnego u ytkownika [46]. Istotnym problemem systemu WWW w obecnej dobie jest to, e zasadniczo odsyłacze s statyczne, tworzone przez autorów stron i nie s weryfikowane lub modyfikowane przez u ytkowników korzystaj cych z systemu. Cz ciowym rozwi zaniem jest korzystanie przez u ytkownika z mechanizmów, jakie s zawarte w przegl darkach (np. historia sesji, drzewo zakładek, wstecz, w przód, powrót do strony domowej). Jednak wydaje si , e hipertekstowa przyszło systemu WWW b dzie oparta na „personalizacji” systemu. Obecnie jest prowadzonych wiele bada z tego zakresu. „Personalizacja” powinna umo liwia dodawanie własnych poł cze oraz filtrowanie poł cze niepotrzebnych czyli weryfikacja poł cze pod k tem profilu u ytkownika. Wykorzystanie sieci neuronowych do tego ostatniego rozwi zania zostało przedstawione w pracy [2]. Calvi i De Bra [11] proponuj natomiast dodawanie i usuwanie odsyłaczy przy przegl daniu systemu hipertekstowego do nauczania studentów, w zale no ci od tego, czy dany student ju przyswoił sobie cz materiału (usuwanie odsyłaczy do opanowanych ju dokumentów) czy nie (dodawanie odsyłaczy do cz ci, które student powinien opanowa ). Hirashima i inni [29] wydzielaj preferencje u ytkownika z historii jego nawigowania po hipertek cie, po to, by filtrowa nast pnie informacje prezentowane u ytkownikowi. Nazywaj to filtrowaniem informacji zorientowanym na kontekst (ang. context-sensitive filtering). W pracy [25], która opisuje koncepcj systemu VOIR, zaproponowano dynamiczne tworzenie odsyłaczy na podstawie pyta zadawanych przez u ytkownika. 7. UWAGI KO COWE System WWW b d c bardzo dynamicznie rozwijaj cym si i otwartym rodowiskiem informacyjnym stwarza du e mo liwo ci ale zarazem du e problemy. Klasyfikacje w złów i odsyłaczy stosowane w tradycyjnych hipertekstowych systemach autorskich nie wydaj si by w pełni odpowiednie dla WWW. Nale y przy tym zauwa y , e klasyfikacja stron i odsyłaczy, zwłaszcza gdyby mo liwe było przeprowadzenie jej i wykorzystanie w sposób zautomatyzowany, mo e mie niebagatelne znaczenie, np. w: • Tworzeniu filtrów przy wyszukiwaniu, np. wł czania lub wył czania okre lonych typów stron i odsyłaczy. • Zwi kszeniu dokładno ci wyszukiwania wyszukiwarek internetowych poprzez ograniczenie odpowiedzi tylko do wybranych typów. • Tworzeniu etykiet przy odsyłaczach poprawiaj cych u ytkownikowi orientacj . U ytkownik lepiej by wtedy wiedział, czego ma si spodziewa po wybraniu danego odsyłacza, gdy rozró niałby jego typ. • Generowaniu map zawieraj cych struktur hipertekstow np. wokół aktualnie ogl danej strony. Mapa taka posiadałaby rozró nienie rodzajów stron i odsyłaczy je ł cz cych. • Konstruowaniu indeksów opartych na strukturach i typach stron. • Wspomaganiu autorów przy tworzeniu i konserwacji serwisów informacyjnych poprzez filtrowanie i lepsz prezentacj swojego systemu i systemów powi zanych. Wydaje si wi c, e prace dotycz ce klasyfikacji stron i odsyłaczy systemu WWW, jak równie innych elementów jego struktury, b d nadal intensywnie prowadzone. LITERATURA 1. Alexander S.: Teaching and Learning on the World Wide Web. Proceedings of the 1st Australian World Wide Web Conference AusWeb95, Ballina, Australia, 30 April – May 2, 1995, http://www.scu.edu.au/sponsored/ausweb/ausweb95/papers/education2/alexander. 2. Ambrosini L., Cirillo V., Micarelli A.: A hybrid architecture for user-adapted information filtering on the World Wide Web. In: Jameson A., Paris C., Tasso C. (Eds.) User Modeling: Proceedings of the Sixth International Conference, UM97. Vienna, New York: Springer Wien New York, 1997, pp. 59-61, http://um.org/um_97/gz/AmbrosiniL.ps.gz. 3. Ashman H., Garrido A., Oinas-Kukkonen H.: Hand-made and Computed Links, Precomputed and Dynamic Links. Proceedings of HIM’97. Hypertext - Information Retrieval – Multimedia, Dortmund, September 29 - October 2, 1997, pp. 191-208, http://www.ep.cs.nott.ac.uk/~hla/HelenAshman.html. 4. Baron L, Tague-Sutcliffe J., Kinnucan M.T., Carey T.: Labeled, typed links as cues when reading hypertext documents. Journal of the American Society for Information Science, 47 (12), December 1996, pp. 896-908. 5. Berners-Lee T.: Universal Resource Identifiers in WWW: A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network as used in the WorldWide Web. Request for Comments RFC 1630. Network Working Group, June 1994, http://www.cis.ohio-state.edu/htbin/rfc/rfc1630.html. 6. Berners-Lee T., Masinter L., McCahill M.: Uniform Resource Locators (URL). Request for Comments RFC 1738. Network Working Group, December 1994, http://www.cis.ohio-state.edu/htbin/rfc/rfc1738.html. 7. Bieber M.P., Kimbrough S.O.: On Generalizing the Concept of Hypertext. MIS Quarterly, vol. 16, no. 1, 1992, pp. 77-93, http://www.cba.uga.edu/misq/MISQ/V16/V16n1art4.html. 8. Bieber M., Vitali F., Ashman H., Balasubramanian V., Oinas-Kukkonen H.: Fourth generation hypermedia: some missing links for the World Wide Web. International Journal of Human-Computer Studies, Special Issue World Wide Web Usability, Vol. 47, No. 1, 1997, pp. 31-65, http://ijhcs.open.ac.uk/bieber/bieber.html. 9. Bloomfield H.: Links in Hypertekst: An investigation into how they can provide information on inter-node relationship. PhD thesis. Queen Mary and Westfield College, University of London, September 1994. 10. Bush V.: As we may think. The Atlantic Monthly, 176, no. 1, July 1945, pp. 101-108, http://www.isg.sfu.ca/~duchier/misc/vbush 11. Calvi L., De Bra P.: Improving the usability of hypertext courseware through adaptive linking. In: Proceedings of the Eighth ACM International Hypertext Conference, Hypertext ’97, Southampton, UK, April 6-11, 1997, pp. 224-225. 12 Carrière S.J., Kazman R.: WebQuery: searching and visualizing the Web through connectivity. Proceedings of the Sixth International WWW Conference, Santa Clara, California USA, April 7-11, 1997. Tak e: Computer Networks and ISDN Systems, Vol. 29, Issue 8-13, 30 Semptember 1997, pp. 1257-1267. 13. Chakrabarti S., Dom B., Raghavan P., Rajagopalan S., Gibson D, Kleinberg J.: Automatic resource compilation by analyzing hyperlink structure and associated text. In: Processing of the Seventh International World Wide Web Conference, Brisbane, 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. Australia, 14-18 April, 1998. Tak e: Computer Networks and ISDN Systems Vol. 30, Issue 1-7, 01-April-1998, pp. 65-74, http://simon.cs.cornell.edu/home/kleinber/www98/438.html. Choro K., Krzywiecki Ł.: Tworzenie wirtualnej rzeczywisto ci sieciowej za pomoc specyfikacji VRML na przykładzie multimedialnego systemu „Zabytki Wrocławia”. W: MiSSI. Multimedialne i sieciowe systemy informacyjne. Materiały konferencyjne. Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, 1998, s. 101-108. Conklin J.: Hypertext: an introduction and survey. Computer, vol. 20, no. 9, September 1987, IEEE Publications, pp. 17-41. Creech M.L.: Author-oriented Link Management. Proceedings of the Fifth International WWW Conference, May 6-10, 1996, Paris, France. Tak e: Computer Networks and ISDN Systems, Vol. 28, Issue 7-11, 01-May-1996, pp. 1015-1025, http://www5conf.inria.fr/fich_html/papers/P11/Overview.html. Daniłowicz Cz.: Dokumenty elektroniczne. Zagadnienia Informacji Naukowej, nr 1, 1998, s. 55-63. Davis H.C.: Referential integrity of links in open hypermedia systems. In: Proceedings of the ninth ACM conference on Hypertext and hypermedia: links, objects, time and space structure in hypermedia systems, Pittsburgh, PA, June 20-24, 1998, pp. 207216. DeRose S.J.: Expanding the notion of links. Second annual ACM conference proceedings on Hypertext '89, November 5-8, 1989. Pittsburgh, Pennsylvania, USA: ACM, 1989, pp. 249-257. Durand D.D., Kahn P.: MAPA: a system for inducing and visualizing hierarchy in websites. In: Proceedings of the ninth ACM conference on Hypertext and hypermedia: links, objects, time and space structure in hypermedia systems, Pittsburgh, PA, June 20-24, 1998, pp. 66-76. Etzioni O., Selberg E.: Multi-service and comparison using the MetaCrawler. Procedings of the 4th International World Wide Web Conference ’95, Boston, Massachusetts, USA, December 11-14, 1995, http://www.w3.org/Conferences/WWW4/Papers/169. Frei H.P., Stieger D.: Making Use of Hypertext Links when Retrieving Information. In: ECHT '92. Proceedings of the Fourth ACM Conference on Hypertext, November 30/December 4, 1992, Milano, Italy, pp. 102-111. Frei H.P., Stieger D.: The use of semantic links in hypertext information retrieval. Information Processing & Management, Vol. 31, No. 1, 1995, pp. 1-13. Garzotto F., Paolini P., Schwabe D.: HDM - A Model-Based Approach to Hypertext Application Design. ACM Transactions on Information Systems, Vol. 11, No. 1, January 1993, pp. 1-26. Golovchinsky G.: What the query told the link: the integration of hypertext and information retrieval. In: Hypertext ’97. Proceedings of the Eighth ACM International Hypertext Conference, Southampton, UK, April 6-11, 1997, pp. 67-74. GVU's 9th WWW User Survey. Georgia Tech Research Corporation, April 1998, http://www.cc.gatech.edu/gvu/user_surveys/survey-1998-04. Halasz F., Schwartz M.: The Dexter hypertext reference model. Communications of the ACM, Vol. 37, No. 2, Feb. 1994, pp. 30-39. Hill G., Hall W.: Extending the microcosm model to a distributed environment. In: ECHT '94. Proceedings of the 1994 ACM European Conference on Hypermedia Technology, Edinburgh, Scotland, UK, Sept. 18-23, 1994, pp. 32-40. 29. Hirashima T., Matsuda N., Nomoto T., Toyoda J.: Context-sensitive filtering for browsing in hypertext. In: IUI '98. Proceedings of the 1998 International Conference on Intelligent User Interfaces, pp. 119-126. 30. Kacmar C.J., Leggett J.J.: PROXHY: a process-oriented extensible hypertext architecture. ACM Transactions on Information Systems, Vol. 9, No. 4, October 1991, pp. 399-419 31. Karpiak-Kozi ska B., Kazienko P.: Usługa zdalnego terminala. W: Daniłowicz Cz. (red.): Sieciowe i multimedialne systemy informacyjne. Wrocław: Zakład Systemów Informacyjnych Wydziału Informatyki i Zarz dzania Politechniki Wrocławskiej, 1996, s. 43-56. 32. Karpiak-Kozi ska B., Kazienko P.: Wyszukiwanie i transfer zbiorów. W: Daniłowicz Cz. (red.): Sieciowe i multimedialne systemy informacyjne. Wrocław: Zakład Systemów Informacyjnych Wydziału Informatyki i Zarz dzania Politechniki Wrocławskiej, 1996, s. 69-80. 33. Katarzyniak R., Kazienko P., Sobecki J.: Wybrane problemy wyszukiwania informacji w sieci Internet. W: IV Krajowe Forum Informacji Naukowej i Technicznej. Materiały konferencyjne. Polskie Towarzystwo Informacji Naukowej, Zakopane, 2-5 wrze nia 1997, [Warszawa, Pol. Tow. Inf. Nauk.], pp. 286-295. 34. Kazienko P.: Poczta elektroniczna. W: Daniłowicz Cz. (red.): Sieciowe i multimedialne systemy informacyjne. Wrocław: Zakład Systemów Informacyjnych Wydziału Informatyki i Zarz dzania Politechniki Wrocławskiej, 1996, s. 9-41. 35. Kleinberg J.: Authoritative sources in a hyperlinked environment. Proceedings of the 9th Annual ACM-SIAM Symposium on Discrete Algorithms, DA98, San Francisco, California, USA, January 25-27, 1998, http://simon.cs.cornell.edu/home/kleinber/auth.ps. 36. Król D., Trawi ski B.: Metody dost pu do baz danych ze stron WWW. W: MiSSI. Multimedialne i sieciowe systemy informacyjne. Materiały konferencyjne. Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, 1998, s. 209-219. 37. Mayes J.T., Kibby M.R., Watson H.: StrathTutor: The development and evaluation of a learning-by-browsing system on the Macintosh. Computers and Education, vol. 12, no. 1, 1988, pp. 221-229. 38. Paulo F.B., Turine M.A.S., de Oliveira M.C.F., Masiero P.C.: XHMBS: a formal model to support hypermedia specification. In: Proceedings of the ninth ACM Conference on Hypertext and Hypermedia: Links, Objects, Time and Space Structure in Hypermedia Systems, Pittsburgh, PA, June 20-24, 1998, pp.161-170. 39. Pitkow J.E., Kehoe C. M.: Emerging trends in the WWW user population. Communications of the ACM, Vol. 39, No. 6, June 1996, pp. 106-108. 40. Robinson D.A., Lester C.R., Hamilton N.M.: Delivering computer assisted learning across the WWW. Proceedings of the 7th WWW Conference, Brisbane, Australia, 1418 April, 1998. Tak e: Computer Networks and ISDN Systems Vol. 30, Issue 1-7, 01April-1998, pp. 301-307. 41. Shneiderman B., Kearsley G.: Hypertext Hands On! Reading, Massachusetts: Addison-Wesley Publishing Company, 1989. 42. Smith P.A., Newman I.A., Parks L.M.: Virtual hierarchies and virtual networks: some lessons from hypermedia usability research applied to the World Wide Web. International Journal of Human-Computer Studies, Special Issue World Wide Web Usability, Vol. 47, No. 1, 1997, pp. 67-95, http://ijhcs.open.ac.uk/smith/smith.html. 43. Sobecki J.: Analiza mo liwo ci wyszukiwania obiektów multimedialnych w systemie WWW. W: MiSSI. Multimedialne i sieciowe systemy informacyjne. Materiały konferencyjne. Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, 1998, s. 189-200. 44. Spertus E.: ParaSite: mining structural information on the Web. Proceedings of the 6th WWW Conference, Santa Clara, California, USA, 7-11 April, 1997. Tak e: Computer Networks and ISDN Systems, Vol. 29, Issue 8-13, 30 Semptember 1997, pp. 12051215, http://www.cs.washington.edu/homes/ellens/w3/parasite.html. 45. Trigg R.H.: A Network-Based Approach to Text Handling for the Online Scientific Community. PhD thesis. Department of Computer Science, University of Maryland, College Park, Maryland, 1983, http://www.parc.xerox.com/spl/members/trigg/thesis. 46. Wang W., Haake J.: Supporting User-defined Activity Spaces. In: Proceedings of the Eighth ACM International Hypertext Conference, Hypertext ’97, Southampton, UK, April 6-11, 1997, pp. 112-123, http://journals.ecs.soton.ac.uk/~lac/ht97/techpapers.html. 47. Wereszczy ska-Cisło B.: Charakterystyka i mo liwo ci eksploatacji hipertekstu. Zagadnienia Informacji Naukowej, nr 2, 1997, s. 17-30. Streszczenie: Problemami systemów hipertekstowych zajmuj si naukowcy od kilkunastu lat. Nowo ci jest system WWW w sieci Internet, który cho posiadaj cy struktur hipertekstu, ma tak e swoja specyfik . W artykule dokonano obszernej analizy struktury systemów hipertekstowych ze szczególnym uwzgl dnieniem systemu WWW. Wymienione zostały wszystkie zasadnicze elementy tej struktury. Systemy hipertekstowe zostały podzielone na autorskie i otwarte. Omówiona została tak e klasyfikacja dokumentów (w złów) hipertekstowych. Odsyłacze hipertekstowe zostały potraktowane w sposób bardziej szczegółowy, gdy przeprowadzono dyskusje nad ich rol w systemach hipertekstowych oraz wymieniono dotychczas zaproponowane w literaturze klasyfikacje, w tym m.in. Trigga, De Rose, Barona i innych jak równie wykazano ich braki w odniesieniu do typów odsyłaczy dost pnych w systemie WWW. Jako wa ny atrybut odsyłaczy w serwisach WWW została opisana struktura adresu URL i mo liwo ci jej wykorzystania. Struktura systemu WWW stwarza wiele problemów zwi zanych głównie z wyszukiwaniem oraz zarz dzaniem informacj . Praca wymienia przyczyny tych problemów oraz aktualne próby ich rozwi zania spotykane w literaturze. Wydaje si , e klasyfikacja stron i odsyłaczy mo e mie du e znaczenie w przezwyci eniu niektórych, wymienionych problemów wynikaj cych ze struktury.