STRUKTURA HIPERTEKSTU A STRUKTURA SYSTEMU WWW

Transkrypt

STRUKTURA HIPERTEKSTU A STRUKTURA SYSTEMU WWW
STRUKTURA HIPERTEKSTU A STRUKTURA
SYSTEMU WWW
Przemysław Kazienko
Zakład Systemów Informacyjnych
Wydział Informatyki i Zarz dzania
Politechniki Wrocławskiej
Hipertekst, struktura hipertekstu, system WWW,
struktura systemu WWW, odsyłacze hipertekstowe.
1. WPROWADZENIE
Idea hipertekstu została po raz pierwszy przedstawiona przez Vannevar Busha w
1945 roku [10]. Jednak e dynamiczny rozwój koncepcji hipertekstu nast pił dopiero w
latach osiemdziesi tych i dziewi dziesi tych. Opracowano wtedy wiele modeli
hipertekstu, jak np. Dexter [27], HDM [24], Proxhy [30], Microcosm [28] czy bardziej
formalny - XHMBS [38]; nadal prowadzone s badania w tym zakresie. Napisanych
zostało tak e du o ksi ek i artykułów w czasopismach naukowych, jak równie cyklicznie
odbywaj si wielkie mi dzynarodowe konferencje z tej dziedziny, np. ACM International
Hypertext Conference czy International WWW Conference. Jako szczególny przykład
systemu hipertekstowego mo na wymieni system WWW, który wraz z poczt
elektroniczn , jest najwa niejsz usług dost pn w sieci Internet. Ze wzgl du na swój
dynamiczny rozwój system WWW stanowi pole badawcze wielu naukowców na całym
wiecie.
Do pocz tków lat dziewi dziesi tych badania z dziedziny hipertekstu ograniczały si
głównie do modeli teoretycznych i prototypowych systemów autorskich. Obecnie mo na
zaobserwowa olbrzymie zainteresowanie problemami, które wi
si bezpo rednio z
WWW. Dotyczy to zwłaszcza wyszukiwania i wydobywania informacji (ang. data mining),
komunikacji u ytkownika z systemem i prezentacji danych (ang. user interface),
modelowania zainteresowa u ytkowników i „personalizacji” systemu WWW (ang. user
profile, user preference) oraz zarz dzania informacj udost pnian w systemie.
2. ELEMENTY STRUKTURY SYSTEMÓW HIPERTEKSTOWYCH
System hipertekstowy jest zbiorem powi zanych ze sob
dokumentów
hipertekstowych. Składa si on z 2 zasadniczych elementów (rys. 1):
• W złów zwanych tak e dokumentami lub ramkami (ang. node, document, frame)
zawieraj cych zwykle tekstow porcj informacji.
• Odsyłaczy, poł cze , linków (ang. link) tworz cych powi zania mi dzy
poszczególnymi dokumentami lub nawet mi dzy cz ciami tego samego w zła.
W zeł ródłowy
(startowy)
Odsyłacz B
W zeł docelowy
(ko cowy)
Odsyłacz A
Rys. 1. Elementy struktury systemu hipertekstowego.
W schemacie przedstawionym na rys. 1 odsyłacz A ł czy dokument ródłowy (ang.
source node) z dokumentem docelowym (ang. destination node), za odsyłacz B ró ne
cz ci tego samego dokumentu.
W zły prócz swojej tre ci tekstowej (w szczególnym przypadku, np. indeksu, jego
cz
tekstowa mo e by pusta) zawieraj tak e elementy odsyłaczy, tzn. przynajmniej
ich punkt zaczepienia – startowy oraz cz
prezentuj c odsyłacz u ytkownikowi - zwykle
jest to nazwa w zła docelowego, do którego odsyłacz si odnosi. Jednostk informacji
prezentowan jednorazowo u ytkownikowi jest wła nie w zeł w swej tre ci tekstowej wraz
z wychodz cymi z niego odsyłaczami. W przypadku systemu WWW w zły nazywaj si
stronami WWW (ang. pages). O strukturze hipertekstu przes dzaj odsyłacze, tj. miejsca
ich umieszczenia w systemie, gdy bez nich przekształciłby si on w system linearny.
Zbiór w złów i odsyłaczy tworzy system hipertekstowy (rys. 2).
2
3
4
1
5
6
7
System hipertekstowy
Rys. 2. Struktura systemu hipertekstowego.
W przykładowym systemie z rys. 2 niektóre dokumenty nie posiadaj odsyłaczy (3, 5,
7), a do niektórych one nie prowadz (4, 7). W zły 1, 4, 6 posiadaj odsyłacze
prowadz ce na zewn trz systemu (linie przerywane), za do dokumentów 3 i 5 odsyłaj
zewn trzne systemy. Dokument 7 nie posiada odsyłaczy i do niego nie prowadz
odsyłacze. Taki dokument mo e istnie w systemie, cho jego u yteczno
jest du o
mniejsza.
W w złach hipertekstowego systemu WWW (na stronach WWW) prócz tekstu
wyst puj tak e inne media: d wi k, sekwencje wideo a przede wszystkim grafika –
obrazy. Dlatego te w stosunku do niego bardziej adekwatnym okre leniem byłoby
„hipermedialny”. Je eli chodzi o zawarto informacyjn systemu, to inne media pełni
ogromnie wa n rol [17]. St d te w ostatnich latach, w dobie „społecze stwa
informacyjnego”, mo na zaobserwowa olbrzymi rozwój technologii multimedialnych, w
tym tak e systemu WWW. Istnienie innych mediów nie ma jednak zasadniczego
znaczenia dla jego struktury. Elementy multimedialne, które nie s zwi zane z
odsyłaczami nic nie wnosz do struktury systemu, za sytuacja, w której ródłem
odsyłacza jest obraz (np. ikona) lub jego fragment (np. cz
„klikowalnej” mapy) w
zasadzie niczym si nie ró ni od tej, gdy pocz tkiem odsyłacza jest jego nazwa czyli tekst.
Zreszt i tak na wielu stronach WWW istniej prócz odsyłaczy graficznych tak e
odpowiadaj ce im odsyłacze tekstowe po to, aby umo liwi korzystanie ze stron równie
u ytkownikom posiadaj cym jedynie tekstowe wersje przegl darek. Dotyczy to np.
wi kszo ci przegl darek dla systemu UNIX. Wielu badaczy z dziedziny hipertekstu termin
„hipertekstowy” i „hipermedialny” u ywa zamiennie [8].
Istniej systemy hipertekstowe (dotyczy to zwłaszcza systemu WWW), w których
odsyłacze mog tak e prowadzi do ró nych cz ci tego samego dokumentu (patrz:
dokumenty 2 i 6 na rys. 2).
Mo na wymieni równie inne elementy struktury hipertekstowej, np. cie ka (ang.
path) czyli droga, jak pokonuje u ytkownik poprzez w zły i odsyłacze, perspektywa czyli
cało
informacji jaka jest zawarta w zadanej cie ce [9] czy trasa (ang. tours) czyli
sugerowana przez autorów cie ka [47]. W terminologii systemów hipertekstowych
wykorzystywane jest tak e poj cie punktu zaczepienia, miejsce zakotwiczenia (ang.
anchor) oznaczaj ce albo dokument ródłowy (punkt startowy odsyłacza) albo dokument
docelowy (punkt ko cowy odsyłacza). Na rys. 1 startowe punkty zaczepienia oznaczone
s czarnymi prostok tami w w le ródłowym.
3. RODZAJE SYSTEMÓW HIPERTEKSTOWYCH
Ze wzgl du na sposób tworzenia mo na wyró ni zasadniczo dwa rodzaje systemów
hipertekstowych:
• Systemy autorskie – tworzone s przez jednego autora lub grup
ci le
współpracuj cych ze sob autorów. Słu one zwykle do zaprezentowania wiedzy z
jakiej wybranej, w skiej dziedziny, w której s oni specjalistami. Autorskimi mo na
nazwa np. ksi ki ukazuj ce si od kilku lat jako systemy hipertekstowe lub
hipermedialne (np. [41]), czasami nawet bez formy drukowanej. Systemem autorskim
b dzie tak e pojedynczy serwis WWW tworzony przez firm komercyjn , a słu cy
np. do zaprezentowania oferty produkowanych wyrobów. Serwis taki jest
opracowywany i utrzymywany przez jej pracowników lub przez wynaj t , inn ,
wyspecjalizowan firm .
• Systemy otwarte – tworzone s przez wielu autorów, którzy ze sob nie współpracuj
lub współpracuj bardzo mało. Mo na je zwykle tak e traktowa jako zbiór słabo
zale nych od siebie systemów autorskich. Wa n ich cech jest stosunkowo du a
elastyczno
wykorzystywanego modelu i narz dzi. Zwykle w systemie otwartym
istniej jedynie nieliczne sztywne reguły (w wypadku WWW b dzie to j zyk opisu
strony - HTML) a ka dy z autorów mo e dodawa do tego swoje elementy. Innymi
słowy - system jest otwarty, je li posiada jak najmniejsz liczb reguł i dopuszcza jak
najwi cej elastyczno ci. Najwi kszym, hipertekstowym systemem otwartym jest WWW
w sieci Internet. Ka dy mo e w nim stworzy i zaprezentowa swój system autorski.
Wystarczy jedynie wykorzysta jedno z wielu umo liwiaj cych to narz dzi.
Systemy autorskie charakteryzuj si spójno ci i dotycz jednego zagadnienia
(jednej dziedziny wiedzy, jednej firmy), za odsyłacze mi dzy dokumentami tworzone s
przez autorów rozwa nie i najcz ciej odzwierciedlaj powi zania tre ciowe mi dzy
dokumentami. Tych cech nie musz posiada systemy otwarte. Powi zania mi dzy
dokumentami czasami bywaj w nich przypadkowe a nawet pozbawione wyra nego
zwi zku, np. odsyłacze reklamowe na rys. 5.
Na rys. 2 został przedstawiony prosty, otwarty system hipertekstowy, w którym
istniej powi zania (narysowane lini przerywan ) z innymi systemami hipertekstowymi
lub innymi cz ciami wi kszego systemu. Przykładem takiego systemu mo e by w sieci
WWW pojedynczy serwis informacyjny. Posiada on zwykle wyró nion stron główn
(domow , pocz tkow ). Serwis taki utrzymywany jest np. przez jedn firm lub jedn
osob . Cały system WWW mo na traktowa jako poł czenie takich pojedynczych
serwisów informacyjnych (rys. 3). Poszczególne serwisy informacyjne mog , ale nie
musz posiada powi za mi dzy sob .
Strona główna
(domowa)
Strona główna
(domowa)
Serwis informacyjny WWW nr 1
Serwis informacyjny WWW nr 2
Strona główna
(domowa)
Serwis informacyjny WWW nr 3
Rys 3. Struktura systemu WWW. Lini przerywan zaznaczono odsyłacze ł cz ce
poszczególne serwisy mi dzy sob .
•
•
Ze wzgl du na umiejscowienie systemy hipertekstowe mo na podzieli na:
Skupione – cały system znajduje si w jednym miejscu, np. na płycie CD lub
pojedynczym serwerze plikowym w sieci lokalnej. Przykładowo mo na tutaj wymieni
multimedialne firmowe systemy prezentacyjne oraz ksi ki wydane w formie
papierowej i równocze nie w postaci komputerowego systemu hipertekstowego (np.
[41]).
Rozproszone – elementy systemu s rozproszone przede wszystkim poprzez sie
komputerow , tzn. dokumenty znajduj si na ró nych, oddalonych od siebie
komputerach. WWW jest wła nie przykładem takiego systemu.
4. RODZAJE W ZŁÓW
W zły systemu hipertekstowego (dokumenty hipertekstowe) zawieraj porcj
informacji, do której mog za pomoc odsyłaczy odwoływa si inne w zły. W systemie
WWW w złem jest strona WWW. Niektórzy badacze z dziedziny hipertekstu wyró niaj
ró ne rodzaje w złów, dziel c je najcz ciej na podstawie wzajemnych relacji, jakie
zachodz pomi dzy zawarto ci informacyjn w złów. Mo na wi c wyró ni „rodzica” i
„potomka”, „cało ” i „cz
”, „nast pc ” i „poprzednika”.
Trigg w 1983 roku [45] dla potrzeb hipertekstowych dokumentów naukowych wyró nił
dwa główne rodzaje tekstów tworz cych system hipertekstowy:
• Tekst zwykły (ang. normal text)
• Komentarz, uwagi (ang. comments and criticism)
Zarówno ten podział jak i inne, stworzone dla potrzeb tradycyjnych systemów
hipertekstowych, nie wydaje si odpowiedni dla systemu WWW, gdy nie uwzgl dnia jego
specyfiki wynikaj cej z dynamiki i otwarto ci tego systemu.
W systemie WWW z cał pewno ci mo na wymieni cztery rodzaje w złów, które
w tradycyjnych systemach hipertekstowych albo w ogóle nie wyst puj albo nie s tak
wyró nione. S to:
• Strony główne, domowe (ang. home pages) b d ce „korzeniami” drzewiastych
struktur pojedynczych serwisów WWW (patrz rys. 3).
• Strony dynamiczne, których zawarto ulega zmianom wskutek działania u ytkownika
lub pod wpływem zewn trznych okoliczno ci.
• Strony narz dziowe umo liwiaj ce dost p do instalacji niezb dnego oprogramowania.
Przykładowo mo e to by strona udost pniaj ca instalacj aplikacji do odtwarzania
d wi ków „na ywo” (ang. real audio), która jest niezb dna przy słuchaniu radia przez
sie Internet.
• Bramki do innych usług. W systemie WWW w złami mog by tak e inne usługi
dost pne w sieci Internet, np. poczta elektroniczna [34], transfer zbiorów – FTP [32],
zdalny terminal – telnet [31] czy wej cia (bramki) do innych systemów, np. wirtualnej
rzeczywisto ci VRML [14].
W tradycyjnych systemach hipertekstowych w zły maj zasadniczo statyczn ,
niezmienn posta . W systemie WWW istnieje wiele stron, których zawarto zmienia si
dynamicznie, np.:
• Strony zawieraj ce wyniki wyszukiwania np.:
− wyszukiwarek internetowych (systemy wyszukiwania informacji na stronach
WWW za pomoc słów kluczowych, np. Altavista - http://www.altavista.pl)
− innych systemów np. bibliotecznych (zobacz: Katalogi biblioteki PWr http://www.bg.pwr.wroc.pl/www-szuk/szuk_baz.htm).
• Strony zawieraj ce dynamiczne elementy pobierane z baz danych, których zawarto
zmienia si w czasie [36].
• Strony umo liwiaj ce dost p do cz sto zmieniaj cej si tre ci gazet czy biuletynów,
np. Rzeczpospolita (patrz rys. 4) a tak e udost pniaj ce online serwisy informacyjne,
np. Reuters (http://www.reuters.pl) czy Giełda Papierów Warto ciowych (np. Serwis
Giełdowy OLIMP - http://www.olimp.com.pl).
Odsyłacze nawigacyjne
umo liwiaj ce szybkie
przemieszczanie si po
całym serwisie
Uszczegółowienie,
tre wspomnianego
tutaj artykułu
Powi kszenie zdj cia
pierwszej strony
aktualnego wydania
Przej cie do
wypełniania
obowi zkowego
formularza
Rys 4. Dynamiczna strona gazety Rzeczpospolita (http://www.rzeczpospolita.pl), której
zawarto jest uaktualniana co najmniej raz dziennie.
Oczywi cie mo na tak e wyró nia strony, mi dzy którymi zachodz ró nego
rodzaju relacje i które, podobnie jak w tradycyjnych systemach hipertekstowych, tworz
całe struktury - hierarchie, grafy. Na rys. 5 przedstawiony został przykładowy serwis
informacyjny Inside Poland, który posiada struktur hierarchiczn . Od strony głównej
odchodz 22 w zły ni szego poziomu, w tym m.in. Miasta. Dalej, „poni ej” Miast znajduj
si kolejne w zły, w tym tak e ten umieszczony na rys. 5 - Zakwaterowanie. Cało
składa si z 2 hierarchicznie zbudowanych serwisów: w j zyku polskim i angielskim.
Bior c wi c pod uwag miejsce w strukturze informacyjnej serwisu, wzajemne relacje
oraz analogie do stosunków panuj cych miedzy członkami rodziny, mo na wyodr bni
nast puj ce rodzaje stron WWW:
• Strony główne, strony domowe, korzenie hierarchii, pocz tki systemów, głowy rodziny.
• Poprzednicy, rodzice – strony, które zawieraj inne strony podległe im w hierarchii.
• Nast pcy, potomkowie – strony podlegaj ce innym stronom w hierarchii.
• Strony równorz dne, rodze stwa – strony pozostaj ce na tym samym poziomie w
hierarchii.
• Strony duplikaty, bli niacy – strony o takiej samej zawarto ci informacyjnej, ale
wyra onej w inny sposób, np. te same strony w ró nych j zykach (zobacz np. odsyłacz
zmiany j zyka na rys. 6).
•
Strony skro ne, dalecy krewniacy - strony tego samego systemu, lecz odległe od
siebie w hierarchii, niezwi zane blisko ze sob .
• Strony po rednie lub obowi zkowe, po rednicy, np. strony z informacj prawn o
dost pno ci nast pnej strony lub strony sprawdzaj ce uprawnienia, itp.
• Komentarze, uzupełnienia, strony z pomoc .
• Indeksy, spisy tre ci, listy.
Nale y zauwa y , e wiele tego typu relacji mi dzy w złami hipertekstowego
systemu WWW bardzo cz sto trudno wyodr bni , zwłaszcza w sposób automatyczny.
Hierarchie i relacje mi dzy w złami najcz ciej nie s tak e prezentowane u ytkownikom.
Nie widz c struktury serwisu u ytkownik gubi si w nim i nie bardzo wie czego mo e si
spodziewa po wybraniu poszczególnych odsyłaczy. Systemy takie jak na rys. 5 i 6, które
posiadaj widoczn hierarchi stron, s rzadko ci . Inny przykładowy serwis z rys. 4 nie
ma ju tak oczywistej budowy hierarchicznej. Mo na w nim jedynie wyró ni pewne
zorganizowane hierarchicznie podsystemy. Przykładem aktualnych prac badawczych
maj cych na celu automatyczne wyodr bnianie hierarchii w serwisach WWW na
podstawie analizy powi za mi dzy stronami jest system MAPA [20].
Odsyłacze do stron
Odsyłacze do systemów
poprzedzaj cych
reklamodawców
aktualn w hierarchii
Odsyłacz do „akcji” rejestracji
swojej strony w serwisie
Powrót do strony
głównej (korzenia
hierarchii)
Odsyłacz do strony
autora serwisu
Odsyłacze do stron
mieszcz cych si
poni ej w hierarchii
Lista odsyłaczy do
w złów na poziomie
poni ej strony głównej
Rys 5. Hierarchiczna struktura przykładowego serwisu WWW o Polsce Inside Poland
(http://www.insidepoland.pl/pl/html/accommodation.html). Doj cie do tej strony mo liwe
jest poprzez dwie cie ki prowadz ce od strony głównej: Miasta: Zakwaterowanie lub
Podró e: Zakwaterowanie.
Interesuj cy podział stron WWW dla potrzeb wyszukiwania informacji poprzez
sortowanie odpowiedzi od wyszukiwarek internetowych (np. Altavista) został
zaproponowany i zaimplementowany w systemie ARC przez Kleinberga, a potem przez
zespół badawczy IBM [13, 35]. Polega on na automatycznym wyodr bnieniu z
dokumentów zwracanych przez wyszukiwarki nast puj cych rodzajów stron WWW:
• Strony autorytatywne (ang. authority pages) zawieraj ce du o informacji na jaki
temat. Miernikiem tego czy strona jest autorytatywna jest to, e wiele stron
koncentratorów posiada do niej odsyłacze.
• Strony - koncentratory (ang. hub pages), które zawieraj du o odsyłaczy do stron
autorytatywnych czyli takie, które s dobrym indeksem, magazynem punktów
startowych dla u ytkownika w celu pozyskania informacji z wybranej dziedziny. Dobre
koncentratory posiadaj wiele odsyłaczy do stron autorytatywnych.
Podział ten uwzgl dnia jedynie struktur hipertekstu (wa na jest liczba odsyłaczy
ł cz cych odpowiednie strony) i w ogóle nie obejmuje tre ci zawartej w dokumentach.
Oczywi cie mo na domniemywa , e tre jest uwzgl dniona poprzez odsyłacze, które
przecie zwykle ł cz porcje informacji powi zane ze sob znaczeniowo. Niestety
istniej ce cz sto w systemie WWW odsyłacze nawigacyjne (patrz ni ej) fałszuj taki
podział.
5. ODSYŁACZE W SYSTEMACH HIPERTEKSTOWYCH
Elementem kluczowym systemów hipertekstowych s odsyłacze ł cz ce w zły
mi dzy sob . Mog one pełni w systemie ró ne funkcje. Na odsyłacz składaj si
nast puj ce elementy:
• Typ odsyłacza
• W zeł ródłowy, pocz tkowy.
• W zeł docelowy, ko cowy.
• Atrybuty odsyłacza, np. identyfikator i hasło dost pu do docelowej strony WWW.
Mo na to wyrazi za pomoc formalizmu zaproponowanego przez Freia i Stiegera
[23], w którym odsyłacz λ∈Λ składa si z nast puj cych elementów:
λ = t λ , nλs , nλd , Aλ , cλ
gdzie: t λ ∈ Tλ to typ odsyłacza, nλs ∈ N oznacza jego
wynikowy w zeł odsyłacza, Aλ = {a1 ,
ródłowy w zeł, nλd ∈ N -
, an } jest zbiorem atrybutów odsyłacza, cλ ∈ A* jest
adnotacj , komentarzem do odsyłacza.
5.1. ROLA ODSYŁACZY HIPERTEKSTOWYCH
Odsyłacze pełni w systemie hipertekstowym dwie podstawowe role (wg [24]):
• „reprezentacyjn ” - ujmuj i prezentuj relacje mi dzy porcjami informacji w tek cie;
• „nawigacyjn ” – obejmuj cie ki poruszania si u ytkownika po systemie.
Czasami te dwie role przenikaj si nawzajem, czasem s rozdzielone. Mo e si na
przykład zdarzy , e istniej ce zwi zki miedzy poszczególnymi rodzajami informacji
umieszczonymi na ró nych stronach nie s odpowiednie dla konkretnej koncepcji
nawigacji po systemie ustalonej przez autorów, a jednocze nie odsyłacze słu ce
poruszaniu si ł cz ze sob dokumenty o słabych zwi zkach semantycznych. Nale y
jednak zauwa y , e im bardziej znaczenie odsyłacza odzwierciedla oczywiste dla
u ytkownika relacje, tym łatwiej temu u ytkownikowi porusza si po systemie z
wykorzystaniem takich odsyłaczy.
Bloomfield [9] twierdzi, e odsyłacze w swojej roli nawigacyjnej mog słu y do:
• Przegl dania hipertekstu przez u ytkownika, przy czym rozró nia si tutaj
przegl dania celowe (ang. purposeful browsing), w którym umo liwia ono wiadome
dotarcie do informacji poszukiwanej przez u ytkownika i niecelowe (ang. aimless
browsing), w którym u ytkownik nie posiada ci le sprecyzowanego celu, np.
przegl da hipertekst dla zabawy. Rys. 4 zawiera przykład kilku tego typu odsyłaczy
ułatwiaj cych jedynie poruszanie si po systemie (przyciski po lewej stronie).
• Instruowania u ytkownika czyli prezentacji u ytkownikowi ci le okre lonej cie ki po
systemie hipertekstowym. Wa nymi odsyłaczami tutaj s : „dokument nast pny”,
„dokument poprzedni” oraz „pocz tek”. Tego typu interakcja wykorzystywana jest
szczególnie cz sto w systemach prezentacyjnych (np. prezentacja o robotach w sieci
Internet
http://www.cs.washington.edu:80/research/projects/softbots/www/sld001.htm)
jak
równie w hipertekstowych systemach komputerowego wspomagania nauczania (CAL
– Computer Assisted/Aided Learning) [1, 40], np. system StrathTutor [37].
Na ogólnym poziomie odsyłacze ł cz ze sob porcje informacji. W zwi zku z tym
mog one (wg [15, 7]):
• Ł czy odno niki (np. przypisy) z tekstem wła ciwym, przy czym zarówno odno niki
oraz tekst tworz jedn cało [15], np. powi kszenia rysunków.
• Ł czy komentarz z dokumentem wła ciwym [15].
• Ł czy dokumenty mi dzy sob . W ten sposób powstaje hierarchia dokumentów lub
inna struktura, np. graf [15].
• Ł czy tekst z nast pnikiem (potomkiem, dzieckiem) [15].
• By powi zane z jak akcj [7], np. wysłanie wypełnionego formularza, rozpocz cie
wyszukiwania, wygenerowanie indeksu, itd.
• By raczej wnioskiem wynikaj cym z tre ci lub struktury ni bezpo rednio istniej ce w
hipertek cie [7].
Ta ostatnia rola pokazuje, e teoretyczne modele hipertekstu uwzgl dniaj prócz
odsyłaczy wprowadzonych do struktury przez autorów tak e te, które mog faktycznie nie
istnie a w zwi zku z tym nie b d dost pne w trakcie przegl dania hipertekstu przez
u ytkowników. Odsyłacze te jednak istniej w sposób wirtualny i ł cz porcje informacji
zwi zane semantycznie. Tego rodzaju poł czenia hipertekstowe mog by udost pniane
u ytkownikom w wyniku dynamicznego tworzenia hipertekstu, np. poprzez wyszukiwanie.
Rozwi zanie takie zaproponował Golovschinsky w pracy [25].
W systemie WWW w zwi zku z otwart struktur oraz dynamik mo na wyró ni
nast puj ce specyficzne zadania jakie spełniaj odsyłacze:
• Akcja, np. uaktualnienie aktywnych danych, wyszukiwanie, wysłanie formularza,
przej cie do innej usługi sieci Internet, np. napisania listu (zobacz np. odsyłacz
rejestracji własnej strony z rys. 5 czy przej cie do wypełniania formularza z rys. 4).
• Przeniesienie do stron domowych autorów stron (zobacz np. rys. 5).
• Aktywne powi zania uaktualniaj ce zawarto całych stron lub ich cz ci, np. serwisy
informacyjne, notowania giełdowe czy walutowe, statystyki, dost p do baz danych,
wyszukiwanie. Zobacz np. stron z rys. 4, której zawarto zmienia si minimum raz
dziennie.
• Przej cie do innej cz ci tej samej strony (tego samego dokumentu) – nawigacja w
ramach jednej, wi kszej strony podzielonej zakładkami.
• Przej cie do innego systemu, np. strony domowej innej instytucji lub zewn trznego
systemu wyszukiwania informacji (np. wyszukiwarki).
• Przej cie do stron domowych firm umieszczaj cych reklamy (patrz np. rys. 5).
• Przej cie do innej cz ci tego samego systemu czyli np. w ramach serwisu jednej
firmy. Mo na tutaj wyró ni przemieszczenia:
− „w dół” - do strony bardzie szczegółowej;
− „w gór ” - do strony ogólniejszej;
− „dalej” - do strony kontynuuj cej dany temat;
− „wstecz” - powrót z kontynuacji;
− „na pocz tek” - powrót do strony głównej (ang. home page);
− „do innego tematu” – zupełnie inne zagadnienie wci w ramach tego samego
systemu informacyjnego, np. na rys. 6 b dzie to przej cie do Centralnego Biura
Maklerskiego CBM;
− „do pomocy”, „do komentarza”, „do wyja nienia”, np. przej cie do systemu
pomocy, słownika trudniejszych terminów, bli sze sprecyzowanie poj , w tym
tak e np. powi kszenie rysunku (zobacz rys. 4 – powi kszenie zdj cia pierwszej
strony gazety).
• Przej cie do strony bli niaczej, np. takiej samej ale w innym j zyku lub na serwerze
lustrzanym (kopii w innym miejscu).
W wielu serwisach WWW mo na obecnie zaobserwowa d enie do umieszczania
na stronach uproszczonej struktury danego systemu, b d cej czym w rodzaju indeksu
odsyłaczy. Umo liwia to lepsz orientacje u ytkownika w systemie oraz zmniejsza
poczucie jego zagubienia - odpowied na problem „zagubienia w hiperprzestrzeni” (ang.
„lost in hyperspace”). Przykładowo na rys. 6 s to odsyłacze umieszczone w lewej cz ci a
na rys. 5 w prawej cz ci oraz odsyłacze do stron umieszczonych na wy szych poziomach
hierarchii serwisu (Miasta, strona główna). Problemem wizualizacji hierarchii istniej cych w
serwisach WWW zajmuje si m.in. praca Duranda i Khana [20].
Aktualna strona
Indeks,
schemat systemu
Przej cie do
strony głównej
Odsyłacz organizacyjny nie
zwi zany z aktualn stron
Uszczegółowienie
informacji
Przej cie do innej
wersji j zykowej
Dodatkowa inf.. o aktualnie Przej cie do innej cz ci tej
pod wietl. odsyłaczu
samej strony (na pocz tek)
Rys 6. Przykładowa strona serwisu informacyjnego Wielkopolskiego Banku Kredytowego
o rachunkach bankowych dla ludno ci (http://www.wbk.com.pl). W hierarchii tego serwisu
b dzie to miejsce: Usługi Dla ludno ci Rachunki Bankowe.
Cech charakterystyczn w systemie WWW s stosunkowo dobrze rozwini te
mechanizmy umo liwiaj ce przemieszczanie si po systemie zgodnie z yczeniem
u ytkownika a nie tylko autora hipertekstu. Słu temu ró nego rodzaju funkcje dost pne
w przegl darkach internetowych, które s
ci le zwi zane z konkretnym u ytkownikiem
lub nawet konkretn „sesj ” jego pracy. Mo na tutaj wymieni :
• Histori sesji czyli list kolejno odwiedzanych przez u ytkownika w złów – „ cie ka
nawigacji”. Za pomoc tej historii u ytkownik mo e cofa si i wraca do dowolnego
miejsca, które odwiedzał. W ramach tego mieszcz si tak e opcje takie, jak „wstecz”
czy „dalej”.
• Adresy stron WWW wpisywane „r cznie” przez u ytkownika umo liwiaj ce przeskok
do dowolnego w zła w systemie WWW (w tym tak e historia poprzednio wpisanych
adresów), do którego mo e nawet nie prowadzi aden odsyłacz z innych w złów.
• Zakładki (ang. bookmarks) czyli hierarchicznie zbudowana baza wa nych dla
u ytkownika adresów stron WWW.
• Przej cie do strony startowej, od której przegl darka zawsze rozpoczyna prac .
W systemie WWW u ytkownik ma wi c do dyspozycji nie tylko odsyłacze
umieszczone w strukturze systemu przez autorów, ale tak e takie, które wynikaj z
konkretnej
systemie.
cie ki przegl dania hipertekstu, a które mog
nawet nie istnie
w tym
5.2. TYPY ODSYŁACZY
Wielu autorów bior c pod uwag dwie wcze niej wymienione zasadnicze role
(reprezentacyjna i nawigacyjn ), jakie odgrywaj odsyłacze, rozró nia dwa główne typy
poł cze hipertekstowych:
• Znaczeniowe (ang. semantic) [22, 23], bazuj ce na tre ci (ang. content-based) [4],
maj ce za zadanie wi za dokumenty mieszcz ce si w tej samej lub pokrewnej
tematyce. Przykładowo na rys. 4 b dzie to odesłanie do powi kszenia rysunku lub
pełnej tre ci wspomnianego na danej stronie artykułu. Na rys. 5 b d to odsyłacze do
stron mieszcz cych si poni ej i powy ej w hierarchii serwisu informacyjnego.
Wi ksza cz
naukowców z dziedziny hipertekstu zajmuje si jedynie odsyłaczami
znaczeniowymi.
• Organizacyjne (ang. organizational) [4], odsyłaj ce (ang. referential) [22, 23], których
celem jest lepsza (szybsza, łatwiejsza) nawigacja po systemie – zobacz np. listy
odsyłaczy na rys. 4, 5, 6.
Jeden z pierwszych podziałów odsyłaczy zaproponował Trigg w pracy [45].
Sklasyfikował on odsyłacze, jakie powinny by dost pne w naukowych dokumentach
hipertekstowych. Był to wi c podział jedynie w ramach odsyłaczy znaczeniowych. Trigg
podzielił wszystkie odsyłacze tego typu na 2 główne grupy: zwykłe (ang. normal links) i
komentarze (ang. commentary links) zawieraj ce ł cznie 75 kategorii. Pierwsza grupa ma
za zadanie ł czy ró ne cz ci jednej pracy naukowej. Mo na w niej wyró ni nast puj ce
kategorie odsyłaczy: cytowania (ang. citations) czyli odsyłacze do cytowa umieszczonych
w pracy, 5 dodatkowych podkategorii; tło (ang. background) okre laj ce bli ej kontekst
naukowy pracy, np. odsyłacze do prac przekrojowych innych autorów; przyszłe prace
(ang. future work) bli ej opisuj ce dalsze badania; odparcie zarzutów (ang. refutations)
zgłoszonych przez innych autorów; poparcia (ang. support) wspieraj ce tezy wygłoszone
przez innych; metodologie (ang. methodologies) opisuj ce przyj te metodologie; dane
(ang. data) np. pochodz ce od innych autorów, na których opiera si praca; generalizacja
(ang. generalize) i specjalizacja (ang. specialize) opisuj ca szczegóły lub elementy
bardziej ogólne; elementy oderwane (ang. abstractions) i przykłady (ang. examples);
formalizmy (ang. formalizations) i zastosowania (ang. applications); argumenty (ang.
arguments) zawieraj ce 5 dodatkowych podkategorii; podsumowania (ang.
summarizations) i szczegóły (ang. details) odnosz ce do bardziej ogólnych lub
szczegółowszych opisów; inne spojrzenia (ang. alternate-views) opisuj ce pomysły
naukowe w inny sposób; inne słowa (ang. rewrite) opisuj ce to samo za pomoc innych
słów; wyja nienia (ang. explanations) dotycz ce pewnych cz ci w zła ródłowego;
uproszczenia (ang. simpfications) i skomplikowania (ang. complications) odsyłaj ce do
bardziej uproszczonego lub skomplikowanego spojrzenia na tekst ródłowy; uaktualnienia
(ang. update) czyli odesłania do nowszych wersji tekstu; korekty (ang. corrections) czyli
odesłania do poprawek; kontynuacje (ang. continuations) ł cz ce dwa w zły nast puj ce
po sobie w obranym toku my lenia.
Druga grupa kategorii odsyłaczy zaproponowanych przez Trigga obejmuje
poł czenia z komentarzami i uwagami krytycznymi lub popieraj cymi, dotycz cymi pracy
ródłowej. Dzieli si ona na nast puj ce kategorie: komentarze (ang. comments) – dwie
podkategorie (krytyczne i popieraj ce), prace zwi zane (ang. related work, environment) –
7 podkategorii, postawione problemy (ang. problem posing) – 6 podkategorii, tezy (ang.
thesis, points) – 11 podkategorii, argumenty (ang. arguments) czyli punkty popieraj ce
wygłoszone tezy – 6 podkategorii, dane (ang. data) czyli np. dane dla eksperymentów – 6
podkategorii, style (ang. style) komentuj ce styl pisania pracy – 6 podkategorii.
Inny wa ny podział odsyłaczy zaproponował De Rose [19] tworz c drzewo typów
odsyłaczy (rys. 7). Uwzgl dnia on nast puj ce rodzaje odsyłaczy:
• Rozwini te (ang. extensional), które, poniewa nie mog by wywnioskowane z tre ci
dokumentów, s zapami tane bezpo rednio w systemie hipertekstowym. Conklin [15]
nazywa je „odno nikowe” (ang. referential). S to odsyłacze najbardziej powszechne.
De Rose dzieli je na pokrewne i zbiorcze.
• Pokrewne, wzgl dne (ang. relational) odzwierciedlaj relacj 1 do 1 ł cz c np. dwa
dokumenty o jednakowym znaczeniu i miejscu w hierarchii. Podzielone s one na dwie
kategorie: skojarzone oraz komentujace.
Odsyłacze
Rozwini te
(zapamietane)
Pokrewne
(1 do 1)
Mocne
(nie pami tane)
Zbiorcze
(1 do wielu)
Skojarzone Komentuj ce Taksonomiczne Sekwencyjne
(samowolne) (systematycz.) (nieuporz d.) (uporz dkow.)
Wywołane
(przez nazw )
Wyszukiwawcze
Domy lne Izomorficzne
(z tre ci) (przez nazw )
Rys 7. Hierarchia podziału typów odsyłaczy wg DeRose.
•
•
Skojarzone, zwi zane (ang. association), samowolne (ang. arbitrary) oznaczaj
odsyłacze dowolnie utworzone przez autora hipertekstu i niekoniecznie ł cz ce
dokumenty posiadaj ce zwi zki tre ciowe. Garzotto [24] nazywa je odsyłaczami
zastosowania (ang. application links). Wynikaj one z sugerowanej przez autora trasy
przegl dania hipertekstu.
Komentuj ce, przypisane (ang. annotative), systematyczne (ang. systematic), których
zadaniem jest odsyłanie do informacji obja niaj cej tekst ródłowy, np. skierowanie do
wyja nienia danego terminu w słowniku.
•
Zbiorcze (ang. inclusive), które ułatwiaj poruszanie si po hipertek cie i które
przedstawiaj struktur systemu. S to np. indeksy (patrz rys. 4, 5, 6). Conklin [15]
nazywa je „organizacyjnymi” (ang. organisational links). Podzielone s one na dwie
kategorie: taksonomiczne oraz sekwencyjne.
• Taksonomiczne, chaotyczne (ang. taxonomic), nieuporz dkowane (ang. unordered)
ł cz ce z nieuporz dkowanym zbiorem w złów systemu, np. odsyłacze do przykładów
pojawiaj cych si cz sto w systemie, w systemie WWW mog to by odsyłacze do
usługi pisania listów poczty elektronicznej do twórców czy administratorów systemu
(patrz rys. 5).
• Sekwencyjne (ang. sequential), uporz dkowane (ang. ordered) czyli ułatwiaj ce
poruszanie si po strukturze hipertekstu z wykorzystaniem uporz dkowanej listy
odsyłaczy (patrz rys. 4, 5).
• Mocne, intensywne, silne (ang. intensional), które wynikaj z tre ci dokumentów i z
tego powodu nie musz by w sposób bezpo redni pami tane w systemie
hipertekstowym. Nie s one projektowane i umieszczane w systemie przez autorów.
Przykładem mog by tutaj powi zania poprzez słowa kluczowe. Odsyłacze mocne
dziel si na wywołane oraz wyszukiwawcze.
• Wywołane (ang. vocative) które przywołuj poszczególne elementy dokumentów
poprzez nazwy. Dziel si one na domy lne oraz izomorficzne.
• Domy lne, domniemane, ukryte, daj ce si wywnioskowa (ang. implicit) tzn. takie,
które ł cz dokument ródłowy zawieraj cy nazw dokumentu ko cowego, np. opis
słowa w słowniku.
rozró ni
• Izomorficzne, równopostaciowe (ang. isomorphic), które potrafi
charakterystyczne nazwy wyst puj ce w dokumencie ródłowym i poł czy je z
odpowiednim dokumentem ko cowym. Przykładem mo e tutaj by termin biblia, który
wyst puje wielokrotnie w ró nych znaczeniach, za odpowiedni odsyłacz zawsze
skieruje u ytkownika do wła ciwej biblii.
• Wyszukiwawcze (ang. retrieval) czyli odsyłacze, które wywołuj mechanizmy
wyszukiwania dokumentów z całej ich kolekcji.
Baron i inni w pracy [4] zaproponowali odmienny podział odsyłaczy opartych na tre ci
(znaczeniowych). Wyró niaj oni nast puj ce ich kategorie (tab. 1):
• Semantyczne (ang. semantic) zwi zane z ró nym znaczeniem słów i
odzwierciedlaj ce relacje: podobie stwa, przeciwie stwa, cz
/ cało .
• Retoryczne (ang. rethorical) oparte na ró nych sposobach komunikacji mi dzyludzkiej,
szczególnie na tej, która ma na celu przekonanie innych. Wszystkie wcze niej
wymienione rodzaje odsyłaczy proponowane przez Trigga mieszcz si w kategorii
retoryczne. Baron i inni dziel t grup na 5 typów: definicje, wyja nienia, kontynuacje,
ilustracje, podsumowania.
• Pragmatyczne (ang. pragmatic) wynikaj ce ze wzgl dów praktycznych i wyra aj ce
relacje mi dzy tekstem i jego wykorzystaniem lub mi dzy tekstem a sytuacj w jakiej
znajduje si
u ytkownik aktualnie korzystaj cy z hipertekstu. Zostały tutaj
wyodr bnione nast puj ce typy: ostrze enia, informacje wcze niej niezb dne (ang.
pre-requisite), sposoby u ycia, przykłady.
Semantyczne
Podobie stwa
Przeciwie stwa
Cz
/cało
Retoryczne
Pragmatyczne
Definicje
Ostrze enia
Wyja nienia
Wcze niej niezb dne
Kontynuacje
Sposoby u ycia
Ilustracje
Przykłady
Podsumowania
Tab 1. Rodzaje odsyłaczy znaczeniowych wyró nione przez Barona i innych [4].
Z przeprowadzonych bada wynika, e wymienione w tab. 1 odsyłacze znaczeniowe
dodane do istniej cych organizacyjnych, je li posiadaj odpowiedni etykiet (nazw ,
wyja nienie) okre laj c odsyłacz i w zeł docelowy polepszaj efektywno przegl dania
(„nawigowania”) systemu hipertekstowego [4].
Klasyfikacja i podział odsyłaczy ma na celu ułatwienie tworzenia i korzystania
(nawigacji) z systemu hipertekstowego. Jasne i zrozumiałe rodzaje widoczne podczas
przegl dania polepszyłyby orientacj u ytkownika oraz informowałyby go o tym czego
mo e si on spodziewa po wybraniu danego odsyłacza. W systemie WWW cz ciowo
tak rol pełni nazwy oraz dodatkowe informacje wy wietlane przez przegl darki, np. w
dolnej linii statusowej. Domy lnie tej w linii pojawia si adres URL (patrz ni ej) pobrany z
aktualnie pod wietlonego odsyłacza (patrz rys. 6), ale autor strony mo e tam umieszcza
tak e inne informacje. Podobn funkcj spełniaj ikonki sugeruj ce zawarto
w zła
docelowego odsyłacza, np. rysunek terminala mo e oznacza wywołanie usługi zdalnego
terminala.
5.3. ATRYBUTY ODSYŁACZY W SYSTEMIE WWW
Cech charakterystyczn systemu WWW jest sposób adresowania stron. Chc c
umo liwi jednoznaczn identyfikacj usług sieci Internet (system WWW nie jest jedyn
usług dost pn w tej sieci), stworzono specyfikacj „jednorodnego wskazania na zasoby”
– URL (ang. Uniform Resource Locator) [5,6]. Odsyłacze w systemie WWW posługuj si
adresami URL w celu wskazania przegl darce na w zeł docelowy. Adres URL składa si
w uproszczeniu z nast puj cych elementów (do przykładu wykorzystano adres:
„http://student:haseł[email protected]/zsi/dzialal/bad_nauk.html”):
• Nazwy protokołu / usługi. W wypadku w zła docelowego b d cego tak e stron
WWW (a nie inn usług ) b dzie to zawsze „http://”.
• Identyfikatora i hasła dost pu do w zła docelowego, np. „student:hasełko@”.
• Nazwy komputera – serwera WWW zawieraj cego tre dokumentu docelowego, np.
„www.”.
• Nazwy domeny internetowej, do której nale y serwer WWW, np. „zsi.pwr.wroc.pl”.
•
cie ki dost pu do kartoteki na serwerze, np. „/zsi/dzialal/”, „dzialal” jest podkartotek
kartoteki „zsi”.
• Nazwy zbioru zawieraj cego główn tre
w zła docelowego odsyłacza, np.
„bad_nauk.html”.
Domena
internetowa
serwera WWW
Serwer WWW
nr 1 w
domenie
internetowej
Kartoteka 1
na serwerze 1
Podkartoteka
nr 1
kartoteki 1
Zbiór 1
(w zeł 1)
w podkartotece 1
Serwer WWW
nr 2 w
domenie
internetowej
Kartoteka 2
na serwerze 1
Podkartoteka
nr 2
kartoteki 1
Zbiór 2
(w zeł 2)
w podkartotece 1
Rys. 8. Wybrane, hierarchicznie uło one elementy adresu URL u ywanego do okre lania
w zła docelowego odsyłacza w systemie WWW.
Elementy adresu URL w zła docelowego mo na nazwa atrybutami odsyłacza w
systemie WWW. Tworz one struktur hierarchiczn – drzewo (patrz rys. 8), tzn. w danej
domenie internetowej mo e istnie wiele serwerów WWW, na danym serwerze mo e
istnie wiele kartotek. Ka da kartoteka mo e zawiera wiele podkartotek, a ka da z
kartotek i podkartotek mo e posiada wiele zbiorów b d cych w złami systemu WWW.
Struktura hierarchiczna odsyłacza bardzo cz sto odzwierciedla struktur
hierarchiczn
stron
tworz cych
serwis
informacyjny,
np.
strony
b d ce
uszczegółowieniem (ni ej poło one w hierarchii serwisu) cz sto s umieszczane przez
autorów w podkartotekach kartoteki, w której znajduje si strona ródłowa. Fakt ten mo na
wykorzysta do automatycznej klasyfikacji odsyłaczy i stron. Je li np. odsyłacz prowadzi
do strony na tym samym serwerze WWW, wtedy z du ym prawdopodobie stwem mo na
domniemywa , e ten w zeł docelowy nale y do tego samego serwisu informacyjnego.
Id c dalej, je li adres URL odsyłacza okre la podkartotek kartoteki, w której mie ci si
w zeł ródłowy, wtedy mo na przypuszcza , e w zeł docelowy jest na ni szym poziomie
w hierarchii danego systemu informacyjnego w stosunku do w zła ródłowego.
Struktur
hierarchiczn
adresu URL wykorzystano m.in. do wyszukiwania
przeniesionych stron, odnajdywania stron relewantnych do wybranej oraz odszukiwania
osób w systemie WWW [44].
Innym, bardzo istotnym atrybutem odsyłacza w systemie WWW, jest tekst jaki
pojawia si w przegl darce w miejscu zakotwiczenia odsyłacza oraz ten pojawiaj cy si w
linii statusowej przy pod wietleniu myszk danego odsyłacza (patrz dolna linia na rys. 6).
Najcz ciej jest to adres URL w zła docelowego ale mo e to by tak e dodatkowa, inna
informacja tekstowa umieszczona w polu „A HREF” w kodzie ródłowym strony HTML.
6. PROBLEMY WYNIKAJ CE ZE STRUKTURY SYSTEMU WWW
Z bada przeprowadzanych co pół roku przez Graphic, Visualization, & Usability
Center's (GVU) na dziesi tkach tysi cy u ytkowników systemu WWW [26, 39] wynika, e
najwi cej zastrze e maj u ytkownicy co do szybko ci pracy z systemem WWW
(pierwsze miejsce w ród wszystkich, zasygnalizowanych kłopotów; zgłaszane przez 65%
badanych u ytkowników). Drugie miejsce (58% u ytkowników) zajmuje problem
niemo no ci poł czenia si z konkretnymi stronami, np. w wyniku wył czenia lub
niesprawno ci serwerów czy elementów sieci Internet, nieaktualnych odsyłaczy, itp.
Trzecie miejsce (47%) wi e si z wyszukiwaniem nowych stron WWW, które razem z
problemem odnajdywania znanych stron, o których u ytkownik wie, e istniej , ale nie
potrafi ich zlokalizowa (czwarte miejsce – 28%), daje ł cznie najwi kszy problem
u ytkowników – wyszukiwanie informacji (75%).
Innym, cz sto spotykanym w literaturze, problemem z dziedziny hipertekstu jest
poczucie zagubienia w hiperprzestrzeni (ang. lost in hyperspace), jakie ma u ytkownik, nie
wiedz c wła ciwie, w którym miejscu tego ogromnego systemu si aktualnie znajduje (wg
bada NEC Research Institute przeprowadzonych w grudniu 1997r. liczba stron
zaindeksowanych przez wyszukiwarki internetowe wynosi ok. 320 mln. stron). Badania
[26, 39] jedynie cz ciowo potwierdzaj rzeczywist wag tego problemu, gdy s
zgłaszane przez jedynie kilka procent u ytkowników (4-6%) i liczby te rokrocznie malej .
Wydaje si , e przyczyn zmniejszaj cej si wagi problemu zagubienia w hiperprzestrzeni
s :
• Lepsza znajomo systemu WWW przez u ytkowników, jak równie wi ksza łatwo
w posługiwaniu si komputerem w ogóle.
• Umieszczanie przez autorów serwisów WWW indeksów odsyłaczy prezentuj cych
struktur danego systemu, które s zawsze widoczne na ekranie. Cz sto tak e
zaznaczona jest na nich aktualnie wy wietlana strona (zobacz np. rys. 5).
cie k
• Lepiej zorganizowane przegl darki zawieraj ce np. cał aktualn
przegl dania z mo liwo ci cofania si i powrotu w dowolne miejsca tej cie ki.
• Korzystanie przez autorów z „ram” (ang. frame) dost pnych w j zyku opisu strony
HTML. Dzi ki temu mo liwe jest „zamro enie” cz ci przegl danej strony. Cz
ta
zwykle zawiera odsyłacze do innych wa nych działów danego serwisu informacyjnego
i mimo pojawiania si zupełnie innych w złów w drugiej, zmiennej cz ci okna, zawsze
jest dost pna.
Prace z dziedziny odpowiedniej prezentacji u ytkownikowi struktury systemu, których
jednym z celów jest zmniejszenie problemu zagubienia w hiperprzestrzeni, wci
s
jednak prowadzone np. [12, 20, 29].
Z odmiennym problemem borykaj si twórcy – autorzy i konserwatorzy systemów
WWW. Musz oni poradzi sobie ze zmienno ci zasobów informacyjnych swoich
systemów oraz tych, z którymi ich systemy s powi zane. Wynika z tego ci gła potrzeba
uaktualniania i konserwacji.
Mo na wi c wyró ni dwie podstawowe grupy problemów struktury systemu WWW:
• Wyszukiwanie informacji. Wybrane problemy wyszukiwania informacji zawarte zostały
w pracy [33], za szerok analiz mo liwo ci wyszukiwania obiektów multimedialnych
w sieci WWW zaj to si m.in. w pracy [43].
• Zarz dzanie informacj .
Zasadniczo wy ej wymienione problemy wynikaj przede wszystkim z dynamicznego
rozwoju, otwarto ci oraz powszechno ci systemu WWW. Tych cech nie posiadały
wcze niejsze, autorskie systemy hipertekstowe. W szczególno ci mo na wymieni
nast puj ce przyczyny:
• Zmienno w czasie.
• Zło ono struktury, w tym tak e du a liczba poł cze mi dzy poszczególnymi
serwisami informacyjnymi.
• Du a wielko zasobów. Nie jest np. mo liwe umieszczenie w jednym dokumencie
wszystkich odsyłaczy do stron relewantnych, gdy stron relewantnych mo e by
bardzo du o.
• Powielanie tych samych informacji. Te same strony, zwane „lustrzanymi” (ang. mirror
pages), wyst puj jednocze nie w wielu miejscach (czasami jedynie z nieznacznie
zmienion zawarto ci ), tzn. na ró nych serwerach (ang. mirror site). Kopiowane s
one zwykle w celu przyspieszenia transferu danych dla u ytkowników znajduj cych si
na ró nych kontynentach lub powstaj w wyniku reorganizacji i przenoszenia serwisów
w inne miejsca. Zdarza si tak e, e te same strony znajduj si w ró nych
kartotekach tego samego serwera, s to np. kopie zapasowe lub kolejne wersje tej
samej strony.
Chc c bli ej opisa przyczyny zmienno ci struktury systemu WWW w czasie czyli
braku strukturalnej integralno ci systemu, nale ałoby wymieni :
• zmiany nazw serwerów WWW, nazw katalogów na serwerze WWW oraz nazw plików;
• zmiany umiejscowienia stron na serwerze (przesuni cia do innych katalogów);
• brak synchronizacji uaktualnie mi dzy stronami „lustrzanymi”, tzn. kopiami strony na
ró nych serwerach;
• usuwanie stron, do których odnosz si odsyłacze;
• podziały i poł czenia stron;
• zmiany tytułów stron.
Według bada przeprowadzonych Etzioni i Selberga [21] a 15% odsyłaczy
podawanych jako odpowiedzi przez wyszukiwarki internetowe jest ju nieaktualna.
Prawdopodobnie odsetek rzeczywistych, nieaktualnych odsyłaczy jest jeszcze wi kszy,
gdy bazy danych z jakich korzystaj wyszukiwarki s nieustannie aktualizowane a
odsyłacze na zwykłych strona WWW najcz ciej nie.
Koniecznym staje si wi c wspomaganie procesów zarz dzania zmieniaj cymi si
odsyłaczami oraz wspieranie autorów podczas tworzenia serwisów. Jednym z rozwi za
jest automatyczne tworzenie i uaktualnianie odsyłaczy. W pracy [3] przeprowadzono
dyskusj na temat wad i zalet odsyłaczy tworzonych „r cznie” oraz automatycznie. Creech
[16] proponuje, aby specjalne narz dzia link-manager oraz web-walk informowały autorów
serwisów WWW o koniecznych zmianach w odsyłaczach a nawet dokonywały za nich tych
zmian.
Davis w pracy [18] rozwa a problemy naruszenia integralno ci otwartych systemów
hipertekstowych (w tym tak e WWW) oraz wady i zalety ró nych rozwi za tego problemu
m.in. poprzez „naprawianie” odsyłaczy w czasie rzeczywistym lub utworzenie jednej bazy
danych zawieraj cej elementy systemu (w zły i odsyłacze), która byłaby „serwerem
elementów systemu”. Tak e Bieber i inni w pracy [8] proponuj stworzenie osobnej,
zewn trznej bazy danych odsyłaczy.
Jednym z rozwi za problemu zło ono ci struktury jest budowanie wirtualnych
struktur [42] lub obszarów zainteresowa (ang. activity space) czyli wydzielenie
fragmentów całego systemu WWW, które odpowiadaj
potrzebom konkretnego
u ytkownika [46].
Istotnym problemem systemu WWW w obecnej dobie jest to, e zasadniczo
odsyłacze s statyczne, tworzone przez autorów stron i nie s weryfikowane lub
modyfikowane przez u ytkowników korzystaj cych z systemu. Cz ciowym rozwi zaniem
jest korzystanie przez u ytkownika z mechanizmów, jakie s zawarte w przegl darkach
(np. historia sesji, drzewo zakładek, wstecz, w przód, powrót do strony domowej). Jednak
wydaje si , e hipertekstowa przyszło systemu WWW b dzie oparta na „personalizacji”
systemu. Obecnie jest prowadzonych wiele bada z tego zakresu. „Personalizacja”
powinna umo liwia
dodawanie własnych poł cze
oraz filtrowanie poł cze
niepotrzebnych czyli weryfikacja poł cze pod k tem profilu u ytkownika. Wykorzystanie
sieci neuronowych do tego ostatniego rozwi zania zostało przedstawione w pracy [2].
Calvi i De Bra [11] proponuj natomiast dodawanie i usuwanie odsyłaczy przy
przegl daniu systemu hipertekstowego do nauczania studentów, w zale no ci od tego,
czy dany student ju przyswoił sobie cz
materiału (usuwanie odsyłaczy do
opanowanych ju dokumentów) czy nie (dodawanie odsyłaczy do cz ci, które student
powinien opanowa ). Hirashima i inni [29] wydzielaj preferencje u ytkownika z historii
jego nawigowania po hipertek cie, po to, by filtrowa nast pnie informacje prezentowane
u ytkownikowi. Nazywaj to filtrowaniem informacji zorientowanym na kontekst (ang.
context-sensitive filtering). W pracy [25], która opisuje koncepcj systemu VOIR,
zaproponowano dynamiczne tworzenie odsyłaczy na podstawie pyta zadawanych przez
u ytkownika.
7. UWAGI KO COWE
System WWW b d c bardzo dynamicznie rozwijaj cym si i otwartym rodowiskiem
informacyjnym stwarza du e mo liwo ci ale zarazem du e problemy. Klasyfikacje w złów
i odsyłaczy stosowane w tradycyjnych hipertekstowych systemach autorskich nie wydaj
si by w pełni odpowiednie dla WWW. Nale y przy tym zauwa y , e klasyfikacja stron i
odsyłaczy, zwłaszcza gdyby mo liwe było przeprowadzenie jej i wykorzystanie w sposób
zautomatyzowany, mo e mie niebagatelne znaczenie, np. w:
• Tworzeniu filtrów przy wyszukiwaniu, np. wł czania lub wył czania okre lonych typów
stron i odsyłaczy.
• Zwi kszeniu dokładno ci wyszukiwania wyszukiwarek internetowych poprzez
ograniczenie odpowiedzi tylko do wybranych typów.
• Tworzeniu etykiet przy odsyłaczach poprawiaj cych u ytkownikowi orientacj .
U ytkownik lepiej by wtedy wiedział, czego ma si spodziewa po wybraniu danego
odsyłacza, gdy rozró niałby jego typ.
• Generowaniu map zawieraj cych struktur hipertekstow np. wokół aktualnie
ogl danej strony. Mapa taka posiadałaby rozró nienie rodzajów stron i odsyłaczy je
ł cz cych.
• Konstruowaniu indeksów opartych na strukturach i typach stron.
• Wspomaganiu autorów przy tworzeniu i konserwacji serwisów informacyjnych poprzez
filtrowanie i lepsz prezentacj swojego systemu i systemów powi zanych.
Wydaje si wi c, e prace dotycz ce klasyfikacji stron i odsyłaczy systemu WWW,
jak równie innych elementów jego struktury, b d nadal intensywnie prowadzone.
LITERATURA
1. Alexander S.: Teaching and Learning on the World Wide Web. Proceedings of the 1st
Australian World Wide Web Conference AusWeb95, Ballina, Australia, 30 April – May
2, 1995,
http://www.scu.edu.au/sponsored/ausweb/ausweb95/papers/education2/alexander.
2. Ambrosini L., Cirillo V., Micarelli A.: A hybrid architecture for user-adapted information
filtering on the World Wide Web. In: Jameson A., Paris C., Tasso C. (Eds.) User
Modeling: Proceedings of the Sixth International Conference, UM97. Vienna, New
York: Springer Wien New York, 1997, pp. 59-61,
http://um.org/um_97/gz/AmbrosiniL.ps.gz.
3. Ashman H., Garrido A., Oinas-Kukkonen H.: Hand-made and Computed Links,
Precomputed and Dynamic Links. Proceedings of HIM’97. Hypertext - Information
Retrieval – Multimedia, Dortmund, September 29 - October 2, 1997, pp. 191-208,
http://www.ep.cs.nott.ac.uk/~hla/HelenAshman.html.
4. Baron L, Tague-Sutcliffe J., Kinnucan M.T., Carey T.: Labeled, typed links as cues
when reading hypertext documents. Journal of the American Society for Information
Science, 47 (12), December 1996, pp. 896-908.
5. Berners-Lee T.: Universal Resource Identifiers in WWW: A Unifying Syntax for the
Expression of Names and Addresses of Objects on the Network as used in the WorldWide Web. Request for Comments RFC 1630. Network Working Group, June 1994,
http://www.cis.ohio-state.edu/htbin/rfc/rfc1630.html.
6. Berners-Lee T., Masinter L., McCahill M.: Uniform Resource Locators (URL). Request
for Comments RFC 1738. Network Working Group, December 1994,
http://www.cis.ohio-state.edu/htbin/rfc/rfc1738.html.
7. Bieber M.P., Kimbrough S.O.: On Generalizing the Concept of Hypertext. MIS
Quarterly, vol. 16, no. 1, 1992, pp. 77-93,
http://www.cba.uga.edu/misq/MISQ/V16/V16n1art4.html.
8. Bieber M., Vitali F., Ashman H., Balasubramanian V., Oinas-Kukkonen H.: Fourth
generation hypermedia: some missing links for the World Wide Web. International
Journal of Human-Computer Studies, Special Issue World Wide Web Usability, Vol.
47, No. 1, 1997, pp. 31-65, http://ijhcs.open.ac.uk/bieber/bieber.html.
9. Bloomfield H.: Links in Hypertekst: An investigation into how they can provide
information on inter-node relationship. PhD thesis. Queen Mary and Westfield
College, University of London, September 1994.
10. Bush V.: As we may think. The Atlantic Monthly, 176, no. 1, July 1945, pp. 101-108,
http://www.isg.sfu.ca/~duchier/misc/vbush
11. Calvi L., De Bra P.: Improving the usability of hypertext courseware through adaptive
linking. In: Proceedings of the Eighth ACM International Hypertext Conference,
Hypertext ’97, Southampton, UK, April 6-11, 1997, pp. 224-225.
12 Carrière S.J., Kazman R.: WebQuery: searching and visualizing the Web through
connectivity. Proceedings of the Sixth International WWW Conference, Santa Clara,
California USA, April 7-11, 1997. Tak e: Computer Networks and ISDN Systems, Vol.
29, Issue 8-13, 30 Semptember 1997, pp. 1257-1267.
13. Chakrabarti S., Dom B., Raghavan P., Rajagopalan S., Gibson D, Kleinberg J.:
Automatic resource compilation by analyzing hyperlink structure and associated text.
In: Processing of the Seventh International World Wide Web Conference, Brisbane,
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
Australia, 14-18 April, 1998. Tak e: Computer Networks and ISDN Systems Vol. 30,
Issue 1-7, 01-April-1998, pp. 65-74,
http://simon.cs.cornell.edu/home/kleinber/www98/438.html.
Choro K., Krzywiecki Ł.: Tworzenie wirtualnej rzeczywisto ci sieciowej za pomoc
specyfikacji VRML na przykładzie multimedialnego systemu „Zabytki Wrocławia”. W:
MiSSI. Multimedialne i sieciowe systemy informacyjne. Materiały konferencyjne.
Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, 1998, s. 101-108.
Conklin J.: Hypertext: an introduction and survey. Computer, vol. 20, no. 9, September
1987, IEEE Publications, pp. 17-41.
Creech M.L.: Author-oriented Link Management. Proceedings of the Fifth International
WWW Conference, May 6-10, 1996, Paris, France. Tak e: Computer Networks and
ISDN Systems, Vol. 28, Issue 7-11, 01-May-1996, pp. 1015-1025,
http://www5conf.inria.fr/fich_html/papers/P11/Overview.html.
Daniłowicz Cz.: Dokumenty elektroniczne. Zagadnienia Informacji Naukowej, nr 1,
1998, s. 55-63.
Davis H.C.: Referential integrity of links in open hypermedia systems. In: Proceedings
of the ninth ACM conference on Hypertext and hypermedia: links, objects, time and
space structure in hypermedia systems, Pittsburgh, PA, June 20-24, 1998, pp. 207216.
DeRose S.J.: Expanding the notion of links. Second annual ACM conference
proceedings on Hypertext '89, November 5-8, 1989. Pittsburgh, Pennsylvania, USA:
ACM, 1989, pp. 249-257.
Durand D.D., Kahn P.: MAPA: a system for inducing and visualizing hierarchy in
websites. In: Proceedings of the ninth ACM conference on Hypertext and hypermedia:
links, objects, time and space structure in hypermedia systems, Pittsburgh, PA, June
20-24, 1998, pp. 66-76.
Etzioni O., Selberg E.: Multi-service and comparison using the MetaCrawler.
Procedings of the 4th International World Wide Web Conference ’95, Boston,
Massachusetts, USA, December 11-14, 1995,
http://www.w3.org/Conferences/WWW4/Papers/169.
Frei H.P., Stieger D.: Making Use of Hypertext Links when Retrieving Information. In:
ECHT '92. Proceedings of the Fourth ACM Conference on Hypertext, November
30/December 4, 1992, Milano, Italy, pp. 102-111.
Frei H.P., Stieger D.: The use of semantic links in hypertext information retrieval.
Information Processing & Management, Vol. 31, No. 1, 1995, pp. 1-13.
Garzotto F., Paolini P., Schwabe D.: HDM - A Model-Based Approach to Hypertext
Application Design. ACM Transactions on Information Systems, Vol. 11, No. 1,
January 1993, pp. 1-26.
Golovchinsky G.: What the query told the link: the integration of hypertext and
information retrieval. In: Hypertext ’97. Proceedings of the Eighth ACM International
Hypertext Conference, Southampton, UK, April 6-11, 1997, pp. 67-74.
GVU's 9th WWW User Survey. Georgia Tech Research Corporation, April 1998,
http://www.cc.gatech.edu/gvu/user_surveys/survey-1998-04.
Halasz F., Schwartz M.: The Dexter hypertext reference model. Communications of
the ACM, Vol. 37, No. 2, Feb. 1994, pp. 30-39.
Hill G., Hall W.: Extending the microcosm model to a distributed environment. In:
ECHT '94. Proceedings of the 1994 ACM European Conference on Hypermedia
Technology, Edinburgh, Scotland, UK, Sept. 18-23, 1994, pp. 32-40.
29. Hirashima T., Matsuda N., Nomoto T., Toyoda J.: Context-sensitive filtering for
browsing in hypertext. In: IUI '98. Proceedings of the 1998 International Conference
on Intelligent User Interfaces, pp. 119-126.
30. Kacmar C.J., Leggett J.J.: PROXHY: a process-oriented extensible hypertext
architecture. ACM Transactions on Information Systems, Vol. 9, No. 4, October 1991,
pp. 399-419
31. Karpiak-Kozi ska B., Kazienko P.: Usługa zdalnego terminala. W: Daniłowicz Cz.
(red.): Sieciowe i multimedialne systemy informacyjne. Wrocław: Zakład Systemów
Informacyjnych Wydziału Informatyki i Zarz dzania Politechniki Wrocławskiej, 1996, s.
43-56.
32. Karpiak-Kozi ska B., Kazienko P.: Wyszukiwanie i transfer zbiorów. W: Daniłowicz Cz.
(red.): Sieciowe i multimedialne systemy informacyjne. Wrocław: Zakład Systemów
Informacyjnych Wydziału Informatyki i Zarz dzania Politechniki Wrocławskiej, 1996, s.
69-80.
33. Katarzyniak R., Kazienko P., Sobecki J.: Wybrane problemy wyszukiwania informacji
w sieci Internet. W: IV Krajowe Forum Informacji Naukowej i Technicznej. Materiały
konferencyjne. Polskie Towarzystwo Informacji Naukowej, Zakopane, 2-5 wrze nia
1997, [Warszawa, Pol. Tow. Inf. Nauk.], pp. 286-295.
34. Kazienko P.: Poczta elektroniczna. W: Daniłowicz Cz. (red.): Sieciowe i multimedialne
systemy informacyjne. Wrocław: Zakład Systemów Informacyjnych Wydziału
Informatyki i Zarz dzania Politechniki Wrocławskiej, 1996, s. 9-41.
35. Kleinberg J.: Authoritative sources in a hyperlinked environment. Proceedings of the
9th Annual ACM-SIAM Symposium on Discrete Algorithms, DA98, San Francisco,
California, USA, January 25-27, 1998,
http://simon.cs.cornell.edu/home/kleinber/auth.ps.
36. Król D., Trawi ski B.: Metody dost pu do baz danych ze stron WWW. W: MiSSI.
Multimedialne i sieciowe systemy informacyjne. Materiały konferencyjne. Wrocław:
Oficyna Wydawnicza Politechniki Wrocławskiej, 1998, s. 209-219.
37. Mayes J.T., Kibby M.R., Watson H.: StrathTutor: The development and evaluation of a
learning-by-browsing system on the Macintosh. Computers and Education, vol. 12, no.
1, 1988, pp. 221-229.
38. Paulo F.B., Turine M.A.S., de Oliveira M.C.F., Masiero P.C.: XHMBS: a formal model
to support hypermedia specification. In: Proceedings of the ninth ACM Conference on
Hypertext and Hypermedia: Links, Objects, Time and Space Structure in Hypermedia
Systems, Pittsburgh, PA, June 20-24, 1998, pp.161-170.
39. Pitkow J.E., Kehoe C. M.: Emerging trends in the WWW user population.
Communications of the ACM, Vol. 39, No. 6, June 1996, pp. 106-108.
40. Robinson D.A., Lester C.R., Hamilton N.M.: Delivering computer assisted learning
across the WWW. Proceedings of the 7th WWW Conference, Brisbane, Australia, 1418 April, 1998. Tak e: Computer Networks and ISDN Systems Vol. 30, Issue 1-7, 01April-1998, pp. 301-307.
41. Shneiderman B., Kearsley G.: Hypertext Hands On! Reading, Massachusetts:
Addison-Wesley Publishing Company, 1989.
42. Smith P.A., Newman I.A., Parks L.M.: Virtual hierarchies and virtual networks: some
lessons from hypermedia usability research applied to the World Wide Web.
International Journal of Human-Computer Studies, Special Issue World Wide Web
Usability, Vol. 47, No. 1, 1997, pp. 67-95, http://ijhcs.open.ac.uk/smith/smith.html.
43. Sobecki J.: Analiza mo liwo ci wyszukiwania obiektów multimedialnych w systemie
WWW. W: MiSSI. Multimedialne i sieciowe systemy informacyjne. Materiały
konferencyjne. Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej, 1998, s.
189-200.
44. Spertus E.: ParaSite: mining structural information on the Web. Proceedings of the 6th
WWW Conference, Santa Clara, California, USA, 7-11 April, 1997. Tak e: Computer
Networks and ISDN Systems, Vol. 29, Issue 8-13, 30 Semptember 1997, pp. 12051215, http://www.cs.washington.edu/homes/ellens/w3/parasite.html.
45. Trigg R.H.: A Network-Based Approach to Text Handling for the Online Scientific
Community. PhD thesis. Department of Computer Science, University of Maryland,
College Park, Maryland, 1983, http://www.parc.xerox.com/spl/members/trigg/thesis.
46. Wang W., Haake J.: Supporting User-defined Activity Spaces. In: Proceedings of the
Eighth ACM International Hypertext Conference, Hypertext ’97, Southampton, UK,
April 6-11, 1997, pp. 112-123,
http://journals.ecs.soton.ac.uk/~lac/ht97/techpapers.html.
47. Wereszczy ska-Cisło B.: Charakterystyka i mo liwo ci eksploatacji hipertekstu.
Zagadnienia Informacji Naukowej, nr 2, 1997, s. 17-30.
Streszczenie:
Problemami systemów hipertekstowych zajmuj si naukowcy od kilkunastu lat. Nowo ci
jest system WWW w sieci Internet, który cho posiadaj cy struktur hipertekstu, ma tak e
swoja specyfik .
W artykule dokonano obszernej analizy struktury systemów hipertekstowych ze
szczególnym uwzgl dnieniem systemu WWW. Wymienione zostały wszystkie zasadnicze
elementy tej struktury. Systemy hipertekstowe zostały podzielone na autorskie i otwarte.
Omówiona została tak e klasyfikacja dokumentów (w złów) hipertekstowych.
Odsyłacze hipertekstowe zostały potraktowane w sposób bardziej szczegółowy, gdy
przeprowadzono dyskusje nad ich rol w systemach hipertekstowych oraz wymieniono
dotychczas zaproponowane w literaturze klasyfikacje, w tym m.in. Trigga, De Rose,
Barona i innych jak równie wykazano ich braki w odniesieniu do typów odsyłaczy
dost pnych w systemie WWW.
Jako wa ny atrybut odsyłaczy w serwisach WWW została opisana struktura adresu URL i
mo liwo ci jej wykorzystania.
Struktura systemu WWW stwarza wiele problemów zwi zanych głównie z wyszukiwaniem
oraz zarz dzaniem informacj . Praca wymienia przyczyny tych problemów oraz aktualne
próby ich rozwi zania spotykane w literaturze.
Wydaje si , e klasyfikacja stron i odsyłaczy mo e mie du e znaczenie w
przezwyci eniu niektórych, wymienionych problemów wynikaj cych ze struktury.

Podobne dokumenty