Luiza Fabisiak - Zachodniopomorski Uniwersytet Technologiczny w

Transkrypt

Luiza Fabisiak - Zachodniopomorski Uniwersytet Technologiczny w
Metoda oceny uŜyteczności
serwisów internetowych
Autoreferat rozprawy doktorskiej
mgr inŜ. Luiza Fabisiak
promotor:
dr hab. BoŜena Śmiałkowska
recenzenci:
dr hab. Izabela Rejer
Wydział Informatyki
Zachodniopomorski Uniwersytet Technologiczny w Szczecinie
dr hab. Waldemar Wolski, prof. US
Wydział Nauk Ekonomicznych i Zarządzania
Uniwersytet Szczeciński
Szczecin 2012
1
Spis treści
1.
Charakterystyka i aktualność problemu .......................................................................................... 3
2.
Przedmiot badań .............................................................................................................................. 3
3.
Metody naukowe stosowane podczas wykonywania badań ........................................................... 3
4.
Główny cel rozprawy ...................................................................................................................... 4
5.
Zadania do rozwiązania ................................................................................................................... 4
6.
Wartość teoretyczna ........................................................................................................................ 4
7.
Wartość praktyczna ......................................................................................................................... 5
8.
Akceptacja wyników przez społeczność naukową.......................................................................... 6
9.
Główne osiągnięcia pracy ............................................................................................................... 6
10. Struktura pracy ................................................................................................................................ 6
11. Ogólna charakterystyka zawartości pracy doktorskiej .................................................................... 6
12. Metoda wielokryterialnej oceny uŜyteczności serwisów internetowych ........................................ 8
12.1 Ogólny schemat metody............................................................................................................... 8
12.2 Ocena uŜyteczności serwisów internetowych na podstawie danych zawartych w
dziennikach logów ...................................................................................................................... 8
12.2.1 Wstępna obróbka danych ...................................................................................................... 11
12.2.2 Badanie istotności kryteriów oceny ...................................................................................... 11
12.2.3 Ocena wielokryterialna uŜyteczności serwisów internetowych ........................................... 14
12.3 Ocena uŜyteczności serwisów internetowych w oparciu o preferencje uŜytkowe .................... 17
12.4 Syntetyczna ocena uŜyteczności serwisów internetowych ........................................................ 19
12.5 Empiryczna weryfikacja metody ............................................................................................... 20
12.6 Analiza porównawcza metody syntetycznej oceny uŜyteczności serwisów internetowych z
innymi metodami ...................................................................................................................... 22
13. Spis publikacji własnych ............................................................................................................... 23
14. Zakończenie .................................................................................................................................. 24
2
1. Charakterystyka i aktualność problemu
Badania i ocena uŜyteczności serwisów internetowych, przynaleŜne do tzw. inŜynierii
oprogramowania, opierają się na naukowej obserwacji, pomiarze, projektowaniu
i modyfikowaniu stron internetowych, zgodnie z dostępnymi metodami i technikami.
Głównym celem tych działań jest zwiększenie łatwości uŜytkowania serwisów, wyznaczenie
walorów poznawczych, uŜyteczności i dostępności serwisów1. Ułatwienie uŜytkowania
i dopasowania walorów tych serwisów do zmiennych w czasie potrzeb uŜytkowych zwykle
róŜnych od tych, które uwzględniono w formie wymagań obowiązujących na etapie
tworzenia serwisu. Raz zbudowany serwis internetowy moŜe tracić na uŜyteczności ze
względu na zmienne potrzeby jego uŜytkowników, procesy starzenia się serwisów, rozwój
narzędzi programowych i sprzętowych w informatyce, rozwój cywilizacyjno-technologiczny,
upływ czasu, zmienną modę, zmienne uwarunkowania związane z zachowaniem
uŜytkowników w interakcji ze stroną internetową, a takŜe pod wpływem zmiany celów
podmiotu dla potrzeb, dla którego taki serwis utworzono.
W literaturze podjęto próbę sformalizowania metod oceny róŜnych serwisów
internetowych2 3. Powstaje równieŜ wiele organizacji zajmujących się badaniem szeroko
pojętej uŜyteczności stron internetowych4. Do stosowanych metod oceny serwisów naleŜą
metody badania preferencji uŜytkowników, badania historii odwiedzin, a takŜe metody
badania opinii ekspertów. Metody te koncentrują się na ocenie funkcjonalności stron bądź
ocenie uŜyteczności serwisów internetowych. W praktyce widoczny jest niedobór metod
i narzędzi o charakterze wieloaspektowym i systemowym, które słuŜyłyby do badania
uŜyteczności z punktu widzenia rzeczywistych i zmiennych w czasie preferencji
uŜytkowników5.
2. Przedmiot badań
Przedmiotem badań jest opracowanie metody oceny uŜyteczność serwisów
internetowych, która uwzględni zmienne preferencje uŜytkowników na dowolnym etapie
eksploatacji serwisu. Takie badanie ma sens z dwóch głównych powodów:
− wymagania uŜytkowników i tzw. uŜyteczność serwisu jest zmienna w czasie a metody
jej projektowania są ukierunkowane na stały w czasie jej charakter;
− ze względów biznesowych wskazane jest wydłuŜanie czasu Ŝycia systemów
informatycznych co moŜna osiągnąć poprzez monitorowanie uŜyteczności i ewentualne
jej doskonalenie wówczas, gdy ta uŜyteczność maleje.
3. Metody naukowe stosowane podczas wykonywania badań
W ocenie uŜyteczności serwisów internetowych widoczny jest niedobór metod
i narzędzi oraz występuje brak analizy systemowej, reengineeringu, metod reduktowych,
które słuŜyłyby do badania uŜyteczności z punktu widzenia rzeczywistych i zmiennych
w czasie preferencji uŜytkowników. Aby zrealizować cel rozprawy zaproponowano
syntetyczną ocenę uŜyteczności serwisów internetowych, która odzwierciedla preferencje
1
Phyo A.: Web Design – Projektowanie atrakcyjnych stron WWW. Gliwice: Helion, 2003
Nielsen J.: Projektowanie funkcjonalnych serwisów internetowych. Gliwice, Helion, 2003
3
Nielsen, J., Molich: Heuristic evaluation of user interfaces. Seattle, 1990, Proc. ACM CHI'90 Conf. (WA, 1-5 April)
4
Firm: Symetria, Ideacto sp. Zoo; Janmedia; WitFlow; Cal.pl; Money.pl
5
Raport interaktywne.com – uŜyteczność w Internecie – www.interaktywne.com – dostęp 05.2012
2
3
uŜytkowników oraz dane rzeczywiste wydobyte z tzw. dzienników logów. Zastosowano
równieŜ metody takie jak:
− analizę systemową;
− metodę inŜynierii systemów informatycznych (metody inŜynierii wymagań);
− analizę danych źródłowych ukierunkowaną na badanie istotności i wiarygodności tych
danych (metoda zbiorów przybliŜonych, metody statystyczne);
− metody wielokryterialnego wyboru;
− metody eksperymentalne;
− metody ankietowe.
4. Główny cel rozprawy
Za cel pracy przyjęto opracowanie metody6 oceny uŜyteczności dowolnego serwisu
internetowego, z uwzględnieniem zmiennych preferencji jego uŜytkowników.
NaleŜy zaznaczyć, Ŝe metoda oceny uŜyteczności serwisów internetowych, zgodnie
z inŜynierią wymagań, powinna być stałym elementem projektowania i reengineeringu
oprogramowania, które organizuje infrastrukturę serwisu.
W pracy formułuje się hipotezę, Ŝe opracowana metoda oceny uŜyteczności serwisów
internetowych moŜe być nowym istotnym elementem architektury systemu informatycznego,
wspomagającym proces odnawiania, modernizacji i przebudowy serwisu. Wówczas, gdy
uŜyteczność serwisów w ocenie eksperta przy uŜyciu opracowanej w pracy metody będzie
niewłaściwa to, powinna nastąpić przebudowa serwisu tak by jego uŜyteczność w przyszłości
była wyŜsza, przez co nastąpi lepsze dopasowanie serwisu do potrzeb jego uŜytkowników.
Metoda oceny uŜyteczności oprócz swoich podstawowych funkcji, moŜe wydłuŜyć cykl
Ŝycia serwisu.
5. Zadania do rozwiązania
W celu opracowania syntetycznej metody oceny uŜyteczności naleŜy:
− zweryfikować informację zawartą w dziennikach logów (historii odwiedzin, wewnętrzna
struktura serwisów) redukcja, czyszczenie danych;
− wybrać metodę wielokryterialną spośród innych metod do oceny uŜyteczności;
− uzyskane dane historyczne (dzienniki logów) ocenić wielokryterialnie;
− utworzyć ankietę odpowiednią do oceny preferencji uŜytkowników;
− dokonać wyboru odpowiedniej metody badania preferencji;
− ocenić preferencji uŜytkowników wybraną metodą;
− wyznaczyć wagi do oceny syntetycznej;
− obliczyć ocenę wynikową (syntetyczną) uwzględniającą oceny cząstkowe.
6. Wartość teoretyczna
Metoda oceny uŜyteczności serwisów internetowych będąca przedmiotem rozprawy
powinna być oparta danych historycznych oraz ocenie odwzorowującej bieŜące i przyszłe
preferencje uŜytkowników, bowiem Ŝadne z nich nie musi być oceną wystarczającą
6
Kotarbiński T.: Elementy teorii poznania, logiki formalnej i metodologii nauk: Wrocław, Ossolineum 1961 - Metoda, czyli
system postępowania, jest to sposób wykonywania czynu złoŜonego, polegający na określonym doborze i układzie jego
działań składowych, a przy tym uplanowiony i nadający się do wielokrotnego stosowania
4
(historyczna ocena nie musi być zgodna z bieŜącymi preferencjami uŜytkownika zaś przyszłe
preferencję są często w ogólności mało przewidywalne). Taka metoda została opracowana
w pracy. Nazwano ją metodą syntetyczną.
MoŜna ją scharakteryzować następującymi własnościami:
− uwzględni zmienne w czasie potrzeby uŜytkowników;
− odwzorowuje zmiany wymagań biznesowych serwisów internetowych w ich otoczeniu
uŜytkowym;
− zintegruje metodę oceny uŜyteczności w oparciu o dane historyczne oraz bieŜące
i przyszłe preferencje uŜytkowników tych serwisów;
− moŜe zminimalizować okres czasu, w którym serwis internetowy jest niedopasowany do
nowych potrzeb uŜytkowników;
− moŜe wpłynąć na wydłuŜenie cyklu Ŝycia serwisów internetowych;
− daje moŜliwość rozszerzenia funkcjonalności serwisów internetowych o wewnętrzne
mechanizmy takiej oceny.
Opracowana w pracy metoda jest nową formalną metodą w obszarze metod oceny
uŜyteczności serwisów internetowych. NaleŜy równieŜ do nowych metod inŜynierii
oprogramowania i inŜynierii wymagań.
7. Wartość praktyczna
Syntetyczna metoda oceny uŜyteczności serwisów internetowych opracowana
w pracy moŜe być elementem systemu informatycznego wspomagającego budowę,
reorganizację, restrukturyzację i modyfikację serwisu internetowego. Koncepcję takiego
systemu opartą na systematycznej metodologii oceny uŜyteczności serwisów internetowych
zaprezentowano na rys. 1.
Rysunek 1 System informatyczny do budowy restrukturyzacji, reorganizacji i modyfikacji serwisu
internetowego (SMSI)
Źródło: opracowanie własne
Pod pojęciem procesu odnawiania, modernizacji i przebudowy wybranego serwisu
internetowego rozumie się tu taką jego przebudowę by uczynić go bardziej uŜytecznym.
Ocena wartości serwisu moŜe być wyznaczona w tym systemie ze stosunkiem uŜyteczności
serwisu do kosztu spełnionej funkcji przez ten serwis. Zaprezentowany system
5
informatyczny naleŜy do klasy systemów CASE. UmoŜliwia teŜ automatyzację prac
w obszarze tzw. reengineeringu systemu oprogramowania internetowego. Jest równieŜ
zgodny z prowadzeniem tzw. auditingu (przeglądu) serwisu. Opracowana w pracy metoda
umoŜliwia równieŜ prowadzenie benchmarkingu zewnętrznego organizacji, która udostępnia
serwis internetowy, bowiem jej produkt (serwis) jest porównywalny pod względem,
uŜyteczności z innymi serwisami (serwisami podobnymi). Jest równieŜ narzędziem
w doskonaleniu działań organizacji w tzw. outsourcingu ukierunkowanym na zwiększanie
skuteczności i efektywności organizacji udostępniającej serwis.
8. Akceptacja wyników przez społeczność naukową
Czasopisma w których recenzenci oceniali wynik rozprawy:
− Metody Informatyki Stosowanej;
− Materiałach Polskiego Stowarzyszenia Zarządzania Wiedzą;
− Monografia naukowa Uniwersytetu Szczecińskiego, Towarzystwo Naukowe Organizacji
i Kierownictwa Oddział Szczecin, WNEiZ Uniwersytet Szczeciński, Komisja
Informatyki PAN;
− Zeszytach Naukowych Polskiego Stowarzyszenia Zarządzania Wiedzą;
− Metody Ilościowe w Badaniach Ekonomicznych;
− Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu.
Konferencje na których wyniki pracy zostały przedyskutowane:
− Konferencja „Strategie zarządzania e-biznesem w przedsiębiorstwach 2010”;
− Konferencja Infogryf “Rola informatyki w rozwoju regionalnym 2010”;
− Konferencja Polskie Towarzystwo Badań Operacyjnych i Systemowych BOS 2010;
− Konferencja Infotrendy “Problemy Społeczeństwa Informacyjnego 2011”;
− Konferencja międzynarodowa Sejmik Młodych Informatyków 2011;
− Konferencja „Strategie zarządzania e-biznesem w przedsiębiorstwach 2012”.
9. Główne osiągnięcia pracy
Nowością w pracy jest wielokryterialna i wieloaspektowa ocena uŜyteczności
serwisów internetowych, w której powiązano dwa źródła danych, a mianowicie dane
rzeczywiste z eksploatacji serwisów z danymi ankietowymi uzyskanymi w procesie
ankietowych badań preferencji uŜytkowników (ekspertów). Dzięki temu moŜliwe będzie
zautomatyzowanie procesów reorganizacji i takiej przebudowy serwisu, aby zwiększyć
uŜyteczność serwisu. MoŜna taką automatyzację uzyskać poprzez implementację
zaprezentowanej w pracy metody w systemie zgodnym z rys. 1.
10. Struktura pracy
Rozprawa doktorska zbudowana jest z siedmiu rozdziałów, literatury, załączników do
których naleŜą spis tabel oraz rysunków. Rozprawa doktorska liczy 134 strony.
W pracy zamieszczono wykaz uŜytej bibliografii, który obejmuje 212 pozycji. NaleŜą
do nich artykuły konferencyjne, polskie i zagraniczne strony internetowe, pozycje ksiąŜkowe
(głównie anglojęzyczne). Praca zawiera w formie załączników wykaz podstawowych
definicji, wykaz 40 tabel i 33 rysunków.
11.Ogólna charakterystyka zawartości pracy doktorskiej
W części pierwszej rozprawa zawiera opis problemu, a takŜe cel i hipotezę pracy.
6
Rozdział drugi zawiera wprowadzenie do uwarunkowań systemowych w ocenie
uŜyteczności serwisów internetowych. Przyjęta perspektywa badawcza zakłada koncentrację
uwagi na architekturze informacji oraz zachowaniach uŜytkowników serwisów. W dalszej
części rozdziału zostały przedstawione metody uŜyteczności oraz dokonano tu ich
porównanie. UŜyteczność zdefiniowano w kontekście norm ISO i wskazano na sposób jej
badania. Na podstawie przeglądu funkcjonują w piśmiennictwie naukowym definicji
uŜyteczności, w pracy przyjęto definicję, która jest najczęściej uŜywana i identyfikuje cechy
dystynktywne przynaleŜne do teorii uŜyteczności i funkcjonalności. Przyjęta definicja
pozwoliła na odpowiednią interpretację i identyfikację zachowań uŜytkowników
z włączeniem narzędzi realizujących funkcję dostępnych danych w strukturach stron
internetowych.
Przedmiotem rozdziału trzeciego jest odkrywanie wzorców zachowań uŜytkowników
stron internetowych. Scharakteryzowano tutaj narzędzia i techniki zachowań uŜytkowników
oraz dokonano charakterystyki i identyfikacji uŜytkowników. Przytoczono równieŜ
koncepcje dostępu do zasobów sieciowych – przy wykorzystaniu dzienników serwera
WWW. W tej części rozprawy scharakteryzowano wiarygodność informacji zawartą
w logach WWW, moŜliwości pobierania, reprezentacji oraz identyfikacji uzyskanych
danych.
W rozdziale czwartym przedstawiono wielokryterialny charakter metod, które mogą
posłuŜyć do oceny uŜytecznych serwisów internetowych. Określono rolę stosowanych
narzędzi w kontekście wspomagania decyzji, identyfikację cech wyszukiwawczych
w uŜyteczności oraz opisano metody oceny uŜyteczności w oparciu o badanie preferencji
uŜytkowników.
W rozdziale piątym przedstawiono autorską metodę syntetycznej oceny uŜyteczności
serwisów internetowych. Rozdział ten jest kluczowym rozdziałem pracy. Zostały w nim
szczegółowo zawarty opis metody wielokryterialnej i wieloaspektowej oceny uŜyteczności
serwisów internetowych. W metodzie tej tzw. syntetyczna ocena U jest wyznaczona jako
złoŜenie dwóch ocen cząstkowych. Oznaczono je w pracy symbolicznie jako:
− Zd - ocena uŜyteczności na podstawie dzienników logów (uŜyteczność obliczona
w oparciu o dane historyczne);
− PS - ocena uŜyteczności w wyniku badań ankietowych (badanie preferencji
uŜytkowników).
W rozdział piątym dokonano oceny syntetycznej metody oraz porównano ją z innymi
stosowanymi w praktyce metodami.
W rozdziale szóstym przedstawiono praktyczny przykład wykorzystania opracowanej
metody oceny uŜyteczności serwisów internetowych.
Metodę zaprezentowaną w pracy zweryfikowano w oparciu o dane empiryczne
uzyskane z eksploatacji serwisów internetowych - księgarni internetowych, działających na
terenie Polski i porównano otrzymany wynik (ranking) z rankingiem czasopisma Wprost
z 2009/2010 roku i dziennikarzy Money.pl. NaleŜy zaznaczyć, Ŝe badania przeprowadzono w
oparciu o dane z dwóch lat, podzielone na cztery okresy badawcze. Przedmiotem oceny było
pięć księgarni internetowych. Zestawione wyniki badań z rankingiem czasopisma Wprost
z 2009/2010 roku i dziennikarzy Money.pl, przedstawiają wysokość zgodność oceny
uŜyteczności tych przykładowych serwisów.
7
Rozdział siódmy zawiera podsumowanie metody, nowatorskie elementy pracy oraz
kierunki dalszych badań.
12.Metoda wielokryterialnej oceny uŜyteczności serwisów internetowych
12.1 Ogólny schemat metody
W celu oceny uŜyteczności dowolnego serwisu internetowego naleŜy:
1. Obliczyć uŜyteczność tego serwisu w oparciu o dane zawarte w dzienniku logów (ocena
cząstkowa Zd).
2. Ocenić uŜyteczność serwisu w oparciu o dane wynikające z badania preferencji grupy
uŜytkowników tego serwisu (ocena cząstkowa PS).
3. Dokonać ostatecznej oceny uŜyteczności U serwisu w postaci tzw. syntetycznej oceny
uŜyteczności w oparciu o Zd oraz PS.
Procedura ta została zaprezentowana schematycznie na rys. 2.
Rysunek 2 Schemat metody oceny uŜyteczności serwisów internetowych
Źródło: opracowanie własne
Metody ocen cząstkowych Zd oraz PS i syntetyczną metodę oceny uŜyteczności U
serwisów internetowych zgodne z rys. 2 przedstawiono w kolejnych podrozdziałach 12.2,
12.3, 12.4 niniejszego autoreferatu.
12.2 Ocena uŜyteczności serwisów internetowych na podstawie danych
zawartych w dziennikach logów
Dzienniki logów serwisów internetowych dostarczają danych o uŜytkownikach i ich
zachowaniu na stronach internetowych. Są to dane gromadzone automatycznie w czasie
rzeczywistym eksploatacji tych serwisów.
Dla ogólności, aby ocenić uŜyteczność dowolnego serwisu w chwili t na podstawie
jego dziennika logów załóŜmy, Ŝe tym serwisem będzie serwis S0 z dziennikiem
symbolicznie oznaczonym, jako D0. Dziennik D0 dostarcza danych o charakterystycznych
cechach uŜytkowania serwisu S0, przy czym cechom tym odpowiadają zawarte w D0
atrybuty opisujące sposób uŜytkowania serwisu S0. Zbiór tych atrybutów w dzienniku D0 dla
serwisu S0 oznaczmy symbolem A0 zgodnie ze wzorem (1):
A0 = {a10 , a 20 ...a m0 }
(1)
gdzie:
a 0j - atrybut opisujący j-tą własność (cechę) sposobu uŜytkowania serwisu internetowego
S0 w dzienniku logów D0,
j ∈ {1,2,..., m0 }
8
mi - liczba atrybutów w dzienniku D0.
UŜyteczność serwisu S0 oznaczona symbolicznie jako Z d 0 jest zmienna w czasie a jej wartość
jest wartością nieznanej funkcji g, takiej, Ŝe:
Z d 0 (t ) = g ( A0 , ζ , t )
(2)
gdzie:
ζ - jest nieznanym i niezidentyfikowanym w dzienniku logów D0 zbiorem czynników,
mających wpływ na uŜyteczność serwisu S0,
t - czas,
A0 - zbiór atrybutów zdefiniowanych w dzienniku D0 serwisu S0, zdefiniowany wzorem
(1).
NaleŜy zaznaczyć, Ŝe przy braku znajomości funkcji g i zbioru ζ oraz przy braku
metod ich identyfikacji uŜyteczność Z d 0 (t ) serwisu S0 w chwili t moŜna wyznaczyć, jako
rangę wartości uŜyteczności serwisu S0 względem innych serwisów podobnych do S0
wyznaczoną na podstawie znanego zbioru atrybutów dostępnych w dziennikach logów. Jest
to wówczas rodzaj oceny kategorycznej, wyraŜającej rangę wartości. Dlatego w dalszych
rozwaŜaniach załoŜono, Ŝe w chwili t dostępne są dodatkowo serwisy podobne do S0
z dziennikami logów. Pod pojęciem serwisu podobnego przyjmuje się taki serwis, który
posiada ten sam zakres podstawowych funkcji przypisanych serwisowi. Serwisy podobne
powiązane są ze sobą nie tylko funkcjonalnością, ale równieŜ treścią, mają zwykle
podobnych odbiorców choć często równieŜ z indywidualnymi upodobaniami. Niech tymi
serwisami podobnymi do S0 są serwisy:
S1, S2,…, Sn
(3)
gdzie:
symbolem n oznaczono liczbę serwisów podobnych do serwisu S0, taką, Ŝe n ≥ 1
Zakładając, Ŝe dla kaŜdego serwisu Si gdzie i ∈ {1,2,..., n} w dowolnej chwili t dostępne
są dzienniki logów symbolicznie oznaczone jako Di i, Ŝe kaŜdy z dzienników Di serwisu Si
podobnego do S0 (dla i=1,2,…n) zawiera kolekcję mi atrybutów Ai świadczących o sposobie
uŜytkowania tych serwisów, tzn.
∀1<=i <=n ∃mi ∈I Ai = {a1i , a 2i ...ami i }
(4)
gdzie:
I - zbiór liczb całkowitych nieujemnych,
n - liczba rozwaŜanych dodatkowo serwisów,
i ∈ {1,2,..., n} ,
mi - liczba atrybutów w dzienniku Di
a ij - atrybut opisujący j-ty sposób uŜytkowania serwisu internetowego Si w dzienniku
logów Di,
j ∈ {1,2,..., mi }
moŜna rozwaŜyć zbiór wspólnych atrybutów ∆ zdefiniowany zgodnie ze wzorem (5):
9
n
∆ = I Ai
(5)
i =0
Zawiera on wspólne atrybuty charakteryzujące serwisów S0, S1, S2,…, Sn z punktu widzenia
ich uŜyteczność. Zbiór ∆ nie jest zbiorem pustym. Wynika to z tego, Ŝe w dziennikach logów
serwisów internetowych znajdują się choćby najczęściej uŜywane takie atrybuty jak: liczba
odwiedzin, czas przebywania na stronie i inne omówione w pracy doktorskiej 7.
ZałóŜmy, Ŝe zbiór ∆ zawiera p elementów, tzn. niech
∆ = {k1 , k 2 ,..., k p }
(6)
gdzie:
i ∈ {1,2,..., p} oznacza numer elementu w zbiorze ∆,
p - liczność zbioru ∆ ,
ki - i-ty element zbioru ∆.
Elementy zbioru ∆ są miarami uŜyteczności serwisów S0, S1, S2,…, Sn. Częstym zbiorem
kryteriów (elementów zbioru ∆) są zwykle: liczba odwołań do serwera przykładowe k1,
liczba uŜytkowników odwiedzających serwis przykładowe k2, strony w sieci, z których
uŜytkownicy wchodzą do serwisu przykładowe k3, strony, z których uŜytkownicy najczęściej
opuszczają serwis przykładowe k4, liczbę odwołań przykładowe k5, strony, z których
najczęściej kierowany jest „ruch” do serwisu atrybut k6, okres największych aktywności
odwiedzających przykładowy atrybut k7.
Dla serwisów S0, S1, S2,…, Sn oraz odpowiednich do nich dzienników D0, D1, D2,…, Dn
moŜna wówczas utworzyć macierz danych źródłowych Ω [ ξ x p] w której elementami
są wartości kolejnych kryteriów w kolejnych pozycjach dzienników logów, gdzie ξ jest
liczba wszystkich zapisów we wszystkich dziennikach logów począwszy od dziennika D0 do
Dn, a p jest licznością zbioru ∆.
W dalszych rozwaŜaniach załoŜono, Ŝe macierz Ω jest macierzą o wymiarze N x p
gdzie N jest liczbą wierszy macierzy Ω a p liczbą jej kolumn (liczbą atrybutów ze zbioru ∆).
Niektóre z atrybutów (miar) dzienników logów (elementy zbioru ∆) mogą być względnie
zaleŜne od siebie, istotne lub nie, z punktu widzenia badania uŜyteczności. Mogą teŜ
wymagać obliczenia (np. liczba odwołań, szybkość z jaką wczytywane są strony serwisu
i wyszukiwane są dane czy średnia liczba sesji na uŜytkownika). Mogą równieŜ zawierać
tzw. szumy informacyjne, które są wynikiem róŜnych błędów, jakie mogą pojawiać się
w danych pochodzących z dzienników logów. Istnienie takich szumów w danych zapisanych
w zbiorze Ω utrudnia wyodrębnienie informacji prawdziwych, pewnych i istotnych z punktu
widzenia wiarygodności oceny. Dlatego dysponując macierzą Ω naleŜy zastosować
odpowiednią metodę czyszczenia, porządkowani i walidacji danych zawartych w Ω ,
co zmniejszy ilość szumów informacyjnych. Ogólnie metody czyszczenia, porządkowania,
walidacji, normalizacji nazwano wstępną obróbką danych. Zaprezentowano je
w podrozdziale 12.2.1 autoreferatu. NiezaleŜnie od wstępnej obróbki danych dla zapewnienia
wiarogodności oceny uŜyteczności serwisów internetowych niezbędne jest wyznaczenie
spośród kryteriów ze zbioru ∆ tych kryteriów, które są istotne do oceny uŜyteczności.
7
Praca doktorska „Metoda ocen uŜyteczności serwisów internetowych”, rozdział III str. 31-51
10
Metodę tę nazwano w pracy redukcją kryteriów oceny uŜyteczności i zaprezentowano ją
w podrozdziale 12.2.2 niniejszego autoreferatu
12.2.1 Wstępna obróbka danych
Wstępna obróbka danych uzyskanych z dzienników logów D0, D1, D2,…, Dn
(n - liczba serwisów podobnych do S0) obejmuje:
1. Usuwanie wiersz i kolumn z macierzy Ω , które zawierają niepełne dane.
2. Obliczenie wartości kryteriów ze zbioru ∆ na podstawie danych zawartych w macierzy
Ω.
3. Normalizację danych (zamiana wartości zawartych w macierzy Ω na wartości
przynaleŜne do jednakowej przestrzeni odniesienia).
W celu otrzymania tablicy danych zawierające nieznane wartości atrybutów
do w pełni zdefiniowanej tablicy informacyjnej Ω naleŜy w tym zakresie zastosować trzy
uogólnienia. Pierwszy rodzaj obróbki wstępnej wynika z niekompletności danych
o wartościach atrybutów ze zbioru ∆ w dziennikach D0, D1, D2,…, Dn. Drugi przypadek
redukcji kryterium ki (i-ty element) ze zbioru ∆ w tablicy informacyjnej Ω występuje, przy
niesymetrycznej relacji prawdopodobieństw dla przypadków podobnych. Oznacza to, Ŝe
redukuje się te kryteria ki (i-ty element) ze zbioru ∆, dla których występuje zaleŜność
pomiędzy
innymi
kryteriami
kj (j-ty
element)
z
tego
zbioru
gdzie
( j ≠ i ) ∧ (1 ≤ i ≤ n ) ∧ (1 ≤ j ≤ n ) . Trzeci przypadek to normalizacja danych, przy której
następuje zamiana wartości zawartych w macierzy Ω na wartości przynaleŜne do
jednakowej przestrzeni odniesienia i jednostek pomiaru. Normalizacja jest niezbędna
wówczas, gdy wartości zawarte w macierzy Ω pochodzą z róŜnych zakresów. Jedną z metod
normalizacji jest min-max normalization, którą wykorzystano w pracy doktorskiej8.
Ostatecznie po wykonaniu czynności wstępnej (obróbki danych zawartych
w macierzy Ω (przypadek 1, 2, 3) z atrybutami ze zbioru ∆) uzyskuje się macierz Γ
z kryteriami ze zbioru Π . Zbiór kryteriów Π jest wówczas zgodny ze wzorem (7).
Π = {q1 , q2 ,..., qu } ⊆ ∆ ∧ u ∈ I ∧ u ≤ p
(7)
gdzie:
I - zbiór liczb całkowitych dodatnich,
∆ - zbiór kryteriów przed obróbką wstępną macierzy Ω ,
u - liczba kryteriów oceny uŜyteczności serwisów internetowych po obróbce wstępnej.
12.2.2 Badanie istotności kryteriów oceny
Aby przeprowadzić ocenę serwisów internetowych pod względem ich uŜyteczności
na podstawie atrybutów zawartych w macierzy danych Γ z kryteriami oceny Π , naleŜy
wybrać ze zbioru Π te kryteria, które są istotne z punktu widzenia celu oceny. Dodatkowo,
ze zbioru odróŜnialnych kryteriów Π i danych z tablicy Γ naleŜy odrzucić równieŜ te,
których usunięcie nie spowoduje utraty istotności wyników w procesie oceny. Taka metoda
usuwania danych nazywa się metodą wyznaczania reduktów.
Według definicji reduktem P nazywa się taki podzbiór zbioru dostępnych danych,
w którym obiekty są opisane na zbiorze kryteriów Φ i dla których algorytm wywodu wiedzy
8
Praca doktorska „Metoda ocen uŜyteczności serwisów internetowych”, rozdział 5.2.1 str. 74
11
(w tym przypadku oceny uŜyteczności serwisu internetowego) będzie osiągał ogólnie
zdefiniowaną funkcję zgodności 9.
Redukcja danych moŜe przyczynić się do:
– zwiększenia efektywności wywodu wiedzy o uŜyteczności serwisu;
– zmniejszenia czasu rozpoznawania wiedzy o tej uŜyteczności;
– wyeliminowania szumów i błędów ze zbioru danych;
– zmniejszenia wymagań, co do zasobów obliczeniowych metody;
– zmniejszenia złoŜoności struktury reprezentacji wiedzy o rozwaŜanym problemie;
– wskazanie kompromisu pomiędzy poziomem dostępu do danych a ich spójnością
i wartością przyjętej funkcji oceny.
Celem zastosowania wyŜej wymienionych przypadków redukcji zbioru Π macierzy
Γ jest uzyskanie najmniej licznego zbioru pozwalającego rozróŜnić warianty oceny
końcowej, a tym samym zredukować liczbę wymiarów oceny i pozostawić te atrybuty
ze zbioru Π , które są istotne do oceny uŜyteczności.
W procesie redukcji danych stosuje się metody polegające na selekcja cech
(atrybutów - kryteriów) za pomocą wyboru takiego podzbioru cech (atrybutów-kryteriów)
Φ , Ŝe Φ ⊆ Π ⊆ ∆ . MoŜna uzyskać stosując metody usunięcia ze zbioru Π kolumn
macierzy Γ o zbyt małej zmienności za pomocą tzw. statystycznej miary zmienności
atrybutu lub metody opartej na podobieństwie cech. Jedną z metod redukcji jest równieŜ
metoda badanie istotności danych.
Aby wyznaczyć względną istotności otrzymanych atrybutów (kryteriów) ze zbioru
Π posłuŜono się metodą zbiorów przybliŜonych10, która wymaga uzupełnienia macierzy
informacyjnej Γ o wektor atrybutów decyzyjnych d (uŜyteczność) zdefiniowany wzorem (8).
d 0 
 
d
d =  1
 ... 
 
d n 
(8)
gdzie:
di - oznacza uŜyteczność serwisu Si,
i - numer kolejnego serwisu, przy czym i ∈ I ∧ 0 ≤ i ≤ n ,
n - wyznacza liczbę analizowanych serwisów,
I - zbiór liczb całkowitych nieujemnych.
Uzyskaną w ten sposób macierz oznaczono symbolem Ψ . Jest ona zgodna z tab. 1.
Tabela 1 Macierz Ψ istotnych danych źródłowych do oceny uŜyteczności serwisów WWW z atrybutem
decyzyjnym d (po obróbce wstępnej i redukcji nieistotnych kryteriów)
S0
S1
S2
…
Sn
q1
Wartość kryterium q1 w D0
Wartość kryterium q1 w D1
Wartość kryterium q1 w D2
…
Wartość kryterium q1 w Dn
q2
Wartość kryterium q2 w D0
Wartość kryterium q2 w D1
Wartość kryterium q2 w D2
…
Wartość kryterium q2 w Dn
…
qu
Wartość kryterium
Wartość kryterium
Wartość kryterium
…
Wartość kryterium
qu w D0
qu w D1
qu w D2
qu w Dn
d
d0
d1
d2
…
dn
Źródło: opracowanie własne
9
Dominik A.: Analiza danych z zastosowaniem teorii zbiorów przybliŜonych. Warszawa, 2004, Praca Dyplomowa
Magisterska opiekun dr inŜ. R. Podraza
10
Pawlak Z., Skowron A.: A rough set approach for decision rules generation, ICS Research Report 23/93. Warszawa:
University of Technology, 1993
12
Dopiero tabela Ψ umoŜliwi analizę istotności kryteriów ze zbioru Π za pomocą metody
zbiorów przybliŜonych.
Ostatecznie w wyniku zastosowania redukatów (badanie istotności atrybutów zbioru
Π ) uzyskuje się zbiór niezaleŜnych i istotnych atrybutów zwanych w dalszej treści pracy
kryteriami oceny uŜyteczności serwisów w oparciu o dzienniki logów. Zbiór tych kryteriów
oznaczono symbolem Φ zgodnie ze wzorem (9)
(9)
Φ = {Q1 , Q 2 ,..., Q r }
gdzie r jest licznością zbioru Φ . NaleŜy zauwaŜyć, Ŝe liczby r oraz u i p (uŜyte we wzorach
6, 7) spełniają warunek (10), taki, Ŝe
r≤u≤ p
(10)
Φ⊆Π⊆∆
(11)
oraz, Ŝe
Tak wyznaczony zbiór Φ istotnych kryteriów opisanych w dziennikach D0, D1,…,Dn
serwisów podobnych S0, S1, S2,…, Sn moŜe posłuŜyć do oceny ich uŜyteczności, równieŜ
uŜyteczności S0.
Znając kryteria ze zbioru Φ w oparciu o dane z dzienników logów moŜna w tym celu
utworzyć tabelę Θ istotnych danych źródłowych oceny uŜyteczności serwisów. Tabelę
tę zaprezentowano w tab. 2.
Tabela 2 Macierz Θ istotnych danych źródłowych do oceny uŜyteczności serwisów WWW w oparciu o dane
z dzienników logów
S0
S1
Q1
Wartość kryterium Q1 w D0
Wartość kryterium Q1 w D1
Q2
Wartość kryterium Q2 w D0
Wartość kryterium Q2 w D1
…
…
…
Qr
Wartość kryterium Qr w D0
Wartość kryterium Qr w D1
…
Sn
…
Wartość kryterium Q1 w Dn
…
Wartość kryterium Q2 w Dn
…
…
…
Wartość kryterium Qr w Dn
Źródło: opracowanie własne
Sformalizowana postać macierzy Θ jest zgodna ze wzorem (12),
o0,1 o0, 2
o
o1, 2
1,1
Θ=
 ...
...

o
o
 n,1 n, 2
... o0, r 
... o1, r 
... ... 

... on , r 
(12)
gdzie:
n+1 - liczba serwisów poddanych badaniu uŜyteczności,
r - liczność zbioru kryteriów Φ ,
oi , j - element tabeli Θ ,
i ∈{0,.., n}, j ∈{1,..,r} są numerem wierzy i kolumn macierzy Θ ,
Macierz Θ , zawierająca istotne kryteria oceny uŜyteczności serwisów S0,S1,…Sn oraz
wartości istotnych kryteriów wyznaczone na podstawie ich dzienników logów D0, D1,…Dn
jest tablicą informacyjną do wielokryterialnej oceny uŜyteczności serwisów S0,S1,…Sn.
13
12.2.3 Ocena wielokryterialna uŜyteczności serwisów internetowych
Aby ocenić uŜyteczność serwisów podobnych S0, S1,…, Sn na podstawie macierzy Θ
z wieloma istotnymi kryteriami ze zbioru Φ naleŜy wybrać odpowiednią metodę. Oznaczmy
poszukiwaną metodę oceny wielokryterialnej serwisów S0, S1,…Sn symbolem M.
Metoda M powinna umoŜliwić definiowanie wag róŜnych kryteriów ze zbioru Φ ze
względu na róŜne składowe posiadające róŜny wpływ na preferencje uŜytkowników. Ponadto
powinna umoŜliwić porównanie wszystkich serwisów S0, S1.,…, Sn pomiędzy sobą.
W wyborze poszukiwanej metody M nie dopuszcza się sytuacji, w której nie jest moŜliwe
porównanie kryteriów między serwisami. Warunek ten jest moŜliwy do osiągnięcia w tym
przypadku, poniewaŜ rozwaŜane serwisy są podobne funkcjonalnie (serwisy internetowe
powinny znajdować się w wybranej grupie tematycznej lub powinny zawierać podobną
strukturę informacyjną w opinii ekspertów) zgodnie z przyjętymi załoŜeniami metody.
Kolejnym problem wyboru odpowiedniej metody wielokryterialnej M jest istnienie w niej
moŜliwości rozmycia przedziałów oceny preferencji w wielokryterialnym wyborze.
Rozmycie to powinno występować ze względu na moŜliwość wystąpienia róŜnic między
serwisami pomimo ich podobieństwa (np. róŜna skala liczby uŜytkowników porównywanych
serwisów od kilku do wielu tysiącach uŜytkowników). Wybrana metoda M powinna
rozpatrywać problem porządkowania lub wyboru rangi oceny. W mniejszym stopniu
powinny tu być zastosowane metody ukierunkowane na sortowanie lub opis kryteriów.
Pozytywną cechą metody M jest równieŜ forma udostępniania wyników metody (naturalna
skala oceny wynikowej metody). Problem wyboru metody M jest równieŜ problemem
wielokryterialnym.
Do wyboru metody M spośród metod potencjalnie moŜliwych uŜyto metodę
ELECTRE I11. Metodę ELECTRE I w procesie analizy i wyboru metody M oceny
uŜyteczności serwisów internetowych zastosowano z następujących powodów:
− rozpatrywano wybór jednej metody M spośród wielu, tak by miała ona najlepszą
stosowalność w ocenie serwisów internetowych;
− wszystkie rozpatrywane kryteria wyboru f1, f2,…, ,f6 metody M mogą przyjmować tylko
wartości binarne 1 lub 0 (prawda, fałsz), wystarczające w jej wyborze;
− ze względu na ocenę kryteriów f1, f2,…, ,f6 w skali binarnej, nie ma potrzeby
wykorzystywania tzw. progów weta.
W celu uŜycia metody ELECTRE I sformułowano kryteria, które umoŜliwią wybór
najlepszej z dostępnych metod wielokryterialnych do oceny uŜyteczności serwisów.
Przyjętymi kryteriami wyboru metody M są kryteria oznaczone symbolicznie kryteria
f1, f2,…, f6 (tab. 3).
Tabela 3 Kierunki preferencji oraz wagi poszczególnych kryteriów
L.p.
f1
f2
f3
f4
f5
f6
Kryterium
czy metoda obejmuje zdefiniowanie wag?
czy metoda dopuszcza sytuację nieporównywalności wariantów oceny?
czy metoda zapewnia rozmycie przedziałów preferencji?
czy metoda rozpatruje problem porządkowania lub wyboru?
czy metoda umoŜliwia dekompozycję problemu oceny?
czy wartości kryteriów oceny są podawane w naturalnych języku czy skali ilościowej?
Kierunek preferencji
max
min
max
max
max
max
Waga
3
5
4
5
3
2
Źródło: opracowanie własne
11
Fabisiak L., Ziemba P.: Metody Wielokryterialnego wspomagania decyzji w ocenie uŜyteczności serwisów internetowych.
Wrocław: Wydawnictwo Uniwersytetu Ekonomicznego, 2011, nr 20, s.303-312
14
Dla ustalenia wag kryteriów oceny f1, f2,…, f6 w metodzie ELECTRE I wykorzystano
skalę Likerta. Jest to technika pomiarowa oparta na wykorzystaniu standaryzowanych
kategorii odpowiedzi, która umoŜliwiła odpowiednie eksperckie dopasowanie wartości
liczbowej do badanego problemu. Aby wskazać jaką z rozwaŜanych w pracy doktorskiej
metod M1 - ELECTRE II, PROMETHEE II; M2 - ELECTRE III, ELECTRE IS,
PROMETHEE I; M3 - ELECTRE IV, MELCHIOR; M4 - ELECTRE Iv; M5 - TOPSIS; M6 UTA; M7 - AHP; M8 - ELECTRE TRI przyjąć za najlepszą posłuŜono się badaniem opinii
ekspertów. W takcie przeprowadzanej procedury obliczeniowej ELECTRE I uzyskano
macierz współczynników zgodności. W wyniku zastosowania metody ELECTRE I
otrzymano graf przewyŜszania zgodny z rys. 3.
Rysunek 3 Graf przewyŜszania obliczoną ELECTRE I
Źródło: opracowanie własne
Dzięki zastosowaniu metody wielokryterialnej ELECTRE I uzyskano końcowe
zestawienie wyników, które potwierdza wybór metody AHP (rys. 3 metoda o numerze M7
o najwyŜszym przewyŜszeniu) na podstawie kryteriów f1, f2…, f6 oznacza to, Ŝe jako metodę
M słuŜącą do oceny uŜyteczności serwisu S0 oraz oceny uŜyteczności serwisów S1, S2,…, Sn
na podstawie danych zawartych w dziennikach logów serwisów D0, D1,…, Dn. W dalszych
obliczeniach przy pomocy tablicy Θ uŜyto metody AHP. Metoda ta wymaga:
1. Zbudowania macierzy porównań parami dla obiektów oceny S0, S1,…, Sn osobno
w ramach kaŜdego kryterium spośród kryteriów Q1, Q2,…, Qr przynaleŜnych do zbioru
Φ i macierzy Θ przy czym porównanie to prowadzi do powstania r+1 (k = r
w metodzie AHP) macierzy porównań; oznaczmy wyniki tych porównań jako macierze
A(1), A(2),…, A(r) zaś macierz porównań kryteriów Q1, Q2,…, Qr oznaczmy symbolem A(0);
2. Wyznaczenia rankingu indywidualnie dla kaŜdej z macierzy A(0), A(1), A(2),…, A(r);
3. Wyznaczenia rankingu wielokryterialnego dla serwisów S0, S1,…, Sn wg tego rankingu
kaŜdy serwis Si otrzyma ocenę uŜyteczności Z d i gdzie i ∈{0,1,...n} .
Procedury realizacji kroków 1, 2 i 3 zostały zaprezentowane w literaturze12 13 i w pracy
doktorskiej14. Ostatecznie w wyniku zastosowania metody AHP uzyskano ocenę
uŜyteczności serwisów S0, S1,…, Sn (a w szczególności uŜyteczność serwisu S0) w formie
wektora Zd zgodnego z następującym wzorem (13):
12
Saaty T L.: Axiomatic foundation of the analytic hierarchy process. Manage. Sci, 32:841-855, 1986
Saaty T.L.: How to make a decision: the analytic hierarchy process: European Journal of Operational Research,, 1990, t 48
14
Praca doktorska „Metoda ocen uŜyteczności serwisów internetowych”, rozdział 4.3 str. 60-64
13
15
Z d0 
Z 
d
Zd =  1 
 ... 


Z dn 
(13)
gdzie:
Z d i - uŜyteczność serwisu Si,
i ∈ {0,1,.., n},
n - liczba rozwaŜonych serwisów.
Schematycznie wyznaczanie oceny Z d 0 dla serwisu S0 zilustrowano na rys. 4
Rysunek 4 Algorytm oceny cząstkowej Zd (patrz: rys. 2) dla dowolnego serwisu S0
Źródło: opracowanie własne
Otrzymana ocena Zd jest oceną cząstkową, która posłuŜyła w budowie ostatecznego modelu
metody w syntetycznej ocenie uŜyteczności serwisów internetowych.
16
12.3 Ocena uŜyteczności serwisów internetowych w oparciu o preferencje
uŜytkowe
Istotnym etapem metody oceny uŜyteczności serwisów internetowych jest ocena
przyszłych i aktualnych preferencji uŜytkowników (ocena Ps na rys. 2). Do rozwiązania tego
problemu wykorzystano metodę wielowymiarowej analizy funkcjonalności, czyli tzw.
metodę oceny punktowej15. NaleŜy zaznaczyć, Ŝe zastosowane kryteria są traktowane
równowaŜnie a skali preferencji przypisywano wartości współczynnikowe. Na podstawie
licznych publikacji16 w celu oceny preferencji uŜytkowników (ekspertów) serwisów
internetowych wytyczono następujące etapy:
– powołanie oceniającego zespołu ekspertów złoŜonego z przedstawicieli uŜytkowników
i potencjalnych uŜytkowników Internetu z określonej grupy badanych serwisów
internetowych;
– stworzenie szczegółowego formularza, czyli określenie kryteriów szczegółowych oceny
serwisów internetowych, ich hierarchii oraz zaleŜności pomiędzy czynnikami oceny;
– ocena ekspercka wybranych serwisów internetowych występujących w danej dziedzinie
oraz charakterystyka tych serwisów w badanym sektorze/branŜy;
– przypisanie kategoriom z grup kryteriów odpowiednich punktów na podstawie
przyjętych;
– zebranie wyników w formie tabel indywidualnych i zestawienia wyników w formie tabel
zbiorczych;
– analiza wyników ostatecznych i wyciągniecie wniosków.
W metodzie punktowej eksperci przypisują kryteriom oceny według skali od 0 do 1 gdzie
ocena 0 to brak cechy, 0,25 – niski (zadawalający) poziom cechy, 0,5 – średni (dostateczny)
poziom cechy, 0,75 – wysoki (dobry) poziom cechy, 1 – bardzo wysoki poziom cechy.
PoniewaŜ w badaniach opinii ekspertów moŜna stosować wiele skal to w celu oceny
preferencji stosuje się zwykle normalizację zgodną ze wzorem (14). Dostosowuje ona
uzyskane wartości badania tak, aby mieściły się one w określonym przedziale17.
P' ' S i =
w − Pmin
( Pnew max − Pnew min ) + Pnew min
Pmax − Pmin
(14)
gdzie:
P ' ' S i - nowa wartość którą chcemy uzyskać po normalizacji,
Pnewmin -nowa wartość minimalna,
Pnewmax -nowa wartość maksymalna,
Pmin- dotychczasowa wartość minimalna,
Pmax - dotychczasowa wartość maksymalna,
w - wartość oceny w dotychczasowej skali.
Po normalizacji danych zaprezentowana skala daje wyniki z przedziału od 0 do 1. Lepszą
gradację ocen w badaniu opinii ekspertów uzyskuje się stosując oceny wyznaczone
15
Chmielarz W.: Analiza atrybutów wybranych księgarni internetowych. Materiały konferencji HCI , 2009
Chmielarz W.: Metody oceny werbalnych księgarni internetowych Komputerowo: Zintegrowane Zarządzanie obszar:
Gospodarka oparta na wiedzy, 2010
17
Jain, A., Nandakumar, K., Ross, A.: Score normalization in multimodal biometric systems. Pattern Recognition 2005,
(38), No. 12,
16
17
w liczbach naturalnych. MoŜna wówczas stosować skalę preferencji zgodną z tab. 4.
Tabela 4 Skala preferencji uŜytkowników
Skala ekspercka
<0,1
0,11-0,2
0,21-0,3
0,31-0,4
0,41-0,5
0,51-0,6
0,61-0,7
0,71-0,8
0,81-0,9
0,91-1
Skala Preferencji
1
2
3
4
5
6
7
8
9
10
Źródło: opracowanie własne
Po przyjęciu przez eksperta skali opartej na liczbach naturalnych, bazując na funkcji
odwzorowania z tab. 4 wyznacza się cząstkową ocenę PS, dla kaŜdego serwisu Si, gdzie
{i=0,1,…n}.
Ostatecznie w wyniku zastosowania metody punktowej zostaną uzyskane preferencję
uŜytkowników w ocenie uŜyteczności serwisów S0, S1,…, Sn (a w szczególności uŜyteczność
serwisu S0) w formie wektora PS zgodnego ze wzorem (15):
 PS 0 
P 
S
Ps =  1 
 ... 


 PS n 
(15)
gdzie:
PSi - preferencję uŜytkowników w ocenie uŜyteczności serwisu Si,
i ∈ {0,1,.., n},
n - liczba rozwaŜonych serwisów.
Schematycznie wyznaczanie oceny PS 0 dla serwisu S0 zilustrowano na rys. 5:
Rysunek 5 Algorytm oceny uŜyteczności dowolnego serwisu S0 metodą badania preferencji uŜytkowników
(ocena cząstkową Ps z rys. 2)
Źródło: opracowanie własne
18
12.4 Syntetyczna ocena uŜyteczności serwisów internetowych
Ostateczna ocena uŜyteczności serwisów internetowych (rys. 2) jest połączenie oceny
cząstkowej Zd i oceny cząstkowej PS (podrozdział 12.2 i 12.3) badanych serwisów
internetowych. Uzyskaną w ten sposób ocenę nazwano syntetyczną. Uwzględnia ona
zarówno historyczne dane z rzeczywistego ich uŜytkowania jak i ocenę bieŜących
i przyszłych preferencji uŜytkowników. W metodzie syntetycznej ostateczną ocenę uzyskuje
się dzięki addytywności funkcji uŜyteczności, syntetyzując udziały obu ocen składowych
z uwzględnieniem stopnia – wagi tych udziałów oraz skali ich odniesienia do zakresu
uzyskanych wartości. W celu uzyskania jednolitej skali odniesienia PS i Zd. naleŜy dokonać
normalizacji tych ocen np. znormalizować Zd względem ocen PS. Wymaga to pomnoŜenia
wartości uzyskanej oceny Zd przez n rozwaŜanych serwisów.
W syntetycznej ocenie uŜyteczności serwisów internetowych dane uzyskane
z dzienników logów to dane rzeczywiste zaś dane preferencji, jako dane niepewne, niepełne
oraz wraŜliwe na dobór reprezentatywnej grupy uŜytkowników (ekspertów). Dlatego
w końcowej syntetycznej ocenie uŜyteczności w celu uwzględnienia wag obu ocen
wprowadzono specjalny współczynnik β . Wartość tego współczynnika moŜna określić
zasięgając opinii eksperta. W określeniu oceny wagi β moŜna zasięgnąć opinii eksperta.
Ekspert moŜe rozwaŜać, Ŝe prawdopodobieństwo wystąpienia błędu otrzymanych ocen
cząstkowych Zd względem PS zawsze jest znana. W przypadku, gdy oszacowanie takiego
prawdopodobieństwa nie jest moŜliwe lub nie jest obiektywne (prawdopodobieństwo
subiektywne lub mieszane) o doborze β decydują eksperci posługujący się własną wiedzą18
19 20
. Szerzej wybór wartości β opisano w pracy doktorskiej21.
Reasumując w celu wyznaczenia syntetycznej oceny uŜyteczności serwisów
internetowych w oparciu o dane z dzienników logów i badanie preferencji z zastosowaniem
normalizacji ocen Zd i PS względem siebie i wagi β otrzymuje się uŜyteczność Ui
badanego serwisu internetowego Si w tym równieŜ ocenę syntetyczną badanego serwisu
internetowego So zgodnie ze wzorem (16).
U
i
= β ⋅ Z d i ⋅ n + (1 − β ) ⋅ P S i
(16)
gdzie:
i ∈ {0,1,..., n}
Ui - uŜyteczność dowolnego serwisu internetowego Si,
PSi - uŜyteczność serwisu Si wyznaczona metodą badania preferencji uŜytkowników,
Z d i - uŜyteczność serwisu Si wyznaczona metodą AHP serwisów Si ,
n - liczba ocenianych serwisów,
β - waga oceny ( 0 ≤ β ≤ 1) .
Schematycznie wyznaczanie oceny U0 dla serwisu S0 zilustrowano na rys. 6:
18
Huang W.C., Chien-Hua C., Keelung T.: Using the ELECTRE II method to apply and analyze the differentiation theory.
Proceedings of the Eastern Asia Society for Transportation Studies, 2005
19
Hurwicz, L.: On the Concept and Possibility of Informational Decentralization. American Economic Review, 1969, 59(2)
20
Stąpor K.: Automatyczna klasyfikacja obiektów. Warszawa, Akademicka Oficyna Wydawnicza EXIT, 2005
21
Praca doktorska „Metoda ocen uŜyteczności serwisów internetowych”, rozdział 5.4 str. 89
19
Rysunek 6 Algorytm przedstawiający ocenę uŜyteczności serwisów internetowych U0
Źródło: opracowanie własne
12.5 Empiryczna weryfikacja metody
W celu potwierdzenia słuszności zaproponowanej syntetycznej metody oceny
uŜyteczności rozwaŜono serwisy w księgarniach internetowych działających na terenie Polski
w okresie dwóch lat (2009-2010). Do badań wybrano pięć popularnych w Polsce księgarni
internetowych. Oceny dokonano w rozwaŜanym okresie co pół roku. Oceniono uŜyteczność
wybranych serwisów na podstawie dzienników logów oraz w opinii ekspertów. Badane
serwisy naleŜą do grupy serwisów podobnych funkcjonalnie (głównie funkcję przez
nierealizowane są takie same). Uzyskano tym samym oceny uŜyteczności tych
przykładowych serwisów. Ostatecznie porównano uzyskane oceny z ocenami serwisów
ogłoszonymi przez Wprost i portal Money.pl dla tego samego okresu dwóch lat 22.
Na etapie oceny cząstkowej Zd w celu dopasowania danych z dzienników logów do
tablicy informacyjnej został wyznaczony następujący zbiór kryteriów (atrybutów) oceny:
liczba uŜytkowników (k1), średnia liczba sesji na uŜytkownika (k2), czas (k3), liczba odsłon
(k4), współoglądalność (k5), zasięg (k6). W kolejnym kroku przeprowadzono badanie
istotność wybranych kryteriów. Zastosowano tu metody zbiorów przybliŜonych i uzyskano
wyniki zgodne z tab. 5.
Tabela 5 Istotność atrybutów za pomocą zbiorów przybliŜonych
Atrybut (kryterium oceny)
k1
k2
k3
k4
k5
k6
Względna istotność atrybutu
0.3043
0.0000
0.1304
0.2609
0.0000
0.1739
Atrybuty k2, k6 pośród sześciu badanych zostały następnie odrzucone poniewaŜ ich istotność
wynosi 0. Ostatecznie na podstawie metody AHP i kryteriów k1, k3, k4, k6 wyznaczono ocenę
cząstkową Zd zgodną z tab. 6 i 7.
Tabela 6 Zestawienie końcowe wyników w oparciu o dane z dzienników logów (2009) metodą AHP
2009 I-VI
Kryteria
Warianty
merlin.pl
empik.pl
wysyłkowa.pl
gandalf.com.pl
kolpoler.pl
Zd
0,142
0,098
0,315
0,353
0,093
2009 VI-XII
Kryteria
Warianty
merlin.pl
empik.pl
wysyłkowa.pl
gandalf.com.pl
kolpoler.pl
Zd
0,206
0,055
0,396
0,263
0,08
22
http://menager.money.pl/strategie/marketing_i_sprzedaz/artykul/internetowy; biznes; skazany;na;sukces,62,0,190270.html
dostęp 1.12.09, 1.12.10
20
Tabela 7 Zestawienie końcowe wyników w oparciu o dane z dzienników logów (2010) metodą AHP
2010 I-VI
Kryteria
2010 VI-XII
Kryteria
Zd
Warianty
merlin.pl
empik.pl
wysyłkowa.pl
gandalf.com.pl
kolpoler.pl
Warianty
0,393
0,156
0,075
0,319
0,057
Zd
0,231
0,102
0,37
0,255
0,042
merlin.pl
empik.pl
wysyłkowa.pl
gandalf.com.pl
kolpoler.pl
Po otrzymaniu oceny cząstkowej Zd syntetycznej oceny badanych serwisów
internetowych kolejnym etapem było wyznaczenie otrzymanie oceny cząstkowej PS na
podstawie badania opinii uŜytkowników. W tym celu opracowano formularz. Do oceny
w badaniu opinii uŜytkowników wykorzystano pięć kryteriów, które zostały wyznaczone
przez ekspertów na podstawie teorii Nielsena J. 23 24 o uŜyteczności serwisów internetowych.
Tymi kryteriami były: wizualizacja strony głównej; oferta serwisu internetowego; obsługa
procesu usługowego; asortyment i ceny; poprawność technologiczna – sprawdzenie
poprawności kodu.
Badanie preferencji uŜytkowników (ekspertów) odniesiono do tych samych serwisów,
jak w przypadku Zd. Wynik oceny PS dla badanych księgarni internetowych są zgodne
z tab. 8 i 9.
Tabela 8 Ocena uŜyteczności wynikająca z preferencji
uŜytkowników (2009)
e-księgarnie
empik.pl
wysyłkowa.pl
merlin.pl
gandalf.com.pl
kolpoler.pl
empik.pl
wysyłkowa.pl
merlin.pl
gandalf.com.pl
kolpoler.pl
P’’Si
2009 I-VI
0,65333333
0,373333333
0,813333333
0,586666667
0,386666667
2009 VI-XII
0,68
0,466666667
0,84
0,533333333
0,52
Tabela 9 Ocena uŜyteczności wynikająca z preferencji
uŜytkowników (2010)
PS
e-księgarnie
7
4
9
6
4
empik.pl
wysyłkowa.pl
merlin.pl
gandalf.com.pl
kolpoler.pl
7
5
9
6
6
empik.pl
wysyłkowa.pl
merlin.pl
gandalf.com.pl
kolpoler.pl
P’’Si
2010 I-VI
0,56
0,453333333
0,533333333
0,573333333
0,426666667
2010 VI-XII
0,666666667
0,773333333
0,653333333
0,813333333
0,68
PS
6
5
6
6
5
7
8
7
9
7
Końcowy wynik oceny uŜyteczności badanych księgarni internetowych (ocena
syntetyczna) wyznaczona na podstawie wzoru (16). Wyniki końcowe dla wartości β = 0,6
(dane rzeczywiste z dzienników logów w opinii eksperta są bardziej wiarygodne)
zaprezentowano w tab. 10 i 11.
Tabela 10 Ranking finalny księgarni internetowych
metodą syntetycznej oceny uŜyteczności 2009
Tabela 11 Ranking finalny księgarni internetowych
metodą syntetycznej oceny uŜyteczności 2010
2009
2010
Ranking
księgarnie internetowe
Wynik końcowy
Ranking
księgarnie internetowe
Wynik końcowy
I
II
III
IV
V
merlin.pl
gandalf.com.pl
empik.pl
wysyłkowa.pl
kolpoler.pl
4,122
3,324
3,0295
2,8665
2,2595
I
II
III
IV
V
gandalf.com.pl
merlin.pl
wysyłkowa.pl
empik.pl
kolpoler.pl
3,861
3,536
3,2675
2,987
2,5485
Aby ocenić uzyskaną metodą syntetyczną ocenę uŜyteczności przykładowych
serwisów internetowych wybranych księgarni internetowych dodatkowo porównano
23
24
Nielsen J.: Projektowanie funkcjonalnych serwisów internetowych. Gliwice, Helion, 2003
Nielsen, J., Molich: Heuristic evaluation of user interfaces. Seattle, Proc. ACM CHI'90 Conf. (WA, 1-5 April), 1990
21
uzyskane wyniki z rankingiem tych serwisów wg czasopisma Wprost z 2009/2010 roku
i opinii dziennikarzy portalu Money.pl. W tab. 12 i 13 zaprezentowano ocenę uzyskaną
z syntetycznej metody oceny uŜyteczności serwisów internetowych i według portalu
Money.pl i tygodnika Wprost.
Tabela 12 Ranking porównywalny księgarni internetowych metodą syntetycznej oceny uŜyteczności oraz
według portalu Money.pl i tygodnika Wprost w 2009
2009
Ranking wg syntetycznej
metody oceny
uŜyteczności
I
II
III
IV
V
księgarnie internetowe
Ranking wg portalu Money.pl i
tygodnika Wprost
merlin.pl
gandalf.com.pl
empik.pl
wysyłkowa.pl
kolpoler.pl
I
II
III
Brak serwisu w klasyfikacji
Brak serwisu w klasyfikacji
Tabela 13 Ranking porównywalny księgarni internetowych metodą syntetycznej oceny uŜyteczności oraz
według portalu Money.pl i tygodnika Wprost w 2010
2010
Ranking wg syntetycznej
metody oceny uŜyteczności
I
II
III
IV
V
księgarnie internetowe
gandalf.com.pl
merlin.pl
wysyłkowa.pl
empik.pl
kolpoler.pl
Ranking wg portalu Money.pl i
tygodnika Wprost
I
II
IV
Brak serwisu w klasyfikacji
III
Uzyskane wyniki w tab. 12 oraz 13 dowodzą porównywalnej słuszności syntetycznej metody
oceny uŜyteczności serwisów internetowych. Dodatkowo, przedstawione w tabelach wyniki
dowodzą, Ŝe w syntetycznej metodzie oceny uŜyteczności liczba uŜytych kryteriów oceny w
stosunku do rankingu portalu Money.pl i tygodnika Wprost jest mniejsza a metoda badawcza
mniej skomplikowana. Koszty badania uŜyteczności serwisów internetowych portalu
Money.pl i tygodnika Wprost są nieznane, ale duŜo wyŜsze niŜ te związane z zastosowaniem
syntetycznej metody opracowanej w pracy. Metody stosowane w obydwu przypadkach
uwzględniają preferencję uŜytkowników. Wartością dodaną w zaprezentowanej syntetycznej
metodzie oceny uŜyteczności jest uwzględnienie danych z dzienników logów. Metoda ta
usprawni pracę analityków przy dopasowaniem serwisów internetowych do bieŜących
potrzeb uŜytkownika w okresie eksploatacji tych serwisów.
12.6 Analiza porównawcza metody syntetycznej oceny uŜyteczności serwisów
internetowych z innymi metodami
W celu porównania dostępnych w literaturze metod oceny uŜyteczności serwisów
internetowych z syntetyczną metodą opracowaną w pracy doktorskiej zastosowano
następujące kryteria Albert B. 25:
– standardowa wielkość próby – ile osób podlega badaniu;
– otoczenie badawcze – naturalne (np.: dom, biuro) lub w laboratorium;
– miary badawcze – miary, które umoŜliwiają ocenę uŜyteczności takie jak liczbę kliknięć,
czas realizacji zadania, poprawność wykonywania zadania;
– badanie zachowań – czy moŜna śledzić zachowania uŜytkownika w trakcie badania,
– badania opinii – czy moŜna badać opinie i postawy w trakcie badań;
25
Albert B. Tedesco D, Beyond: The Usability Lab. Conducting Large-scale, On-Line User Experience Study. MA USA,
Morgan Kaufmann, 2010
22
– pytania potestowe – czy po zakończeniu badań moŜna zadać uŜytkownikowi jeszcze
dodatkowe pytania;
– przedmiot badania – co moŜe podlegać badaniu;
– wpływ moderatora – na ile jest silny wpływ moderatora na działania badanych
i zalecenia zaprezentowane w literaturze26. Wyniki tych porównań zestawiono w tab. 14.
Tabela 14 Porównanie metod badań uŜyteczności serwisów internetowych
Miary
badawcze
Wielkość
próby
Otoczenie
badawcze
Wpływ
moderatora
Pytania
potestowe
Badanie
zachowań
Badanie
opinii
Analiza
ruchu
Ankietowanie
uŜytkowników
Postacie i
scenariusze
dyskusyjne
Analiza
opinii
Testy
funkcjonaln
ości
Ocena
preferencji
Metoda
wielokryteria
lna
ilościowe
Ilościowe
jakościowe
jakościowe
jakościowe
jakościowe
jakościowe
jakościowe
ilościowe
duŜa/mała
mała
mała
mała
mała
duŜa/mała
mała
duŜa/mała
sztuczne
naturalne
sztuczne
sztuczne
naturalne
sztuczne
naturalne
naturalne
sztuczne
naturalne
naturalne
sztuczne
nie
tak/nie
tak
tak/nie
nie
nie
tak/nie
nie
nie
tak
tak
tak
tak
nie
tak
tak
tak
tak/nie
tak/nie
tak
nie
tak
tak
tak/nie
Grupy
tak
tak
nie
tak
tak
tak
tak
tak
Przedmiot
badań
wybrany
wszystkie
wybrany
wszystkie
wybrany
wybrany
wszystkie
wybrany
Czas badań
długi
krótki
długi
krótki
długi
krótki
cały czas
cały czas
długi
krótki
etap
duŜy
duŜy
mały
długi
krótki
etap
planowania
duŜy
mały
długi
krótki
Zastosowanie
długi
krótki
etap
planowania
duŜy
mały
Koszt
etap
planowania
duŜy
mały
cały czas
duŜy
mały
planowania
duŜy
mały
cały czas
mały
NaleŜy zaznaczyć, Ŝe poprzez analizę na podstawie kryteriów Albert B. zaproponowana
syntetyczna metoda oceny uŜyteczności serwisów internetowych spełnia kryteria w sposób
efektywny, szybszy oraz tańszy od oceny serwisów z innymi metodami.
13. Spis publikacji własnych
1 Fabisiak L.: Eksploracja danych w serwisach internetowych. Metody Informatyki
Stosowanej, 2009, nr 3 (20), s. 33-43, ISSN 1898-5297.
2 Fabisiak L.: Wolski W., Metody analizy wielokryterialnej w ocenie uŜyteczności
serwisów internetowych. Studia i materiały Polskiego Stowarzyszenia Zarządzania
Wiedzą, 2010, nr 27, s. 116-126, ISSN 1732-324X.
3 Fabisiak L.: Zastosowanie logiki rozmytej w ocenie uŜyteczności serwisów
internetowych. Studia i materiały Polskiego Stowarzyszenia Zarządzania Wiedzą, 2010,
nr 28, s.48-58, ISSN 1732-324X.
4 Fabisiak L.,: A comparison of multiple-criteria decision-making methods in evaluation
of website utility. Zeszyty Naukowe Uniwersytetu Szczecińskiego, Applied Informatics,
Methods and Algorithms, 2010, s.89-107, ISBN 978-83-751821-8-7.
5 Fabisiak L., Wolski W.: Ocena audiencji serwisów internetowych. Studia i materiały
Polskiego Stowarzyszenia Zarządzania Wiedzą, 2010, nr 32, s. 165-176, ISSN 1731324X.
6 Fabisiak L., Szarafińska M.: Analiza porównawcza metod wielokryterialnych w ocenie
audiencji serwisów internetowych. Metody Ilościowe w Badaniach Ekonomicznych,
2010, nr 2(6), s.232-241, ISBN 978-83-7583-240-2.
7 Fabisiak L., Ziemba P.: Wybrane metody analizy wielokryterialnej w ocenie
uŜyteczności serwisów internetowych. Zeszyty Naukowe Uniwersytetu Szczecińskiego,
Studia Informatica, 2011, nr 28, s.21-33, ISSN 1640-6818, ISSN 0867-1753.
26
Kocjan J. Wycena/analiza porównawcza http://www.gospodarka.pl/48850, Wycena analiza porownawcza,1,20,2.html
dostęp 30.04.10
23
8 Fabisiak L., Ziemba P.: Metody Wielokryterialnego wspomagania decyzji w ocenie
uŜyteczności serwisów internetowych .Wydawnictwo Uniwersytetu Ekonomicznego we
Wrocławiu, 2011, nr 20, s.303-312, ISSN 1899-3192.
14. Zakończenie
Celem niniejszej pracy było opracowanie metody oceny uŜyteczności dowolnego
serwisu internetowego, z uwzględnieniem zmiennych preferencji jego uŜytkowników. Aby
wskazać, Ŝe cel pracy został osiągnięty została przedstawiona syntetyczna metoda. Metodę
zweryfikowano na podstawie grupy serwisów internetowych i dokonano porównania metody
z innymi metodami oceny uŜyteczności dostępnymi w literaturze. Syntetyczna metoda oceny
uŜyteczności serwisów internetowych uwzględnia dwa aspekty oceny tych serwisów
a mianowicie preferencje uŜytkowników oraz historyczne dane rzeczywiste uzyskane
z dzienników logów. KaŜda z nich reprezentuje odmienne cechy strukturalne i tym samym w
róŜny sposób odwzorowuje oceny serwisów. Dzięki temu syntetyczna ocena uŜyteczności
jest metodą wieloaspektową.
Metoda ta ma charakter proceduralny, jest działaniem zaplanowanym i moŜliwym do
wielokrotnego stosowania. Uwzględniony w opracowanej metodzie, szeroki aspekt
zmienności preferencji uŜytkowników, ma dodatkowo adaptacyjny a nie sztywny
(jednokrotnie realizowany) charakter. Adaptacja polega tu na moŜliwości dopasowania zmian
w preferencjach uŜytkowników, gdzie zdefiniowanie przez eksperta kryteria, wyraŜają
odpowiednią funkcję przynaleŜności do serwisu internetowego w danej grupie badawczej.
Metoda ta moŜe być uŜyta w dowolnym rodzaju grup serwisów internetowych jak równieŜ w
dowolnej ilości. Liczba serwisów internetowych zaleŜna będzie od postawionego problemu
oceny uŜyteczności badanych serwisów. Dodatkowo metoda pozwala w czasie rzeczywistym
na:
1. Gromadzenie danych z dzienników logów, czyli stworzenie swoistej bazy wiedzy do
oceny uŜyteczności;
2. Gromadzenie danych do oceny preferencji uŜytkowników w badanych serwisach
internetowych.
W pracy proponuje się równieŜ włączenie metody oceny uŜyteczności serwisów
internetowych do architektury systemu informatycznego SMSI (rys 1) jako stały element.
W ten sposób udowodniono prawidłowość hipotezy w pracy, Ŝe opracowana metoda oceny
uŜyteczności serwisów internetowych moŜe być nowym istotnym elementem architektury
systemu informatycznego, wspomagającym proces odnawiania, modernizacji i przebudowy
serwisu w trakcie oraz po przeprowadzeniu badań oceny uŜyteczności. Pozwoli ona ocenić
nie tylko dopasowanie serwisów internetowych do preferencji uŜytkowników, serwisów
internetowych do otoczenia trendów panujących w Internecie, ale takŜe umoŜliwi
wprowadzenie skutków zmian (usprawnień) w danym momencie i stopnia realizacji strategii
biznesowych serwisów. Prawdziwość tej hipotezy wynika z przedstawionej w pracy
koncepcji systemu SMSI (rys 1).
Perspektywy dalszych badań na tym polu to połączenie metody oceny z bazą wiedzy
w jedno narzędzie do modyfikowania wewnętrznych struktur serwisów internetowych.
24

Podobne dokumenty