Wykorzystanie statystyki w tworzeniu biblioteki cyfrowej

Transkrypt

Wykorzystanie statystyki w tworzeniu biblioteki cyfrowej
Biblioteka Cyfrowa
Politechniki Łódzkiej
Wykorzystanie statystyki w tworzeniu
biblioteki cyfrowej – doświadczenia Biblioteki
Politechniki Łódzkiej eBiPol
Analiza statystyk
Małgorzata RoŜniakowska
ElŜbieta Skubała
Biblioteka Politechniki Łódzkiej
Poznań 12-14 grudnia 2006
Biblioteka Cyfrowa
Politechniki Łódzkiej
Plan prezentacji
1.
Krótka historia eBiPol’u
2.
Cele i formy prezentowania bibliotek cyfrowych
3.
Narzędzia statystyczne wykorzystywane w eBiPol’u
4.
Analiza zasobu pod względem kolekcji, języka i formatu
5.
Analiza wykorzystania pod względem kolekcji, języka i formatu
6.
Analiza odwiedzin
7.
Analiza sposobu wyszukiwania
8.
Wnioski
Małgorzata RoŜniakowska
ElŜbieta Skubała
Biblioteka Politechniki Łódzkiej
Poznań 12-14 grudnia 2006
Biblioteka Cyfrowa
Politechniki Łódzkiej
1. Krótka historia eBiPol’u
2004 rok
– powołanie zespołu digitalizacji
– wyposaŜenie pracowni
2004/2005
– przygotowanie merytoryczne zespołu
2005 rok
– cyfryzacja zasobów
Listopad 2005 r.
– uruchomienie eBiPol’u
Biblioteka Cyfrowa
Politechniki Łódzkiej
Zespół digitalizacji:
Skład zespołu:
6 osób:
– 2 bibliotekarzy
– 4 pracowników z przygotowaniem technicznym
+ informatyk
Biblioteka Cyfrowa
Politechniki Łódzkiej
WyposaŜenie pracowni:
aparaty cyfrowe:
- Minolta DIMAGE 7i (matryca 5.0 Mpx)
- Kodak Professional DCS ProSLR/n (matryca 13.5 Mpx)
- skaner do mikrofisz CANON MS350 z wyposaŜeniem
- 3 skanery płaskie Plustek OpticBook 3600 (format A4)
- 6 stanowisk komputerowych z monitorami 21”
Biblioteka Cyfrowa
Politechniki Łódzkiej
Kolekcje zaplanowane w eBiPol:
Czasopisma
KsiąŜki (podkolekcje: KsiąŜki pełnotekstowe, KsiąŜki – spisy treści)
Materiały dydaktyczne
Rozprawy doktorskie PŁ
Serie wydawnicze PŁ (podkolekcje: Monografie PŁ, Rozprawy
Naukowe PŁ, Zeszyty Naukowe PŁ, Zeszyty Specjalne PŁ)
Varia
Zbiory mikrofiszowe
Biblioteka Cyfrowa
Politechniki Łódzkiej
Umowy z Autorami (stan na grudzień 2006 r.):
Liczba Autorów - 43
Liczba podpisanych umów - 47
Liczba publikacji - 30
Biblioteka Cyfrowa
Politechniki Łódzkiej
2. Cele i formy prezentowania bibliotek cyfrowych
Cele prezentowania biblioteki cyfrowej:
1. Wymiana doświadczeń
2. Promocja eBiPolu
3. Pozyskiwanie nowych publikacji
4. Pozyskiwanie środków finansowych
Biblioteka Cyfrowa
Politechniki Łódzkiej
Formy prezentowania biblioteki cyfrowej:
1. Prezentacje środowisku bibliotekarskim (konferencje, warsztaty)
2. Spotkania z uŜytkownikami i władzami zwierzchnimi
3. Rozsyłanie informacji o nowościach do potencjalnych
czytelników
4. GadŜety
5. Akcje ankietowe
Biblioteka Cyfrowa
Politechniki Łódzkiej
Dane wykorzystywane w spotkaniach
bezpośrednich:
1. Historyczne
2. Statystyczne (w tym struktura zasobu)
3. Techniczne
4. Informacje adresowe
Biblioteka Cyfrowa
Politechniki Łódzkiej
3. Narzędzia statystyczne wykorzystywane w eBiPol’u
Statystyki wewnętrzne dLibry:
- zbierane były od 10 listopada 2005 roku
- prezentacja graficzna dostępna jest pod standardowo ustawioną
zakładką „Statystyki” – obszar Dodatki
-od lipca 2006 r. (czyli momentu przejścia na nową wersję systemu dLibra 2.5) na
stronie www eBiPol prezentowane są takŜe wykresy miesięczne lub zbiorcze
dotyczące:
• średniej liczby wygenerowanych stron www w ciągu godziny,
• średniej liczby wyszukiwań w ciągu godziny,
• średniej liczby odwiedzających w ciągu godziny,
• średniej liczby wyświetlonych publikacji w ciągu godziny.
Biblioteka Cyfrowa
Politechniki Łódzkiej
Statystyki wewnętrzne:
-wykonywane są od lutego 2006 r.
- AWStats wykonuje analizę plików typu log zgromadzonych w
ciągu miesiąca i w ostatnim kroku generuje raport dla strony www
- program wychwytuje większość robotów, analizuje ilość zapytań
html, ilość unikatowych gości i wizyt,
- program swobodnie generuje statystyki oraz daje moŜliwość
wyboru czy efekty mają być sporządzane online czy offline
Biblioteka Cyfrowa
Politechniki Łódzkiej
4. Analiza zasobu
Metadane to informacja dotycząca struktury obiektu, mająca na celu
umoŜliwienie jego wyszukania, opisu, wykorzystania, administrowania i/lub
zarządzania.
Rodzaje metadanych
1.
2.
3.
opisowe pozwalające uŜytkownikowi odnaleźć obiekt, odróŜnić od siebie róŜne obiekty
i zrozumieć przedmiot lub treść obiektu – tj. informacje katalogowe wraz z klasyfikacją
rzeczową, przedmiotową
administracyjne pomagają zarządzającym zasobami kontrolować obiekty dla takich
celów jak zarządzanie plikami, obsługa praw autorskich i archiwizacja
strukturalne opisują relacje między obiektami, np. związki pomiędzy artykułami,
zeszytami i tomami czasopism lub stronami lub rozdziałami ksiąŜek
Biblioteka Cyfrowa
Politechniki Łódzkiej
Struktura dokumentu cyfrowego – wydawnictwo ciągłe
TYTUŁ
Obiekt w formacie .html
Rocznik
Element zasobu
w katalogach
bibliotecznych
Wolumin
oraz
Zeszyt
Obiekt w
formacie .pdf
Biblioteka Cyfrowa
Politechniki Łódzkiej
Struktura dokumentu cyfrowego – wydawnictwo ciągłe
Chemik Polski.pdf
Zakres roczników:
1901-1928
Częstotliwość:
miesięcznik???
Liczba obiektów - 230
First Monday.html
Zakres roczników:
1996-2005
Częstotliwość:
miesięcznik
Liczba obiektów - 1
Biblioteka Cyfrowa
Politechniki Łódzkiej
Liczba
obiektów
cyfrowych:
513
Biblioteka Cyfrowa
Politechniki Łódzkiej
1.
2.
3.
4.
application/pdf [509]
text/html [2]
image/x.djvu [1]
application/vnd.ms-powerpoint [1]
Biblioteka Cyfrowa
Politechniki Łódzkiej
Zestawienie według udostępnionych
publikacji
Biblioteka Cyfrowa
Politechniki Łódzkiej
Struktura publikacji według
języka
Biblioteka Cyfrowa
Politechniki Łódzkiej
5. Analiza wykorzystania zbiorów
Wykorzystanie publikacji według
języka
Biblioteka Cyfrowa
Politechniki Łódzkiej
Liczba obejrzanych stron www Biblioteki Cyfrowej eBiPol w funkcji średniego
dobowego rozkładu godzinnego (okres luty-listopad 2006)
Liczba obejrzanych
stron www
150,00
Godzina 4.00 - 18
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
0,00
Godzina 13.00 - 135
Godziny
Strony www eBiPol
Biblioteka Cyfrowa
Politechniki Łódzkiej
Październik 2006 - AWStats
Liczba wygenerowanych stron - HTM L
7000
6000
ilość stron
5000
4000
3000
2000
1000
0
1
2
3
4
5
6
7
8
9
10
11
12
13
godziny
14
15
16
17
18
19
20
21
22
23
24
Biblioteka Cyfrowa
Politechniki Łódzkiej
Październik 2006 - dLibra
Biblioteka Cyfrowa
Politechniki Łódzkiej
Zestawienie według
wykorzystanych publikacji
Biblioteka Cyfrowa
Politechniki Łódzkiej
Zestawienie intensywności wykorzystania zasobu według kolekcji
400
Stosunek liczby
wyświetleń publikacji z
atrybutem nazwy kolekcji
do liczby publikacji z tym
atrybutem
300
Czasopisma - 49,52
200
Materiały dydakt. - 1,48
100
Skrypty - 407,14
Wykorzystanie
500
Monografie - 13,75
Mat. Inf.
Wykorzystanie
KsiąŜki
Monograf
Skrypty
Mat.dyd.
Czasop
0
KsiąŜki - 47,25
Materiały inf. - 58
Biblioteka Cyfrowa
Politechniki Łódzkiej
Średnia wykorzystania publikacji w eBiPol’u
26.898
513
Liczba wyświetleń
Liczba obiektów cyfrowych
52,43
Statystyczne wykorzystanie kaŜdego obiektu w
ciągu roku
Średnia wykorzystania publikacji w BPŁ
540.760
Liczba wypoŜyczeń na
zewnątrz i na miejscu w
czytelniach w 2005 r.
410.699
Liczba zbiorów
drukowanych: ksiąŜek
i czasopism w 2005 r.
1,32
Statystyczne wykorzystanie kaŜdej
ksiąŜki i czasopisma w ciągu roku 2005
Biblioteka Cyfrowa
Politechniki Łódzkiej
6. Analiza odwiedzin
Odwiedziny na stronach eBiPol’u do 5.12.2006 r.
Łączna liczba czytelników od dnia 2005-12-20:
288 158 (liczba sesji+ruch nieoglądany w postaci robotów)
Sesja (ruch rzeczywisty) – wejście na stronę www eBiPol i zamknięcie okna
przeglądarki ok. 50%
Ruch nieoglądany – zawiera ruch generowany przez roboty, robaki
internetowe lub odpowiedzi ze specjalnymi kodami statusu HTTP (np. błąd
404 - nie ma takiej strony)
ok. 50%
Biblioteka Cyfrowa
Politechniki Łódzkiej
Liczba unikatowych gości i liczba wizyt w Bibliotece Cyfrowej eBiPol
w rozkładzie miesięcznym
Liczba unikatowych
gości/Liczba wizyt
10000
Listopad - 9344
9000
8000
7000
Listopad - 6492
6000
5000
4000
3000
Czerwiec - 2760
Wizyty
Listopad
Październik
Unikatowi goście
Wrzesień
Sierpień
Lipiec
Czerwiec
Maj
Kwiecień
Czerwiec - 1108
Marzec
Luty
2000
1000
0
Biblioteka Cyfrowa
Politechniki Łódzkiej
Liczba obejrzanych stron www Biblioteki Cyfrowej eBiPol w zaleŜności
od narodowości jej uŜytkowników (okres luty-listopad 2006)
Liczba obejrzanych
stron w w w
2500
USA - 2637
Finlandia -2208
2000
1500
Niemcy -1977
1000
Rumunia - 11
Belgia - 20
Niemcy
Strony www
eBiPol
0
Hiszpania - 23
rpa
uk
Szwecja
Szwajcaria
Czechy
Hiszpania
Wlochy
Rumunia
Austria
Kanada
Rosja
Holandia
Belgia
USA
Francja
Finlandia
500
Biblioteka Cyfrowa
Politechniki Łódzkiej
7. Analiza sposobu wyszukiwania
Sposoby poszukiwań z zasobach biblioteki
cyfrowej:
1. Z wyszukiwarek zewnętrznych
- wpisywanie fraz
- wpisywanie słów kluczowych
2. Z poziomu eBiPol’u
- frazy i słowa kluczowe
Biblioteka Cyfrowa
Politechniki Łódzkiej
F r a z y w p is yw a n e w w ys z u k iw a r k i z e w n ę t r z n e
p r o c e s y te c h n o lo g ii
Ŝ y w noś c i
r e c u e il d e s tr a v a u x
c h im iq u e s d e s p a y s bas *
a n a liz a u k ła d ó w
e le k tr o n ic z n y c h
h a s ło p r z e d m io to w e
p r o c e s y te c h n o lo g ii
z y w n o s c i b o r u c h kr ó l
o p is b ib lio g r a f ic z n y
z e s z y ty n a u k o w e
e b ip o l
ju s tu s lie b ig
p r z e k sz ta ł tn i k i *
k a c e r k a łó d ź
z e s z y ty n a u k o w e
p o lite c h n ik i łó d z k ie j*
la b o r a to r iu m z c h e m ii
f iz y c z n e j
o p is b ib lio g r a f ic z n y
c z a s o p is m a
z w ię z ły k u r s c h e m ii
o r g a n ic z n e j
In n e
w o jc ie c h b la s in s k i
te o r ia u k ła d ó w
lo g ic z n y c h
w w w .e b ip o l.p .lo d z .p l
e b ip o l.p .lo d z .p l
b ib lio te k a p o lite c h n ik i
łó d z k ie j
m a te r ia ły d y d a k ty c z n e
ro z p ra w y
d o k to r sk i e
b ib lio te k a p ł
b a z a d a n y c h ć w ic z n ia
n a u k a o w łó k n ie
b i b l i o te k a
c y fr o w a
p r o je k to w a n ie u k ła d ó w
lo g ic z n y c h
te c h n ic a l u n iv e r s ity o f
lo d z
Biblioteka Cyfrowa
Politechniki Łódzkiej
Najczęściej wpisywane słowa kluczowe w wyszukiwarki zewnętrzne
fizycznej
organicznej
opis
laboratorium
laboratoryjne
ćw iczenia
bibliograficzny
naukow e
zeszyty
doktorskie
politechniki
des
z
łódzkiej*
układów
przekształtniki
logicznych
ebipol
Inne
teoria
chemii
politechnika
projektow anie
pł
dydaktyczne
cyfrowa
biblioteka
rozpraw y
materiały
ebipol.p.lodz.pl
Biblioteka Cyfrowa
Politechniki Łódzkiej
Najczęściej wyszukiwane frazy i słowa kluczowe w Bibliotece Cyfrowej eBiPol
kamień
4%
ekonomia
4%
logistyka
4%
First
4%
architektura
4%
fizyka
5%
biochip
4%
elektronika
5%
Metoda elementów
skończonych
4%
ceramiczne tarcze
hamulcow e
3%
chemia
5%
Inne
28%
jakość
5%
zarządzanie
5%
internet
4%
galw anotechnika
3%
grzejnictw o indukcyjne
3%
marketing
6%
oczyszczanie ścieków
6%
matematyka
3%
a
6%
mechanika
9%
metody numeryczne
3%
Biblioteka Cyfrowa
Politechniki Łódzkiej
Ranking wykorzystania kolekcji 1:
Kolekcja ksiąŜek
•
Laboratorium z inŜynierii wysokonapięciowej – 3698 (od początku)
•
Teoria układów logicznych – 279 (od początku)
•
Przekształtniki : zagadnienia teorii obwodu – 266 (od początku)
•
Administracja bazą danych – 230 (od początku)
Biblioteka Cyfrowa
Politechniki Łódzkiej
Ranking wykorzystania kolekcji 2:
Kolekcja czasopism
• First Monday” – 6978 (publikacja lipiec 2006 r.)
• World Libraries – 831 (publikacja październik 2006 r.)
• ”Chemik Polski” – 1549 wejście do rocznika (publikacja grudzień 2005 r.)
•„Annalen der Pharmacie” – 246 wejście do Bandu (publikacja styczeń 2006 r.)
Biblioteka Cyfrowa
Politechniki Łódzkiej
Ranking wykorzystania kolekcji 3:
Kolekcja Varia
„Biblioteka Cyfrowa PŁ
Ł eBiPoL: prezentacja rocznicowa” – 98 (publikacja
listopad 2006 r.)
„Projekt załoŜenia Instytutu Politechnicznego w Łodzi w latach 1864-1867” – 70
(publikacja wrzesień
ń 2006 r. )
„Informator Biblioteki Politechniki Łódzkiej” – 37 (publikacja wrzesień
ń 2006 r.)
„Sprawozdanie z działalności BGPŁ w roku 2005” – 24 (publikacja lipiec 2006 r.)
Biblioteka Cyfrowa
Politechniki Łódzkiej
8. Wnioski:
1.
2.
3.
4.
Dane statystyczne odwiedzin na stronach na platformie dLibry są
zawyŜone o ruch robotów tj. o około 50%
Dane statystyczne zawartości zasobu zniekształca róŜnorodność
formatów, niekonsekwencje w ustalaniu struktury obiektu i jego
metadanych – konieczność opracowania standardów
Wykorzystanie źródeł cyfrowych jest ponad 50 razy większe od
wykorzystania źródeł drukowanych – argument na intensyfikację
prac nad tworzeniem bibliotek cyfrowych
Intensywność wykorzystania kolekcji „Skrypty” w stosunku do
pozostałych jest wielokrotnie wyŜsza – argument na intensywniejsze
działania zmierzające do włączania do zasobu biblioteki cyfrowej
źródeł przeznaczonych dla studentów