Wykorzystanie statystyki w tworzeniu biblioteki cyfrowej
Transkrypt
Wykorzystanie statystyki w tworzeniu biblioteki cyfrowej
Biblioteka Cyfrowa Politechniki Łódzkiej Wykorzystanie statystyki w tworzeniu biblioteki cyfrowej – doświadczenia Biblioteki Politechniki Łódzkiej eBiPol Analiza statystyk Małgorzata RoŜniakowska ElŜbieta Skubała Biblioteka Politechniki Łódzkiej Poznań 12-14 grudnia 2006 Biblioteka Cyfrowa Politechniki Łódzkiej Plan prezentacji 1. Krótka historia eBiPol’u 2. Cele i formy prezentowania bibliotek cyfrowych 3. Narzędzia statystyczne wykorzystywane w eBiPol’u 4. Analiza zasobu pod względem kolekcji, języka i formatu 5. Analiza wykorzystania pod względem kolekcji, języka i formatu 6. Analiza odwiedzin 7. Analiza sposobu wyszukiwania 8. Wnioski Małgorzata RoŜniakowska ElŜbieta Skubała Biblioteka Politechniki Łódzkiej Poznań 12-14 grudnia 2006 Biblioteka Cyfrowa Politechniki Łódzkiej 1. Krótka historia eBiPol’u 2004 rok – powołanie zespołu digitalizacji – wyposaŜenie pracowni 2004/2005 – przygotowanie merytoryczne zespołu 2005 rok – cyfryzacja zasobów Listopad 2005 r. – uruchomienie eBiPol’u Biblioteka Cyfrowa Politechniki Łódzkiej Zespół digitalizacji: Skład zespołu: 6 osób: – 2 bibliotekarzy – 4 pracowników z przygotowaniem technicznym + informatyk Biblioteka Cyfrowa Politechniki Łódzkiej WyposaŜenie pracowni: aparaty cyfrowe: - Minolta DIMAGE 7i (matryca 5.0 Mpx) - Kodak Professional DCS ProSLR/n (matryca 13.5 Mpx) - skaner do mikrofisz CANON MS350 z wyposaŜeniem - 3 skanery płaskie Plustek OpticBook 3600 (format A4) - 6 stanowisk komputerowych z monitorami 21” Biblioteka Cyfrowa Politechniki Łódzkiej Kolekcje zaplanowane w eBiPol: Czasopisma KsiąŜki (podkolekcje: KsiąŜki pełnotekstowe, KsiąŜki – spisy treści) Materiały dydaktyczne Rozprawy doktorskie PŁ Serie wydawnicze PŁ (podkolekcje: Monografie PŁ, Rozprawy Naukowe PŁ, Zeszyty Naukowe PŁ, Zeszyty Specjalne PŁ) Varia Zbiory mikrofiszowe Biblioteka Cyfrowa Politechniki Łódzkiej Umowy z Autorami (stan na grudzień 2006 r.): Liczba Autorów - 43 Liczba podpisanych umów - 47 Liczba publikacji - 30 Biblioteka Cyfrowa Politechniki Łódzkiej 2. Cele i formy prezentowania bibliotek cyfrowych Cele prezentowania biblioteki cyfrowej: 1. Wymiana doświadczeń 2. Promocja eBiPolu 3. Pozyskiwanie nowych publikacji 4. Pozyskiwanie środków finansowych Biblioteka Cyfrowa Politechniki Łódzkiej Formy prezentowania biblioteki cyfrowej: 1. Prezentacje środowisku bibliotekarskim (konferencje, warsztaty) 2. Spotkania z uŜytkownikami i władzami zwierzchnimi 3. Rozsyłanie informacji o nowościach do potencjalnych czytelników 4. GadŜety 5. Akcje ankietowe Biblioteka Cyfrowa Politechniki Łódzkiej Dane wykorzystywane w spotkaniach bezpośrednich: 1. Historyczne 2. Statystyczne (w tym struktura zasobu) 3. Techniczne 4. Informacje adresowe Biblioteka Cyfrowa Politechniki Łódzkiej 3. Narzędzia statystyczne wykorzystywane w eBiPol’u Statystyki wewnętrzne dLibry: - zbierane były od 10 listopada 2005 roku - prezentacja graficzna dostępna jest pod standardowo ustawioną zakładką „Statystyki” – obszar Dodatki -od lipca 2006 r. (czyli momentu przejścia na nową wersję systemu dLibra 2.5) na stronie www eBiPol prezentowane są takŜe wykresy miesięczne lub zbiorcze dotyczące: • średniej liczby wygenerowanych stron www w ciągu godziny, • średniej liczby wyszukiwań w ciągu godziny, • średniej liczby odwiedzających w ciągu godziny, • średniej liczby wyświetlonych publikacji w ciągu godziny. Biblioteka Cyfrowa Politechniki Łódzkiej Statystyki wewnętrzne: -wykonywane są od lutego 2006 r. - AWStats wykonuje analizę plików typu log zgromadzonych w ciągu miesiąca i w ostatnim kroku generuje raport dla strony www - program wychwytuje większość robotów, analizuje ilość zapytań html, ilość unikatowych gości i wizyt, - program swobodnie generuje statystyki oraz daje moŜliwość wyboru czy efekty mają być sporządzane online czy offline Biblioteka Cyfrowa Politechniki Łódzkiej 4. Analiza zasobu Metadane to informacja dotycząca struktury obiektu, mająca na celu umoŜliwienie jego wyszukania, opisu, wykorzystania, administrowania i/lub zarządzania. Rodzaje metadanych 1. 2. 3. opisowe pozwalające uŜytkownikowi odnaleźć obiekt, odróŜnić od siebie róŜne obiekty i zrozumieć przedmiot lub treść obiektu – tj. informacje katalogowe wraz z klasyfikacją rzeczową, przedmiotową administracyjne pomagają zarządzającym zasobami kontrolować obiekty dla takich celów jak zarządzanie plikami, obsługa praw autorskich i archiwizacja strukturalne opisują relacje między obiektami, np. związki pomiędzy artykułami, zeszytami i tomami czasopism lub stronami lub rozdziałami ksiąŜek Biblioteka Cyfrowa Politechniki Łódzkiej Struktura dokumentu cyfrowego – wydawnictwo ciągłe TYTUŁ Obiekt w formacie .html Rocznik Element zasobu w katalogach bibliotecznych Wolumin oraz Zeszyt Obiekt w formacie .pdf Biblioteka Cyfrowa Politechniki Łódzkiej Struktura dokumentu cyfrowego – wydawnictwo ciągłe Chemik Polski.pdf Zakres roczników: 1901-1928 Częstotliwość: miesięcznik??? Liczba obiektów - 230 First Monday.html Zakres roczników: 1996-2005 Częstotliwość: miesięcznik Liczba obiektów - 1 Biblioteka Cyfrowa Politechniki Łódzkiej Liczba obiektów cyfrowych: 513 Biblioteka Cyfrowa Politechniki Łódzkiej 1. 2. 3. 4. application/pdf [509] text/html [2] image/x.djvu [1] application/vnd.ms-powerpoint [1] Biblioteka Cyfrowa Politechniki Łódzkiej Zestawienie według udostępnionych publikacji Biblioteka Cyfrowa Politechniki Łódzkiej Struktura publikacji według języka Biblioteka Cyfrowa Politechniki Łódzkiej 5. Analiza wykorzystania zbiorów Wykorzystanie publikacji według języka Biblioteka Cyfrowa Politechniki Łódzkiej Liczba obejrzanych stron www Biblioteki Cyfrowej eBiPol w funkcji średniego dobowego rozkładu godzinnego (okres luty-listopad 2006) Liczba obejrzanych stron www 150,00 Godzina 4.00 - 18 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0,00 Godzina 13.00 - 135 Godziny Strony www eBiPol Biblioteka Cyfrowa Politechniki Łódzkiej Październik 2006 - AWStats Liczba wygenerowanych stron - HTM L 7000 6000 ilość stron 5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 godziny 14 15 16 17 18 19 20 21 22 23 24 Biblioteka Cyfrowa Politechniki Łódzkiej Październik 2006 - dLibra Biblioteka Cyfrowa Politechniki Łódzkiej Zestawienie według wykorzystanych publikacji Biblioteka Cyfrowa Politechniki Łódzkiej Zestawienie intensywności wykorzystania zasobu według kolekcji 400 Stosunek liczby wyświetleń publikacji z atrybutem nazwy kolekcji do liczby publikacji z tym atrybutem 300 Czasopisma - 49,52 200 Materiały dydakt. - 1,48 100 Skrypty - 407,14 Wykorzystanie 500 Monografie - 13,75 Mat. Inf. Wykorzystanie KsiąŜki Monograf Skrypty Mat.dyd. Czasop 0 KsiąŜki - 47,25 Materiały inf. - 58 Biblioteka Cyfrowa Politechniki Łódzkiej Średnia wykorzystania publikacji w eBiPol’u 26.898 513 Liczba wyświetleń Liczba obiektów cyfrowych 52,43 Statystyczne wykorzystanie kaŜdego obiektu w ciągu roku Średnia wykorzystania publikacji w BPŁ 540.760 Liczba wypoŜyczeń na zewnątrz i na miejscu w czytelniach w 2005 r. 410.699 Liczba zbiorów drukowanych: ksiąŜek i czasopism w 2005 r. 1,32 Statystyczne wykorzystanie kaŜdej ksiąŜki i czasopisma w ciągu roku 2005 Biblioteka Cyfrowa Politechniki Łódzkiej 6. Analiza odwiedzin Odwiedziny na stronach eBiPol’u do 5.12.2006 r. Łączna liczba czytelników od dnia 2005-12-20: 288 158 (liczba sesji+ruch nieoglądany w postaci robotów) Sesja (ruch rzeczywisty) – wejście na stronę www eBiPol i zamknięcie okna przeglądarki ok. 50% Ruch nieoglądany – zawiera ruch generowany przez roboty, robaki internetowe lub odpowiedzi ze specjalnymi kodami statusu HTTP (np. błąd 404 - nie ma takiej strony) ok. 50% Biblioteka Cyfrowa Politechniki Łódzkiej Liczba unikatowych gości i liczba wizyt w Bibliotece Cyfrowej eBiPol w rozkładzie miesięcznym Liczba unikatowych gości/Liczba wizyt 10000 Listopad - 9344 9000 8000 7000 Listopad - 6492 6000 5000 4000 3000 Czerwiec - 2760 Wizyty Listopad Październik Unikatowi goście Wrzesień Sierpień Lipiec Czerwiec Maj Kwiecień Czerwiec - 1108 Marzec Luty 2000 1000 0 Biblioteka Cyfrowa Politechniki Łódzkiej Liczba obejrzanych stron www Biblioteki Cyfrowej eBiPol w zaleŜności od narodowości jej uŜytkowników (okres luty-listopad 2006) Liczba obejrzanych stron w w w 2500 USA - 2637 Finlandia -2208 2000 1500 Niemcy -1977 1000 Rumunia - 11 Belgia - 20 Niemcy Strony www eBiPol 0 Hiszpania - 23 rpa uk Szwecja Szwajcaria Czechy Hiszpania Wlochy Rumunia Austria Kanada Rosja Holandia Belgia USA Francja Finlandia 500 Biblioteka Cyfrowa Politechniki Łódzkiej 7. Analiza sposobu wyszukiwania Sposoby poszukiwań z zasobach biblioteki cyfrowej: 1. Z wyszukiwarek zewnętrznych - wpisywanie fraz - wpisywanie słów kluczowych 2. Z poziomu eBiPol’u - frazy i słowa kluczowe Biblioteka Cyfrowa Politechniki Łódzkiej F r a z y w p is yw a n e w w ys z u k iw a r k i z e w n ę t r z n e p r o c e s y te c h n o lo g ii Ŝ y w noś c i r e c u e il d e s tr a v a u x c h im iq u e s d e s p a y s bas * a n a liz a u k ła d ó w e le k tr o n ic z n y c h h a s ło p r z e d m io to w e p r o c e s y te c h n o lo g ii z y w n o s c i b o r u c h kr ó l o p is b ib lio g r a f ic z n y z e s z y ty n a u k o w e e b ip o l ju s tu s lie b ig p r z e k sz ta ł tn i k i * k a c e r k a łó d ź z e s z y ty n a u k o w e p o lite c h n ik i łó d z k ie j* la b o r a to r iu m z c h e m ii f iz y c z n e j o p is b ib lio g r a f ic z n y c z a s o p is m a z w ię z ły k u r s c h e m ii o r g a n ic z n e j In n e w o jc ie c h b la s in s k i te o r ia u k ła d ó w lo g ic z n y c h w w w .e b ip o l.p .lo d z .p l e b ip o l.p .lo d z .p l b ib lio te k a p o lite c h n ik i łó d z k ie j m a te r ia ły d y d a k ty c z n e ro z p ra w y d o k to r sk i e b ib lio te k a p ł b a z a d a n y c h ć w ic z n ia n a u k a o w łó k n ie b i b l i o te k a c y fr o w a p r o je k to w a n ie u k ła d ó w lo g ic z n y c h te c h n ic a l u n iv e r s ity o f lo d z Biblioteka Cyfrowa Politechniki Łódzkiej Najczęściej wpisywane słowa kluczowe w wyszukiwarki zewnętrzne fizycznej organicznej opis laboratorium laboratoryjne ćw iczenia bibliograficzny naukow e zeszyty doktorskie politechniki des z łódzkiej* układów przekształtniki logicznych ebipol Inne teoria chemii politechnika projektow anie pł dydaktyczne cyfrowa biblioteka rozpraw y materiały ebipol.p.lodz.pl Biblioteka Cyfrowa Politechniki Łódzkiej Najczęściej wyszukiwane frazy i słowa kluczowe w Bibliotece Cyfrowej eBiPol kamień 4% ekonomia 4% logistyka 4% First 4% architektura 4% fizyka 5% biochip 4% elektronika 5% Metoda elementów skończonych 4% ceramiczne tarcze hamulcow e 3% chemia 5% Inne 28% jakość 5% zarządzanie 5% internet 4% galw anotechnika 3% grzejnictw o indukcyjne 3% marketing 6% oczyszczanie ścieków 6% matematyka 3% a 6% mechanika 9% metody numeryczne 3% Biblioteka Cyfrowa Politechniki Łódzkiej Ranking wykorzystania kolekcji 1: Kolekcja ksiąŜek • Laboratorium z inŜynierii wysokonapięciowej – 3698 (od początku) • Teoria układów logicznych – 279 (od początku) • Przekształtniki : zagadnienia teorii obwodu – 266 (od początku) • Administracja bazą danych – 230 (od początku) Biblioteka Cyfrowa Politechniki Łódzkiej Ranking wykorzystania kolekcji 2: Kolekcja czasopism • First Monday” – 6978 (publikacja lipiec 2006 r.) • World Libraries – 831 (publikacja październik 2006 r.) • ”Chemik Polski” – 1549 wejście do rocznika (publikacja grudzień 2005 r.) •„Annalen der Pharmacie” – 246 wejście do Bandu (publikacja styczeń 2006 r.) Biblioteka Cyfrowa Politechniki Łódzkiej Ranking wykorzystania kolekcji 3: Kolekcja Varia „Biblioteka Cyfrowa PŁ Ł eBiPoL: prezentacja rocznicowa” – 98 (publikacja listopad 2006 r.) „Projekt załoŜenia Instytutu Politechnicznego w Łodzi w latach 1864-1867” – 70 (publikacja wrzesień ń 2006 r. ) „Informator Biblioteki Politechniki Łódzkiej” – 37 (publikacja wrzesień ń 2006 r.) „Sprawozdanie z działalności BGPŁ w roku 2005” – 24 (publikacja lipiec 2006 r.) Biblioteka Cyfrowa Politechniki Łódzkiej 8. Wnioski: 1. 2. 3. 4. Dane statystyczne odwiedzin na stronach na platformie dLibry są zawyŜone o ruch robotów tj. o około 50% Dane statystyczne zawartości zasobu zniekształca róŜnorodność formatów, niekonsekwencje w ustalaniu struktury obiektu i jego metadanych – konieczność opracowania standardów Wykorzystanie źródeł cyfrowych jest ponad 50 razy większe od wykorzystania źródeł drukowanych – argument na intensyfikację prac nad tworzeniem bibliotek cyfrowych Intensywność wykorzystania kolekcji „Skrypty” w stosunku do pozostałych jest wielokrotnie wyŜsza – argument na intensywniejsze działania zmierzające do włączania do zasobu biblioteki cyfrowej źródeł przeznaczonych dla studentów