Prof. dr hab. Wiesław Babik Kraków, 13 kwietnia 2015 r. Instytut
Transkrypt
Prof. dr hab. Wiesław Babik Kraków, 13 kwietnia 2015 r. Instytut
Prof. dr hab. Wiesław Babik Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu Jagiellońskiego w Krakowie E-mail: [email protected] Kraków, 13 kwietnia 2015 r. Recenzja rozprawy doktorskiej mgr Bartłomieja Włodarczyka pt. „Zastosowanie map tematów w językach haseł przedmiotowych na przykładzie Języka Haseł Przedmiotowych Biblioteki Narodowej”, przygotowanej pod kierunkiem prof. dr hab. Jadwigi Woźniak-Kasperek. Warszawa: Uniwersytet Warszawski, Wydział Historyczny 2015, 486 s. – T. I ss. 1-251, T. II ss. 252-486 (20 tabel, 35 rysunków oraz 3 Aneksy) Recenzja została wykonana na zlecenie Rady Wydziału Historycznego Uniwersytetu Warszawskiego (pismo WH 531-26/2015 z dnia 6 marca 2015 r.). 1. Kontekst rozprawy doktorskiej W polskich i zagranicznych bibliotekach naukowych trwają obecnie dyskusje nad przyszłością opracowania rzeczowego i rozwiązaniami ułatwiającymi użytkownikom posługiwanie się językami informacyjno-wyszukiwawczymi (jiw), w tym językami haseł przedmiotowych (jhp). Recenzowana rozprawa doktorska wpisuje się ten nurt dyskusji. Biblioteki stosujące język haseł przedmiotowych, w tym Biblioteka Narodowa, stanęły przed dylematem „[…] czy należy dalej rozwijać ten język, a jeśli tak, to w jakim kierunku” (s. 8). Z wielu wymienionych w rozprawie powodów Autor rozprawy opowiada się jednoznacznie za rozwojem tego języka, proponując na przykładzie JHP BN nowy kierunek jego rozwoju. Temat rozprawy – moim zdaniem - jest bardzo interesujący, aktualny, godny uwagi i refleksji naukowej. Dotyczy on zarówno struktury, jak i pragmatyki tego języka. Języki haseł przedmiotowych nie są częstym przedmiotem refleksji naukowej w dziedzinie bibliologii i informatologii. Jednym z powodów jest zaliczanie tych języków do elity języków informacyjno-wyszukiwawczych, a więc języków o wyjątkowo wyrafinowanej strukturze i pragmatyce. Są one stosowane w różnych krajach i w różnego typu bibliotekach. Ich geneza sięga średniowiecza. W Polsce najbardziej rozpowszechnione są dwa języki haseł przedmiotowych: JHP BN i znacznie młodszy – język KABA. Języki te stanowią jedno z lingwistycznych narzędzi opisu zbiorów bibliotecznych. Mają swoją specyfikę, o której pisało już wielu specjalistów (W Polsce m.in. J. Ćwiekowa, J. Sadowska, J. Woźniak-Kasperek). Języki haseł przedmiotowych były i są obiektem licznych badań w Polsce i za granicą, które Autor rozprawy szczegółowo przedstawił we wstępie (s. 8–19). Badania te dotyczyły różnych elementów i aspektów JHP. Osobną grupę badań, zarówno w Polsce, jak i za granicą, stanowią 1 badania stopnia wykorzystania JHP przez użytkowników prowadzących wyszukiwania przedmiotowe w katalogu bibliotecznym. Są one ważne, gdyż od początku lat 90. XX wieku, a więc od pojawienia się Internetu (potem dynamicznego rozwoju systemu WWW), i co za tym idzie popularnością wyszukiwarek internetowych następuje stały spadek wyszukiwania z wykorzystaniem słownika kontrolowanego (a takie są słowniki jhp) na rzecz wyszukiwania swobodnego przez słowa, co powoduje trudności w tradycyjnym wyszukiwaniu przedmiotowym. Nawyków związanych z wyszukiwaniem w Internecie, w którym dominuje wyszukiwanie pełnotekstowe nie można i nie należy lekceważyć tworząc wizję dalszego rozwoju JHP, w tym JHP BN, chociaż ten ostatni jest pod dużym wpływem metodyki Adama Łysakowskiego. Skomplikowana struktura tego języka sprawia, że jego użytkownicy w procesach wyszukiwania informacji mają problemy z formułowaniem pytań informacyjnych w tym języku. Jedną z przyczyn są niskie kompetencje językowe użytkowników, które generują m.in. niski stopień zrozumienia haseł rozwiniętych, a więc konstrukcji złożonych z tematu i określników oraz odsyłaczy a także trudności w parafrazowaniu grup imiennych; zresztą potwierdzają to amerykańskie badania Karen Markey Drabenstott wraz z zespołem (s. 13). Najnowsze badania pokazują, że użytkownicy preferują wyrażenia języka naturalnego zgodne z jego ususem językowym (s. 11). Zdaniem Tiny Gross i Arlene Taylor jednak zaniechanie stosowania haseł przedmiotowych skutkowałoby wieloma negatywnymi konsekwencjami, gdyż słownictwo kontrolowane (a takie jest w jhp) jest elementem skutecznie wspomagającym wyszukiwanie pełnotekstowe. Indeksowanie za pomocą tego języka wymaga jednak wysoko wykwalifikowanych bibliotekarzy-specjalistów. Poza tym – jak pisze Autor rozprawy - bardzo trudno jest odwzorować w nim inne jiw oraz zaprezentować go w schematach Dublin Core i SKOS. Przez to nie jest dostępny dla wyszukiwarek internetowych. Przesłanki te stanowiły podstawę projektu FAST, którego rezultatem była fasetyzacja słownika LCSH, czyli podział haseł przedmiotowych na elementy przynależne do rozłącznych kategorii. Przedstawiony przez Autora obszerny przegląd badań wskazał na problemy użytkowników związane z korzystaniem z haseł przedmiotowych. Modyfikacja sposobów tworzenia i dostosowania jhp do potrzeb współczesnego użytkownika staje się „być albo nie być” dla dalszego istnienia tego języka. Wymusza to poszukiwanie dróg dalszego rozwoju tych języków oraz opracowania i wyszukiwania przedmiotowego. 2. Ocena merytoryczna rozprawy Przedmiotem oceny jest obszerna (2-tomowa, łącznie licząca 486 stron) rozprawa doktorska mgr Bartłomieja Włodarczyka pt. „Zastosowanie map tematów w językach haseł przedmiotowych na przykładzie języka haseł przedmiotowych Biblioteki Narodowej”. Celem tej rozprawy było zaprezentowanie koncepcji transformacji JHP BN do postaci mapy tematów, która pozwoli 2 usprawnić wyszukiwanie informacji w katalogach bibliotecznych1. Koncepcja ta opiera się na lepszym wykorzystaniu i organizacji leksyki tego języka. Mapy tematów stanowią standard reprezentacji wiedzy przystosowany do środowiska komputerowego. Są jednym z modeli umożliwiających reprezentację systemów organizacji wiedzy w sieci WWW takich, jak taksonomie, tezaurusy, klasyfikacje fasetowe, ontologie, kartoteki wzorcowe, pierścienie synonimów, słowa kluczowe i jhp. Mapy tematów są też standardem umożliwiającym sprawną nawigację i organizację zasobów informacyjnych (bibliotecznych), a potem ich uzupełnianie. Mgr Włodarczyk poprawnie określił cel rozprawy jako „analizę i zaprezentowanie jej rezultatów w zakresie możliwości optymalizacji wykorzystania danych semantycznych zorganizowanych jako języki haseł przedmiotowych w celu stworzenia systemu zapewniającego skuteczniejsze, bliższe oczekiwaniom użytkowników wyszukiwanie informacji” (s. 19). Swoje rozważania oparł na tezie, że w językach haseł przedmiotowych tkwi niewykorzystany dotychczas potencjał informacyjno-wyszukiwawczy, a jego wykorzystanie w katalogach bibliotecznych jest możliwe za pomocą technik semantycznych. Jako jeden z modeli umożliwiających taką transformację przyjął mapę tematów. Wybór mapy tematów jako metodologicznej podstawy propozycji przekształcenia języka haseł przedmiotowych został podyktowany możliwościami tego modelu. Wprawdzie nie jest to propozycja oryginalna, gdyż takie prace prowadził już m.in. japoński zespół pod kierunkiem Motomu Naito, co zauważa Autor na s. 20, ale zakres prac tego zespołu był bardzo ograniczony (brak dokładnej analizy struktury przekształcanych języków oraz objęcie transformacją wyłącznie relacji paradygmatycznych w słownikach jhp). Istnieją też modele włoskiego języka haseł przedmiotowych – Nuovo Soggettario oraz model indeksu opartego na ontologii autorstwa Winfrieda Göderta, Jessici Hubrich oraz Matthiasa Nagelschmidta. Autor podjął rozważania nad tym modelem odnosząc go do konkretnego języka haseł przedmiotowych – JHP BN. Dzięki temu przedstawiona do oceny rozprawa doktorska ma nie tylko charakter poznawczy, lecz także (a może przede wszystkim) wdrożeniowy, co wynika z obranego głównego celu dysertacji. Postawionemu celowi rozprawy podporządkowano metodologię (badań i rozprawy), która została opracowana poprawnie i adekwatnie do badanego przedmiotu. Warto podkreślić dużą świadomość metodologiczną Autora, przejrzystość w prezentacji metodologii badań oraz podjęcie się tematu aktualnego, istotnego z punktu widzenia teorii i praktyki języków informacyjno-wyszukiwawczych, do tej pory w nikłym stopniu eksplorowanego badawczo. Realizacji podjętego zdania odpowiada przyjęta struktura rozprawy. Praca składa się ze wstępu, trzech obszernych rozdziałów (wewnętrznie rozbudowanych), zakończenia, bibliografii 1 Warto dodać, że nie jest to jedyna propozycja w tym zakresie. Istnieje równie cenna propozycja opracowania rzeczowego za pomocą deskryptorów, czyli „udeskryptorowienia” języka haseł przedmiotowych, przygotowywana przez powstałą 1 czerwca 2014 r. Pracownię Deskryptorów Biblioteki Narodowej. 3 załącznikowej, wykazu tabel, wykazu ilustracji oraz w aneksie trzech załączników. Nie zabrakło także wykazu stosowanych skrótów, których z uwagi na podjęty temat pojawia się bardzo dużo. Warto podkreślić logiczną strukturę pracy oraz dbałość o jednoznaczność używanej terminologii. Dobór źródeł oraz literatury przedmiotu nie budzi zastrzeżeń. We wstępie Autor określił szczegółowo cel pracy, przyjętą tezę, założenia transformacji JHP BN do postaci mapy tematów a także stosowaną w tekście rozprawy terminologię. W rozdziale I przedstawił historię oraz aktualny stan JHP BN (zwłaszcza po 2001 roku, co stanowi novum). Ma to istotne znaczenie dla przekształcania i formalizacji tego języka. Informacje w tej części rozprawy stanowiły oparcie dla propozycji przekształcenia JHP BN w mapę tematów. Twierdzę, że już ta pierwsza część rozprawy świadczy o niezwykle rzetelnym i solidnie przemyślanym podejściu Autora do zasadniczego problemu badawczego. Rozdział II został poświęcony omówieniu rodziny standardów map tematów. Scharakteryzowano w nim również najnowsze wersje oprogramowania do tworzenia i zarządzania mapami tematów. Najważniejszą część rozprawy stanowi rozdział III szczegółowo omawiający poszczególne elementy autorskiej propozycji Włodarczyka przekształcenia JHP BN w postać mapy tematów. Najpierw opisał On istniejące modele organizacji wiedzy realizowane przez JHP oraz model realizowany przez gramatykę częściowo pozycyjną. Następnie jasno i z wielką precyzją, niemal krok po kroku przedstawił szczegółowe problemy dotyczące podjętej transformacji JHP BN ujawniając tym samym swój wyśmienity warsztat badawczy. Dołączenie ilustracji dokumentujących kolejne etapy transformacji nie tylko ułatwia lekturę rozprawy, lecz pozwala też prześledzić cały proces postępowania badawczego. Mgr Włodarczyk przeprowadził nie tylko dogłębną analizę struktury istniejącego JHP BN, pokazał też kierunki i problemy związane z przekształcaniem rekordów wzorcowych tematów JHP BN w tematy na mapie tematów. Przedstawił również różne możliwości reprezentacji relacji JHP BN na mapie tematów. W zakończeniu zaprezentował zaprojektowaną własną wstępną ontologię mapy tematów opartą na JHP BN. Jej zaletą jest większa kontrola struktury JHP BN w porównaniu z rozwiązaniami opartymi na formacie MARC 21. Należy stwierdzić, że założenia badawcze przyjęte w rozprawie w pełni zostały zrealizowane w kolejnych rozdziałach rozprawy, chociaż końcowe wnioski pokazują, że przyjęte procedury należałoby nieco poszerzyć. Podsumowując tę część recenzji trzeba dodać, że praca napisana jest bardzo dobrą polszczyzną. Nieliczne błędy stylistyczne, składniowe i interpunkcyjne nie wpływają negatywnie na merytoryczną wartość opracowania. W całej pracy na uwagę zasługuje jasny, wyważony i bardzo zdyscyplinowany tok narracji, który w tego typu pracach jest wyjątkowo potrzebny. Jest to rozprawa imponująca ze względu na wagę i wielość poruszonych problemów oraz dociekliwość Autora, a także różnorodność zastosowanych narzędzi badawczych. 4 Ważne dla postawionego celu badawczego są wnioski zamieszczone na ss. od 390 do 398. Opisane w rozprawie niekonsekwencje w opracowaniu przedmiotowym zbiorów Biblioteki Narodowej mają negatywny wpływ nie tylko na wyszukiwanie dokumentów w katalogach bibliotecznych, lecz także na możliwości przekształcania i wizualizacji JHP BN w przyszłości. Język haseł przedmiotowych nie powinien być tylko dla „wtajemniczonych” (w domyśle bibliotekarzy), lecz także dla zwykłego użytkownika i jak najbardziej zbliżony do języka naturalnego. Cała systemowa „kuchnia” powinna być przed użytkownikami ukryta i tworzona przez specjalistów, ale z uwzględnieniem potrzeb i preferencji użytkowników. Wprawdzie – powtarzam - propozycja transformacji JHP BN w mapę tematów nie jest nowa, ale jej odniesienie do JHP BN jest nowatorskie, gdyż do tej pory nikt tego nie zrobił w takim zakresie. Autor bardzo skrupulatnie opracował i przedstawił w rozprawie co i jak należy/można zrobić, aby dokonać transformacji, słusznie konkludując na ss. 279, 371, że pełna transformacja JHP BN w mapę tematów przekracza możliwości pojedynczego specjalisty; wymaga wręcz ogromnej pracy całego zespołu. W przedstawionej koncepcji trudno doszukiwać się jakichkolwiek błędów. Mogą one ujawnić się na etapie jej implementacji, której w pełni nie dokonano. Równokształtność haseł katalogu przedmiotowego z wyrażeniami języka naturalnego bezwzględnie przemawia na jego korzyść, choć może być źródłem pewnych nieporozumień czy frustracji użytkowników. W wypadku katalogów o słownictwie paranaturalnym trzeba w sposób szczególny troszczyć się, żeby znaczenia poszczególnych haseł nie odbiegały zbyt daleko od znaczeń odpowiadających im wyrażeń języka naturalnego. Szukający odnajdując „znajomy” termin w katalogu, będzie się bowiem skłaniał ku przypisaniu mu znaczenia takiego samego lub bliskiego znaczeniu, jakie ma on w języku naturalnym. Autor rozprawy wykazał na przykładzie JHP BN, że w jhp podobnie, jak w innych jiw, tkwi nie w pełni wykorzystany potencjał informacyjno-wyszukiwawczy. Jego większe wykorzystanie jest możliwe poprzez zastosowanie technologii wykorzystujących semantykę tych języków, co w konsekwencji ma doprowadzić do stworzenia możliwości łatwiejszego i skuteczniejszego wyszukiwania informacji katalogowych. Jego zdaniem do tej pory optymalnie nie wykorzystano danych zapisanych w rekordach wzorcowych wszystkich kategorii tematów. Przekształcenie JHP BN w mapy tematów pozwoli na efektywniejsze i precyzyjniejsze przedstawianie zarówno relacji paradygmatycznych, jak i relacji syntagmatycznych. W szczególności dotyczy to relacji hierarchicznych oraz specyfikowanych relacji skojarzeniowych. W rozprawie przedstawiono możliwości przekształcenia relacji słownikowych JHP BN w powiązania w mapie tematów. Podkreślono szczególne znaczenie w wyszukiwaniu informacji relacji syntagmatycznych realizowanych w JHP w formie haseł rozwiniętych, których to ze względu na ich złożoność zwykle nie rozumieją użytkownicy. Specyfikacja tych relacji może pomóc w zrozumieniu znaczenia tego typu 5 konstrukcji. Mapa tematów może być wykorzystana zarówno w systemach i językach opartych na postkoordynacji, jak i na prekoordynacji. Większość zaprezentowanych wyników odnosi się wyłącznie do JHP BN, ale wiele zaproponowanych rozwiązań można zastosować w różnych jhp. W niektórych przypadkach niezbędna może okazać się modyfikacja sieci relacji i innych elementów. Zdaniem Autora rozprawy zaproponowana transformacja JHP BN do postaci mapy tematów w wymienionych w rozprawie powodów, powinna przyjąć formę semiautomatycznej transformacji JHP BN. Uważam to rozwiązanie za rozsądne, biorąc pod uwagę rzeczywistą jakość konkretnych danych wejściowych w procesie transformacji. Do dalszych badań Autor zaliczył metodykę indeksowania opartego na mapie tematów oraz sposoby wizualizacji mapy tematów, związane z interfejsem wyszukiwawczym (s. 392). Jego zdaniem zaprezentowane możliwości spełniają oczekiwania użytkowników (czego nie zbadano!), gdyż w prostszy i bardziej intuicyjny sposób umożliwiają skuteczniejsze wyszukiwanie informacji w porównaniu z JHP BN. Specyfikacja relacji umożliwia lepsze zrozumienie struktury stworzonego języka i przeglądanej dziedziny. Wartość uzyskanej mapy tematów zależy do jakości danych wejściowych, czyli opisów przedmiotowych tworzonych z zastosowaniem JHP BN. Oznacza to, że niezbędna jest dbałość o jakość danych wejściowych, a więc o pragmatykę indeksowania w jhp, co stanowi osobne pole do dalszych badań. W porównaniu do wcześniejszych transformacji propozycja Włodarczyka jest kompleksowa, m. in. oparta na dogłębnej analizie przekształcanego JHP BN oraz uwzględnia relacje syntagmatyczne wyrażane w jhp za pomocą haseł rozwiniętych. Nie istnieje gotowa metodologia tworzenia map tematów w oparciu o jhp (s. 268). Istnieją natomiast metodologie budowy ontologii z wykorzystaniem zasobów, których semantyka nie została jeszcze sformalizowana z użyciem ontologii (s. 268). Ostatecznym celem transformacji w przypadku rozprawy było stworzenie ontologii odwzorowującej rzeczywistość stworzoną przez JHP BN. Takie przekształcenie miało udoskonalić możliwości wyszukiwawcze systemu bibliotecznego, w którym będzie zaimplementowana mapa tematów (s. 270). W ontologii bowiem tkwi potencjał zmniejszania przeciążenia poznawczego użytkownika, na które jest narażony użytkownik współczesnych siw, poprzez dostarczenie mu powiązanych i zgrupowanych informacji (s. 275). Zaprezentowana w rozprawie ontologia nie ma jednak charakteru rozwiązania finalnego (s. 371). Podejmowane decyzje przy transformacji – zdaniem Autora – powinny mieć charakter praktyczny i uwzględniać semantykę języka naturalnego, na bazie którego powstał dany jhp (s. 291). W toku analizy okazało się, że w słowniku JHP BN brakuje wielu niezbędnych dla procesu transformacji informacji. Zatem praktyka rozwoju JHP BN powinna zostać tak zmieniona, aby lepiej 6 wykorzystywać możliwości jakie dają mapy tematów (s. 284). Część relacji hierarchicznych zapisanych w słowniku JHP BN nie spełnia kryteriów poprawności. Do braku precyzji w ustanawianiu relacji hierarchicznych przyczynia się brak jawnych zasad postępowania przy tworzeniu nowych artykułów słownikowych oraz przeznaczenie leksyki języka do przeglądania przez użytkowników i jako pomoc w opracowywaniu zbiorów. Schemat mapy tematów został zaprezentowany za pomocą stworzonych z wykorzystaniem programu Onotoa 12 diagramów GTM (rys. 24-35). Recenzowana rozprawa stanowi pierwsze w Polsce opracowanie na taką skalę map tematów oraz analizę współczesnego języka haseł przedmiotowych. Ponieważ zaproponowane rozwiązania mogą być zastosowane także w innych jhp i jiw, dlatego po naniesieniu uwag recenzentów warto tę pracę opublikować i przez to udostępnić całemu środowisku bibliotekarskiemu. 3. Uwagi szczegółowe Historia JHP BN sięga przełomu lat 50. XX wieku. Z tekstu na s. 7 dowiadujemy się, że języki haseł przedmiotowych powstały na przełomie XIX i XX wieku, co stoi w sprzeczności z informacjami znajdującymi się w literaturze przedmiotu z tego zakresu, sytuującymi genezę tych języków w okresie średniowiecza. W trakcie lektury tekstu odniosłem wrażenie zdecydowanego preferowania zagranicznych prac naukowych, z pominięciem (a przynajmniej zasygnalizowaniem) jeszcze innych cennych polskich opracowań z teorii języków informacyjno-wyszukiwawczych, związanych pośrednio lub bezpośrednio z eksplorowaną w rozprawie problematyką. Stąd brak odesłania m.in. do już nieżyjącego jednego z najwybitniejszych teoretyków języków informacyjno-wyszukiwawczych w Polsce – profesora Eugeniusza Ścibora, twórcy strukturalnej typologii języków informacyjnych, który w swoich opracowaniach dotykał także niektórych problemów języków haseł przedmiotowych. 4. Konkluzja Podsumowując całość rozważań oceniam pracę mgr Bartłomieja Włodarczyka bardzo dobrze. Recenzowana rozprawa doktorska jest dziełem dojrzałym, wartościowym poznawczo, niezwykle starannie opracowanym, imponującym ze względu na niezwykle pracochłonne procedury badawcze. Autor podjął ważny z punktu widzenia teorii i praktyki języków informacyjno-wyszukiwawczych problem, który do tej pory nie doczekał się w zagranicznym i polskojęzycznym piśmiennictwie naukowym z zakresu bibliologii i informatologii pełnego opracowania. Praca ma charakter teoretyczno-wdrożeniowy i może stanowić cenną pomoc dla bibliotek stosujących języki haseł przedmiotowych. Należy podkreślić, że rozprawa ma charakter interdyscyplinarny, z wyraźną orientacją bibliologiczną. Autor sprawnie porusza się w obszarze bibliologii i informatologii, dowodząc tym samym dojrzałości badawczej. Oryginalnym wkładem mgr Bartłomieja Włodarczyka 7 do bibliologii i informatologii jest poszerzenie wiedzy z zakresu teorii i praktyki języków informacyjno-wyszukiwawczych, zwłaszcza języków haseł przedmiotowych z możliwością wykorzystania jej w opracowaniu przedmiotowym zbiorów bibliotecznych. Autor osiągnął założony w rozprawie cel, zweryfikował też postawioną tezę. Wykazał się umiejętnością dobrego zaplanowania i przeprowadzenia postępowania badawczego oraz dużymi kompetencjami i odwagą w prezentacji i interpretacji wyników badań, a także syntezy rozważań. W związku z powyższym uważam, że rozprawa doktorska mgr Bartłomieja Włodarczyka pt. „Zastosowanie map tematów w językach haseł przedmiotowych na przykładzie języka haseł przedmiotowych Biblioteki Narodowej” spełnia wymagania określone w art. 13. Ustawy z 14 marca 2003 r. o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki i dlatego wnoszę o dopuszczenie mgr. Włodarczyka do dalszych etapów przewodu doktorskiego. Wiesław Babik 8