2007 - Instytut Mechanizacji Budownictwa i Górnictwa Skalnego
Transkrypt
2007 - Instytut Mechanizacji Budownictwa i Górnictwa Skalnego
BIULETYN Klubu Użytkowników Pakietu Mikro CDS/ISIS Listopad 2007 Instytut Mechanizacji Budownictwa i Górnictwa Skalnego 02-673 Warszawa, ul. Racjonalizacji 6/8 Tel./Fax (+ 22 ) 847 10 82 e-mail [email protected] URL html://www.iinte.edu.pl/klub.htm Od redakcji Ten numer naszego biuletynu jest w całości poświęcony produktom BIREME do obsługi baz danych CDS/ISIS. BIREME to skrótowa nazwa Centrum Informacji Medycznej dla Ameryki Łacińskiej i Regionu Karaibów. Polscy użytkownicy systemu CDS/ISIS znają BIREME przede wszystkim jako instytucję, w której została opracowana biblioteka ISISDLL oraz oprogramowanie WWWISIS. BIREME już wcześniej odgrywało istotną rolę w powstaniu rodziny programów CDS/ISIS, a wraz ze spadkiem finansowego i organizacyjnego zaangażowania UNESCO w rozwój ogólnodostępnego oprogramowania staje się obecnie ważnym ośrodkiem koordynującym rozwój CDS/ISIS. W pierwszym artykule omawiamy rolę BIEME w rozwoju oprogramowania wchodzącego w skład rodziny CDS/ISIS, a w kolejnych artykułach przedstawiamy nowe wersje trzech bezpłatnych produktów BIREME - WWWISIS, IAH i CISIS. Czytelnicy naszego biuletynu znają poprzednie wersje oprogramowania WWWISIS, które umożliwia przetwarzanie baz danych CDS/ISIS w sieci Internet. Dostępna obecnie wersja 7 nie różni się istotnie od wersji 5, ale jest ona obecnie dostępna nieodpłatnie. IAH jest gotową aplikacją WWWISIS do przeszukiwania baz CDS/ISIS w Internecie, która może zostać wykorzystany przez osoby chcące uniknąć trudności związanych z samodzielnym przygotowaniem aplikacji do przeszukiwania własnych baz danych. CISIS jest nazwą zestawu programów narzędziowych do przetwarzania baz danych CDS/ISIS. BIREME opracowało CISIS kilkanaście lat temu jako narzędzie umożliwiające przetwarzanie baz CDS/ISIS bez użycia systemu CDS/ISIS. Pomimo upływu czasu popularność CISIS nie maleje i dlatego na początku 2007 roku została udostępniona kolejna wersja tych programów narzędziowych. CISIS miał istotny wpływ na inne produkty z rodziny CDS/ISIS. I tak stosowany w systemie WinISIS i bibliotece ISISDLL język aktualizacji pól pochodzi z CISIS, a formaty stosowane w oprogramowaniu WWWISIS są pisane w języku formatowania CISIS. Rola BIREME w rozwoju rodziny CDS/ISIS Przeszłość systemu CDS/ISIS jest nierozerwalnie związana z UNESCO. W tej organizacji pod kierunkiem twórcy tego systemu Giampaolo del Bigio były prowadzone prace nad rozwojem kolejnych wersji tego oprogramowania dla systemu DOS, tam też powstały kolejne wersje CDS/ISIS dla Windows. W latach 90-tych XX wieku UNESCO przeznaczało znaczne fundusze na rozwój tego systemu i wspierało tworzenie społeczności użytkowników CDS/ISIS, organizując na różnych kontynentach kursy szkoleniowe, seminaria i spotkania dystrybutorów. Kulminacyjnym wydarzeniem tego okresu był I Międzynarodowy Kongres CDS/ISIS, który w 1995 roku zgromadził ponad 400 osób z Ameryki Łacińskiej i regionu Karaibów, Europy i Afryki. Ten etap rozwoju oprogramowania zakończył się w 1999 roku, kiedy to ciężko chorego Giampaolo del Bigio zastąpił na stanowisku kierownika projektu CDS/ISIS Davide Storti. Zmiany nie ograniczyły się jednak tylko do spraw osobowych. W kolejnych latach UNESCO przeznaczało w swym w budżecie coraz mniejsze sumy na rozwój systemu WinISIS, a tendencji tej nie odwróciły nawet specjalne akcje protestacyjne organizowane przez międzynarodową społeczność użytkowników CDS/ISIS. Momentem przełomowym był wrzesień 2005 roku, kiedy to na II Światowym Kongresie CDS/ISIS nie był obecny kierownik projektu CDS/ISIS, a centralę UNESCO reprezentowała specjalna wysłanniczka Zastępcy Dyrektora Generalnego. Pod koniec tego samego roku Davide Storti objął inne stanowisko, a sprawami CDS/ISIS formalnie zaczęła się zajmować osoba odpowiedzialna za wszystkie projekty informatyczne UNESCO. Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS W tej sytuacji coraz większą rolę w koordynacji rozwoju systemu CDS/ISIS zaczęło odgrywać Centrum Informacji Medycznej dla Ameryki Łacińskiej i Regionu Karaibów, które jest znane pod skrótową nazwą BIREME. Polscy użytkownicy systemu CDS/ISIS znają BIREME przede wszystkim jako instytucję, w której zostały opracowane biblioteka ISISDLL, pozwalająca na przygotowywanie własnych programów aplikacyjnych przetwarzających bazy danych pakietu CDS/ISIS w środowiskach wyposażonych w graficzne łącze z użytkownikiem, oraz oprogramowanie WWWISIS służące do przetwarzania baz danych CDS/ISIS w Internecie. Jednakże wkład, w rozwój rodziny CDS/ISIS nie ograniczył się do opracowania dwóch wymienionych narzędzi. BIREME było najważniejszym partnerem UNESCO przy projektowaniu i realizacji systemu WinISIS, a w 2006 roku zainicjowało prace nad przygotowaniem następcy tego systemu, który nosi roboczą nazwę ISIS-NBP. BIREME, które działa jako centrum informacji naukowej i technicznej w obszarze medycyny dla regionu Ameryki Łacińskiej i Karaibów, od lat większość swoich danych gromadzi w postaci baz CDS/ISIS. W celu przetwarzania tych baz danych BIREME opracowało różnego rodzaju oprogramowanie, które początkowo stosowało dla własnych potrzeb, a z upływem czasu udostępniało te narzędzia międzynarodowej społeczności użytkowników systemu CDS/ISIS. Na początku 2007 roku na swojej stronie internetowej http://bvsmodelo.bvsalud.org/php/index.php?lang=en BIREME umieściło sekcję ISIS Family (Rodzina CDS/ISIS), która zapewnia bezpłatny dostęp do wszystkich produktów tej organizacji związanych z systemem CDS/ISIS. Większość z tych produktów była dostępna już wcześniej, ale niektóre z nich były dostępne odpłatnie (oprogramowanie WWWISIS i narzędzie IAH) albo są dostępne w nowej wersjach (programy narzędziowe CISIS). Ułatwieniem w korzystaniu z tych produktów jest dostępność ich dokumentacji w innych językach niż hiszpański czy portugalski. Dzięki woluntariuszom dokumentacja wszystkich produktów została przetłumaczona na angielski i arabski, a część dokumentów jest również dostępna w języku francuskim i włoskim. W dalszych artykułach tego numeru naszego biuletynu omawiamy następujące produkty BIREME: Strona 2 wersję 7 oprogramowania WWWISIS, system IAH, 4 wersje programów narzędziowych CISIS w wydaniu 5.2. Bezpłatne oprogramowanie WWWISIS Jednym z najszerzej stosowanych produktów BIREME jest oprogramowanie WWWISIS. Jest to wielofunkcyjny program umożliwiający przetwarzanie baz danych CDS/ISIS w sieci Internet. WWWISIS jest programem CGI, co oznacza że korzysta on z protokołu Common Gateway Interface przy wymianie danych z przeglądarką internetową. Dane wejściowe, które program WWWISIS otrzymuje z przeglądarki określają czynności, jakie ma on wykonać w bazie danych CDS/ISIS. Z reguły rezultatem tych czynności jest wygenerowanie - na podstawie zawartości bazy - danych wyjściowych zapisanych w formacie HTML, które są zwracane do przeglądarki. Typowy przykład danych wejściowych to polecenie wykonania podanego zapytania wyszukiwawczego we wskazanej bazie danych i zwrócenie zawartości pierwszych 10 odszukanych rekordów zgodnie z zadanym formatem wyprowadzania (w tym przypadku danymi wyjściowymi są odpowiednio sformatowane rekordy). Użytkownik WWWISIS określa wykonywane operacje przy pomocy poleceń sterujących działaniem tego programu. Wraz z opracowywaniem kolejnych wersji WWWISIS zmieniał się sposób sterowania działaniem tego programu. Zasadnicza zmiana miała miejsce z wprowadzeniem w 2000 roku wersji 4. W przypadku wcześniejszych wersji WWWISIS, oznaczonych numerami od 1 do 3.3, programista miał do dyspozycji gamę kilkudziesięciu parametrów sterujących o zróżnicowanej budowie, które były zapisywane w plikach parametrów, przy czym w osobnych plikach i w inny sposób były zapisywane parametry statyczne oraz parametry dynamiczne (więcej informacji nt korzystania z programu WWWISIS 3.3 zawiera nasz biuletyn z 1999 roku). Począwszy od wersji 4 polecenia sterujące działaniem WWWISIS są zapisywane przy użyciu specjalnego języka poleceń IsisScript, którego składnia jest zgodna z formatem XML. Dzięki temu zapisany w tym języku skrypt sterujący WWWISIS ma przejrzystą budowę, co ułatwia Listopad 2007 zarówno przygotowywanie nowych skryptów jak i modyfikowanie skryptów już istniejących. Znaczenie nowego sposobu sterowania WWWISIS znalazło odbicie w zmianie nazwy tego programu. Począwszy od wersji 4 sam program nosi nazwę WXIS, będącą skrótem anglojęzycznego określenia WWWISIS XML IsisScript Server, które oznacza że program WWWISIS jest serwerem CGI korzystającym z języka XML IsisScript (więcej informacji nt języka IsisScript zawiera nasz biuletyn z 2001 roku). sługuje zbiory odwrócone o standardowej budowie, których terminy krótkie mają długość do 10 znaków, a terminy długie do 30 znaków. Wersja rozszerzona WWWISIS, tak jak rozszerzona wersja WinISIS, obsługuje zbiory odwrócone o długościach tych terminów zwiększonych odpowiednio do 16 i 60 znaków. Odmiennie niż w przypadku innych programów wprowadzenie nowych wersji oprogramowania WWWISIS nie spowodowało jednak, że przestały być wykorzystywane poprzednie wersje tego programu, a zwłaszcza wersja 3.3 bezpośrednio poprzedzająca wersję 4. Przyczyną tego była zmiana polityki dystrybucji oprogramowania. O ile pierwsze wersje WWWISIS aż do wersji 3.3 były udostępniane bezpłatnie i bez utrudnień administracyjnych, to począwszy od wersji 4 BIREME wprowadziło wymóg opłacenia opłaty licencyjnej w wysokości 150 USD. Opłata ta dotyczyła użytkowania oprogramowania WWW-ISIS w powiązaniu z serwerem internetowym o podanym numerze IP, co powodowało że instytucja pragnąca wykorzystać ten program na kilku serwerach wnosiła osobne opłaty dla poszczególnych serwerów. WWWISIS jest bardzo silnym narzędziem, ale utworzenie przy jego użyciu aplikacji internetowej jest pracochłonną operacją, która oprócz znajomości systemu CDS/ISIS wymaga doświadczenia programistycznego. Dlatego też sporą popularność zdobyło oprogramowanie GenISIS, które umożliwia osobom pozbawionym takiego doświadczenia szybkie tworzenie prostych aplikacji WWWISIS 3.3 przeszukujących bazę danych CDS/ISIS w Internecie (więcej informacji nt oprogramowania GenISIS zawiera nasz biuletyn z 2003 roku). Podstawowym problemem nie była jednak sama wysokość opłaty, lecz utrudnienia administracyjne związane z nową procedurą dystrybucyjną. Dopiero po wpłynięciu opłaty licencyjnej na konto BIREME, udostępniało ono specjalny kod umożliwiający funkcjonowanie programu WWWISIS w powiązaniu z serwerem o ustalonej nazwie i numerze IP, a zazwyczaj od momentu wniesienia opłaty do chwili uzyskania kodu upływało co najmniej kilka tygodni. Dodatkowe problemy pojawiły się, gdy następowała zmiana nazwy serwera lub jego numeru IP, to bowiem wymagało uzyskania nowego kodu dostępu do programu WWWISIS. Rozpowszechniana przez BIREME od lutego 2007 roku wersja 7 programu WWWISIS jest znowu dostępna bez ograniczeń. Można ją pobrać i wykorzystywać bezpłatnie na dowolnych serwerach internetowych. Na swojej witrynie internetowej o adresie http://bvsmodelo.bvsalud.org/php/level.php?lang=en &component=31&item=2 BIREME udostępnia dwa warianty programu WWWISIS, które różnią się od siebie długością terminów w obsługiwanych zbiorach odwróconych. Wersja 7 w wariancie standardowym ob- Udostępnianie baz w Internecie przy użyciu IAH Do tej samej co GenISIS kategorii należy system IAH, który BIREME udostępnia bezpłatnie na swojej witrynie internetowej pod adresem http://bvsmodelo.bvsalud.org/php/level.php?lang=en &component=31&item=3 IAH jest skrótem anglojęzycznego określenia Interface for Access to Health Information, które oznacza intefejs zapewniający dostęp do informacji medycznej. Pod tą nazwą kryje się aplikacja WWWISIS 5.4 służąca do przeszukiwania baz danych CDS/ISIS w Internecie. Została ona zaprojektowana do obsługi utrzymywanych przez BIREME baz informacji medycznej, ale może zostać użyta do udostępniania w Internecie dowolnych baz CDS/ISIS. System IAH należy zainstalować na komputerze wyposażonym w serwer internetowy (do testowania systemu wystarczy, by na tym komputerze działało również oprogramowanie funkcjonujące jako lokalny serwer internetowy). W skład systemu wchodzą trzy grupy plików, które powinny zostać umieszczone we wskazanych katalogach: program WWWISIS oraz jego skrypty sterujące powinien zostać umieszczony w katalogu cgi-bin; do tego katalogu należy również skopiować podkatalog cgi-bin\iah, w którym są umieszczone formaty generujące dynamiczne strony WWW; do głównego katalogu stron WWW należy skopiować podkatalog htdocs\iah, w którym Strona 3 Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS są umieszczone statyczne strony WWW oraz pliki definicyjne; do osobnego katalogu należy skopiować podkatalog bases\iah, w którym są pliki dwóch przykładowych baz danych dystrybuowanych wraz systemem IAH. Przed przystąpieniem do eksploatacji systemu należy odpowiednio zmodyfikować zawartość pliku definicyjnego IAH.DEF, w którym są zapisane m.in. ścieżki dostępu do tych katalogów. IAH jest systemem wielojęzycznym. W oryginale systemu są dostępne trzy wersje językowe: portugalska, hiszpańska i angielska, a polscy użytkownicy IAH otrzymują dodatkowo jego wersję polskojęzyczną opracowaną IMBiGS. Strona główna systemu pozwala na wybór jednej z dwóch przykładowych baz danych: - bazy bibliograficznej DBLIL, - katalogu czasopism DBSECS. Po wyborze danych jest wyświetlany formularz wyszukiwania prostego, w którym użytkownik wpisuje poszukiwane słowa i wskazuje operator logiczny służący do połączenia tych terminów w wyrażeniu wyszukiwawczym. Większą precyzję wyszukiwania można osiągnąć przy użyciu formularza do wyszukiwania zaawansowanego, który jest podobny do formularza wyszukiwania wspomaganego systemu WinISIS. Użytkownik może wskazać pole, z którego pochodzą terminy wyszukiwawcze, i może pobierać te terminy ze słownika bazy danych, a także wskazać operatory logiczne łączące wybrane terminy w wyrażeniu wyszukiwawczym. Wyniki wyszukiwania są prezentowane zgodnie z domyślnym formatem wyświetlania. Każdemu z odszukanych dokumentów towarzyszy pole wyboru oraz ikona drukowania. Przy ich pomocy użytkownik może drukować pojedyncze dokumenty lub wybrać interesujące go dokumenty i wydrukować wszystkie z nich. Jeśli opisy dokumentów zawierają odsyłacze do treści tych dokumentów w postaci elektronicznej (tak jest w bazie DBLIL), to przy odpowiednich odszukanych dokumentach pojawia się dodatkowo ikona zapewniająca dostęp do elektronicznej wersji danego dokumentu. Użytkownik może wysłać wyniki bieżącego wyszukiwania. Przed wykonaniem tej operacji wybiera on zakres przetwarzanych dokumentów (wszystkie odszukane dokumenty, dokumenty wskazane przez zakres ich numerów porządkowych w zbiorze wyników lub wszystkie wybrane dokumenty) oraz wskazuje dokąd mają zostać Strona 4 przesłane te dokumenty. W tym zakresie ma on trzy możliwości: - skierowanie dokumentów na drukarkę czyli ich wydrukowanie, - zapisanie dokumentów na własnym komputerze w formacie XML, HTML lub ISO 2709, - przesłanie dokumentów na wskazany adres elektroniczny. Ta ostatnia możliwość jest dostępna tylko wówczas, jeśli administrator systemu IAH zezwolił na jego współpracę z serwerem pocztowym. Użytkownik ma wpływ na działanie systemu IAH przez dobór jego parametrów konfiguracyjnych. Należą do nich: język konwersacji, wskazanie czy każdy z odszukanych dokumentów ma zostać poprzedzony paskiem nawigacji, liczba dokumentów wyświetlanych jako jedna strona wyników, format wyświetlania. Pozostałe parametry konfiguracyjne systemu są zapisane w pliku definicyjnym IAH.DEF. Modyfikując zawartość tego pliku administrator systemu może decydować o kolejności wyświetlania wyszukanych dokumentów (domyślnie dokumenty są wyświetlane w odwrotnym porządku ich numerów MFN, czyli poczynając od dokumentu najpóźniej wprowadzonego) oraz wpływać na wygląd stron systemu, zmieniając winietę i logo wyświetlane u góry każdej strony lub ustalając inne kolory poszczególnych elementów składowych strony (kolor tła i liter, kolor paska i wyświetlanych na nim znaków). Oprócz pliku definicyjnego IAH.DEF, który zawiera parametry obowiązujące dla wszystkich baz danych, w systemie IAH muszą występować pliki definicyjne baza.DEF, które zawierają parametry definicyjne dla wskazanej bazy danych. W poszczególnych sekcjach takiego pliku definicyjnego są m.in. zapisywane następujące parametry: - ścieżki dostępu do elementów składowych danej bazy, - definicje sposobów dostępu słownika (w tym nazwy przeszukiwanych pól), - nazwy dostępnych formatów wyświetlania oraz wskazanie formatu domyślnego. W tym pliku znajduje się również parametr wskazujący, czy użytkownicy bazy mogą wysyłać wyniki wyszukiwania pocztą elektroniczną. W systemie IAH można udostępnić do wyszukiwania w Internecie inne bazy CDS/ISIS. W Listopad 2007 tym celu należy dla każdej bazy danych wykonać następujące kroki: skopiować do odpowiednich katalogów plik ISO z zawartością bazy danych oraz formaty wyświetlania i tablice FST, wykonując odpowiedni plik poleceń utworzyć bazę danych na podstawie pliku ISO, utworzyć dla tej bazy danych plik definicyjny baza.DEF, zmodyfikować główną stronę systemu, dodając nową bazę danych do umieszczonego na tej stronie wykazu baz dostępnych do przeszukiwania. Formaty wyświetlania stosowane w systemie IAH muszą być dostosowane do prawidłowego funkcjonowania w Internecie, a ich przygotowanie wymaga dobrej znajomości języka formatowania CDS/ISIS oraz języka HTML i jest niewątpliwie najbardziej pracochłonną z wszystkich czynności wykonywanych w celu udostępnienia w tym systemie nowej bazy danych. Konieczność samodzielnego przygotowania formatów wyświetlania oraz pliku definicyjnego bazy może sprawić, że część użytkowników uzna system IAH za mniej przyjazne narzędzie do udostępniania własnych baz danych w Internecie niż oprogramowanie GenISIS. Z pewnością IAH jest narzędziem mniej uniwersalnym niż GenISIS, w którym użytkownik sam definiuje m.in. układ formularza wyszukiwawczego, jednakże dla osób nie mających szczególnych wymagań w tym względzie użycie IAH będzie łatwiejsze, tu bowiem wszystkie bazy korzystają z istniejącego zestawu formularzy wyszukiwawczych. Charakterystyka programów narzędziowych CISIS W celu przygotowywania własnych aplikacji przetwarzających bazy danych CDS/ISIS bez udziału samego systemu CDS/ISIS BIREME opracowało specjalną bibliotekę funkcji w języku programowania C. Ta biblioteka otrzymała nazwę CISIS. Już na początku lat 90-tych BIREME przygotowało przy użyciu tej biblioteki zestaw programów narzędziowych umożliwiających osobne przetwarzanie zbiorów głównych i zbiorów odwróconych baz danych CDS/ISIS. Te programy są znane pod nazwą programów narzędziowych CISIS (ang. CISIS utilities). Przy ich użyciu można tworzyć aplikacje, które przetwarzają bazy CDS/ISIS nie korzystając z plików definiujących strukturę tych baz. Poza wykonywaniem wszystkich najważniejszych operacji systemu CDS/ISIS, programy narzędziowe umożliwiają wykonanie wielu innych czynności niedostępnych w tym systemie, takich jak wygenerowanie dla jednego zbioru głównego kilku zbiorów odwróconych, sporządzenie zestawień statystycznych fraz występujących w rekordach czy zmiana wyróżników pól (niektóre z tych czynności są dostępne w programie narzędziowym SWK, który został udostępniony w 2004 roku). Programy CISIS ułatwiają również wykonanie takich operacji jak korekta błędów ortograficznych w bazach danych CDS/ISIS. Programy narzędziowe CISIS powstały, gdy komputery osobiste były wyposażone w system operacyjny MS DOS, w którym wszystkie programy są wywoływane z wiersza poleceń. W ten sam sposób te programy są wykonywane również w systemie operacyjnym Windows. Użyteczność tych programów powoduje jednak, że wielu osobom nie przeszkadza ten przestarzały sposób wywoływania programów oraz sterowania ich działaniem i dlatego to narzędzie ma wciąż swych wiernych użytkowników. Na początku 2007 roku BIREME udostępniło na witrynie internetowej pod adresem http://bvsmodelo.bvsalud.org/php/level.php?lang=en &component=31&item=1 wydanie 5.2 programów narzędziowych CISIS. To wydanie CISIS jest dostępne w czterech wersjach, które różnią się od siebie długością terminów zbioru odwróconego oraz maksymalną wielkością rekordów. Podstawową wersją jest wersja 10/30, w której terminy krótkie zbioru odwróconego mają długość do 10 znaków, a terminy długie do 30 znaków. Pozostałe wersje to: wersja 16/60, w której ograniczenia długości tych terminów to odpowiednio 16 i 60 znaków (zbiory odwrócone o takiej budowie są przetwarzane przez rozszerzone wersje systemu WinISIS), wersja LIND, która również obsługuje słowniki z terminami o długości do 16 i 60 znaków, ale zapewnia szybsze wyszukiwanie za cenę rezygnacji z możliwości stosowania operatorów położenia i wskazywania pola, z którego pochodzi dany termin (w tej wersji stosowane są zbiory odwrócone o uproszczonej budowie, nie zawierające informacji o polu, z którego pobrano termin, ani o położeniu tego terminu w tym polu); wersja FFI, która umożliwia przechowywanie w zbiorze głównym rekordów o rozmiarze do 1 MB (w pozostałych wersjach ten rozmiar to 32 Strona 5 Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS KB) i obsługuje słowniki z terminami o długości do 16 i 60 znaków. Z tych wszystkich wersji jedynie wersja 10/30 obsługuje bazy danych, które mogą być przetwarzane przez standardowe wersje systemu CDS/ISIS. Każdy z programów narzędziowych CISIS ma zdefiniowany zestaw parametrów, których użycie powoduje wykonanie określonych działań przez ten program. Nazwy większości parametrów mają mnemoniczne znaczenie w języku angielskim, ale znaczenie wielu z nich powinno być również zrozumiałe dla polskich użytkowników systemu CDS/ISIS. Przykładowo, przy użyciu parametru pft wskazuje się format wyświetlania, parametr fst służy do wskazania tablicy FST, a przy użyciu parametru iso wskazuje się plik w formacie ISO 2709. Wywołanie programu bez parametrów powoduje wyprowadzenie na ekran krótkiego opisu jego działania w języku angielskim, który zawiera m.in. nazwy parametrów obowiązkowych i opcjonalnych. W poleceniu wykonania programu kolejne parametry są oddzielane od siebie spacjami i dlatego parametry zawierające spacje oraz inne znaki specjalne (takie jak nawiasy kątowe, symbol \ itd.) powinny zostać ujęte w cudzysłowy. Poniższy przykład przedstawia wykonanie programu MX z trzema parametrami (nazwa bazy danych, wyrażenie wyszukiwawcze i format wyświetlania) mx \cisis\databases\cds "plants*water" "pft=mfn/'Tyt: 'v24/(|Aut: |v70/)" którego rezultatem jest wykonanie w bazie CDS zapytania wyszukiwawczego plants*water i wyświetlenie wyników zgodnie z następującym formatem: mfn/'Tyt: 'v24/(|Aut: |v70/) Główny program narzędziowy CISIS nosi nazwę MX. Oprócz tego podstawowego narzędzia ogólnego przeznaczenia w skład zestawu CISIS wchodzi kilkanaście specjalistycznych programów do obsługi zbioru głównego i zbioru odwróconego. Program MX i pozostałe programy CISIS zostały opisane w dwóch następnych artykułach tego biuletynu. Wyczerpujące informacje na temat narzędzi CISIS zawiera najnowsza publikacji z serii Informacja Naukowa, która nosi tytuł "Zestaw programów narzędziowych CISIS wersja 5.2. Dokumentacja użytkowa". Strona 6 MX - główny program narzędziowy CISIS Program MX jest najczęściej używanym programem narzędziowym CISIS. Jest on programem ogólnego przeznaczenia, który pozwala tworzyć nowe bazy danych CDS/ISIS oraz przetwarzać bazy istniejące. Tak jak inne programy CISIS, program MX nie korzysta z plików definiujących strukturę baz danych, a działa bezpośrednio na zbiorze głównym i zbiorze odwróconym oraz w razie potrzeby używa formaty, tablice FST i inne pliki, takie jak np. plik słów nieznaczących. Program MX działa na wejściowym zbiorze danych. Zazwyczaj zbiorem tym jest plik główny bazy CDS/ISIS, ale może on także czytać pliki w formacie ISO 2709 lub pliki tekstowe, w których pola są oddzielone separatorami, i zapisywać odczytane rekordy jako rekordy zbioru głównego przetwarzanej bazy danych. Jeśli nie ograniczono zbioru obsługiwanych rekordów, program przetwarza wszystkie rekordy zbioru wejściowego. Zbiór rekordów można ograniczyć do rekordów: - znalezionych w wyniku wyszukiwania w zbiorze odwróconym lub wyszukiwania pełnotekstowego, - wskazanych za pomocą zakresu numerów i/lub liczby przetwarzanych rekordów, - wybranych w pętli, np. rekordy o numerach 5, 10, 15, 20 itd. Typowe zastosowanie programu MX to przetworzenie rekordów wejściowej bazy danych w określony sposób i zapisanie zmodyfikowanej zawartości tej bazy w pliku wyjściowym. Tak jak w przypadku pliku wejściowego, plik wyjściowy może być plikiem głównym bazy CDS/ISIS, plikiem w formacie ISO 2709 lub plikiem tekstowym zawierającym pola oddzielone separatorami (taki plik może być czytany przez inne programy, takie jak MS Excel). Jeśli zbiorem wyjściowym jest plik główny bazy danych CDS/ISIS, zmodyfikowane rekordy mogą zostać zapisane w tej bazie w następujący sposób: zmodyfikowane rekordy zastępują dotychczasową zawartość bazy, zmodyfikowane rekordy są dopisywane na końcu bazy, zmodyfikowane rekordy są zapisywane tylko wówczas, gdy w bazie nie istnieją rekordy o numerach przypisanych rekordom wejściowym. Oprócz tego możliwa jest tzw. aktualizacja pól. Podczas tej operacji w wyjściowej bazie danych Listopad 2007 jest odnajdywany rekord o numerze pokrywającym się z numerem bieżącego rekordu i zawartość wszystkich pól tego rekordu, których wyróżniki pokrywają się z wyróżnikami rekordu bieżącego, jest zastępowana zawartością odpowiednich pól pobraną z rekordu bieżącego. Podstawowym narzędziem służącym do modyfikacji zawartości rekordów jest znany z ISISDLL, WWWISIS oraz WinISIS język aktualizacji pól. Język ten jest narzędziem, które zostało opracowane dla potrzeb interfejsu CISIS. W programie MX można użyć poleceń tego języka np. w celu usunięcia lub dodania pól albo zmiany ich zawartości. Również język formatowania stosowany w aplikacjach WWWISIS jest w istocie językiem formatowania CISIS. Język ten poza wszystkimi poleceniami formatującymi systemu CDS/ISIS dla DOS zawiera niektóre polecenia dostępne w systemie WinISIS (niektóre z nich są jednak zapisywane w odmienny sposób), a także kilka poleceń, które są dostępne tylko w tym języku. Inny sposób zmiany zawartości przetwarzanej bazy danych to globalne zastępowanie tekstów w polach rekordów w wyniku wykonania tzw. konwersji Gizmo. Poszczególne reguły zamiany tekstów są zapisywane w osobnych rekordach specjalnej bazy danych, a globalna zmiana zawartości może dotyczyć wszystkich pól lub tylko pól o podanych wyróżnikach. Możliwe jest także wykonanie operacji łączenia rekordów, czyli dołączenie do przetwarzanego rekordu pól pobranych z innego rekordu innej lub tej samej bazy danych, przy czym dołączany rekord zostanie wskazany przy użyciu jego numeru MFN lub za pośrednictwem terminu ze zbioru odwróconego. W ten sposób można na przykład uzupełnić zapisane w rekordach bazy bibliograficznej nazwiska autorów dodatkowymi danymi o tych autorach pobranymi z bazy haseł wzorcowych zawierającej znormalizowane opisy autorów. Gdy nie jest wymagane pobranie dodatkowych danych, lecz wyłącznie stwierdzenie czy przetwarzany rekord zawiera terminy występujące w zbiorze odwróconym wykorzystywanym jako kartoteka haseł wzorcowych, można wykonać operację porównania zawartości rekordu ze zbiorem odwróconym. W ten sposób można na przykład sporządzić wykaz wszystkich rekordów, w których zapisano nazwiska autorów, które nie występują w bazie haseł wzorcowych zawierającej znormalizowane opisy autorów. Program MX może dołączyć do każdego rekordu wejściowego dodatkowe pola zawierające terminy utworzone w wyniku wykonania działań zapisanych w tablicy FST na zawartości tego rekordu poddanej przetwarzaniu (możliwe jest na przykład zapisanie w postaci wystąpień nowego pola wyrazów pobranych z pola Nazwa). Tablica FST może zostać także użyta przez program w celu utworzenia na podstawie przetwarzanych rekordów zbiorów pośrednich zawierających terminy wyszukiwawcze, które po posortowaniu mogą posłużyć do utworzenia zbioru odwróconego. Zbiór pośredni utworzony przez program MX może mieć prostszy format niż taki sam zbiór utworzony w systemie CDS/ISIS, co pozwala osiągnąć szybsze wyszukiwanie za cenę rezygnacji z pewnych operacji dostępnych w standardowym języku wyszukiwawczym (możliwość stosowania podczas wyszukiwania operatorów położenia i wskazywania pola, z którego pochodzi dany termin). Tak jak inne programy narzędziowe CISIS, program MX jest przystosowany do przetwarzania kilku zbiorów odwróconych utworzonych dla jednej bazy danych. Przy jego pomocy można dla tego samego zbioru głównego utworzyć różne zbiory odwrócone (identyfikowane przy pomocy nazwy), a następnie poddać przetwarzaniu konkretny zbiór odwrócony. Nieznaczna modyfikacja składni pozwala nawet na odwoływanie się w tym jednym wyrażeniu wyszukiwawczym do terminów pochodzących z różnych zbiorów odwróconych. Program może również potraktować terminy zbioru odwróconego jako dane wejściowe i utworzyć osobny rekord wejściowy dla każdego odczytanego terminu. W ten sposób może zostać na przykład utworzona baza danych zawierająca terminy zbioru odwróconego. Jedynym obowiązkowym parametrem programu MX jest parametr wskazujący zbiór wejściowy. Użycie tylko tego parametru powoduje wyświetlenie rekordów wskazanej bazy bez formatowania, co daje efekt podobny do użycia formatu ALL w oknie bazy danych systemu WinISIS. Standardowo program zatrzymuje się po przetworzeniu każdego rekordu, oczekując na interwencję użytkownika, który może polecić przerwanie pracy programu. Użycie parametru now powoduje przetworzenie wszystkich rekordów bez interwencji użytkownika, co jest użyteczne np. wówczas gdy program jest wykonywany w trybie wsadowym. W takim przypadku jest z reguły wykorzystywany także parametr -all, który Strona 7 Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS powoduje że na ekran nie są wyprowadzone żadne informacje o przetwarzanych rekordach. W typowym przypadku program MX jest wywoływany z kilkoma parametrami i wówczas parametr wskazujący zbiór wejściowy musi być wystąpić jako pierwszy. Program zakłada, że w wierszu poleceń każdy następny ciąg znaków, który nie rozpoczyna się od zarezerwowanego identyfikatora parametru jest wyrażeniem wyszukiwawczym. Stosując te reguły do polecenia: mx \cisis\databases\cds "plants*water" "pft=mfn/'Tyt: 'v24/(|Aut: |v70/)" Z tego powodu programy te zostały podzielone na programy narzędziowe do obsługi zbioru głównego i programy narzędziowe do obsługi zbioru odwróconego. W dalszej części tego artykułu opisano przeznaczenie najczęściej stosowanych z tych programów. Do najważniejszych programów do obsługi zbioru głównego należą: analizuje rekordy wskazanego MXF0 zbioru głównego i dostarcza informacji o występujących polach i zawartych w nich znakach; MXTB zlicza frazy występujące w polach, obliczając np. liczbę wystąpień wszystkich autorów, deskryptorów, kombinacji Autor – Tytuł itp.; wynikiem działania tego programu jest zbiór główny zawierający osobne rekordy dla wszystkich odnalezionych fraz, w którym zapisana jest częstość występowania tych fraz; MXCP kopiuje rekordy z wejściowego zbioru głównego do wyjściowego zbioru głównego, przy czym dane wejściowe przed skopiowaniem mogą podlegać przekształceniom, takim jak globalne zmiany zawartości lub usunięcie spacji na początku i końcu pól, usunięcie znaków niewidocznych oraz znaków interpunkcyjnych kończących pole; program ten może także przekształcać pole zawierające frazy oddzielone pewnym ogranicznikiem w pole powtarzalne, usuwać pola wejściowe o określonych wyróżnikach oraz odtwarzać rekordy usunięte z wejściowego zbioru głównego; MSRT porządkuje rekordy zbioru głównego według rosnących wartości kluczy otrzymanych w wyniku wykonania formatu na zawartości tych rekordów; RETAG ten program wykonuje dwie funkcje: zmienia wyróżniki pól występujących w zbiorze głównym zgodnie ze schematem zamiany zapisanym w specjalnej tablicy i usuwa blokady rekordów tego zbioru głównego; CTLMFN wyświetla rekord sterujący zbioru głównego oraz umożliwia zmianę program stwierdza najpierw, że zbiorem wejściowym jest baza CDS umieszczona w katalogu \cisis\databases. Parametr plants*water nie zaczyna się od identyfikatora i dlatego jest interpretowany jako zapytanie wyszukiwawcze, natomiast ostatni parametr jest na podstawie zawartego w nim identyfikatora pft traktowany jako format wyświetlania. W przypadku wielu aplikacji programu MX liczba parametrów, przy pomocy których użytkownik steruje działaniem programu, jest zbyt duża, by wszystkie parametry zapisać w wierszu poleceń. Można wówczas większość parametrów zapisać pliku parametrów i w wierszu poleceń podać nazwę tego pliku jako wartość parametru in. Oprócz tego pliku parametrów, program MX może korzystać z pliku parametrów CISIS, nazywanego skrótowo plikiem CIPAR, który w tym programie pełni tę samą rolę co pliki parametrów SYSPAR.PAR i baza.PAR w systemie CDS/ISIS. Oczywiście poszczególne parametry są zapisywane w inny sposób, ale korzystanie z pliku CIPAR nie powinno stwarzać żadnych problemów użytkownikom oprogramowania WWWISIS, bo w wykorzystywanych przez to oprogramowanie plikach CIPAR parametry zapisuje się w ten sam sposób co w plikach parametrów programu MX. Pozostałe programy narzędziowe CISIS W skład zestawu programów CISIS oprócz omówionego w poprzednim artykule programu MX wchodzi kilkanaście innych programów narzędziowych. W odróżnieniu od programu MX, który może w rozmaity sposób przetwarzać zbiory główne i zbiory odwrócone CDS/ISIS, każdy z pozostałych programów narzędziowych CISIS zazwyczaj realizuje określoną funkcję albo na zbiorze głównym albo na zbiorze odwróconym bazy CDS/ISIS. Strona 8 Listopad 2007 MKXRF I2ID ID2I jego zawartości; dzięki temu ten program może być użyty do odzyskania usuniętej nieopatrznie zawartości zbioru głównego; Stowarzyszenie LAMBDA ul. Hoża 50/40 00-682 Warszawa Osoba odpowiedzialna: Inga Kostrzewa program ten czyta plik baza.MST i tworzy na jego podstawie plik baza.XRF; może on zostać użyty do odtworzenia w zbiorze głównym wszystkich rekordów usuniętych logicznie; Instytucja Filmowa SILESIA-FILM ul. Górnicza 5 40-009 Katowice Osoba odpowiedzialna: Aneta Ozorek program I2ID czyta zbiór główny i tworzy na jego podstawie zbiór tekstowy, którego zawartość można poddać edycji (np. w celu zbadania poprawności pisowni wyrazów za pomocą edytora tekstowego); jest on używany w parze z programem ID2I, który wykonuje czynność odwrotną: czyta zbiór tekstowy i przekształca zawarte w nim dane w rekordy zbioru głównego. AKA-SOFT Artur Kucharski ul. Lanciego 7A m. 4 02-792 Warszawa Kolegium Miejskie Centrum Kształcenia Ustawicznego ul. Raduńska 21 81-057 Gdynia Osoba odpowiedzialna: Małgorzata Medycka Do najważniejszych programów do obsługi zbioru odwróconego należą: IFKEYS wyświetla wykaz terminów zbioru odwróconego wraz z liczbą odsyłaczy do tych terminów (można wskazać pola, z których zostały pobrane wyświetlane terminy); IFLOAD tworzy zgodnie z zadanymi parametrami zbiór odwrócony na podstawie wskazanego zbioru pośredniego; MYS sortuje zbiór pośredni, który zostanie użyty do utworzenia zbioru odwróconego. Nowi użytkownicy W celu ułatwienia nawiązywania kontaktów między polskimi użytkownikami pakietu Mikro CDS/ISIS prezentujemy poniżej listę tych użytkowników, którzy uzyskali licencję na korzystanie z pakietu od listopada 2006 roku do października 2007 roku. Dane użytkowników zostały uporządkowane w kolejności otrzymywania licencji. PEDAGOGIUM Wyższa Szkoła Pedagogiki Resocjalizacyjnej w Warszawie Marszałkowska 115 00-102 Warszawa Osoba odpowiedzialna: Anna Kaczyńska Strona 9