2007 - Instytut Mechanizacji Budownictwa i Górnictwa Skalnego

Transkrypt

2007 - Instytut Mechanizacji Budownictwa i Górnictwa Skalnego
BIULETYN
Klubu Użytkowników Pakietu Mikro CDS/ISIS
Listopad 2007
Instytut Mechanizacji Budownictwa i Górnictwa Skalnego
02-673 Warszawa, ul. Racjonalizacji 6/8
Tel./Fax (+ 22 ) 847 10 82
e-mail [email protected]
URL html://www.iinte.edu.pl/klub.htm
Od redakcji
Ten numer naszego biuletynu jest w całości
poświęcony produktom BIREME do obsługi baz
danych CDS/ISIS. BIREME to skrótowa nazwa
Centrum Informacji Medycznej dla Ameryki
Łacińskiej i Regionu Karaibów. Polscy użytkownicy systemu CDS/ISIS znają BIREME przede
wszystkim jako instytucję, w której została opracowana biblioteka ISISDLL oraz oprogramowanie WWWISIS. BIREME już wcześniej odgrywało istotną rolę w powstaniu rodziny programów CDS/ISIS, a wraz ze spadkiem
finansowego i organizacyjnego zaangażowania
UNESCO
w
rozwój
ogólnodostępnego
oprogramowania staje się obecnie ważnym
ośrodkiem koordynującym rozwój CDS/ISIS.
W pierwszym artykule omawiamy rolę BIEME
w rozwoju oprogramowania wchodzącego w
skład rodziny CDS/ISIS, a w kolejnych
artykułach przedstawiamy nowe wersje trzech
bezpłatnych produktów BIREME - WWWISIS,
IAH i CISIS. Czytelnicy naszego biuletynu znają
poprzednie wersje oprogramowania WWWISIS,
które umożliwia przetwarzanie baz danych
CDS/ISIS w sieci Internet. Dostępna obecnie
wersja 7 nie różni się istotnie od wersji 5, ale jest
ona obecnie dostępna nieodpłatnie. IAH jest
gotową aplikacją WWWISIS do przeszukiwania
baz CDS/ISIS w Internecie, która może zostać
wykorzystany przez osoby
chcące uniknąć
trudności
związanych
z
samodzielnym
przygotowaniem aplikacji do przeszukiwania
własnych baz danych.
CISIS jest nazwą zestawu programów narzędziowych do przetwarzania baz danych
CDS/ISIS. BIREME opracowało CISIS kilkanaście lat temu jako narzędzie umożliwiające
przetwarzanie baz CDS/ISIS bez użycia systemu
CDS/ISIS. Pomimo upływu czasu popularność
CISIS nie maleje i dlatego na początku 2007
roku została udostępniona kolejna wersja tych
programów narzędziowych. CISIS miał istotny
wpływ na inne produkty z rodziny CDS/ISIS. I
tak stosowany w systemie WinISIS i bibliotece
ISISDLL język aktualizacji pól pochodzi z
CISIS, a formaty stosowane w oprogramowaniu
WWWISIS są pisane w języku formatowania
CISIS.
Rola BIREME w rozwoju rodziny
CDS/ISIS
Przeszłość systemu CDS/ISIS jest nierozerwalnie
związana z UNESCO. W tej organizacji pod kierunkiem twórcy tego systemu Giampaolo del
Bigio były prowadzone prace nad rozwojem
kolejnych wersji tego oprogramowania dla systemu DOS, tam też powstały kolejne wersje
CDS/ISIS dla Windows. W latach 90-tych XX
wieku UNESCO przeznaczało znaczne fundusze
na rozwój tego systemu i wspierało tworzenie
społeczności użytkowników CDS/ISIS, organizując na różnych kontynentach kursy szkoleniowe, seminaria i spotkania dystrybutorów. Kulminacyjnym wydarzeniem tego okresu był I Międzynarodowy Kongres CDS/ISIS, który w 1995
roku zgromadził ponad 400 osób z Ameryki
Łacińskiej i regionu Karaibów, Europy i Afryki.
Ten etap rozwoju oprogramowania zakończył się
w 1999 roku, kiedy to ciężko chorego Giampaolo
del Bigio zastąpił na stanowisku kierownika projektu CDS/ISIS Davide Storti. Zmiany nie ograniczyły się jednak tylko do spraw osobowych. W
kolejnych latach UNESCO przeznaczało w
swym w budżecie coraz mniejsze sumy na
rozwój systemu WinISIS, a tendencji tej nie
odwróciły nawet specjalne akcje protestacyjne
organizowane
przez
międzynarodową
społeczność
użytkowników
CDS/ISIS.
Momentem przełomowym był wrzesień 2005
roku, kiedy to na II Światowym Kongresie
CDS/ISIS nie był obecny kierownik projektu
CDS/ISIS, a centralę UNESCO reprezentowała
specjalna wysłanniczka Zastępcy Dyrektora
Generalnego. Pod koniec tego samego roku
Davide Storti objął inne stanowisko, a sprawami
CDS/ISIS formalnie zaczęła się zajmować osoba
odpowiedzialna
za
wszystkie
projekty
informatyczne UNESCO.
Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS
W tej sytuacji coraz większą rolę w koordynacji
rozwoju systemu CDS/ISIS zaczęło odgrywać
Centrum Informacji Medycznej dla Ameryki
Łacińskiej i Regionu Karaibów, które jest
znane pod skrótową nazwą BIREME. Polscy
użytkownicy systemu CDS/ISIS znają BIREME
przede wszystkim jako instytucję, w której
zostały opracowane biblioteka ISISDLL, pozwalająca na przygotowywanie własnych programów
aplikacyjnych przetwarzających bazy danych
pakietu CDS/ISIS w środowiskach wyposażonych w graficzne łącze z użytkownikiem, oraz
oprogramowanie WWWISIS służące do przetwarzania baz danych CDS/ISIS w Internecie. Jednakże wkład, w rozwój rodziny CDS/ISIS nie
ograniczył się do opracowania dwóch wymienionych narzędzi. BIREME było najważniejszym
partnerem UNESCO przy projektowaniu i realizacji systemu WinISIS, a w 2006 roku zainicjowało prace nad przygotowaniem następcy tego
systemu, który nosi roboczą nazwę ISIS-NBP.
BIREME, które działa jako centrum informacji
naukowej i technicznej w obszarze medycyny dla
regionu Ameryki Łacińskiej i Karaibów, od lat
większość swoich danych gromadzi w postaci
baz CDS/ISIS. W celu przetwarzania tych baz
danych BIREME opracowało różnego rodzaju
oprogramowanie, które początkowo stosowało
dla własnych potrzeb, a z upływem czasu
udostępniało te narzędzia międzynarodowej
społeczności użytkowników systemu CDS/ISIS.
Na początku 2007 roku na swojej stronie internetowej
http://bvsmodelo.bvsalud.org/php/index.php?lang=en
BIREME umieściło sekcję ISIS Family (Rodzina
CDS/ISIS), która zapewnia bezpłatny dostęp do
wszystkich
produktów
tej
organizacji
związanych z systemem CDS/ISIS. Większość z
tych produktów była dostępna już wcześniej, ale
niektóre z nich były dostępne odpłatnie
(oprogramowanie WWWISIS i narzędzie IAH)
albo są dostępne w nowej wersjach (programy
narzędziowe CISIS). Ułatwieniem w korzystaniu
z tych produktów jest dostępność ich
dokumentacji w innych językach niż hiszpański
czy
portugalski. Dzięki woluntariuszom
dokumentacja wszystkich produktów została
przetłumaczona na angielski i arabski, a część
dokumentów jest również dostępna w języku
francuskim i włoskim.
W dalszych artykułach tego numeru naszego
biuletynu omawiamy następujące produkty
BIREME:
Strona 2
 wersję 7 oprogramowania WWWISIS,
 system IAH,
 4 wersje programów narzędziowych CISIS w
wydaniu 5.2.
Bezpłatne oprogramowanie
WWWISIS
Jednym z najszerzej stosowanych produktów
BIREME jest oprogramowanie WWWISIS. Jest
to wielofunkcyjny program umożliwiający przetwarzanie baz danych CDS/ISIS w sieci Internet.
WWWISIS jest programem CGI, co oznacza że
korzysta on z protokołu Common Gateway
Interface przy wymianie danych z przeglądarką
internetową.
Dane wejściowe, które program WWWISIS
otrzymuje z przeglądarki określają czynności,
jakie ma on wykonać w bazie danych CDS/ISIS.
Z reguły rezultatem tych czynności jest wygenerowanie - na podstawie zawartości bazy - danych
wyjściowych zapisanych w formacie HTML,
które są zwracane do przeglądarki. Typowy
przykład danych wejściowych to polecenie
wykonania
podanego
zapytania
wyszukiwawczego we wskazanej bazie danych i
zwrócenie
zawartości
pierwszych
10
odszukanych rekordów zgodnie z zadanym
formatem wyprowadzania (w tym przypadku
danymi wyjściowymi są odpowiednio sformatowane rekordy).
Użytkownik WWWISIS określa wykonywane
operacje przy pomocy poleceń sterujących działaniem tego programu. Wraz z opracowywaniem
kolejnych wersji WWWISIS zmieniał się sposób
sterowania działaniem tego programu. Zasadnicza zmiana miała miejsce z wprowadzeniem w
2000
roku
wersji
4.
W
przypadku
wcześniejszych wersji WWWISIS, oznaczonych
numerami od 1 do 3.3, programista miał do
dyspozycji gamę kilkudziesięciu parametrów
sterujących o zróżnicowanej budowie, które były
zapisywane w plikach parametrów, przy czym w
osobnych plikach i w inny sposób były
zapisywane parametry statyczne oraz parametry
dynamiczne (więcej informacji nt korzystania z
programu WWWISIS 3.3 zawiera nasz biuletyn
z 1999 roku).
Począwszy od wersji 4 polecenia sterujące działaniem WWWISIS są zapisywane przy użyciu
specjalnego języka poleceń IsisScript, którego
składnia jest zgodna z formatem XML. Dzięki
temu zapisany w tym języku skrypt sterujący
WWWISIS ma przejrzystą budowę, co ułatwia
Listopad 2007
zarówno przygotowywanie nowych skryptów jak
i modyfikowanie skryptów już istniejących. Znaczenie nowego sposobu sterowania WWWISIS
znalazło odbicie w zmianie nazwy tego programu. Począwszy od wersji 4 sam program nosi
nazwę WXIS, będącą skrótem anglojęzycznego
określenia WWWISIS XML IsisScript Server,
które oznacza że program WWWISIS jest serwerem CGI korzystającym z języka XML IsisScript
(więcej informacji nt języka IsisScript zawiera
nasz biuletyn z 2001 roku).
sługuje zbiory odwrócone o standardowej budowie, których terminy krótkie mają długość do 10
znaków, a terminy długie do 30 znaków. Wersja
rozszerzona WWWISIS, tak jak rozszerzona
wersja WinISIS, obsługuje zbiory odwrócone o
długościach tych terminów zwiększonych odpowiednio do 16 i 60 znaków.
Odmiennie niż w przypadku innych programów
wprowadzenie nowych wersji oprogramowania
WWWISIS nie spowodowało jednak, że przestały być wykorzystywane poprzednie wersje
tego programu, a zwłaszcza wersja 3.3 bezpośrednio poprzedzająca wersję 4. Przyczyną tego
była zmiana polityki dystrybucji oprogramowania. O ile pierwsze wersje WWWISIS aż do wersji 3.3 były udostępniane bezpłatnie i bez utrudnień administracyjnych, to począwszy od wersji
4 BIREME wprowadziło wymóg opłacenia
opłaty licencyjnej w wysokości 150 USD. Opłata
ta dotyczyła użytkowania oprogramowania
WWW-ISIS w powiązaniu z serwerem internetowym o podanym numerze IP, co powodowało że
instytucja pragnąca wykorzystać ten program na
kilku serwerach wnosiła osobne opłaty dla poszczególnych serwerów.
WWWISIS jest bardzo silnym narzędziem, ale
utworzenie przy jego użyciu aplikacji internetowej jest pracochłonną operacją, która oprócz
znajomości systemu CDS/ISIS wymaga doświadczenia programistycznego. Dlatego też sporą
popularność zdobyło oprogramowanie GenISIS,
które umożliwia osobom pozbawionym takiego
doświadczenia szybkie tworzenie prostych aplikacji WWWISIS 3.3 przeszukujących bazę danych CDS/ISIS w Internecie (więcej informacji
nt oprogramowania GenISIS zawiera nasz
biuletyn z 2003 roku).
Podstawowym problemem nie była jednak sama
wysokość opłaty, lecz utrudnienia administracyjne związane z nową procedurą dystrybucyjną.
Dopiero po wpłynięciu opłaty licencyjnej na
konto BIREME, udostępniało ono specjalny kod
umożliwiający
funkcjonowanie
programu
WWWISIS w powiązaniu z serwerem o
ustalonej nazwie i numerze IP, a zazwyczaj od
momentu wniesienia opłaty do chwili uzyskania
kodu upływało co najmniej kilka tygodni.
Dodatkowe problemy pojawiły się, gdy
następowała zmiana nazwy serwera lub jego
numeru IP, to bowiem wymagało uzyskania
nowego kodu dostępu do programu WWWISIS.
Rozpowszechniana przez BIREME od lutego
2007 roku wersja 7 programu WWWISIS jest
znowu dostępna bez ograniczeń. Można ją
pobrać i wykorzystywać bezpłatnie na
dowolnych serwerach internetowych. Na swojej
witrynie internetowej o adresie
http://bvsmodelo.bvsalud.org/php/level.php?lang=en
&component=31&item=2
BIREME udostępnia dwa warianty programu
WWWISIS, które różnią się od siebie długością
terminów w obsługiwanych zbiorach odwróconych. Wersja 7 w wariancie standardowym ob-
Udostępnianie baz w Internecie
przy użyciu IAH
Do tej samej co GenISIS kategorii należy system
IAH, który BIREME udostępnia bezpłatnie na
swojej witrynie internetowej pod adresem
http://bvsmodelo.bvsalud.org/php/level.php?lang=en
&component=31&item=3
IAH jest skrótem anglojęzycznego określenia
Interface for Access to Health Information,
które oznacza intefejs zapewniający dostęp do
informacji medycznej. Pod tą nazwą kryje się
aplikacja WWWISIS 5.4 służąca do
przeszukiwania baz danych CDS/ISIS w
Internecie. Została ona zaprojektowana do
obsługi utrzymywanych przez BIREME baz
informacji medycznej, ale może zostać użyta do
udostępniania w Internecie dowolnych baz
CDS/ISIS.
System IAH należy zainstalować na komputerze
wyposażonym w serwer internetowy (do testowania systemu wystarczy, by na tym komputerze
działało również oprogramowanie funkcjonujące
jako lokalny serwer internetowy). W skład systemu wchodzą trzy grupy plików, które powinny
zostać umieszczone we wskazanych katalogach:
 program WWWISIS oraz jego skrypty sterujące powinien zostać umieszczony w
katalogu cgi-bin; do tego katalogu należy
również skopiować podkatalog cgi-bin\iah, w
którym są umieszczone formaty generujące
dynamiczne strony WWW;
 do głównego katalogu stron WWW należy
skopiować podkatalog htdocs\iah, w którym
Strona 3
Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS
są umieszczone statyczne strony WWW oraz
pliki definicyjne;
 do osobnego katalogu należy skopiować podkatalog bases\iah, w którym są pliki dwóch
przykładowych baz danych dystrybuowanych
wraz systemem IAH.
Przed przystąpieniem do eksploatacji systemu
należy odpowiednio zmodyfikować zawartość
pliku definicyjnego IAH.DEF, w którym są zapisane m.in. ścieżki dostępu do tych katalogów.
IAH jest systemem wielojęzycznym. W oryginale
systemu są dostępne trzy wersje językowe: portugalska, hiszpańska i angielska, a polscy
użytkownicy IAH otrzymują dodatkowo jego
wersję polskojęzyczną opracowaną IMBiGS.
Strona główna systemu pozwala na wybór jednej
z dwóch przykładowych baz danych:
- bazy bibliograficznej DBLIL,
- katalogu czasopism DBSECS.
Po wyborze danych jest wyświetlany formularz
wyszukiwania prostego, w którym użytkownik
wpisuje poszukiwane słowa i wskazuje operator
logiczny służący do połączenia tych terminów w
wyrażeniu wyszukiwawczym. Większą precyzję
wyszukiwania można osiągnąć przy użyciu formularza do wyszukiwania zaawansowanego,
który jest podobny do formularza wyszukiwania
wspomaganego systemu WinISIS. Użytkownik
może wskazać pole, z którego pochodzą terminy
wyszukiwawcze, i może pobierać te terminy ze
słownika bazy danych, a także wskazać
operatory logiczne łączące wybrane terminy w
wyrażeniu wyszukiwawczym.
Wyniki wyszukiwania są prezentowane zgodnie
z domyślnym formatem wyświetlania. Każdemu
z odszukanych dokumentów towarzyszy pole wyboru oraz ikona drukowania. Przy ich pomocy
użytkownik może drukować pojedyncze dokumenty lub wybrać interesujące go dokumenty i
wydrukować wszystkie z nich. Jeśli opisy dokumentów zawierają odsyłacze do treści tych
dokumentów w postaci elektronicznej (tak jest w
bazie DBLIL), to przy odpowiednich odszukanych dokumentach pojawia się dodatkowo ikona
zapewniająca dostęp do elektronicznej wersji
danego dokumentu.
Użytkownik może wysłać wyniki bieżącego
wyszukiwania. Przed wykonaniem tej operacji
wybiera on zakres przetwarzanych dokumentów
(wszystkie odszukane dokumenty, dokumenty
wskazane przez zakres ich numerów porządkowych w zbiorze wyników lub wszystkie wybrane
dokumenty) oraz wskazuje dokąd mają zostać
Strona 4
przesłane te dokumenty. W tym zakresie ma on
trzy możliwości:
- skierowanie dokumentów na drukarkę czyli ich
wydrukowanie,
- zapisanie
dokumentów
na
własnym
komputerze w formacie XML, HTML lub ISO
2709,
- przesłanie dokumentów na wskazany adres
elektroniczny.
Ta ostatnia możliwość jest dostępna tylko wówczas, jeśli administrator systemu IAH zezwolił
na jego współpracę z serwerem pocztowym.
Użytkownik ma wpływ na działanie systemu
IAH
przez
dobór
jego
parametrów
konfiguracyjnych. Należą do nich:
 język konwersacji,
 wskazanie czy każdy z odszukanych dokumentów ma zostać poprzedzony paskiem
nawigacji,
 liczba dokumentów wyświetlanych jako jedna
strona wyników,
 format wyświetlania.
Pozostałe parametry konfiguracyjne systemu są
zapisane w pliku definicyjnym IAH.DEF. Modyfikując zawartość tego pliku administrator systemu może decydować o kolejności wyświetlania
wyszukanych dokumentów (domyślnie dokumenty są wyświetlane w odwrotnym porządku
ich numerów MFN, czyli poczynając od
dokumentu najpóźniej wprowadzonego) oraz
wpływać na wygląd stron systemu, zmieniając
winietę i logo wyświetlane u góry każdej strony
lub ustalając inne kolory poszczególnych
elementów składowych strony (kolor tła i liter,
kolor paska i wyświetlanych na nim znaków).
Oprócz pliku definicyjnego IAH.DEF, który
zawiera parametry obowiązujące dla wszystkich
baz danych, w systemie IAH muszą występować
pliki definicyjne baza.DEF, które zawierają
parametry definicyjne dla wskazanej bazy danych. W poszczególnych sekcjach takiego pliku
definicyjnego są m.in. zapisywane następujące
parametry:
- ścieżki dostępu do elementów składowych
danej bazy,
- definicje sposobów dostępu słownika (w tym
nazwy przeszukiwanych pól),
- nazwy dostępnych formatów wyświetlania
oraz wskazanie formatu domyślnego.
W tym pliku znajduje się również parametr
wskazujący, czy użytkownicy bazy mogą wysyłać
wyniki wyszukiwania pocztą elektroniczną.
W systemie IAH można udostępnić do wyszukiwania w Internecie inne bazy CDS/ISIS. W
Listopad 2007
tym celu należy dla każdej bazy danych wykonać
następujące kroki:
 skopiować do odpowiednich katalogów plik
ISO z zawartością bazy danych oraz formaty
wyświetlania i tablice FST,
 wykonując odpowiedni plik poleceń utworzyć
bazę danych na podstawie pliku ISO,
 utworzyć dla tej bazy danych plik definicyjny
baza.DEF,
 zmodyfikować główną stronę systemu, dodając nową bazę danych do umieszczonego na
tej stronie wykazu baz dostępnych do przeszukiwania.
Formaty wyświetlania stosowane w systemie
IAH muszą być dostosowane do prawidłowego
funkcjonowania
w
Internecie,
a
ich
przygotowanie wymaga dobrej znajomości
języka formatowania CDS/ISIS oraz języka
HTML i jest niewątpliwie najbardziej
pracochłonną
z
wszystkich
czynności
wykonywanych w celu udostępnienia w tym systemie nowej bazy danych.
Konieczność samodzielnego przygotowania formatów wyświetlania oraz pliku definicyjnego
bazy może sprawić, że część użytkowników uzna
system IAH za mniej przyjazne narzędzie do
udostępniania własnych baz danych w Internecie
niż oprogramowanie GenISIS. Z pewnością IAH
jest narzędziem mniej uniwersalnym niż GenISIS, w którym użytkownik sam definiuje m.in.
układ formularza wyszukiwawczego, jednakże
dla osób nie mających szczególnych wymagań w
tym względzie użycie IAH będzie łatwiejsze, tu
bowiem wszystkie bazy korzystają z istniejącego
zestawu formularzy wyszukiwawczych.
Charakterystyka programów
narzędziowych CISIS
W celu przygotowywania własnych aplikacji
przetwarzających bazy danych CDS/ISIS bez
udziału samego systemu CDS/ISIS BIREME
opracowało specjalną bibliotekę funkcji w języku
programowania C. Ta biblioteka otrzymała
nazwę CISIS.
Już na początku lat 90-tych BIREME przygotowało przy użyciu tej biblioteki zestaw
programów narzędziowych umożliwiających
osobne przetwarzanie zbiorów głównych i
zbiorów odwróconych baz danych CDS/ISIS. Te
programy są znane pod nazwą programów
narzędziowych CISIS (ang. CISIS utilities). Przy
ich użyciu można tworzyć aplikacje, które
przetwarzają bazy CDS/ISIS nie korzystając z
plików definiujących strukturę tych baz. Poza
wykonywaniem wszystkich najważniejszych
operacji
systemu
CDS/ISIS,
programy
narzędziowe umożliwiają wykonanie wielu
innych czynności niedostępnych w tym systemie,
takich jak wygenerowanie dla jednego zbioru
głównego kilku zbiorów odwróconych, sporządzenie zestawień statystycznych fraz występujących w rekordach czy zmiana wyróżników pól
(niektóre z tych czynności są dostępne w programie narzędziowym SWK, który został udostępniony w 2004 roku). Programy CISIS ułatwiają
również wykonanie takich operacji jak korekta
błędów ortograficznych w bazach danych
CDS/ISIS.
Programy narzędziowe CISIS powstały, gdy
komputery osobiste były wyposażone w system
operacyjny MS DOS, w którym wszystkie programy są wywoływane z wiersza poleceń. W ten
sam sposób te programy są wykonywane również
w systemie operacyjnym Windows. Użyteczność
tych programów powoduje jednak, że wielu osobom nie przeszkadza ten przestarzały sposób
wywoływania programów oraz sterowania ich
działaniem i dlatego to narzędzie ma wciąż
swych wiernych użytkowników.
Na początku 2007 roku BIREME udostępniło na
witrynie internetowej pod adresem
http://bvsmodelo.bvsalud.org/php/level.php?lang=en
&component=31&item=1
wydanie 5.2 programów narzędziowych
CISIS. To wydanie CISIS jest dostępne w czterech wersjach, które różnią się od siebie długością terminów zbioru odwróconego oraz maksymalną wielkością rekordów. Podstawową wersją
jest wersja 10/30, w której terminy krótkie
zbioru odwróconego mają długość do 10
znaków, a terminy długie do 30 znaków.
Pozostałe wersje to:
 wersja 16/60, w której ograniczenia długości
tych terminów to odpowiednio 16 i 60 znaków
(zbiory odwrócone o takiej budowie są przetwarzane przez rozszerzone wersje systemu
WinISIS),
 wersja LIND, która również obsługuje słowniki z terminami o długości do 16 i 60 znaków,
ale zapewnia szybsze wyszukiwanie za cenę
rezygnacji
z
możliwości
stosowania
operatorów położenia i wskazywania pola, z
którego pochodzi dany termin (w tej wersji
stosowane są zbiory odwrócone o uproszczonej
budowie, nie zawierające informacji o polu, z
którego pobrano termin, ani o położeniu tego
terminu w tym polu);
 wersja FFI, która umożliwia przechowywanie
w zbiorze głównym rekordów o rozmiarze do 1
MB (w pozostałych wersjach ten rozmiar to 32
Strona 5
Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS
KB) i obsługuje słowniki z terminami o długości do 16 i 60 znaków.
Z tych wszystkich wersji jedynie wersja 10/30
obsługuje bazy danych, które mogą być przetwarzane przez standardowe wersje systemu
CDS/ISIS.
Każdy z programów narzędziowych CISIS ma
zdefiniowany zestaw parametrów, których użycie
powoduje wykonanie określonych działań przez
ten program. Nazwy większości parametrów
mają mnemoniczne znaczenie w języku
angielskim, ale znaczenie wielu z nich powinno
być
również
zrozumiałe
dla
polskich
użytkowników systemu CDS/ISIS. Przykładowo,
przy użyciu parametru pft wskazuje się format
wyświetlania, parametr fst służy do wskazania
tablicy FST, a przy użyciu parametru iso
wskazuje się plik w formacie ISO 2709.
Wywołanie programu bez parametrów powoduje
wyprowadzenie na ekran krótkiego opisu jego
działania w języku angielskim, który zawiera
m.in. nazwy parametrów obowiązkowych i
opcjonalnych.
W poleceniu wykonania programu kolejne parametry są oddzielane od siebie spacjami i dlatego
parametry zawierające spacje oraz inne znaki
specjalne (takie jak nawiasy kątowe, symbol \
itd.) powinny zostać ujęte w cudzysłowy. Poniższy przykład przedstawia wykonanie programu
MX z trzema parametrami (nazwa bazy danych,
wyrażenie
wyszukiwawcze
i
format
wyświetlania)
mx \cisis\databases\cds
"plants*water" "pft=mfn/'Tyt:
'v24/(|Aut: |v70/)"
którego rezultatem jest wykonanie w bazie CDS
zapytania wyszukiwawczego plants*water i wyświetlenie wyników zgodnie z następującym formatem:
mfn/'Tyt: 'v24/(|Aut: |v70/)
Główny program narzędziowy CISIS nosi nazwę
MX. Oprócz tego podstawowego narzędzia ogólnego przeznaczenia w skład zestawu CISIS
wchodzi kilkanaście specjalistycznych programów do obsługi zbioru głównego i zbioru odwróconego. Program MX i pozostałe programy
CISIS zostały opisane w dwóch następnych artykułach tego biuletynu. Wyczerpujące informacje
na temat narzędzi CISIS zawiera najnowsza
publikacji z serii Informacja Naukowa, która
nosi tytuł "Zestaw programów narzędziowych
CISIS wersja 5.2. Dokumentacja użytkowa".
Strona 6
MX - główny program
narzędziowy CISIS
Program MX jest najczęściej używanym programem narzędziowym CISIS. Jest on programem
ogólnego przeznaczenia, który pozwala tworzyć
nowe bazy danych CDS/ISIS oraz przetwarzać
bazy istniejące. Tak jak inne programy CISIS,
program MX nie korzysta z plików definiujących
strukturę baz danych, a działa bezpośrednio na
zbiorze głównym i zbiorze odwróconym oraz w
razie potrzeby używa formaty, tablice FST i inne
pliki, takie jak np. plik słów nieznaczących.
Program MX działa na wejściowym zbiorze danych. Zazwyczaj zbiorem tym jest plik główny
bazy CDS/ISIS, ale może on także czytać pliki w
formacie ISO 2709 lub pliki tekstowe, w których
pola są oddzielone separatorami, i zapisywać
odczytane rekordy jako rekordy zbioru głównego
przetwarzanej
bazy
danych.
Jeśli
nie
ograniczono zbioru obsługiwanych rekordów,
program przetwarza wszystkie rekordy zbioru
wejściowego. Zbiór rekordów można ograniczyć
do rekordów:
- znalezionych w wyniku wyszukiwania w
zbiorze odwróconym lub wyszukiwania
pełnotekstowego,
- wskazanych za pomocą zakresu numerów
i/lub liczby przetwarzanych rekordów,
- wybranych w pętli, np. rekordy o numerach
5, 10, 15, 20 itd.
Typowe zastosowanie programu MX to przetworzenie rekordów wejściowej bazy danych w określony sposób i zapisanie zmodyfikowanej
zawartości tej bazy w pliku wyjściowym. Tak jak
w przypadku pliku wejściowego, plik wyjściowy
może być plikiem głównym bazy CDS/ISIS, plikiem w formacie ISO 2709 lub plikiem tekstowym zawierającym pola oddzielone separatorami
(taki plik może być czytany przez inne
programy, takie jak MS Excel).
Jeśli zbiorem wyjściowym jest plik główny bazy
danych CDS/ISIS, zmodyfikowane rekordy
mogą zostać zapisane w tej bazie w następujący
sposób:
 zmodyfikowane rekordy zastępują dotychczasową zawartość bazy,
 zmodyfikowane rekordy są dopisywane na
końcu bazy,
 zmodyfikowane rekordy są zapisywane tylko
wówczas, gdy w bazie nie istnieją rekordy o
numerach przypisanych rekordom wejściowym.
Oprócz tego możliwa jest tzw. aktualizacja pól.
Podczas tej operacji w wyjściowej bazie danych
Listopad 2007
jest odnajdywany rekord o numerze pokrywającym się z numerem bieżącego rekordu i zawartość wszystkich pól tego rekordu, których wyróżniki pokrywają się z wyróżnikami rekordu bieżącego, jest zastępowana zawartością odpowiednich pól pobraną z rekordu bieżącego.
Podstawowym narzędziem służącym do modyfikacji zawartości rekordów jest znany z ISISDLL,
WWWISIS oraz WinISIS język aktualizacji
pól. Język ten jest narzędziem, które zostało
opracowane dla potrzeb interfejsu CISIS. W programie MX można użyć poleceń tego języka np.
w celu usunięcia lub dodania pól albo zmiany
ich zawartości. Również język formatowania
stosowany w aplikacjach WWWISIS jest w
istocie językiem formatowania CISIS. Język
ten poza wszystkimi poleceniami formatującymi
systemu CDS/ISIS dla DOS zawiera niektóre
polecenia dostępne w systemie WinISIS
(niektóre z nich są jednak zapisywane w
odmienny sposób), a także kilka poleceń, które
są dostępne tylko w tym języku.
Inny sposób zmiany zawartości przetwarzanej
bazy danych to globalne zastępowanie tekstów w
polach rekordów w wyniku wykonania tzw. konwersji Gizmo. Poszczególne reguły zamiany tekstów są zapisywane w osobnych rekordach specjalnej bazy danych, a globalna zmiana zawartości może dotyczyć wszystkich pól lub tylko pól o
podanych wyróżnikach.
Możliwe jest także wykonanie operacji łączenia
rekordów, czyli dołączenie do przetwarzanego
rekordu pól pobranych z innego rekordu innej
lub tej samej bazy danych, przy czym dołączany
rekord zostanie wskazany przy użyciu jego
numeru MFN lub za pośrednictwem terminu ze
zbioru odwróconego. W ten sposób można na
przykład uzupełnić zapisane w rekordach bazy
bibliograficznej nazwiska autorów dodatkowymi
danymi o tych autorach pobranymi z bazy haseł
wzorcowych zawierającej znormalizowane opisy
autorów.
Gdy nie jest wymagane pobranie dodatkowych
danych, lecz wyłącznie stwierdzenie czy
przetwarzany
rekord
zawiera
terminy
występujące
w
zbiorze
odwróconym
wykorzystywanym
jako
kartoteka
haseł
wzorcowych,
można
wykonać
operację
porównania zawartości rekordu ze zbiorem
odwróconym. W ten sposób można na przykład
sporządzić wykaz wszystkich rekordów, w
których zapisano nazwiska autorów, które nie
występują w bazie haseł wzorcowych zawierającej znormalizowane opisy autorów.
Program MX może dołączyć do każdego rekordu
wejściowego dodatkowe pola zawierające terminy utworzone w wyniku wykonania działań
zapisanych w tablicy FST na zawartości tego
rekordu poddanej przetwarzaniu (możliwe jest
na przykład zapisanie w postaci wystąpień
nowego pola wyrazów pobranych z pola Nazwa).
Tablica FST może zostać także użyta przez
program w celu utworzenia na podstawie
przetwarzanych rekordów zbiorów pośrednich
zawierających terminy wyszukiwawcze, które po
posortowaniu mogą posłużyć do utworzenia
zbioru odwróconego. Zbiór pośredni utworzony
przez program MX może mieć prostszy format
niż taki sam zbiór utworzony w systemie
CDS/ISIS, co pozwala osiągnąć
szybsze
wyszukiwanie za cenę rezygnacji z pewnych
operacji dostępnych w standardowym języku
wyszukiwawczym
(możliwość
stosowania
podczas wyszukiwania operatorów położenia i
wskazywania pola, z którego pochodzi dany
termin).
Tak jak inne programy narzędziowe CISIS, program MX jest przystosowany do przetwarzania
kilku zbiorów odwróconych utworzonych dla
jednej bazy danych. Przy jego pomocy można dla
tego samego zbioru głównego utworzyć różne
zbiory odwrócone (identyfikowane przy pomocy
nazwy), a następnie poddać przetwarzaniu konkretny
zbiór
odwrócony.
Nieznaczna
modyfikacja składni pozwala nawet na
odwoływanie się w tym jednym wyrażeniu
wyszukiwawczym do terminów pochodzących z
różnych zbiorów odwróconych. Program może
również
potraktować
terminy
zbioru
odwróconego jako dane wejściowe i utworzyć
osobny rekord wejściowy dla każdego
odczytanego terminu. W ten sposób może zostać
na przykład utworzona baza danych zawierająca
terminy zbioru odwróconego.
Jedynym obowiązkowym parametrem programu
MX jest parametr wskazujący zbiór wejściowy.
Użycie tylko tego parametru powoduje wyświetlenie rekordów wskazanej bazy bez formatowania, co daje efekt podobny do użycia formatu
ALL w oknie bazy danych systemu WinISIS.
Standardowo program zatrzymuje się po przetworzeniu każdego rekordu, oczekując na interwencję użytkownika, który może polecić przerwanie pracy programu. Użycie parametru now
powoduje przetworzenie wszystkich rekordów
bez interwencji użytkownika, co jest użyteczne
np. wówczas gdy program jest wykonywany w
trybie wsadowym. W takim przypadku jest z reguły wykorzystywany także parametr -all, który
Strona 7
Biuletyn Klubu Użytkowników Pakietu Mikro CDS/ISIS
powoduje że na ekran nie są wyprowadzone
żadne informacje o przetwarzanych rekordach.
W typowym przypadku program MX jest wywoływany z kilkoma parametrami i wówczas parametr wskazujący zbiór wejściowy musi być wystąpić jako pierwszy. Program zakłada, że w
wierszu poleceń każdy następny ciąg znaków,
który nie rozpoczyna się od zarezerwowanego
identyfikatora parametru jest wyrażeniem
wyszukiwawczym. Stosując te reguły do
polecenia:
mx \cisis\databases\cds
"plants*water" "pft=mfn/'Tyt:
'v24/(|Aut: |v70/)"
Z tego powodu programy te zostały podzielone
na programy narzędziowe do obsługi zbioru
głównego i programy narzędziowe do obsługi
zbioru odwróconego. W dalszej części tego artykułu opisano przeznaczenie najczęściej stosowanych z tych programów.
Do najważniejszych programów do obsługi
zbioru głównego należą:
analizuje rekordy wskazanego
MXF0
zbioru głównego i dostarcza informacji o występujących polach i
zawartych w nich znakach;
MXTB
zlicza frazy występujące w polach, obliczając np. liczbę wystąpień wszystkich autorów,
deskryptorów, kombinacji Autor
– Tytuł itp.; wynikiem działania
tego programu jest zbiór główny
zawierający osobne rekordy dla
wszystkich odnalezionych fraz, w
którym zapisana jest częstość
występowania tych fraz;
MXCP
kopiuje rekordy z wejściowego
zbioru głównego do wyjściowego
zbioru głównego, przy czym dane
wejściowe przed skopiowaniem
mogą podlegać przekształceniom,
takim jak globalne zmiany
zawartości lub usunięcie spacji na
początku i końcu pól, usunięcie
znaków niewidocznych oraz znaków interpunkcyjnych
kończących pole; program ten
może także przekształcać pole
zawierające frazy oddzielone
pewnym ogranicznikiem w pole
powtarzalne, usuwać pola
wejściowe o określonych
wyróżnikach oraz odtwarzać
rekordy usunięte z wejściowego
zbioru głównego;
MSRT
porządkuje rekordy zbioru głównego według rosnących wartości
kluczy otrzymanych w wyniku
wykonania formatu na zawartości
tych rekordów;
RETAG
ten program wykonuje dwie funkcje: zmienia wyróżniki pól występujących w zbiorze głównym
zgodnie ze schematem zamiany
zapisanym w specjalnej tablicy i
usuwa blokady rekordów tego
zbioru głównego;
CTLMFN
wyświetla rekord sterujący zbioru
głównego oraz umożliwia zmianę
program stwierdza najpierw, że zbiorem wejściowym jest baza CDS umieszczona w katalogu
\cisis\databases. Parametr plants*water nie zaczyna się od identyfikatora i dlatego jest interpretowany jako zapytanie wyszukiwawcze, natomiast ostatni parametr jest na podstawie
zawartego w nim identyfikatora pft traktowany
jako format wyświetlania.
W przypadku wielu aplikacji programu MX
liczba parametrów, przy pomocy których użytkownik steruje działaniem programu, jest zbyt
duża, by wszystkie parametry zapisać w wierszu
poleceń. Można wówczas większość parametrów
zapisać pliku parametrów i w wierszu poleceń
podać nazwę tego pliku jako wartość parametru
in. Oprócz tego pliku parametrów, program MX
może korzystać z pliku parametrów CISIS,
nazywanego skrótowo plikiem CIPAR, który w
tym programie pełni tę samą rolę co pliki parametrów SYSPAR.PAR i baza.PAR w systemie
CDS/ISIS. Oczywiście poszczególne parametry
są zapisywane w inny sposób, ale korzystanie z
pliku CIPAR nie powinno stwarzać żadnych problemów użytkownikom oprogramowania WWWISIS, bo w wykorzystywanych przez to oprogramowanie plikach CIPAR parametry zapisuje się
w ten sam sposób co w plikach parametrów programu MX.
Pozostałe programy narzędziowe
CISIS
W skład zestawu programów CISIS oprócz
omówionego w poprzednim artykule programu
MX wchodzi kilkanaście innych programów
narzędziowych. W odróżnieniu od programu
MX, który może w rozmaity sposób przetwarzać
zbiory główne i zbiory odwrócone CDS/ISIS,
każdy z pozostałych programów narzędziowych
CISIS zazwyczaj realizuje określoną funkcję
albo na zbiorze głównym albo na zbiorze
odwróconym bazy CDS/ISIS.
Strona 8
Listopad 2007
MKXRF
I2ID
ID2I
jego zawartości; dzięki temu ten
program może być użyty do odzyskania usuniętej nieopatrznie
zawartości zbioru głównego;
Stowarzyszenie LAMBDA
ul. Hoża 50/40
00-682 Warszawa
Osoba odpowiedzialna: Inga Kostrzewa
program ten czyta plik baza.MST
i tworzy na jego podstawie plik
baza.XRF; może on zostać użyty
do odtworzenia w zbiorze głównym wszystkich rekordów usuniętych logicznie;
Instytucja Filmowa SILESIA-FILM
ul. Górnicza 5
40-009 Katowice
Osoba odpowiedzialna: Aneta Ozorek
program I2ID czyta zbiór główny
i tworzy na jego podstawie zbiór
tekstowy, którego zawartość
można poddać edycji (np. w celu
zbadania poprawności pisowni
wyrazów za pomocą edytora tekstowego); jest on używany w
parze z programem ID2I, który
wykonuje czynność odwrotną:
czyta zbiór tekstowy i przekształca zawarte w nim dane w
rekordy zbioru głównego.
AKA-SOFT Artur Kucharski
ul. Lanciego 7A m. 4
02-792 Warszawa
Kolegium Miejskie
Centrum Kształcenia Ustawicznego
ul. Raduńska 21
81-057 Gdynia
Osoba odpowiedzialna: Małgorzata Medycka
Do najważniejszych programów do obsługi
zbioru odwróconego należą:
IFKEYS wyświetla wykaz terminów zbioru
odwróconego wraz z liczbą odsyłaczy do tych terminów (można
wskazać pola, z których zostały
pobrane wyświetlane terminy);
IFLOAD
tworzy zgodnie z zadanymi parametrami zbiór odwrócony na podstawie wskazanego zbioru pośredniego;
MYS
sortuje zbiór pośredni, który zostanie użyty do utworzenia zbioru
odwróconego.
Nowi użytkownicy
W celu ułatwienia nawiązywania kontaktów między polskimi użytkownikami pakietu Mikro
CDS/ISIS prezentujemy poniżej listę tych użytkowników, którzy uzyskali licencję na korzystanie z pakietu od listopada 2006 roku do
października 2007 roku. Dane użytkowników
zostały
uporządkowane
w
kolejności
otrzymywania licencji.
PEDAGOGIUM Wyższa Szkoła Pedagogiki
Resocjalizacyjnej w Warszawie
Marszałkowska 115
00-102 Warszawa
Osoba odpowiedzialna: Anna Kaczyńska
Strona 9