E-WŁĄCZENIE W PROCES PRZEPŁYWU ELEKTRONICZNEJ
Transkrypt
E-WŁĄCZENIE W PROCES PRZEPŁYWU ELEKTRONICZNEJ
Seria III: e-Publikacje Instytutu INiB, Uniwersytet Jagielloński. Red. Maria Kocójowa Nr 2. E-WŁĄCZENIE CZY E-WYOBCOWANIE? 2006 Tomasz Borkowski* Ośrodek Przetwarzania Informacji Uniwersytet Warszawski E-WŁĄCZENIE W PROCES PRZEPŁYWU ELEKTRONICZNEJ INFORMACJI TERMINOLOGICZNEJ. EUROTERMBANK Z PERSPEKTYWY POLSKI [E-INCLUSION INTO THE FLOW OF ELECTRONIC TERMINOLOGICAL INFORMATION. EUROTERMBANK FROM POLISH PERSPECTIVE] Abstrakt: Zła jakość zasobów terminologii w nowych krajach członkowskich UE powoduje ich e-wyobcowanie uniemożliwiając skuteczną komunikację międzynarodową w Europie. EuroTermBank ma być ogólnoeuropejskim publicznie dostępnym bankiem terminologicznym zawierającym dane z różnych zasobów, stworzonym przy wykorzystaniu nowoczesnych technologii. Narzędzie to pozwoli na sprawny przepływ elektronicznej informacji terminologicznej służący rozpowszechnieniu tych zasobów. To umożliwi e-włączenie społeczeństw krajów nowoprzyjętych. BAZY DANYCH – EUROTERMBANK – e-WŁĄCZENIE – TERMINOLOGIA – UNIA EUROPEJSKA Abstract: Poor quality of terminological resources in new member states of the European Union causes their alienation and makes the effective international communication in Europe hardly possible. Created with the help of modern technologies EuroTermBank is supposed to be an all-European, publicly accessible terminological bank containing data from various resources. This tool will make the flow of electronic terminological information very efficient and this way will serve better dissemination of such resources facilitating e-inclusion of recently admitted members of the European Union. DATABASES – e-INCLUSION – EUROPEAN UNION – EUROTERMBANK – TERMINOLOGY * * * Przesłanki dla rozpoczęcia prac w ramach EuroTermBanku Obecnie istnieje konieczność sprostania wymogom rosnącej globalizacji powodującej n a t ę ż o n ą k o m u n i k a c j ę m i ę d z y n a r o d o w ą , a więc i wielojęzyczną. S k u t e c z n o ś ć t a k i e j k o m u n i k a c j i zależy bezpośrednio od j a k o ś c i z a s o b ó w t e r m i n o l o g i i . Niestety, obecnie w nowych krajach członkowskich Unii Europejskiej obserwuje się znaczne rozproszenie zbiorów terminologicznych w różnych instytucjach, a także pojęciową niespójność i brak koordynacji przy opracowywaniu terminologii. Należy * Mgr TOMASZ BORKOWSKI, absolwent Instytutu Lingwistyki Stosowanej na Wydziale Lingwistyki Stosowanej i Filologii Wschodniosłowiańskich, Uniwersytet Warszawski; główny specjalista w Ośrodku Przetwarzania Informacji. Autor m.in.: (2006 w druku) Mikrosieci semantyczno-normatywne jako „matryca” porównawcza w tłumaczeniu prawniczym w kontekście harmonizacji prawa. Adres elektr.: [email protected] 71 Seria III: e-Publikacje Instytutu INiB, Uniwersytet Jagielloński. Red. Maria Kocójowa Nr 2. E-WŁĄCZENIE CZY E-WYOBCOWANIE? 2006 również podkreślić w tym kontekście wysoką n i e k o m p a t y b i l n o ś ć s t r u k t u r a l n ą i t e c h n i c z n ą z a s o b ó w . Ta sytuacja zdecydowanie nie sprzyja sprawnemu porozumiewaniu się w kontekście międzynarodowym i wobec tego świadczy o dotychczasowym e - w y o b c o w a n i u społeczeństw nowych krajów członkowskich Unii. EuroTermBank Cel przedsięwzięcia EuroTermBank Odpowiedzią na opisany stan rzeczy było rozpoczęcie prac nad przedsięwzięciem, którego pełna nazwa, zarazem ogólnie określająca jego cel, brzmi: Collection of Pan-European Terminology Resources through Cooperation of Terminology institutions [Gromadzenie ogólnoeuropejskich zasobów terminologii poprzez współpracę organizacji terminologicznych], a które skrótowo określane jest właśnie jako EuroTermBank (ETB). Ściślej rzecz ujmując, celem przedsięwzięcia jest stworzenie o g ó l n i e d o s t ę p n e g o w i e l o j ę z y c z n e g o c e n t r a l n e g o i n t e r n e t o w e g o b a n k u t e r m i n o l o g i c z n e g o , czyli z b i o r u e l e k t r o n i c z n y c h i n f o r m a c j i t e r m i n o l o g i c z n y c h , pod nazwą EuroTermBank, poprzez e l e k t r o n i c z n ą i n t e g r a c j ę z a s o b ó w t e r m i n o l o g i c z n y c h różnych organizacji. Integracja zasobów w ramach ETB zakłada kolejno: a) stworzenie odpowiedniej metodologii harmonizacji prac dotyczących przygotowywania terminologii w nowych krajach członkowskich; b) harmonizację struktury danych terminologicznych w zbiorach będących w posiadaniu poszczególnych partnerów i ujednolicenie formatów ich zapisu; c) połączenie tych danych w zbiór ETB i ich późniejszą aktualizację na podstawie mechanizmów i procedur wymiany stworzonych w procesie opisanym pod literą „b”. Dzięki stworzeniu specjalnego interfejsu, bank ten ma również umożliwiać dostęp do innych istniejących banków terminologicznych w Unii Europejskiej (zewnętrznych). Podstawowa idea przedsięwzięcia – powszechny dostęp do informacji elektronicznych zgromadzonych w ETB dla wszystkich – jest przejawem chęci aktywnego działania na rzecz interakcji ze społeczeństwami nowych krajów członkowskich poprzez usprawnienie praktyki w zakresie wykorzystania nowoczesnych technologii informacyjnych i komunikacyjnych na rzecz skutecznego p r z e p ł y w u e l e k t r o n i c z n y c h i n f o r m a c j i t e r m i n o l o g i c z n y c h . Ramy organizacyjne ETB Przedsięwzięcie jest realizowane w ramach programu Komisji Europejskiej noszącego nazwę e C o n t e n t , którego celem jest pomoc w tworzeniu, wykorzystywaniu i dystrybucji treści cyfrowych, a także promocja zróżnicowania językowego i kulturowego w globalnej sieci internetowej. Treści cyfrowe rozumiane są tu jako informacje publikowane lub zamieszczane na dowolnej platformie internetowej, począwszy od tradycyjnych stron www, poprzez komunikację bezprzewodową, aż po nowoczesne interaktywne rozwiązania internetowe. EuroTermBank realizowany jest przy współpracy partnerów, będących liderami w zakresie informacji elektronicznej, pochodzących z następujących krajów: 72 Seria III: e-Publikacje Instytutu INiB, Uniwersytet Jagielloński. Red. Maria Kocójowa Nr 2. E-WŁĄCZENIE CZY E-WYOBCOWANIE? 2006 1. Łotwa: • koordynator projektu – firma Tilde: odpowiada za kierowanie przedsięwzięciem, opracowanie i realizację systemu informatycznego dla EuroTermBanku; • Komisja Terminologiczna Łotewskiej Akademii Nauk (LAS) – odpowiada za selekcję, pozyskanie i przetworzenie zasobów terminologii zebranych przez partnerów w poszczególnych krajach, a także za gromadzenie zasobów krajowych. 2. Niemcy: Instytut Zarządzania Informacją (IMM) – odpowiada za tworzenie sieci organizacji terminologicznych oraz opracowanie ram organizacyjnych i prawnych ETB. 3. Dania: Centrum Technologii Językowych (CST) – odpowiedzialne za tworzenie sieci organizacji terminologicznych oraz opracowanie metodologii i norm dotyczących stworzenia banku. 4. Litwa: Instytut Języka Litewskiego (LKI) – odpowiedzialny za kwestie promowania, rozpowszechniania ETB, marketingu, oraz za stworzenie planów korzystania z zasobów ETB; również za gromadzenie zasobów krajowych. 5. Węgry: firma Morphologic – odpowiada za analizę wymogów, projekt systemu ETB i zebranie zasobów krajowych. 6. Estonia: Uniwersytet w Tartu (TU) – odpowiada za ocenę wdrożonego systemu w wersji roboczej z próbką danych i usprawnienia w nim, a także zebranie krajowych zasobów terminologii. 7. Polska: Ośrodek Przetwarzania Informacji (OPI) – odpowiada za rozeznanie i zebranie zasobów krajowych, oraz propagowanie ETB na poziomie krajowym. Idea współpracy partnerów w zakresie stworzenia EuroTermBanku polega na współdziałaniu w ramach sieci organizacji terminologicznych (twórców i posiadaczy zasobów terminologicznych) zarówno na poziomie krajowym, jak i międzynarodowym, służącym harmonizacji, ujednolicaniu, integracji i rozpowszechnianiu zbiorów. Ma temu sprzyjać przeniesienie doświadczeń w zakresie tworzenia i funkcjonowania innych sieci terminologicznych w ramach Unii Europejskiej. Jeśli chodzi o poziom krajowy, każdy z partnerów z nowych krajów członkowskich ma dodatkowo za zadanie zebrać w swoim kraju jak największą liczbę zasobów terminologicznych, które nadają się do przetworzenia, tak, aby w efekcie EuroTermBank obejmował 500 000 haseł terminologicznych. Szerzej zajmę się kwestią gromadzenia zbiorów na poziomie krajowym opisując w szczegółach perspektywę Polski. Czas przewidziany na realizację projektu to 2 lata (2005-2006). Proces tworzenia ETB Działania zaplanowane w zakresie realizacji ETB określone są w tzw. workpackages (pakietach zadań). Kolejne spotkania partnerów pozwalają na ocenę zaawansowania tych prac oraz wyznaczanie nowych zadań dla partnerów, dzięki czemu proces realizacji przedsięwzięcia może przebiegać sprawnie i terminowo. Podsumowanie wykonania zadań zawarte jest w dokumentach końcowych zredagowanych przez poszczególnych partnerów projektu EuroTermBank odpowiedzialnych za daną kwestię. W ten sposób dokumenty te tworzą metodologiczne, techniczne i prawne ramy przedsięwzięcia pozwalające na stworzenie elektronicznych informacji terminologicznych wysokiej jakości i zagwarantowania ich sprawnego 73 Seria III: e-Publikacje Instytutu INiB, Uniwersytet Jagielloński. Red. Maria Kocójowa Nr 2. E-WŁĄCZENIE CZY E-WYOBCOWANIE? 2006 przepływu dzięki właściwemu wykorzystaniu technologii informacyjnych i komunikacyjnych. Jednocześnie każdy z partnerów stara się w swoim kraju w jak największym stopniu informować o projekcie, np. poprzez seminaria, zamieszczanie informacji o ETB w internecie, publikację artykułów. Wszystkie te działania mają na celu zwrócenie uwagi społecznej na tę cenną inicjatywę. Polski wkład w tworzenie EuroTermBanku Partnerem ETB ze strony Polski jest Ośrodek Przetwarzania Informacji. Na tej instytucji spoczywa obowiązek dokładania wszelkich starań na rzecz włączenia jak największej ilości dobrej jakości informacji z polskich zasobów terminologicznych w europejski obieg elektroniczny, i tym samym odegrać istotną rolę w procesie e - I n c l u s i o n . OPI zidentyfikował 32 zasoby terminologicznych z różnych dziedzin mogących docelowo znaleźć się w ETB. Oto one: 1. Illustrated Dictionary of Informatics - [email protected] 2. English-Polish Dictionary of TV Advertising [email protected] 3. Lexicon of New Names and Concepts in Biochemistry and Molecullar Biology [email protected] 4. Dictionary of Agricultural Engineering in Six Languages [email protected] 5. Dictionary of Metallurgical Terminology [email protected] 6. Mining Lexicon [email protected] 7. Polish-English Mathematical Dictionary [email protected] 8. Dictionary of Literary Terms [email protected] 9. Lexicon of the European Union [email protected] 10. Netopedia. Encyclopedia of Internet and New Technologies On-line 11. Polish-English and English-Polish Dictionary in the Range of Footwera Technology [email protected] 12. Lexicon of Marketing Terms [email protected] 13. Dictionary of Quantitative Methods Terms [email protected] 14. Lexicon for Telecomputer Scientist [email protected] 15. Encyclopedia of Ecology and Agriculture [email protected] 16. OSTEN - Open Dictionary of Scientific Terminology [email protected] 17. Lexicon of Medical Diagnosises [email protected] 18. Business Lexicon [email protected] 19. Large Encyclopedia of Internet and Telecommunications [email protected] 20. Hydrogeological Dictionary [email protected] 21. BTInfo Specialist Dictionary [email protected] 22. Słownik mian anatomicznych [email protected] 23. STEBIS - Thesaurus of Law [email protected] 24. PolTerm [email protected] 74 Seria III: e-Publikacje Instytutu INiB, Uniwersytet Jagielloński. Red. Maria Kocójowa Nr 2. E-WŁĄCZENIE CZY E-WYOBCOWANIE? 2006 25. Glosariusz terminów dotyczących kontroli i audytu w administracji publicznej [email protected] 26. Tezaurus transportu TEZ [email protected] 27. Angielsko-polski słownik terminologiczny programów rozwoju regionalnego [email protected] 28. Helionica - sieciowa encyklopedia informatyki [email protected] 29. Glosariusz terminologii związanej z aplikacjami informatycznymi dla przedsiębiorstw [email protected] 30. Baza danych terminologicznych UKIE http://www1.ukie.gov.pl/dtt.nsf 31. System baz Sejmu: http://wwww.wydawnictwo.sejm.gov.pl/serie/microtezaurusy.html 32. Bank terminologii PKN (niedostępny w internecie) Chciałbym pokrótce opisać cztery największe polskie zbiory terminologiczne spośród nich. Bank terminologii PKN Jednymi z podstawowych źródeł terminologii, jakie partnerzy ze wszystkich krajów uczestniczących w przedsięwzięciu uznali za warte wprowadzenia do ETB w celu ich wielojęzycznego zestawienia, są normy ISO w językach tych krajów. W Polsce organizacją zajmującą się adaptacją norm ISO z języka angielskiego jest Polski Komitet Normalizacyjny. Polskie normy noszą oznaczenie „PN-ISO”. Na ich podstawie powstał bank terminologii zawierający 77 tysięcy haseł dotyczących terminów wyekstrahowanych z polskich norm. Bank zawiera cenne informacje hasłowe dla każdego terminu, m.in. definicję i ekwiwalenty obcojęzyczne. Oprócz niego istnieje zbiór słowników stworzonych na podstawie norm. Baza danych terminologicznych UKIE Baza danych UKIE tworzona jest w Departamencie Tłumaczeń i obejmuje hasła zawierające terminy zebrane podczas tłumaczeń aktów prawnych Unii Europejskiej. Zawiera m.in. hasła pochodzące z traktatów założycielskich, akcesyjnych, a także glosariuszy Komisji Europejskiej, m.in. „Glosariusz terminów dotyczących rynku wewnętrznego”, „Glosariusz terminów Traktatu o Unii Europejskiej”, „Ekonomia, finanse, pieniądz”, oraz wewnętrznych publikacji Departamentu Tłumaczeń: „Raport Okresowy Komisji Europejskiej” i „Glosariusz terminów Układu Europejskiego”. Wszystkie hasła są dostępne w języku angielskim i polskim, niektóre ponadto w języku francuskim i niemieckim. Ilość haseł: 9400. Baza jest ogólnie dostępna w internecie. System baz Sejmu – STEBIS STEBIS jest systemem tezaurusów Biblioteki Sejmowej wykorzystywanym do indeksowania i wyszukiwania dokumentów (książek, artykułów z wybranych czasopism, audycji radiowo-telewizyjnych itp.) znajdujących się w bazach danych Biblioteki (system ALEPH-BS). W 1998 r. rozpoczęto publikację mikrotezaurusów STEBIS. Tezaurusy STEBIS są tezaurusami wielojęzycznymi, polskie terminy wyszukiwawcze posiadają odpowiedniki w jęz. angielskim, francuskim i niemieckim. Każdy mikrotezaurus zaopatrzony jest w systematyczny (hierarchiczny) i alfabetyczny wykaz terminów wyszukiwawczych (wraz z relacjami między nimi) oraz w wyka- 75 Seria III: e-Publikacje Instytutu INiB, Uniwersytet Jagielloński. Red. Maria Kocójowa Nr 2. E-WŁĄCZENIE CZY E-WYOBCOWANIE? 2006 zy pomocnicze. Do serii należą, m.in., „Nauka – mikrotezaurus”, „Praca – mikrotezaurus”, „Prawo – mikrotezaurus”. System terminologii zunifikowanej PolTerm PolTerm jest bazą terminologiczną stworzoną w Wydawnictwie TEPiS (obecna nazwa: TRANSLEGIS). Jest ona przechowywana i uaktualniana w jednym z programów wspomagających tłumaczenie (tzw. CAT). Zawiera terminy prawne wyekstrahowane z kilkudziesięciu polskich ustaw przetłumaczonych na język angielski i wciąż uaktualnianych zgodnie ze zmianami w Dzienniku Ustaw Rzeczpospolitej Polskiej. Ustawy wraz z ich tłumaczeniami tworzą dwujęzyczny korpus przechowywany na dysku komputerowym i stanowiący podstawę selekcji terminów do bazy. W tej chwili liczba haseł sięga prawie 11 000. Część bazy PolTerm w postaci glosariusza kluczowych terminów dostępna jest w internecie. Podsumowanie Sprawny przepływ profesjonalnie stworzonej elektronicznej informacji terminologicznej w jednoczącej się Europie jest strategiczny dla poprawy jakości międzynarodowej komunikacji. Poprzez harmonizację, gromadzenie i rozpowszechnianie zasobów terminologicznych projekt EuroTermBank mający na celu stworzenie publicznie dostępnego ogólnoeuropejskiego zbioru zasobów terminologii połączonego z innymi bankami terminologicznymi będzie stymulował i wspomagał rozwój informacji sektora publicznego. Pozwoli on też na ulepszenie infrastruktury lingwistycznej w nowych krajach członkowskich Unii Europejskiej, co zagwarantuje ich obywatelom lepszą jakość komunikacji również w ramach języków krajowych. Te wszystkie czynniki sprawiają, że EuroTermBank jest z pewnością jedną z e - i n i c j a t y w , których celem jest jak najszersze e - w ł ą c z e n i e społeczności Europy w proces obiegu informacji, a więc obrona społeczeństw krajów nowoprzyjętych przed a l i e n a c j ą s p o ł e c z n ą wynikającą z braku dostępu do informacji terminologicznych, co umożliwi z kolei przyspieszenie integracji, a więc dalszy rozwój Europy. Wykaz stron internetowych Strona EuroTermBanku: http://www.eurotermbank.com Strona OPI: http://www.opi.org.pl Strona Polskiego Komitetu Normalizacyjnego: http://www.pkn.pl/opkn1.htm Strona bazy danych terminologicznych UKIE: http://www1.ukie.gov.pl/dtt.nsf Strona mikrotezaurusów Wydawnictw Sejmowych: http://wwww.wydawnictwo.sejm.gov.pl/serie/microtezaurusy.html 76