Projekt EpiBaza współfinansowany przez Unię Europejską ze
Transkrypt
Projekt EpiBaza współfinansowany przez Unię Europejską ze
Opis przedmiotu zamówienia Załącznik 1 I. Zakres zamówienia Zamówienie obejmuje digitalizację biuletynów z lat 1958 - 2016 w ilości stron do zeskanowania oraz ilości pól do wprowadzenia danych zgodnie z Załącznikiem 1a do SIWZ Biuletyny. Biuletyny przeznaczone do digitalizacji – ogółem 207 sztuk w postaci zeszytów formatu A4/A5/C4 (dokładny opis poszczególnych biuletynów znajduje się w załączniku 1a), w miękkich lub twardych okładkach, klejone lub zszywane, zadrukowane dwustronnie, w stanie dobrym - bez uszkodzeń mechanicznych i zabrudzeń. Główną zawartość stanowią tabele wypełnione danymi liczbowymi oraz dodatkowo wykresy, grafiki, mapki i strony tytułowe . Adresy do przykładowych próbek biuletynów charakterystycznych dla określonych grup biuletynów są zawarte w załączniku nr 2. Biuletyny: 1. o zachorowaniach za lata 1958 – 1972 nie mogą być rozszywane, najstarsze biuletyny są drukowane na słabej jakości papierze, podczas rozkładania oraz przekładania stron w procesie digitalizacji mogą być podatne na uszkodzenia mechaniczne 2. o zachorowaniach biuletyny za lata 1973 - 1998 - po ewentualnym ich rozszyciu powinny zostać ponownie zszyte 3. o szczepieniach za lata 1975 – 1989 nie mogą być rozszywane, najstarsze biuletyny są drukowane na słabej jakości papierze, podczas rozkładania oraz przekładania stron w procesie digitalizacji mogą być podatne na uszkodzenia mechaniczne 4. o szczepieniach biuletyny za lata 1990 - 1998 - po ewentualnym ich rozszyciu powinny zostać ponownie zszyte II. Skanowanie: 1. Skanowaniu podlegają wszystkie wskazane strony biuletynów z roczników wskazanych w załączniku 1a, których sumaryczna liczba to około 5500. 2. Skanowanie biuletynów, o których mowa w pkt I ust. 1 i ust. 3 OPZ zostanie wykonane za pomocą skanera dziełowego, o formacie A3 ze światłem zimnym bez UV i IR. 3. Parametry skanowania a. format pliku: PDF scalone do jednego pliku w ramach jednego rocznika i typu (zachorowania, szczepienia) b. minimum 300 dpi c. minimum odcienie szarości d. wykorzystanie filtrów typu jasność/kontrast/balans bieli/ostrość tam gdzie zaistnieje taka potrzeba e. powstałe pliki otrzymują nazwy, które są tytułami biuletynów 4. Dostarczanie gotowych plików PDF drogą elektroniczną w miarę postępu prac zgodnie z uzgodnionym harmonogramem (punkt V) 5. Zapis i dostarczenie wszystkich skanów w formie plików PDF na płytach DVD w minimum 10 kopiach III. Digitalizacja danych 1. Digitalizacji podlegają wszystkie dane merytoryczno-numeryczne zawarte w rocznikach biuletynów wskazanych w załączniku 1a, zgodnie z podanym zakresem i ilością stron. Dane z tabel powinny być w całości przeniesione do formy elektronicznej, natomiast wykresy, grafiki, mapy oraz strony tytułowe biuletynów nie podlegają digitalizacji do formy elektronicznej. Łącznie procesowi wprowadzenia danych podlega około 1 250 000 liczb od 1 do 7 cyfrowych oraz opis tabel, w których się znajdują. Poprzez opis tabel rozumie się nazwę, opis, nagłówek kolumny, nagłówek wiersza oraz wyjaśnienia. Nagłówki kolumn i wierszy są powtarzalne w ramach jednego biuletynu (dla różnych jednostek chorobowych) jak i biuletynów z kilku lat, natomiast nazwy i opisy tabel są powtarzalne w biuletynach następujących po sobie(przez lata) Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00 2. Zachowanie jakości odzwierciedlenia danych na poziomie 100% 3. Dostarczanie zdigitalizowanych danych drogą elektroniczną sukcesywnie w miarę postępu prac zgodnie z uzgodnionym harmonogramem i formą wskazaną w ofercie celem weryfikacji przez Zamawiającego 4. Dostarczenie wszystkich zdigitalizowanych danych na płycie DVD w minimum 10 kopiach po zakończeniu prac IV. Dodatkowe wymagania odnośnie Zamówienia: 1. Digitalizacja musi odbyć się poza siedzibą Zamawiającego 2. Transport wraz z załadunkiem biuletynów z/do NIZP-PZH odbędzie się na koszt i odpowiedzialność Wykonawcy – całość materiałów Zaamwiający udostępni jednorazowo po podpisaniu umowy. 3. Przygotowanie biuletynów do digitalizacji tzn. tam gdzie to możliwe (wg pkt. I. 1.) rozszycie i ponowne zszycie 4. Wymagania ogólne dla realizacji zamówienia: Wykonawca bierze pełną odpowiedzialność za przekazane materiały oraz gwarantuje ich oddanie w niezmienionym stanie. 5. Wykonawca w celu zapewnienia wysokiej jakości pracy na każdym etapie realizacji (skanowanie, digitalizacji) zobowiązuje się do przeprowadzania wewnętrznej kontroli jakości. 6. Zamawiający zastrzega sobie prawo do przeglądania wprowadzonych danych. V. Harmonogram prac: Planowany termin rozpoczęcia prac to 3 dni od podpisania umowy a data zakończenia to 31 października 2018 r. Usługi zostaną wykonane w następujących etapach: Etap 1: Zakończenie prac związanych ze skanowaniem do 31 listopada 2017 r. Etap 2: Zakończenie prac związanych z digitalizacją biuletynów dotyczących zachorowań do 28 marca 2018 r. Etap 3: Zakończenie prac związanych z digitalizacją biuletynów dotyczących szczepień do 31 października 2018 r. VI. Procedura weryfikacji: 1. W zakresie etapu 1 Zamawiający dokona odbioru jakościowego usługi w terminie 6 miesięcy od dnia przekazania zeskanowanych materiałów. 2. W zakresie etapu 2 i etapu 3 rozpoczęcie przekazywania/udostępniania danych fragmentarycznych (pełne tablice wraz z tytułami kolumn i wierszy) do weryfikacji przez Zamawiając ego nastąpi 3 miesiące po rozpoczęciu prac w danym obszarze (skanowanie, digitalizacja biuletynów dotyczących zachorowań, digitalizacja biuletynów dotyczących szczepień) i będzie następowało sukcesywnie tj. co 3 miesiące. 3. Zamawiający będzie zgłaszał błędy na bieżąco w miarę upływu prac oraz po wykonaniu usługi w danym etapie. 4. Odbiór jakościowy etapu 2 nastąpi do dnia 31 sierpnia 2018 r., natomiast dla etapu 3 do dnia 31 stycznia 2019 r. 5. Wykonawca będzie zobowiązany do usunięcia błędów w terminie 14 dni od dnia ich zgłoszenia. 6. W przypadku gdy zgłoszone błędy nie zostaną poprawione w ww. terminie Zamawiający wzywa wykonawcę ponownie wyznaczając 3 dniowy termin na usunięcie błędów. 7. W przypadku ponownego wykrycia błędów w już raz poprawionej części odbiór jakościowy etapu (1, 2 lub 3) może nastąpić w przesunięciu o 14 dni. 8. Każde kolejne wykrycie błędów w tym samym fragmencie powoduje możliwość przesunięcia terminu odbioru o kolejne 14 dni. 9. Odbiór danego etapu będzie możliwy po usunięciu wszystkich zgłoszonych błędów. 10. Odbiór poszczególnych etapów zostanie stwierdzony protokołem odbioru etapu. VII. Gwarancja jakości 1. Wykonawca udziela gwarancji na wykonany przedmiot Umowy na okres wskazany w ofercie. 2. Okres gwarancji rozpoczyna się od dnia podpisania protokołu odbioru ostatniego etapu. Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00 3. Okres gwarancji nie może być krótszy niż 29 miesięcy i musi być podany w pełnych miesiącach. 4. W przypadku ujawnienia w okresie gwarancji wad, usterek tec hnicznych lub niezgodności z przyjętymi standardami digitalizacji, w tym skanowania, obróbki graficznej lub wprowadzenia danych Wykonawca ma obowiązek usunąć ww. wady, usterki i niezgodności na własny koszt i ryzyko, w terminie 14 dni kalendarzowych od zgłoszenia żądania usunięcia wady. Usunięcie ww. wad, usterek i niezgodności może być wykonane poprzez ponowną digitalizację obiektu na koszt i ryzyko Wykonawcy w siedzibie Zamawiającego. VIII. Format danych Docelowy format danych elektronicznych musi być zbieżny z podanym poniżej. 1. Definicja formatu danych Poniżej przestawiono strukturę, na podstawie której należy przekazać Zamawiającemu zdigitalizowane dane. Struktura składa się z następujących elementów: Key o o o o Code/ID – unikalny identyfikator Name wartość z nagłówka kolumny/wiersza Type (Row/Column) – typ – wiersz lub kolumna ParentKey Code/ID – odniesienie do nadrzędnego klucza Struktura Key ma na celu zebrane wszystkich unikalnych nagłówków tabel – dotczy to zarówno nagłówków kolumn jak i wierszy. Dodatkowo dzięki właściwości ParentKey, możliwe jest utrzymanie struktury drzewiastej – wykorzystywane np. w podwójnych nagłówkach np. kolumna Miasto dzieli się na trzy podkolumny – Mężczyźni, Kobiety oraz Ogółem. Poszczególne wartości Key powinny był współdzielone pomiędzy różnymi tabelami, w różnych biuletynach. Bulletin: o Code/ID – unikalny identyfikator o Year – rok biuletynu o Name – nazwa biuletynu o ISSN – numer ISSN o Type (Epi/Vacc) – typ biuletynu (Epi – o zachorowaniach, Vacc – o szczepieniach) Struktura Bulletin ma na celu zebrane wszystkich biuletynów, bez względu na tym w jedną unikalną kolekcję o uniwersalnej formie. Table: o o o o Code/ID – unikalny identyfikator Bulletin Code/ID – odniesienie się do biuletynu, w którym znajduje się tabela Name – nazwa tabeli Description – opis tabeli Struktura Table ma na celu zebrane wszystkich tabel w jedną kolekcję, bez względu, z którego biuletynu pochodzi w jedną uniwersalną formę. TableComment: o Code/ID – unikalny identyfikator o Table Code/ID – odniesienie się do tabeli, której dotyczy komentarz o Key Code/ID – odniesienie się do klucza(wiersza, kolumny), której dotyczy komentarz o Comment – treść komentarza Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00 Struktura TableComment ma na celu zebrane wszystkich występujących komentarzy w biuletynach w jedną uniwersalną formę. Value: o o o o o Code/ID – unikalny identyfikator Table Code/ID – odniesienie się do tabeli, w której znajduje się wartość Row Code/ID - (Key Code/ID) – odniesienie się do wiersza, w której znajduje się wartość Column Code/ID - (Key Code/ID) – odniesienie się do kolumny, w której znajduje się wartość Value – wartość Struktura Value ma na celu zebrane wartości ze wszystkich tabel dostępnych w biuletynach w jedną uniwersalną formę. Zaprezentowaną powyższą strukturę można końcowo zaimplementować w akceptowalne struktury: Baza danych Oracle, do której posiada Zlecający licencję 5 typów plików CSV – jeden dla każdego typu danych Pliki XML, implementujące 5 typów obiektów w strukturze XML (mogą być w osobnych plikach XML) 2. Umiejscowienie poszczególnych elementów w przykładowej tabeli w biuletynie: 3. Przykład mapowania danych: Jako przykład digitalizacji/mapowania do zaprezentowanego formatu posłuży pierwsza tabela z biuletynu o zachorowaniach za rok 2014, która jest dostępna pod adresem: http://wwwold.pzh.gov.pl/oldpage/epimeld/2014/Ch_2014.pdf Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00 Dane po zdigitalizowaniu powyższej tabeli powinny przypominać poniższe: Key: Code/ID Name Type ParentKey Code/ID 1 Województwo Row 2 Polska Row 3 2013 Row 2 4 2014 Row 2 5 Lubelskie Row 6 Łódzkie Row 7 Śląskie Row 8 Liczba zachorowań w kwartałach Column 9 I Column 8 10 II Column 8 11 III Column 8 12 IV Column 8 13 Liczba zachorowań w roku Column 14 Zapadalność na 100 tyś. Column 15 Hospitalizacja Column 16 Liczba Column 15 17 % Column 15 Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00 Bulletin: Code/ID B1 Year 2014 Name ISSN CHOROBY ZAKAŹNE I ZATRUCIA W POLSCE W 2014 ROKU 1643-8655 Type Epi Table: Code/ID T1 Bulletin Code/ID B1 Name Description DUR BRZUSZNY (A01.0) Liczba zachorowań (w kwartałach i ogółem), zapadalność oraz liczba i procent hospitalizowanych wg województw TableComment: Code/ID T1 Table Code/ID T1 Key Code/ID 1 Comment pominięto województwa, w których nie zarejestrowano zachorowań Value: Code/ID Table Code/ID Row Code/ID Column Code/ID Value XXX1 T1 3 10 2 XXX2 T1 3 13 2 XXX3 T1 3 14 0,005 XXX4 T1 3 16 2 XXX5 T1 3 17 100,0 XXX6 T1 4 9 1 XXX7 T1 4 10 1 XXX8 T1 4 11 1 XXX9 T1 4 13 3 XXX10 T1 4 14 0,008 XXX11 T1 4 16 3 Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00 XXX12 T1 4 17 100,0 XXX13 T1 5 10 1 XXX14 T1 5 13 1 XXX15 T1 5 14 0,0461 XXX16 T1 5 16 1 XXX17 T1 5 17 100,0 XXX18 T1 6 11 1 XXX19 T1 6 13 1 XXX20 T1 6 14 0,040 XXX21 T1 6 16 1 XXX22 T1 6 17 100,0 XXX23 T1 7 9 1 XXX24 T1 7 13 1 XXX25 T1 7 14 0,022 XXX26 T1 7 16 1 XXX27 T1 7 17 100,0 Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020 w ramach POPC nr POPC.02.03.01-00–0003/15-00