Projekt EpiBaza współfinansowany przez Unię Europejską ze

Transkrypt

Projekt EpiBaza współfinansowany przez Unię Europejską ze
Opis przedmiotu zamówienia
Załącznik 1
I.
Zakres zamówienia
Zamówienie obejmuje digitalizację biuletynów z lat 1958 - 2016 w ilości stron do zeskanowania oraz ilości pól do
wprowadzenia danych zgodnie z Załącznikiem 1a do SIWZ Biuletyny.
Biuletyny przeznaczone do digitalizacji – ogółem 207 sztuk w postaci zeszytów formatu A4/A5/C4 (dokładny opis
poszczególnych biuletynów znajduje się w załączniku 1a), w miękkich lub twardych okładkach, klejone lub
zszywane, zadrukowane dwustronnie, w stanie dobrym - bez uszkodzeń mechanicznych i zabrudzeń. Główną
zawartość stanowią tabele wypełnione danymi liczbowymi oraz dodatkowo wykresy, grafiki, mapki i strony
tytułowe .
Adresy do przykładowych próbek biuletynów charakterystycznych dla określonych grup biuletynów są zawarte w
załączniku nr 2.
Biuletyny:
1. o zachorowaniach za lata 1958 – 1972 nie mogą być rozszywane, najstarsze biuletyny są drukowane
na słabej jakości papierze, podczas rozkładania oraz przekładania stron w procesie digitalizacji mogą
być podatne na uszkodzenia mechaniczne
2. o zachorowaniach biuletyny za lata 1973 - 1998 - po ewentualnym ich rozszyciu powinny zostać
ponownie zszyte
3. o szczepieniach za lata 1975 – 1989 nie mogą być rozszywane, najstarsze biuletyny są drukowane na
słabej jakości papierze, podczas rozkładania oraz przekładania stron w procesie digitalizacji mogą być
podatne na uszkodzenia mechaniczne
4. o szczepieniach biuletyny za lata 1990 - 1998 - po ewentualnym ich rozszyciu powinny zostać ponownie
zszyte
II. Skanowanie:
1. Skanowaniu podlegają wszystkie wskazane strony biuletynów z roczników wskazanych w załączniku 1a,
których sumaryczna liczba to około 5500.
2. Skanowanie biuletynów, o których mowa w pkt I ust. 1 i ust. 3 OPZ zostanie wykonane za pomocą
skanera dziełowego, o formacie A3 ze światłem zimnym bez UV i IR.
3. Parametry skanowania
a. format pliku: PDF scalone do jednego pliku w ramach jednego rocznika i typu (zachorowania,
szczepienia)
b. minimum 300 dpi
c. minimum odcienie szarości
d. wykorzystanie filtrów typu jasność/kontrast/balans bieli/ostrość tam gdzie zaistnieje taka
potrzeba
e. powstałe pliki otrzymują nazwy, które są tytułami biuletynów
4. Dostarczanie gotowych plików PDF drogą elektroniczną w miarę postępu prac zgodnie z uzgodnionym
harmonogramem (punkt V)
5. Zapis i dostarczenie wszystkich skanów w formie plików PDF na płytach DVD w minimum 10 kopiach
III. Digitalizacja danych
1. Digitalizacji podlegają wszystkie dane merytoryczno-numeryczne zawarte w rocznikach biuletynów
wskazanych w załączniku 1a, zgodnie z podanym zakresem i ilością stron. Dane z tabel powinny być w
całości przeniesione do formy elektronicznej, natomiast wykresy, grafiki, mapy oraz strony tytułowe
biuletynów nie podlegają digitalizacji do formy elektronicznej.
Łącznie procesowi wprowadzenia danych podlega około 1 250 000 liczb od 1 do 7 cyfrowych oraz opis
tabel, w których się znajdują. Poprzez opis tabel rozumie się nazwę, opis, nagłówek kolumny, nagłówek
wiersza oraz wyjaśnienia. Nagłówki kolumn i wierszy są powtarzalne w ramach jednego biuletynu (dla
różnych jednostek chorobowych) jak i biuletynów z kilku lat, natomiast nazwy i opisy tabel są
powtarzalne w biuletynach następujących po sobie(przez lata)
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00
2. Zachowanie jakości odzwierciedlenia danych na poziomie 100%
3. Dostarczanie zdigitalizowanych danych drogą elektroniczną sukcesywnie w miarę postępu prac zgodnie
z uzgodnionym harmonogramem i formą wskazaną w ofercie celem weryfikacji przez Zamawiającego
4. Dostarczenie wszystkich zdigitalizowanych danych na płycie DVD w minimum 10 kopiach po
zakończeniu prac
IV. Dodatkowe wymagania odnośnie Zamówienia:
1. Digitalizacja musi odbyć się poza siedzibą Zamawiającego
2. Transport wraz z załadunkiem biuletynów z/do NIZP-PZH odbędzie się na koszt i odpowiedzialność
Wykonawcy – całość materiałów Zaamwiający udostępni jednorazowo po podpisaniu umowy.
3. Przygotowanie biuletynów do digitalizacji tzn. tam gdzie to możliwe (wg pkt. I. 1.) rozszycie i ponowne
zszycie
4. Wymagania ogólne dla realizacji zamówienia: Wykonawca bierze pełną odpowiedzialność za
przekazane materiały oraz gwarantuje ich oddanie w niezmienionym stanie.
5. Wykonawca w celu zapewnienia wysokiej jakości pracy na każdym etapie realizacji (skanowanie,
digitalizacji) zobowiązuje się do przeprowadzania wewnętrznej kontroli jakości.
6. Zamawiający zastrzega sobie prawo do przeglądania wprowadzonych danych.
V. Harmonogram prac:
Planowany termin rozpoczęcia prac to 3 dni od podpisania umowy a data zakończenia to 31 października 2018 r.
Usługi zostaną wykonane w następujących etapach:
Etap 1: Zakończenie prac związanych ze skanowaniem do 31 listopada 2017 r.
Etap 2: Zakończenie prac związanych z digitalizacją biuletynów dotyczących zachorowań do 28 marca 2018 r.
Etap 3: Zakończenie prac związanych z digitalizacją biuletynów dotyczących szczepień do 31 października 2018
r.
VI. Procedura weryfikacji:
1. W zakresie etapu 1 Zamawiający dokona odbioru jakościowego usługi w terminie 6 miesięcy od dnia
przekazania zeskanowanych materiałów.
2. W zakresie etapu 2 i etapu 3 rozpoczęcie przekazywania/udostępniania danych fragmentarycznych
(pełne tablice wraz z tytułami kolumn i wierszy) do weryfikacji przez Zamawiając ego nastąpi 3 miesiące po
rozpoczęciu prac w danym obszarze (skanowanie, digitalizacja biuletynów dotyczących zachorowań,
digitalizacja biuletynów dotyczących szczepień) i będzie następowało sukcesywnie tj. co 3 miesiące.
3. Zamawiający będzie zgłaszał błędy na bieżąco w miarę upływu prac oraz po wykonaniu usługi w danym
etapie.
4. Odbiór jakościowy etapu 2 nastąpi do dnia 31 sierpnia 2018 r., natomiast dla etapu 3 do dnia 31 stycznia
2019 r.
5. Wykonawca będzie zobowiązany do usunięcia błędów w terminie 14 dni od dnia ich zgłoszenia.
6. W przypadku gdy zgłoszone błędy nie zostaną poprawione w ww. terminie Zamawiający wzywa
wykonawcę ponownie wyznaczając 3 dniowy termin na usunięcie błędów.
7. W przypadku ponownego wykrycia błędów w już raz poprawionej części odbiór jakościowy etapu (1, 2
lub 3) może nastąpić w przesunięciu o 14 dni.
8. Każde kolejne wykrycie błędów w tym samym fragmencie powoduje możliwość przesunięcia terminu
odbioru o kolejne 14 dni.
9. Odbiór danego etapu będzie możliwy po usunięciu wszystkich zgłoszonych błędów.
10. Odbiór poszczególnych etapów zostanie stwierdzony protokołem odbioru etapu.
VII. Gwarancja jakości
1. Wykonawca udziela gwarancji na wykonany przedmiot Umowy na okres wskazany w ofercie.
2. Okres gwarancji rozpoczyna się od dnia podpisania protokołu odbioru ostatniego etapu.
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00
3. Okres gwarancji nie może być krótszy niż 29 miesięcy i musi być podany w pełnych miesiącach.
4. W przypadku ujawnienia w okresie gwarancji wad, usterek tec hnicznych lub niezgodności z przyjętymi
standardami digitalizacji, w tym skanowania, obróbki graficznej lub wprowadzenia danych Wykonawca
ma obowiązek usunąć ww. wady, usterki i niezgodności na własny koszt i ryzyko, w terminie 14 dni
kalendarzowych od zgłoszenia żądania usunięcia wady. Usunięcie ww. wad, usterek i niezgodności
może być wykonane poprzez ponowną digitalizację obiektu na koszt i ryzyko Wykonawcy w siedzibie
Zamawiającego.
VIII. Format danych
Docelowy format danych elektronicznych musi być zbieżny z podanym poniżej.
1. Definicja formatu danych
Poniżej przestawiono strukturę, na podstawie której należy przekazać Zamawiającemu zdigitalizowane dane.
Struktura składa się z następujących elementów:

Key
o
o
o
o
Code/ID – unikalny identyfikator
Name wartość z nagłówka kolumny/wiersza
Type (Row/Column) – typ – wiersz lub kolumna
ParentKey Code/ID – odniesienie do nadrzędnego klucza
Struktura Key ma na celu zebrane wszystkich unikalnych nagłówków tabel – dotczy to zarówno
nagłówków kolumn jak i wierszy. Dodatkowo dzięki właściwości ParentKey, możliwe jest
utrzymanie struktury drzewiastej – wykorzystywane np. w podwójnych nagłówkach np. kolumna
Miasto dzieli się na trzy podkolumny – Mężczyźni, Kobiety oraz Ogółem. Poszczególne
wartości Key powinny był współdzielone pomiędzy różnymi tabelami, w różnych biuletynach.

Bulletin:
o Code/ID – unikalny identyfikator
o Year – rok biuletynu
o Name – nazwa biuletynu
o ISSN – numer ISSN
o Type (Epi/Vacc) – typ biuletynu (Epi – o zachorowaniach, Vacc – o szczepieniach)
Struktura Bulletin ma na celu zebrane wszystkich biuletynów, bez względu na tym w jedną
unikalną kolekcję o uniwersalnej formie.

Table:
o
o
o
o
Code/ID – unikalny identyfikator
Bulletin Code/ID – odniesienie się do biuletynu, w którym znajduje się tabela
Name – nazwa tabeli
Description – opis tabeli
Struktura Table ma na celu zebrane wszystkich tabel w jedną kolekcję, bez względu, z którego
biuletynu pochodzi w jedną uniwersalną formę.

TableComment:
o Code/ID – unikalny identyfikator
o Table Code/ID – odniesienie się do tabeli, której dotyczy komentarz
o Key Code/ID – odniesienie się do klucza(wiersza, kolumny), której dotyczy komentarz
o Comment – treść komentarza
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00
Struktura TableComment ma na celu zebrane wszystkich występujących komentarzy w
biuletynach w jedną uniwersalną formę.

Value:
o
o
o
o
o
Code/ID – unikalny identyfikator
Table Code/ID – odniesienie się do tabeli, w której znajduje się wartość
Row Code/ID - (Key Code/ID) – odniesienie się do wiersza, w której znajduje się wartość
Column Code/ID - (Key Code/ID) – odniesienie się do kolumny, w której znajduje się wartość
Value – wartość
Struktura Value ma na celu zebrane wartości ze wszystkich tabel dostępnych w biuletynach w
jedną uniwersalną formę.
Zaprezentowaną powyższą strukturę można końcowo zaimplementować w akceptowalne struktury:



Baza danych Oracle, do której posiada Zlecający licencję
5 typów plików CSV – jeden dla każdego typu danych
Pliki XML, implementujące 5 typów obiektów w strukturze XML (mogą być w osobnych plikach XML)
2. Umiejscowienie poszczególnych elementów w przykładowej tabeli w biuletynie:
3. Przykład mapowania danych:
Jako przykład digitalizacji/mapowania do zaprezentowanego formatu posłuży pierwsza tabela z biuletynu o
zachorowaniach za rok 2014, która jest dostępna pod adresem:
http://wwwold.pzh.gov.pl/oldpage/epimeld/2014/Ch_2014.pdf
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00
Dane po zdigitalizowaniu powyższej tabeli powinny przypominać poniższe:

Key:
Code/ID
Name
Type
ParentKey Code/ID
1
Województwo
Row
2
Polska
Row
3
2013
Row
2
4
2014
Row
2
5
Lubelskie
Row
6
Łódzkie
Row
7
Śląskie
Row
8
Liczba zachorowań w kwartałach
Column
9
I
Column
8
10
II
Column
8
11
III
Column
8
12
IV
Column
8
13
Liczba zachorowań w roku
Column
14
Zapadalność na 100 tyś.
Column
15
Hospitalizacja
Column
16
Liczba
Column
15
17
%
Column
15
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00

Bulletin:
Code/ID
B1
Year
2014

Name
ISSN
CHOROBY ZAKAŹNE I ZATRUCIA W POLSCE
W 2014 ROKU
1643-8655
Type
Epi
Table:
Code/ID
T1
Bulletin Code/ID
B1

Name
Description
DUR BRZUSZNY (A01.0)
Liczba zachorowań (w kwartałach i ogółem),
zapadalność oraz liczba i procent
hospitalizowanych wg województw
TableComment:
Code/ID
T1
Table Code/ID
T1

Key Code/ID
1
Comment
pominięto województwa, w których nie zarejestrowano
zachorowań
Value:
Code/ID
Table Code/ID
Row Code/ID
Column Code/ID
Value
XXX1
T1
3
10
2
XXX2
T1
3
13
2
XXX3
T1
3
14
0,005
XXX4
T1
3
16
2
XXX5
T1
3
17
100,0
XXX6
T1
4
9
1
XXX7
T1
4
10
1
XXX8
T1
4
11
1
XXX9
T1
4
13
3
XXX10
T1
4
14
0,008
XXX11
T1
4
16
3
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00
XXX12
T1
4
17
100,0
XXX13
T1
5
10
1
XXX14
T1
5
13
1
XXX15
T1
5
14
0,0461
XXX16
T1
5
16
1
XXX17
T1
5
17
100,0
XXX18
T1
6
11
1
XXX19
T1
6
13
1
XXX20
T1
6
14
0,040
XXX21
T1
6
16
1
XXX22
T1
6
17
100,0
XXX23
T1
7
9
1
XXX24
T1
7
13
1
XXX25
T1
7
14
0,022
XXX26
T1
7
16
1
XXX27
T1
7
17
100,0
Projekt EpiBaza współfinansowany przez Unię Europejską ze środków EFRR i EFS 2014-2020
w ramach POPC nr POPC.02.03.01-00–0003/15-00

Podobne dokumenty