Załącznik_do_zapytania_1/02/2015

Transkrypt

Załącznik_do_zapytania_1/02/2015
Załącznik nr 1.
Przykładowe makiety (ang. mockup) projektowanego interfejsu opracowane na etapie
projektowania funkcjonalności.
Rys. 1. Makieta strony powitalnej
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
Rys. 2. Makieta okna niezalogowanego użytkownika
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
Rys. 3. Makieta okna użytkownika w przestrzeni roboczej
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
Rys. 4. Makieta okna analiz danych
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
Załącznik nr 2.
Wymagania techniczne ze studium wykonalności projektu „Utworzenie bazy danych
immunogenetycznych polskiej populacji MultiGenBank”.
Zadanie nr 2:
Przygotowanie, zakup i instalacja wybranych elementów infrastruktury informatycznej
niezbędnej do prawidłowego funkcjonowania utworzonej platformy MultiGenBank
W ramach zadania zostaną wybrane podmioty, które dostarcza niezbędne urządzenia oraz
oprogramowanie (środki trwałe z instruktażem oraz oprogramowanie niezbędne do
prawidłowego działania platformy w trakcie i po zakończeniu realizacji projektu – okres
zachowania jego trwałości – nie mniej niż 5 lat), przeprowadzona zostanie konfiguracja
i zabezpieczenie zakupionych urządzeń i oprogramowania. W ramach realizowanego zadania
będzie ogłoszony przetarg na wykonanie specjalistycznej zintegrowanej platformy
MultiGenBanku zgodnie z ustawą o zamówieniach publicznych, wykonanej na bazie
projektów: funkcjonalnego, graficznego i technicznego, uwzględniających wdrożenie
rozwiązań, które pozwalają na zmniejszenie zużycia energii przy zachowaniu wysokiej
wydajności, dostępności oraz bezpieczeństwa przepływu danych.
Zadanie nr 2 zostało podzielone na etapy uwzględniające czas przygotowania niezbędnej
dokumentacji (zgodnie z obowiązującą Ustawą Prawo Zamówień Publicznych) oraz
wyłonienia dostawców sprzętu i wykonawców prac:
1)
Zakup i instalacja urządzeń aktywnych zapewniających sprawne, energooszczędne
i bezpieczne funkcjonowanie platformy, w tym:
− serwer – 4szt – są niezbędne do uruchomienia usług realizowanych w projekcie. Ze
względu na przewidziane zadania zasadne będzie zastosowanie 4 serwerów do pełnienia
funkcji: bazy danych, portalu internetowego udostępniającego dane i przyjmującego
zlecenia wprowadzenia lub przetworzenia danych, wprowadzania danych i ich pobierania
z urządzeń współpracujących oraz przeprowadzania analiz danych. Ulokowanie
poszczególnych usług na odrębnych maszynach fizycznych zapewni dostateczną moc
obliczeniową i umożliwi rozłożenie obciążenia. Pozwoli ponadto zapewnić
bezpieczeństwo danych, poprzez konfigurację firewalla i podział na różne stopnie
dostępu.
− macierz dyskowa – 2szt. – dwie macierze dyskowe umożliwią przechowanie danych,
które zostaną przekonwertowane na postać cyfrową, oraz danych dostarczanych przez
urządzenia współpracujące zakupione w trakcie realizacji projektu. Duża objętość danych
genetycznych powstałych w wyniku pracy skanerów wymaga adekwatnej pojemności
dysków. Dane każdego eksperymentu mogą zajmować nawet kilkanaście gigabajtów.
Zastosowanie dwóch macierzy z możliwością replikacji zapewni również fizyczne
bezpieczeństwo danych i zabezpieczy przed ich utratą w wyniku awarii sprzętu. Duża
ilość przechowywanych danych sprawia, że takie rozwiązanie będzie bardziej efektywne
niż np. kopie zapasowe na taśmach magnetycznych.
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
− przełącznik sieciowy z akcesoriami ma zapewnić łączność pomiędzy serwerami
i macierzami dyskowymi. Ze względu na zastosowanie macierzy dyskowych
podłączanych do serwerów poprzez interfejsy sieciowe niezbędne jest zastosowanie
odpowiednio wydajnego przełącznika sieciowego wyposażonego w moduły zapewniające
prędkość transmisji 10Gb/s.
− zestaw: szafa serwerowa, konsola KVM, zasilacze awaryjne zapewni stabilne zasilanie dla
urządzeń zamontowanych w serwerowni oraz zabezpieczy przed chwilowymi przerwami
w zasilaniu. Instytut posiada zasilanie z dwóch niezależnych linii energetycznych,
przełączanych w przypadku awarii. Zasilacze awaryjne powinny zapewnić zasilanie
wszystkich urządzeń (przy założeniu, że pracują przy maksymalnym poborze energii)
przez kilkanaście minut – na wypadek zakłóceń lub innych problemów występujących
podczas przełączania linii. Wybrane modele zasilaczy powinny zapewnić ponadto
monitorowanie temperatury wewnątrz szafy, dzięki temu rozwiązaniu będzie można
optymalnie ustawić urządzenia klimatyzacyjne (co spowoduje ograniczenie zużycia
energii przez system klimatyzacji).
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
Załącznik nr 3.
Przewidywana lista funkcjonalności platformy MultiGenBank.
Moduł administracyjny (ogólny)
1. System umożliwia rejestrację użytkowników na stronie
a. opcjonalne ograniczenie na domenę maila
b. opcjonalne ograniczenie w postaci Captchy
2. System umożliwia osobie uprawnionej edytować wybrane parametry/opcje działania
systemu (np. kontrolę maila przy rejestracji)
3. System umożliwia dodawanie aktualności na stronę
4. System umożliwia skorzystanie z formularza kontaktowego, rejestrując zgłoszenie
w bazie i wysyłając maila
5. System umożliwia publikowane danych wg różnych kryteriów:
a. dostęp publicznych
b. dostęp ograniczony dla użytkowników zalogowanych
c. dostęp ograniczony dla właściciela zasobu
d. dostęp ograniczony dla wskazanych grup
6. System umożliwia wprowadzanie użytkowników z pominięciem restrykcji przy rejestracji
na stronie
7. System umożliwia wprowadzanie danych bibliograficznych
8. System umożliwia określenie uprawnień związanych z:
a. edycją
b. wyświetlanie
c. usuwanie
d. aktualizacja
9. System umożliwia określenie uprawnień na określonych poziomach:
a. ogólne
b. grupy
c. właściciel
10. System udostępnia API zgodne z następującymi założeniami:
a. format JSON
b. udostępnione dane są ograniczone zgodnie z uprawnieniami użytkownika
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
c. ograniczenie liczby zapytań na minutę
d. dostęp ograniczony do wskazanych użytkowników
11. System gromadzi historię zmian zgodnie z następującymi założeniami:
a. przechowywane są poprzednie wersje zmienionych danych
b. rejestrowany jest użytkownik, IP i data zmiany
c. wgląd w historie wymaga specjalnego uprawnienia
d. historii nie można edytować ani kasować
Moduł immunogenetyczny (ImGen)
12. System umożliwia wprowadzanie danych immunogenetycznych (zgodnie z przekazanym
formatem). Przyjęcie danych jest potwierdzane wiadomością zwrotną z raportem (email).
Dane przed upublicznieniem podlegają automatycznej weryfikacji technicznej oraz muszą
być zaakceptowane przez użytkownika z odpowiednimi uprawnieniami.
13. System przed upublicznieniem danych weryfikuje je pod względem zgodności
z formatem. Wprowadzone dane są weryfikowane automatycznie pod względem
spełnienia kryteriów technicznych (np. liczba rekordów 50).
14. System umożliwia kierowanie zapytań do bazy o liczbę rekordów spełniających kryteria
związane z polami:
1. osoba
a. płeć
b. wiek
2. diagnoza (z wykorzystaniem słownika ICD10) lub osoba zdrowa
3. gen
a. nazwa własna, język PL, EN, symbol, ID
b. lokalizacja na chromosomie
c. linki do OMIM, Ensembl, Geneatlas
4. rodzaj polimorfizmu
a. polimorfizm pojedynczego nukleotydu (SNP)
b. tandemowych powtórzeń (VNTR)
c. polimorfizmów mikrosatelitarnych (STR)
d. insercji/delecji (ins/del)
e. polimorfizm genów kodujących HLA
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
f. polimorfizm genów KIR i ich ligandów (C1 i C2)
5. miejsce występowania polimorfizmu
Moduł analityczny - dla ImGen
15. System
daje zalogowanemu
użytkownikowi
dostęp do podręcznej
przestrzeni
użytkownika, w której tymczasowo mogą być przechowywane (bez upublicznienia):
a. własne dane immunogenetyczne wczytane z plików
b. dane wyselekcjonowane z dostępnych w bazie zasobów przez formułowanie
zapytań
c. raporty z przeprowadzanych analiz
16. System umożliwia łączenie zbiorów przechowywanych w przestrzeni użytkownika w celu
przeprowadzenia analiz
17. Dla zbioru poddawanego analizie obliczane są podstawowe charakterystyki: średni wiek,
mediana, odchylenie standardowe, zakres, odsetek kobiet/mężczyzn
18. W zbiorze danych poddawanych analizie możliwe jest wyróżnienie dowolnej liczby grup
pacjentów, poprzez określenie wymaganych wartości pól (np. grupa1 - pole “diagnoza”
wartość: “białaczka”, grupa2 - pole “diagnoza” wartość: “zdrowy”)
19. Dla wyznaczonych grup system umożliwia:
a. Jeżeli wybrano jedną grupę:
● wyliczenie wartości statystyk:wyliczenie rozkładu alleli oraz genotypów,
Minor Allel Frequency (MAF), Hardy-Weinberg Equilibrium (HWE),
● dla więcej niż jednego polimorfizmu w tym samym genie lub chromosomieLinkage Disequilibrium (LD) wyliczenie częstości haplotypów
b. Jeżeli wybrano 2 grupy
● wyliczenie wartości statystyk chi2, Odds Ratio (OR), 95% Confidence
Intervals(CI), p-value dla alleli, genotypów, haplotypów, interakcji gen-gen
c. obliczanie siły zależności między dwoma wariantami genetycznymi metodą
Svejgaarda i Rydera
d. obliczanie odległości genetycznej
e. wyświetlenie informacji o użytkowniku, który wprowadził dane
f. wyświetlenie referencji literaturowych
20. Po wykonaniu obliczeń generowany jest raport z:
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
1. Wyliczonymi statystykami (określonymi wcześniej)
2. Wizualizacją wyników (wykresy słupkowe rozkładu alleli, wykres Odds Ratio
z 95% CI, linkage disequlibrium między różnymi polimorfizmami, dendrogramy
(drzewa filogenetyczne))
3. Listą odnośników źródeł literaturowych
4. Oświadczeniem o zobowiązaniu do cytowania prac
Moduł administracyjny - dla ImGen
21. System umożliwia modyfikowanie wymaganego formatu danych deponowanych (EAV)
przez modyfikowanie kryteriów weryfikacji technicznej
Moduł mikrobiologiczny (MicroB)
22. System umożliwia przechowywanie danych o szczepach bakteryjnych w tym całych
sekwencji genomów.
23. System umożliwia ręczne wprowadzanie danych poprzez załączanie plików.
24. System zakłada synchronizację danych z zawartością bazy PCM (synchronizacja odnosi
się do pól “NazwaOrg, Numer Szczepu, Genotyp, Taksonomia (2 grupy)”, )
25. System umożliwia przejście z bazy MGB do odpowiedniego rekordu w bazie PCM przez
link umieszczony w numerze PCM szczepu (pole2)
26. System umożliwia podgląd sekwencji nukleotydowej, lub aminokwasowej głównego
markera szczepu (pole5) przez link do umieszczonego w bazie pliku w formacie FASTA
lub Genebank
27. System umożliwia podgląd sekwencji nukleotydowej lub aminokwasowej innych
markerów (pole6) przez link do pliku FASTA lub Genebank. Przykład: dnaJ (nt, aa),
gdzie “nn” oraz “aa” to hiperłącza.
28. System umożliwia przejście lub podgląd opisu metody pomiarowej (protokołu)
wykorzystanej przy genotypowaniu (pole71)
29. System umożliwia przejście lub podgląd pliku z wynikami badania w formie tabeli
z długościami sekwencji (pole7)
30. System umożliwia przejście lub podgląd pliku z wynikami badania w formie pliku
rastrowego (pole7)
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
31. System umożliwia wyświetlenie opisów genów i mechanizmów odpowiadających za
określone oporności (pole8)
32. System umożliwia wyświetlenie plików tekstowych z sewencjami nukleotydowymi
i aminokwasowymi genów oporności. Pliki powinny być zapisane w formatach:
FASTA oraz Genbank. Przykład: genA(description, nt fasta, aa fasta, nt genebank, aa
genebank) pole(8)
33. System umożliwia przejście lub podgląd plików tekstowych z opisem oraz sekwencjami
genów kodujących użyteczne enzymy. Udostępniane pliki:
1. opis
2. sekwencje w formacie FASTA (aminowkasowa, nukleotydowa)
3. sekwencje w formacie genbank (aminokwasowa, nukleotydowa)
34. System umożliwia przejście z opisów enzymów (pole9) do produktów w bazie PCM
35. System umożliwia graficzne przedstawienie szlaków syntezy określonych metabolitów.
Generowane grafiki powinny być interaktywne i wyświetlać informacje o wskazywanych
obiektach (genach, białkach, modułach domen).
Dla genów dane to:
1. opis,
2. sekwencje aminokwasowe i nukleotydowe w formacie FASTA i Genbank,
3. nazwa metabolitu.
Wygląd rysunku (długości elementów, odległości między nimi) zależy od analizowanej
sekwencji. Poniżej modułów domen wyświetlane są grafiki z produkowanym
metabolitem oraz linkami do opisu i wzoru chemicznego zapisanego w standardowym
formacie SMILES (Simplified Molecular Input Line Entry Specification). Opis genu
zawiera również wykaz modułów i domen białkowych.
Przykład:
1. genA(description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite)
2. “metabolite” może być połączony hiperłączem z produktami w PCM
36. System umożliwia przeszukiwanie bazy w celu listowania rekordów posiadających słowa
kluczowe występujące w odpowiednich polach (przeszukiwane są również pliki z opisami
genów)
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
37. System umożliwia formowanie złożonych zapytań z wykorzystaniem operatorów
logicznych)
(AND,
OR,
NOT).
Przykładowe
zapytanie:
Actinobacteria
AND
Amphotericin.
38. Program wyszukujący na bieżąco podpowiada użytkownikowi możliwe uzupełnienia
wprowadzanego zapytania.
39. System zwraca wyniki wyszukiwania w formie tabelarycznej - jeden szczep : jeden
wiersz. Istnienie możliwość ukrywania kolumn w zależności od zapotrzebowania
użytkownika.
40. System umożliwia przeszukiwanie bazy za pomocą porównań sekwencji (z pól 5,6,8,9,
10) z wykorzystaniem programu BLAST. Efektem jest tabela sekwencji homologicznych,
z których każda ma link do swojego rekordu.
41. System umożliwia pobranie wybranych sekwencji w formie pliku tekstowego.
W nagłówkach kolumn znajdują się przyciski do zaznaczenia wszystkich sekwencji.
Przyciski znajdują się również przy poszególnych sekwencjach.
42. System umożliwia przeprowadzenie analizy wybranych sekwencji nukleotydowych lub
aminokwasowych za pomocą programu Clustal - tworzy przyrównanie sekwencji oraz
rysunek z drzewem filogenetycznym.
43. System umożliwia wylistowanie w rozwijanym menu wszystkich metod badawczych dla
analizowanego zbioru. W oparciu o listę możliwe jest zaznaczenie wszystkich plików
z wynikami dla danej metody. A następnie ich analizę.
44. System umożliwia wyszukiwanie zestawów genów lub zestawów modułów domen, które
będą w połączeniu produkować określony w zapytaniu metabolit. Zapytanie ma formę
struktury zapisanej w standardowym formacie (SMILES)
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.