Załącznik_do_zapytania_1/02/2015
Transkrypt
Załącznik_do_zapytania_1/02/2015
Załącznik nr 1. Przykładowe makiety (ang. mockup) projektowanego interfejsu opracowane na etapie projektowania funkcjonalności. Rys. 1. Makieta strony powitalnej Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Rys. 2. Makieta okna niezalogowanego użytkownika Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Rys. 3. Makieta okna użytkownika w przestrzeni roboczej Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Rys. 4. Makieta okna analiz danych Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Załącznik nr 2. Wymagania techniczne ze studium wykonalności projektu „Utworzenie bazy danych immunogenetycznych polskiej populacji MultiGenBank”. Zadanie nr 2: Przygotowanie, zakup i instalacja wybranych elementów infrastruktury informatycznej niezbędnej do prawidłowego funkcjonowania utworzonej platformy MultiGenBank W ramach zadania zostaną wybrane podmioty, które dostarcza niezbędne urządzenia oraz oprogramowanie (środki trwałe z instruktażem oraz oprogramowanie niezbędne do prawidłowego działania platformy w trakcie i po zakończeniu realizacji projektu – okres zachowania jego trwałości – nie mniej niż 5 lat), przeprowadzona zostanie konfiguracja i zabezpieczenie zakupionych urządzeń i oprogramowania. W ramach realizowanego zadania będzie ogłoszony przetarg na wykonanie specjalistycznej zintegrowanej platformy MultiGenBanku zgodnie z ustawą o zamówieniach publicznych, wykonanej na bazie projektów: funkcjonalnego, graficznego i technicznego, uwzględniających wdrożenie rozwiązań, które pozwalają na zmniejszenie zużycia energii przy zachowaniu wysokiej wydajności, dostępności oraz bezpieczeństwa przepływu danych. Zadanie nr 2 zostało podzielone na etapy uwzględniające czas przygotowania niezbędnej dokumentacji (zgodnie z obowiązującą Ustawą Prawo Zamówień Publicznych) oraz wyłonienia dostawców sprzętu i wykonawców prac: 1) Zakup i instalacja urządzeń aktywnych zapewniających sprawne, energooszczędne i bezpieczne funkcjonowanie platformy, w tym: − serwer – 4szt – są niezbędne do uruchomienia usług realizowanych w projekcie. Ze względu na przewidziane zadania zasadne będzie zastosowanie 4 serwerów do pełnienia funkcji: bazy danych, portalu internetowego udostępniającego dane i przyjmującego zlecenia wprowadzenia lub przetworzenia danych, wprowadzania danych i ich pobierania z urządzeń współpracujących oraz przeprowadzania analiz danych. Ulokowanie poszczególnych usług na odrębnych maszynach fizycznych zapewni dostateczną moc obliczeniową i umożliwi rozłożenie obciążenia. Pozwoli ponadto zapewnić bezpieczeństwo danych, poprzez konfigurację firewalla i podział na różne stopnie dostępu. − macierz dyskowa – 2szt. – dwie macierze dyskowe umożliwią przechowanie danych, które zostaną przekonwertowane na postać cyfrową, oraz danych dostarczanych przez urządzenia współpracujące zakupione w trakcie realizacji projektu. Duża objętość danych genetycznych powstałych w wyniku pracy skanerów wymaga adekwatnej pojemności dysków. Dane każdego eksperymentu mogą zajmować nawet kilkanaście gigabajtów. Zastosowanie dwóch macierzy z możliwością replikacji zapewni również fizyczne bezpieczeństwo danych i zabezpieczy przed ich utratą w wyniku awarii sprzętu. Duża ilość przechowywanych danych sprawia, że takie rozwiązanie będzie bardziej efektywne niż np. kopie zapasowe na taśmach magnetycznych. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. − przełącznik sieciowy z akcesoriami ma zapewnić łączność pomiędzy serwerami i macierzami dyskowymi. Ze względu na zastosowanie macierzy dyskowych podłączanych do serwerów poprzez interfejsy sieciowe niezbędne jest zastosowanie odpowiednio wydajnego przełącznika sieciowego wyposażonego w moduły zapewniające prędkość transmisji 10Gb/s. − zestaw: szafa serwerowa, konsola KVM, zasilacze awaryjne zapewni stabilne zasilanie dla urządzeń zamontowanych w serwerowni oraz zabezpieczy przed chwilowymi przerwami w zasilaniu. Instytut posiada zasilanie z dwóch niezależnych linii energetycznych, przełączanych w przypadku awarii. Zasilacze awaryjne powinny zapewnić zasilanie wszystkich urządzeń (przy założeniu, że pracują przy maksymalnym poborze energii) przez kilkanaście minut – na wypadek zakłóceń lub innych problemów występujących podczas przełączania linii. Wybrane modele zasilaczy powinny zapewnić ponadto monitorowanie temperatury wewnątrz szafy, dzięki temu rozwiązaniu będzie można optymalnie ustawić urządzenia klimatyzacyjne (co spowoduje ograniczenie zużycia energii przez system klimatyzacji). Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Załącznik nr 3. Przewidywana lista funkcjonalności platformy MultiGenBank. Moduł administracyjny (ogólny) 1. System umożliwia rejestrację użytkowników na stronie a. opcjonalne ograniczenie na domenę maila b. opcjonalne ograniczenie w postaci Captchy 2. System umożliwia osobie uprawnionej edytować wybrane parametry/opcje działania systemu (np. kontrolę maila przy rejestracji) 3. System umożliwia dodawanie aktualności na stronę 4. System umożliwia skorzystanie z formularza kontaktowego, rejestrując zgłoszenie w bazie i wysyłając maila 5. System umożliwia publikowane danych wg różnych kryteriów: a. dostęp publicznych b. dostęp ograniczony dla użytkowników zalogowanych c. dostęp ograniczony dla właściciela zasobu d. dostęp ograniczony dla wskazanych grup 6. System umożliwia wprowadzanie użytkowników z pominięciem restrykcji przy rejestracji na stronie 7. System umożliwia wprowadzanie danych bibliograficznych 8. System umożliwia określenie uprawnień związanych z: a. edycją b. wyświetlanie c. usuwanie d. aktualizacja 9. System umożliwia określenie uprawnień na określonych poziomach: a. ogólne b. grupy c. właściciel 10. System udostępnia API zgodne z następującymi założeniami: a. format JSON b. udostępnione dane są ograniczone zgodnie z uprawnieniami użytkownika Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. c. ograniczenie liczby zapytań na minutę d. dostęp ograniczony do wskazanych użytkowników 11. System gromadzi historię zmian zgodnie z następującymi założeniami: a. przechowywane są poprzednie wersje zmienionych danych b. rejestrowany jest użytkownik, IP i data zmiany c. wgląd w historie wymaga specjalnego uprawnienia d. historii nie można edytować ani kasować Moduł immunogenetyczny (ImGen) 12. System umożliwia wprowadzanie danych immunogenetycznych (zgodnie z przekazanym formatem). Przyjęcie danych jest potwierdzane wiadomością zwrotną z raportem (email). Dane przed upublicznieniem podlegają automatycznej weryfikacji technicznej oraz muszą być zaakceptowane przez użytkownika z odpowiednimi uprawnieniami. 13. System przed upublicznieniem danych weryfikuje je pod względem zgodności z formatem. Wprowadzone dane są weryfikowane automatycznie pod względem spełnienia kryteriów technicznych (np. liczba rekordów 50). 14. System umożliwia kierowanie zapytań do bazy o liczbę rekordów spełniających kryteria związane z polami: 1. osoba a. płeć b. wiek 2. diagnoza (z wykorzystaniem słownika ICD10) lub osoba zdrowa 3. gen a. nazwa własna, język PL, EN, symbol, ID b. lokalizacja na chromosomie c. linki do OMIM, Ensembl, Geneatlas 4. rodzaj polimorfizmu a. polimorfizm pojedynczego nukleotydu (SNP) b. tandemowych powtórzeń (VNTR) c. polimorfizmów mikrosatelitarnych (STR) d. insercji/delecji (ins/del) e. polimorfizm genów kodujących HLA Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. f. polimorfizm genów KIR i ich ligandów (C1 i C2) 5. miejsce występowania polimorfizmu Moduł analityczny - dla ImGen 15. System daje zalogowanemu użytkownikowi dostęp do podręcznej przestrzeni użytkownika, w której tymczasowo mogą być przechowywane (bez upublicznienia): a. własne dane immunogenetyczne wczytane z plików b. dane wyselekcjonowane z dostępnych w bazie zasobów przez formułowanie zapytań c. raporty z przeprowadzanych analiz 16. System umożliwia łączenie zbiorów przechowywanych w przestrzeni użytkownika w celu przeprowadzenia analiz 17. Dla zbioru poddawanego analizie obliczane są podstawowe charakterystyki: średni wiek, mediana, odchylenie standardowe, zakres, odsetek kobiet/mężczyzn 18. W zbiorze danych poddawanych analizie możliwe jest wyróżnienie dowolnej liczby grup pacjentów, poprzez określenie wymaganych wartości pól (np. grupa1 - pole “diagnoza” wartość: “białaczka”, grupa2 - pole “diagnoza” wartość: “zdrowy”) 19. Dla wyznaczonych grup system umożliwia: a. Jeżeli wybrano jedną grupę: ● wyliczenie wartości statystyk:wyliczenie rozkładu alleli oraz genotypów, Minor Allel Frequency (MAF), Hardy-Weinberg Equilibrium (HWE), ● dla więcej niż jednego polimorfizmu w tym samym genie lub chromosomieLinkage Disequilibrium (LD) wyliczenie częstości haplotypów b. Jeżeli wybrano 2 grupy ● wyliczenie wartości statystyk chi2, Odds Ratio (OR), 95% Confidence Intervals(CI), p-value dla alleli, genotypów, haplotypów, interakcji gen-gen c. obliczanie siły zależności między dwoma wariantami genetycznymi metodą Svejgaarda i Rydera d. obliczanie odległości genetycznej e. wyświetlenie informacji o użytkowniku, który wprowadził dane f. wyświetlenie referencji literaturowych 20. Po wykonaniu obliczeń generowany jest raport z: Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. 1. Wyliczonymi statystykami (określonymi wcześniej) 2. Wizualizacją wyników (wykresy słupkowe rozkładu alleli, wykres Odds Ratio z 95% CI, linkage disequlibrium między różnymi polimorfizmami, dendrogramy (drzewa filogenetyczne)) 3. Listą odnośników źródeł literaturowych 4. Oświadczeniem o zobowiązaniu do cytowania prac Moduł administracyjny - dla ImGen 21. System umożliwia modyfikowanie wymaganego formatu danych deponowanych (EAV) przez modyfikowanie kryteriów weryfikacji technicznej Moduł mikrobiologiczny (MicroB) 22. System umożliwia przechowywanie danych o szczepach bakteryjnych w tym całych sekwencji genomów. 23. System umożliwia ręczne wprowadzanie danych poprzez załączanie plików. 24. System zakłada synchronizację danych z zawartością bazy PCM (synchronizacja odnosi się do pól “NazwaOrg, Numer Szczepu, Genotyp, Taksonomia (2 grupy)”, ) 25. System umożliwia przejście z bazy MGB do odpowiedniego rekordu w bazie PCM przez link umieszczony w numerze PCM szczepu (pole2) 26. System umożliwia podgląd sekwencji nukleotydowej, lub aminokwasowej głównego markera szczepu (pole5) przez link do umieszczonego w bazie pliku w formacie FASTA lub Genebank 27. System umożliwia podgląd sekwencji nukleotydowej lub aminokwasowej innych markerów (pole6) przez link do pliku FASTA lub Genebank. Przykład: dnaJ (nt, aa), gdzie “nn” oraz “aa” to hiperłącza. 28. System umożliwia przejście lub podgląd opisu metody pomiarowej (protokołu) wykorzystanej przy genotypowaniu (pole71) 29. System umożliwia przejście lub podgląd pliku z wynikami badania w formie tabeli z długościami sekwencji (pole7) 30. System umożliwia przejście lub podgląd pliku z wynikami badania w formie pliku rastrowego (pole7) Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. 31. System umożliwia wyświetlenie opisów genów i mechanizmów odpowiadających za określone oporności (pole8) 32. System umożliwia wyświetlenie plików tekstowych z sewencjami nukleotydowymi i aminokwasowymi genów oporności. Pliki powinny być zapisane w formatach: FASTA oraz Genbank. Przykład: genA(description, nt fasta, aa fasta, nt genebank, aa genebank) pole(8) 33. System umożliwia przejście lub podgląd plików tekstowych z opisem oraz sekwencjami genów kodujących użyteczne enzymy. Udostępniane pliki: 1. opis 2. sekwencje w formacie FASTA (aminowkasowa, nukleotydowa) 3. sekwencje w formacie genbank (aminokwasowa, nukleotydowa) 34. System umożliwia przejście z opisów enzymów (pole9) do produktów w bazie PCM 35. System umożliwia graficzne przedstawienie szlaków syntezy określonych metabolitów. Generowane grafiki powinny być interaktywne i wyświetlać informacje o wskazywanych obiektach (genach, białkach, modułach domen). Dla genów dane to: 1. opis, 2. sekwencje aminokwasowe i nukleotydowe w formacie FASTA i Genbank, 3. nazwa metabolitu. Wygląd rysunku (długości elementów, odległości między nimi) zależy od analizowanej sekwencji. Poniżej modułów domen wyświetlane są grafiki z produkowanym metabolitem oraz linkami do opisu i wzoru chemicznego zapisanego w standardowym formacie SMILES (Simplified Molecular Input Line Entry Specification). Opis genu zawiera również wykaz modułów i domen białkowych. Przykład: 1. genA(description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite) 2. “metabolite” może być połączony hiperłączem z produktami w PCM 36. System umożliwia przeszukiwanie bazy w celu listowania rekordów posiadających słowa kluczowe występujące w odpowiednich polach (przeszukiwane są również pliki z opisami genów) Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. 37. System umożliwia formowanie złożonych zapytań z wykorzystaniem operatorów logicznych) (AND, OR, NOT). Przykładowe zapytanie: Actinobacteria AND Amphotericin. 38. Program wyszukujący na bieżąco podpowiada użytkownikowi możliwe uzupełnienia wprowadzanego zapytania. 39. System zwraca wyniki wyszukiwania w formie tabelarycznej - jeden szczep : jeden wiersz. Istnienie możliwość ukrywania kolumn w zależności od zapotrzebowania użytkownika. 40. System umożliwia przeszukiwanie bazy za pomocą porównań sekwencji (z pól 5,6,8,9, 10) z wykorzystaniem programu BLAST. Efektem jest tabela sekwencji homologicznych, z których każda ma link do swojego rekordu. 41. System umożliwia pobranie wybranych sekwencji w formie pliku tekstowego. W nagłówkach kolumn znajdują się przyciski do zaznaczenia wszystkich sekwencji. Przyciski znajdują się również przy poszególnych sekwencjach. 42. System umożliwia przeprowadzenie analizy wybranych sekwencji nukleotydowych lub aminokwasowych za pomocą programu Clustal - tworzy przyrównanie sekwencji oraz rysunek z drzewem filogenetycznym. 43. System umożliwia wylistowanie w rozwijanym menu wszystkich metod badawczych dla analizowanego zbioru. W oparciu o listę możliwe jest zaznaczenie wszystkich plików z wynikami dla danej metody. A następnie ich analizę. 44. System umożliwia wyszukiwanie zestawów genów lub zestawów modułów domen, które będą w połączeniu produkować określony w zapytaniu metabolit. Zapytanie ma formę struktury zapisanej w standardowym formacie (SMILES) Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.