Zapytanie_ofertowe_4/12/2014 - Instytut Immunologii i Terapii
Transkrypt
Zapytanie_ofertowe_4/12/2014 - Instytut Immunologii i Terapii
Wrocław, dnia 19.12.2014 r. Zapytanie ofertowe dotyczące zamówienia w ramach projektu: „Utworzenie bazy danych immunogenetycznych polskiej populacji MultiGenBank” Projekt jest realizowany w ramach Priorytetu 2. Infrastruktura sfery B+R, Działanie 2.3 Inwestycje związane z rozwojem infrastruktury informatycznej nauki, Poddziałanie 2.3.2 Projekty w zakresie rozwoju zasobów informacyjnych nauki w postaci cyfrowej współfinansowanego ze środków Unii Europejskiej w ramach Programu Operacyjnego Innowacyjna Gospodarka na lata 2007–2013. 1. Zamawiający (Beneficjent): Nazwa: Instytut Immunologii i Terapii Doświadczalnej im. Ludwika Hirszfelda Polskiej Akademii Nauk we Wrocławiu Adres: ul. R. Weigla 12, 53-114 Wrocław NIP: 896-000-56-96, Regon: 000325883 2. Opis przedmiotu oraz zakres zamówienia: Przedmiotem zamówienia jest opracowanie projektu funkcjonalnego platformy MultiGenBank – systemu informatycznego służącego do gromadzenia, przetwarzania i udostępniania danych o polimorfizmach genetycznych, immunogenetycznych oraz mikrobiologicznych, którego użytkownikami będą przedstawiciele przemysłu (głównie farmaceutycznego oraz biotechnologicznego), nauki (ośrodki badawcze, jednostki medyczne) oraz edukacji (wyższe uczelnie) zlokalizowanych na terenie całej Unii Europejskiej i poza jej granicami. Platforma ta ma być zasilana danymi o ustandaryzowanej strukturze i formacie, pochodzącymi z systemów obsługujących stanowiska badawcze w laboratoriach Zamawiającego oraz z innych, zewnętrznych źródeł (głównie będą to wyniki analiz przeprowadzonych za pomocą specjalizowanego, własnościowego lub otwartego oprogramowania). Opracowany projekt ma być podstawą do późniejszej implementacji i wdrożenia platformy MultiGenBank. Dlatego podczas realizacji zamówienia należy postępować zgodnie z wymogami inżynierii oprogramowania, zaś powstająca dokumentacja powinna ujmować wszystkie aspekty funkcjonowania platformy (oferowane funkcje, realizowane procesy, zasady przetwarzania danych, udostępniane i wykorzystywane interfejsy, makiety interfejsu użytkownika, zasady współpracy z innymi systemami, analiza przypadków użycia, architektura logiczna itp.) w stopniu pozwalającym na rozpoczęcie prac implementacyjnych. W razie powstania trudności w interpretacji zapisów projektu funkcjonalnego na etapie implementacji, wykonawca projektu zobowiązany będzie do ich wyjaśnienia na drodze konsultacji. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Realizacja zamówienia ma odbywać się we współpracy z ekspertami dziedzinowymi delegowanymi przez Zamawiającego w jego siedzibie. Postęp prac będzie monitorowany przez Zamawiającego w ustalonych terminach (przynajmniej raz na tydzień). Na potrzeby realizacji zamówienia Zamawiający udostępni potrzebne materiały z zachowaniem poufności. Specyfikacja szczegółów zamówienia znajduje się w załącznikach: nr 1 (Założenia ogólne), nr 2 (Moduł immunogenetyczny), nr 3 (Moduł mikrobiologiczny). 3. Rodzaj i opis kryteriów, którymi Zamawiający będzie się kierował przy wyborze oferty, wraz z podaniem znaczenia tych kryteriów i sposobu oceny ofert oraz opis sposobu obliczenia ceny. Przy wyborze oferty Zamawiający będzie się kierował następującymi kryteriami: 1. kryterium: cena — do zdobycia max: 80 pkt. 2. kryterium: doświadczenie firmy mierzone liczbą zrealizowanych projektów baz danych dla przemysłu i nauki — do zdobycia max: 20 pkt. Wg powyższych kryteriów Zamawiający oceni otrzymane oferty posługując się poniższym wzorem: POB = Cmin / COB x 80 pkt + DOB / Dmax x 20 pkt. gdzie: POB Cmin COB Dmax DOB – liczba punktów przyznanych Wykonawcy, którego oferta jest badana, – najniższa zaoferowana cena, – cena zaoferowana w ofercie badanej, – największa liczba zrealizowanych projektów baz danych przez oferentów, – liczba zrealizowanych projektów przez oferenta w ofercie badanej. Zaokrągleń liczb niecałkowitych punktów przyznanych Wykonawcy dokonuje się zgodnie z regułami matematycznymi. Jako ofertę przyjęta do realizacji uznaję się tę, która uzyskała największą liczbę punktów. W przypadku uzyskania równej maksymalnej liczby punktów jako ofertę do realizacji wybiera się tę, która charakteryzuje się najniższą ceną. Oferta powinna zawierać cenę, którą należy podać w PLN. Oferowana cena powinna zawierać wszystkie koszty związane z realizacją zamówienia. 4. Termin realizacji zamówienia: do 30.01.2015r. 5. Miejsce, sposób i termin składania ofert: Oferta może być przekazana pocztą elektroniczną na adres: [email protected] Oferty można złożyć osobiście w zamkniętej kopercie w siedzibie Zamawiającego lub wysłać pocztą (liczy się data wpływu oferty). Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Adres: Instytut Immunologii i Terapii Doświadczalnej im. Ludwika Hirszfelda Polskiej Akademii Nauk we Wrocławiu, ul. R. Weigla 12, 53-114 Wrocław w terminie do dnia: 5.01.2015 r. do godz. 12:00 Oferty, które wpłyną do siedziby po wyznaczonym terminie składania ofert będą odsyłane bez otwierania. 6. Opis warunków udziału w postępowaniu: 1. Oferta musi być sporządzona w j. polskim. 2. O zamówienie może ubiegać się wykonawca, który wykaże swoje doświadczenie posługując się referencjami potwierdzającymi liczbę zrealizowanych projektów bazodanowych dla przemysłu i nauki. 3. W toku dokonywania oceny złożonych ofert Zamawiający może żądać udzielenia przez Wykonawcę wyjaśnień dotyczących treści złożonej oferty. 7. Rozstrzygniecie postępowania 1. Postępowanie ofertowe zostanie rozstrzygnięte najpóźniej w dniu 7.01.2015 r. 2. Zamawiający zastrzega sobie prawo do unieważnienia niniejszego postępowania bez podania przyczyny. 8. Sposób udzielania informacji i wyjaśnień: Szczegółowych informacji na temat przedmiotu zamówienia udziela koordynator projektu: Dariusz Wójcik, e-mail: [email protected]. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Załącznik nr 1. Założenia ogólne Głównym celem opracowania projektu funkcjonalnego jest stworzenie kompletnej dokumentacji ujmującej wszystkie aspekty funkcjonowania platformy MultiGenBank. Dokumentacja ta ma być opracowana zgodnie z dobrymi praktykami inżynierii oprogramowania w stopniu pozwalającym na podjęcie prac implementacyjnych i wdrożeniowych. Na każdym etapie prowadzonych prac (specyfikacji modelu konceptualnego, logicznego i fizycznego) kluczowe decyzje projektowe powinny być wypracowywane przez zespoły z udziałem przedstawicieli Zamawiającego. Sama platforma ma pełnić rolę narzędzia programowego pozwalającego na gromadzenie, przetwarzanie oraz udostępnianie danych o polimorfizmach genetycznych, immunogenetycznych oraz mikrobiologicznych użytkownikom wewnętrznym i zewnętrznym za pośrednictwem przeglądarki internetowej. Ponadto powinna udostępniać API (ang. Application Programming Interface) czyli interfejs programistyczny aplikacji, pozwalający na komunikację z innymi systemami informatycznymi oraz rozszerzanie funkcji platformy (zakłada się, iż platformę będzie można rozbudowywać nawet po zakończeniu realizacji projektu, np. przez dokładanie kolejnych modułów i ich udostępnianie w oparciu o rozbudowywalne menu). Platforma ma obsługiwać użytkowników związanych merytorycznie z dwoma dziedzinami nauki: immunogenetyką oraz mikrobiologią. Dlatego w projekcie funkcjonalnym należy wyróżnić dwa specjalizowane obszary: moduł immunogenetyczny oraz moduł mikrobiologiczny. Poza wykorzystaniem tych samych komponentów i mechanizmów platformy (np. z mechanizmów uwierzytelniania i autoryzacji) w założeniach co do implementacji tych modułów należy uwzględnić specyficzność zdefiniowanych w nich funkcji oraz niezależność i autonomiczność objętych nimi obszarów. Założenia co do zakresu funkcji modułu immunogenetycznego oraz mikrobiologicznego opisano, odpowiednio, w załączniku 2 i załączniku 3. Punktem dostępowym do funkcji platformy powinien być dwujęzyczny (j. polski i j.angielski) portal internetowy. Portal ten powinien posiadać elementy o dającej się zarządzać treści (część informacyjna) oraz elementy odpowiedzialne za realizację funkcji modułu immunogenetycznego oraz modułu mikrobiologicznego (część specjalistyczna). Zarządzanie treścią powinno być zrealizowane na zasadach, na jakich działają systemy CMS (ang. Content Management System) pozwalające na pracę w trybie edycji i przeglądania, wykorzystanie szablonów itp. Publikowanie informacji specjalistycznych powinno bazować na mechanizmach pozwalających na dynamiczne generowanie zawartości stron internetowych w oparciu o szablony i zawartość baz danych (na etapie implementacji pożądane będzie uwzględnienie możliwości przetwarzanie skryptów po stronie klienta i po stronie serwera). W architekturze logicznej platformy MultiGenBank powinny zostać zidentyfikowane komponenty zapewniające bezpieczną, niezawodną i efektywne realizację określonych funkcji. W zarysie do zestawu tych komponentów można zaliczyć: moduł bazy danych (centralna część platformy) Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. moduł administracyjny o moduł zarządzania użytkownikami (odpowiedzialny za rejestrację użytkowników, edycję profili, zarządzanie uprawnieniami itp.) o moduł zarządzania treścią (odpowiedzialny za konfigurację portalu i wygląd poszczególnych stron) o moduł konserwacji i utrzymania (odpowiedzialny za archiwizację i jej harmonogramowanie, obsługę eksportu i importu danych itp.) o moduł monitorowania oraz generowania raportów (odpowiedzialny za rejestrowanie zmian w systemie oraz przygotowywanie zestawień) moduł zarządzania danymi (współpracujący z modułem przepływów pracy) o moduł obsługi danych (odpowiedzialny za wprowadzanie danych, zarządzanie danymi oraz publikowanie danych przez użytkowników z zachowaniem uprawnień), o moduł udostępniania danych (odpowiedzialny za przygotowywanie zestawień danych do przeglądania przez użytkowników w trybie offline) o moduł integracji i konwersji danych (odpowiedzialny za zapewnienie interoperacyjność z oprogramowaniem analitycznym oraz zewnętrznymi źródłami danych: usługami sieciowymi, urządzeniami itp.) o moduł bibliograficzny (odpowiedzialny za wiązanie wykazów literatury do danych oraz rejestrowanie innych zależności) moduł przepływów pracy (odpowiedzialny za monitorowanie realizacji sekwencji działań wynikających z łańcuchów zależności prac wykonywanych przez wyznaczonych użytkowników, posiadający mechanizm wersjonowania i powrotów) o moduł wymiany danych z innymi podmiotami (odpowiedzialny za udostępnianie danych zainteresowanym podmiotom w formie umożliwiającej ich analizę przy użyciu oprogramowania zewnętrznego) o moduł obiegu dokumentów (odpowiedzialny za realizację procedur związanych ze standaryzacją, współpracę naukową, zarządzanie wynikami badań i prawami do nich itp.) moduł analiz (odpowiedzialny za uruchamianie narzędzi służących do przeprowadzania analiz na zgromadzonych danych, specyficznych dla określonego typu danych) Projekt funkcjonalny powinien zawierać elementy potrzebne do określenia wymogów sprzętowych na potrzeby projektu technicznego (np. oszacowanie wolumenu przetwarzanych danych, liczby użytkowników) oraz wytyczne do projektu graficznego tworzonego portalu MultiGenBank (makiety interfejsu użytkownika, szablony formularzy). Powyższa lista założeń ma charakter poglądowy. Jej dopracowanie i uściślenie ma nastąpić podczas realizacji projektu funkcjonalnego. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Załącznik nr 2 Moduł immunogenetyczny Platforma MultiGenBank ma obsługiwać użytkowników związanych merytorycznie z dwiema dziedzinami nauki: immunogenetyką oraz mikrobiologią. Dlatego w projekcie funkcjonalnym platformy należy uwzględnić istnienie dwóch rozłącznych jej części (działających i zarządzanych niezależnie): modułu immunogenetycznego oraz modułu mikrobiologicznego. Części te, choć specyficzne, powinny wykorzystywać wspólne komponenty i mechanizmy platformy. Zakłada się, że głównym obiektem zainteresowania użytkowników modułu immunogenetycznego będzie przetwarzanie danych immunogenetycznych dotyczących polskiej populacji ludzkiej. Do populacji tej będą należeć zdrowi osobnicy oraz pacjenci z różnymi jednostkami chorobowymi (chorobami autoimmunologicznymi, układu krwiotwórczego, nowotworami itp.), scharakteryzowani pod względem wieku, płci, występowania różnych typów polimorfizmów genetycznych oraz innych atrybutów zgodnie z ogólnoeuropejskimi standardami. Planowane jest długoterminowe pozyskiwanie tych danych z wykorzystaniem systemów obsługujących stanowiska badawcze w laboratoriach Zamawiającego oraz z innych, zewnętrznych źródeł. Dokładny zakres treści bazy danych powinien zostać zdefiniowany podczas prac analitycznych. Moduł immunogenetyczny ma pełnić rolę rejestru referencyjnego. Dlatego powinien działać na zasadach obowiązujących w rejestrach (jak wykorzystanie unikalnych identyfikatorów do gromadzonych rekordów, zastosowanie standardów przy opisie i wymianie danych, monitorowanie oraz rejestracja zmian wraz z ich autorami, zapewnienie trwałych referencji do zasobów, anonimizacja udostępnianych danych itp.). Ponadto moduł immunogenetyczny powinien pełnić rolę aplikacji pozwalającej na przeprowadzanie badań naukowych. Oznacza to, że powinien dostarczać narzędzi do przeprowadzania różnego typu analiz oraz zapewniać możliwość weryfikacji i dyskusji uzyskanych wyników. Przetwarzanie danych w tym kontekście powinno charakteryzować się szerokim spektrum oferowanych opcji, pozwalając na dokonywanie analiz związanych zarówno z określoną grupą genów, jak również z całymi przekrojami dostępnych informacji. Przewiduje się badanie rozkładu alleli i genotypów, przeprowadzanie testów i obliczeń statystycznych (χ2, OR, 95%CI, p, MAF, HWE, LD, częstości haplotypów, gen-gen itp.) i innych. Ponadto zakłada się, że przetwarzanie danych będzie odbywać się wg scenariuszy, polityki uprawnień oraz zasad bezpieczeństwa opracowanych podczas prac analitycznych. Zasady te będą szczególnie istotne przy pracy na własnych bądź współdzielonych danych, zasilaniu modułu nowymi danymi oraz ich udostępnianiu (gdzie mogą pojawić się: konieczność Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. weryfikacji poprawności wprowadzanych danych przed ich udostępnieniem, konieczność monitorowania przepływu danych do i z systemu oraz kontrolowania iteracji wynikających z ich obiegu itp.). Wspomniana wcześniej weryfikacja i dyskusja wyników prac naukowych może odbywać się poprzez odwołania do pozycji literaturowych, przeprowadzanie testów porównawczych itp. Dlatego moduł immunogenetyczny powinien pozwalać na korzystanie z zewnętrznych, referencyjnych źródeł danych. W szczególności powinien umożliwiać budowę grafów zależności między danymi przechowywanymi we własnej bazie danych a danymi zewnętrznymi. Przykładem takich zależności są referencje do pozycji literaturowych, w których wykorzystano określone dane immunogenetyczne lub w jakiś inny sposób odniesiono się do nich. Odwołania do tych pozycji, jak również do innych dziedzinowych narzędzi i serwisów w najprostszym przypadku mogą przyjąć postać hiperlinków do odpowiednich zasobów (np. zasobów serwisów www.ncbi.nlm.nih.gov, www.ensembl.org, snpinfo.niehs.nih.gov), w bardziej zaawansowanej formie mogą polegać na uruchomieniu mechanizmów integracji (z zewnętrznymi narzędziami i serwisami). Wymienione powyżej założenia mają charakter poglądowy. Nakreślają one jedynie główne ramy oczekiwanych funkcji modułu immunogenetycznego. Podczas opracowywania projektu funkcjonalnego należy zidentyfikować w detalach wszystkie aspekty funkcjonowania tego modułu (na podstawie rozmów z ekspertami dziedzinowymi i dostarczonych materiałów) oraz wpisać je w architekturę logiczną budowanej platformy. Końcowy efekt tych prac, w postaci dokumentu stworzonego zgodnie z dobrymi praktykami inżynierii oprogramowania, powinien pozwolić na podjęcie prac implementacyjnych i wdrożeniowych. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Załącznik nr 3 Moduł mikrobiologiczny 1. Uwagi ogólne Wszystkie funkcje bazy mają być dostępne jedynie przez stronę www dla zewnętrznych użytkowników. Użytkownicy mogą być dowolni, jednak przewidujemy konieczność rejestracji przez podanie adresu email oraz zabezpieczenia ograniczające działalność automatów przy korzystaniu z bazy i narzędzi. Powinna istnieć możliwość ograniczenia akceptowanych adresów email, np. w celu wyeliminowania adresów z ogólnodostępnych serwisów i zawężeniu jedynie do adresów służbowych (związanych z instytucjami naukowymi lub firmami) użytkowników. Szacowana liczba rekordów w bazie będzie wynosiła około 3000. Przy tworzeniu bazy danych może być konieczne przetworzenie surowych danych, wyekstrahowanie informacji z innych baz oraz ich zaadaptowanie i wprowadzenie do powstającej bazy, co będzie po stronie wykonawcy. Baza powinna mieć możliwość wprowadzenia i przechowywania sekwencji całych genomów bakteryjnych. 2. Tabela z nagłówkami widoczna dla użytkownika: Wersja angielska Strain genotyping Organism name Strain number Genotype Taxonomy 1 2 3 4 Interesting features Sequence of main markers Sequence of other markers Results of RAPD and other methods 5 6 7 Resistance genes Useful enzymes Secondary metabolites 8 9 10 Wersja polska Genotypowanie szczepu Nazwa organizmu Numer szczepu Genotyp Taksonomia 1 2 3 4 Interesujące cechy Sekwencja głównego markera Sekwencje innych markerów Wyniki RAPD i innych metod 5 6 7 Geny oporności Użyteczne enzymy Wtórne metabolity 8 9 10 3. Charakterystyka tabeli Pole 1: Nazwa naukowa organizmu: rodzaj i gatunek, np. Streptomyces coelicolor. Nazwa musi być taka sama jak w bazie Polish Collection of Microorganisms (PCM): http://www.pcm.org.pl. Obie bazy Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. muszą być pod tym względem spójne. Zmiany dokonywane w jednej z baz muszą pociągać zmiany w drugiej bazie. Pole 2: Numer szczepu. m.in. w kolekcji PCM, np. PCM-2324, z łączem do odpowiedniego rekordu w bazie PCM - API, standard zapisu JSON (Java Script Object Notification). Z powodów historycznych może być kilka numerów opisujących ten sam mikroorganizm. Pole 3: Informacje o genotypie: wprowadzone mutacje, charakterystyczne plazmidy i geny, według formatu http://www.sigmaaldrich.com/life-science/molecular-biology/cloning-and-expression/learningcenter/definitions.html np.: DeltaM15, Delta(lacZYA-argF), U169, recA1, endA1, hsdR17(rK-mK+), supE44, thi-1, gyrA96, relA1. Pole 4: Nazwy grup taksonomicznych, np. Bacteria, Actinobacteria, Streptomycetaceae. Nazwa musi być taka sama jak w bazie PCM. Obie bazy muszą być pod tym względem spójne. Zmiany dokonywane w jednej z baz muszą pociągać zmiany w drugiej bazie. Pole 5: Nazwa głównego markera: 16S rRNA, ITS-1 lub ITS-2 z łączem do pliku tekstowego z ich sekwencją w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa markera. Wszystko czcionką Courier, np.: >Streptomyces_coelicolor_2324_16SrRNA ATCGTAGCTGGAGGAGATGGAGCGTAGCATGCTAGATAGTCTAGCTAGTA ATCGTGATGCATGCATGCTGATGCTAGCTAGCTAGCTAGCTAGCTAGCTA ATGAATGTAGCTAGCTTAGCTGACTGCTGCTGTAGCTGATCGTAGCTGAC Po kliknięciu otworzy się łącze i wyświetli się jego zawartość. Pole 6: Nazwa innych markerów: dnaJ, sod A, tuf, rpoB, gyrB, elongation factor Tt, F-ATPase beta subunit; 16S-23S rRNA spacer; recA; groEL, dnaK; omp50; choE; hsp65, każdy z łączem: - nazwa nt do pliku tekstowego z ich sekwencją nukleotydową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa markera. Wszystko czcionką Courier, np.: >Streptomyces_coelicolor_2324_dnaJ ATGCTGAGCTAGTACGTCGTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAG AATAGATCGTAGCTAGCTAGCTAGCTAGCTAGTCGTCGCTGATCGATCGT AATCGATGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. - nazwa aa do pliku tekstowego z ich sekwencją aminokwasową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa markera. Po kliknięciu otworzy się łącze i wyświetli się jego zawartość. W tym polu może być więcej niż jedna nazwa. Zwykle nie więcej niż trzy nazwy. Przykład: dnaJ (nt, aa) sod A (nt, aa) tuf (nt, aa) Pole 7: Opis metody w której uzyskuje się dane, ze znacznikiem kontrolującym, że w analizach porównuje się dane uzyskane tą sama metodą. Nazwa Image z łączem do pliku rastrowego zwierającego zdjęcie obrazu elektroforezy, np.: Nazwa Method_description_nr (nr oznacza numer metody w bazie) z łączem do opisu metody genotypowania. Nazwa Method_data_nr (nr oznacza numer metody w bazie) z łączem do pliku tekstowego zwierającego długości sekwencji uzyskanych w wyniku RAPD, posortowanych rosnąco, np.: 300 320 550 620 750 1150 1700 Po kliknięciu otworzy się łącze i wyświetli się jego zawartość. Przykład: Image Method_description_nr Method_data_nr Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Pole 8: Nazwa genu związanego z opornością szczepu. Po nazwie genu: - nazwa description z łączem do pełnej nazwy genu, kodowanego produktu i opisu związanego z opornością, - nazwa nt fasta z łączem do pliku tekstowego z ich sekwencją nukleotydową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu, - nazwa aa fasta z łączem do pliku tekstowego z ich sekwencją aminokwasową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu, - nazwa nt genbank z łączem do pliku z sekwencją nukleotydową w formacie Genbank (gbk), - nazwa aa genbank z łączem do pliku z sekwencją aminokwasową w formacie Genbank (gbk). Po kliknięciu otworzy się łącze i wyświetli się jego zawartość. W tym polu może być więcej niż jedna nazwa i nie wszystkie mogą mieć aktywne łącza. Przykład: genA (description, nt fasta, aa fasta, nt genbank, aa genbank) genB (description, nt fasta, aa fasta, nt genbank, aa genbank) genC (description, nt fasta, aa fasta, nt genbank, aa genbank) Pole 9: Nazwa genu kodującego enzymy użyteczne przemysłowo (w tym enzymy z grzybów użyteczne w biotransformacjach). Po nazwie genu: - nazwa description z łączem do pełnej nazwy genu, kodowanego produktu i opisu związanego z funkcją enzymatyczną, - nazwa nt fasta z łączem do pliku tekstowego z ich sekwencją nukleotydową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu, - nazwa aa fasta z łączem do pliku tekstowego z ich sekwencją aminokwasową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu, - nazwa nt genbank z łączem do pliku z sekwencją nukleotydową w formacie Genbank (gbk), - nazwa aa genbank z łączem do pliku z sekwencją aminokwasową w formacie Genbank (gbk). Po kliknięciu otworzy się łącze i wyświetli się jego zawartość. W tym polu może być więcej niż jedna nazwa i nie wszystkie mogą mieć aktywne łącza. Przykład: genA (description, nt fasta, aa fasta, nt genbank, aa genbank) genB (description, nt fasta, aa fasta, nt genbank, aa genbank) genC (description, nt fasta, aa fasta, nt genbank, aa genbank) Po wejściu do description mogą w nim znajdować się łącza do produktów umieszczonych w Platformie PCM. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Pole 10: Nazwa cluster z łączem do schematu genów, ich produktów z domenami białkowymi i wytwarzanymi lub modyfikowanymi produktami. Długości obiektów graficznych reprezentujące geny (strzałki), produkty (prostokąty) i domeny (prostokąty) są proporcjonalne do ich długości, a odległości między nimi odzwierciedlają względne położenie w sekwencji genomu lub białka. Obiekty będą odpowiednio podpisane i po kliknięciu pojawi się ich opis. Pod domenami będą obiekty graficzne ze wzorami i nazwami metabolitu wtórnego wytwarzanego lub modyfikowanego przez dane domeny. Pod obiektem pierwszej domeny produktu pierwszego genu będzie obiekt reprezentujący substrat reakcji. Po kliknięciu na obiekty substratów i metabolitów zostaną one wyświetlone w powiększeniu. Przykład: Gene A Protein A Gene B Gene C Protein B Protein C Nazwa genu związanego z syntezą metabolitów wtórnych (głównie poliketydów). Po nazwie genu: - nazwa description z łączem do pełnej nazwy genu, kodowanego produktu i opisu związanego z funkcją enzymatyczną, - nazwa nt fasta z łączem do pliku tekstowego z ich sekwencją nukleotydową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu, - nazwa aa fasta z łączem do pliku tekstowego z ich sekwencją aminokwasową w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu, - nazwa nt genbank z łączem do pliku z sekwencją nukleotydową w formacie Genbank (gbk), - nazwa aa genbank z łączem do pliku z sekwencją aminokwasową w formacie Genbank (gbk), - nazwa ostatecznego metabolitu wtórnego wytwarzanego lub modyfikowanego przez dane białko z łączem do pliku rastrowego (lub innego) z jego opisem i wzorem chemicznym. Wzory zapisywane są w formacie SMILES lub innym dla wzorów chemicznych (http://pl.wikipedia.org/wiki/SMILES, http://pubchem.ncbi.nlm.nih.gov/edit2/index.html). Po kliknięciu otworzy się łącze i wyświetli się jego zawartość. W tym polu może być więcej niż jedna nazwa (nawet 49) i nie wszystkie muszą mieć aktywne łącza. Przykład: genA (description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite) genB (description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite) genC (description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite) Geny ułożone są zgodnie z ich kolejnością położenia w genomie i kolejnością przeprowadzania reakcji chemicznych przez ich produkty. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość. Po wejściu do description poza opisem pojawi się wykaz modułów i domen białkowych. Po wejściu do metabolite mogą w nim znajdować się łącza do produktów umieszczonych w Platformie PCM. 4. Operacje na danych zwartych w bazie 1. Baza danych może być przeszukiwana w celu wylistowania rekordów posiadających dane słowa kluczowe występujące w odpowiednich polach tabeli i łączach do nich. Jest możliwość tworzenia zaawansowanych zapytań wykorzystując operatory AND, OR, NOT. 2. W polach (5, 6, 8, 9 i 10) przy łączach do sekwencji występuje pole wyboru z możliwością jego zaznaczenia. W odpowiednim nagłówku tabeli jest dodatkowe pole lub pola (odpowiednio dla typów sekwencji, np. nt fasta, aa fasta, nt genbank, aa genbank) umożliwiające zaznaczenie wszystkich sekwencji w wylistowanych rekordach w danej kolumnie tabeli. Zaznaczone sekwencję mogą zostać pobrane przez użytkownika w formie pliku tekstowego, a na sekwencjach homologicznych (wszystkich sekwencjach z pola 5 i odpowiednich grupach sekwencji z pola 6) mogą zostać wykonane analizy przy pomocy programów wykonujących przyrównania sekwencji (np. Clustal, Mafft, Muscle) oraz tworzących proste drzewa filogenetyczne. Programy będą uruchamiane lokalnie. 3. W polu 7 przy nazwie Method_data_nr występuje pole wyboru z możliwością jego zaznaczenia. W nagłówku tabeli jest dodatkowe łącze umożliwiające wylistowanie wszystkich metod (w formacie Method_nr, gdzie nr to numer metody) występujących w wylistowanych rekordach. Zaznaczenie jednej metody będzie skutkowało wyborem wszystkich pól Method_data_nr dla tej samej zaznaczonej metody w wylistowanych rekordach w kolumnie tabeli. Zaznaczone dane mogą zostać pobrane przez użytkownika w formie pliku tekstowego oraz mogą zostać wykonane dla nich analizy przy pomocy programu GelCompar, GelQuest/ClusterVis lub innych (dane tabelaryczne mogą być również analizowane programem statystycznym, np. w pakiecie R). Program będzie uruchamiany lokalnie. 4. Ma istnieć możliwość poszukiwania sekwencji zawartych w bazie w oparciu o podobieństwo sekwencji przy pomocy lokalnie uruchamianego programu BLAST. Znalezione sekwencje homologiczne mają łącza do swoich odpowiednich rekordów. Podobnie jak w punkcie 2 mogą zostać wykonane na nich analizy przy pomocy programów wykonujących przyrównania sekwencji (np. Clustal, Mafft, Muscle) oraz tworzących proste drzewa filogenetyczne. 5. Z danymi w polu 10 będzie skojarzone narzędzie pozwalające na wybieranie z bazy zestawu genów lub ich fragmentów (modułów i domen białkowych) na podstawie podanego wzoru chemicznego (formacie SMILES lub innym dla wzorów chemicznych) metabolitu wytwarzanego lub modyfikowanego. Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.