Zapytanie_ofertowe_4/12/2014 - Instytut Immunologii i Terapii

Transkrypt

Wrocław, dnia 19.12.2014 r.
Zapytanie ofertowe
dotyczące zamówienia w ramach projektu:
„Utworzenie bazy danych immunogenetycznych polskiej populacji MultiGenBank”
Projekt jest realizowany w ramach Priorytetu 2. Infrastruktura sfery B+R, Działanie 2.3
Inwestycje związane z rozwojem infrastruktury informatycznej nauki, Poddziałanie 2.3.2
Projekty w zakresie rozwoju zasobów informacyjnych nauki w postaci cyfrowej
współfinansowanego ze środków Unii Europejskiej w ramach Programu Operacyjnego
Innowacyjna Gospodarka na lata 2007–2013.
1. Zamawiający (Beneficjent):
Nazwa: Instytut Immunologii i Terapii Doświadczalnej im. Ludwika Hirszfelda
Polskiej Akademii Nauk we Wrocławiu
Adres: ul. R. Weigla 12, 53-114 Wrocław
NIP:
896-000-56-96,
Regon: 000325883
2. Opis przedmiotu oraz zakres zamówienia:
Przedmiotem zamówienia jest opracowanie projektu funkcjonalnego platformy
MultiGenBank – systemu informatycznego służącego do gromadzenia, przetwarzania
i udostępniania danych o polimorfizmach genetycznych, immunogenetycznych oraz
mikrobiologicznych, którego użytkownikami będą przedstawiciele przemysłu (głównie
farmaceutycznego oraz biotechnologicznego), nauki (ośrodki badawcze, jednostki medyczne)
oraz edukacji (wyższe uczelnie) zlokalizowanych na terenie całej Unii Europejskiej i poza jej
granicami. Platforma ta ma być zasilana danymi o ustandaryzowanej strukturze i formacie,
pochodzącymi z systemów obsługujących stanowiska badawcze w laboratoriach
Zamawiającego oraz z innych, zewnętrznych źródeł (głównie będą to wyniki analiz
przeprowadzonych za pomocą specjalizowanego, własnościowego lub otwartego
oprogramowania).
Opracowany projekt ma być podstawą do późniejszej implementacji i wdrożenia
platformy MultiGenBank. Dlatego podczas realizacji zamówienia należy postępować zgodnie
z wymogami inżynierii oprogramowania, zaś powstająca dokumentacja powinna ujmować
wszystkie aspekty funkcjonowania platformy (oferowane funkcje, realizowane procesy,
zasady przetwarzania danych, udostępniane i wykorzystywane interfejsy, makiety interfejsu
użytkownika, zasady współpracy z innymi systemami, analiza przypadków użycia,
architektura logiczna itp.) w stopniu pozwalającym na rozpoczęcie prac implementacyjnych.
W razie powstania trudności w interpretacji zapisów projektu funkcjonalnego na etapie
implementacji, wykonawca projektu zobowiązany będzie do ich wyjaśnienia na drodze
konsultacji.
Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Operacyjnego Innowacyjna Gospodarka. Dotacje na innowacje. Inwestujemy w Waszą przyszłość.
Realizacja zamówienia ma odbywać się we współpracy z ekspertami dziedzinowymi
delegowanymi przez Zamawiającego w jego siedzibie. Postęp prac będzie monitorowany
przez Zamawiającego w ustalonych terminach (przynajmniej raz na tydzień). Na potrzeby
realizacji zamówienia Zamawiający udostępni potrzebne materiały z zachowaniem poufności.
Specyfikacja szczegółów zamówienia znajduje się w załącznikach: nr 1 (Założenia
ogólne), nr 2 (Moduł immunogenetyczny), nr 3 (Moduł mikrobiologiczny).
3. Rodzaj i opis kryteriów, którymi Zamawiający będzie się kierował przy wyborze
oferty, wraz z podaniem znaczenia tych kryteriów i sposobu oceny ofert oraz opis
sposobu obliczenia ceny.
Przy wyborze oferty Zamawiający będzie się kierował następującymi kryteriami:
1. kryterium: cena — do zdobycia max: 80 pkt.
2. kryterium: doświadczenie firmy mierzone liczbą zrealizowanych projektów baz danych
dla przemysłu i nauki — do zdobycia max: 20 pkt.
Wg powyższych kryteriów Zamawiający oceni otrzymane oferty posługując się poniższym
wzorem:
POB = Cmin / COB x 80 pkt + DOB / Dmax x 20 pkt.
gdzie:
POB
Cmin
COB
Dmax
DOB
– liczba punktów przyznanych Wykonawcy, którego oferta jest badana,
– najniższa zaoferowana cena,
– cena zaoferowana w ofercie badanej,
– największa liczba zrealizowanych projektów baz danych przez oferentów,
– liczba zrealizowanych projektów przez oferenta w ofercie badanej.
Zaokrągleń liczb niecałkowitych punktów przyznanych Wykonawcy dokonuje się zgodnie
z regułami matematycznymi. Jako ofertę przyjęta do realizacji uznaję się tę, która uzyskała
największą liczbę punktów. W przypadku uzyskania równej maksymalnej liczby punktów
jako ofertę do realizacji wybiera się tę, która charakteryzuje się najniższą ceną.
Oferta powinna zawierać cenę, którą należy podać w PLN.
Oferowana cena powinna zawierać wszystkie koszty związane z realizacją zamówienia.
4. Termin realizacji zamówienia:
do 30.01.2015r.
5. Miejsce, sposób i termin składania ofert:
Oferta może być przekazana pocztą elektroniczną na adres: [email protected]
Oferty można złożyć osobiście w zamkniętej kopercie w siedzibie Zamawiającego lub wysłać
pocztą (liczy się data wpływu oferty).
Adres: Instytut Immunologii i Terapii Doświadczalnej im. Ludwika Hirszfelda Polskiej
Akademii Nauk we Wrocławiu,
ul. R. Weigla 12,
53-114 Wrocław
w terminie do dnia: 5.01.2015 r. do godz. 12:00
Oferty, które wpłyną do siedziby po wyznaczonym terminie składania ofert będą odsyłane bez
otwierania.
6. Opis warunków udziału w postępowaniu:
1. Oferta musi być sporządzona w j. polskim.
2. O zamówienie może ubiegać się wykonawca, który wykaże swoje doświadczenie
posługując się referencjami potwierdzającymi liczbę zrealizowanych projektów
bazodanowych dla przemysłu i nauki.
3. W toku dokonywania oceny złożonych ofert Zamawiający może żądać udzielenia
przez Wykonawcę wyjaśnień dotyczących treści złożonej oferty.
7. Rozstrzygniecie postępowania
1. Postępowanie ofertowe zostanie rozstrzygnięte najpóźniej w dniu 7.01.2015 r.
2. Zamawiający zastrzega sobie prawo do unieważnienia niniejszego postępowania bez
podania przyczyny.
8. Sposób udzielania informacji i wyjaśnień:
Szczegółowych informacji na temat przedmiotu zamówienia udziela koordynator projektu:
Dariusz Wójcik, e-mail: [email protected].
Załącznik nr 1.
Założenia ogólne
Głównym celem opracowania projektu funkcjonalnego jest stworzenie kompletnej
dokumentacji ujmującej wszystkie aspekty funkcjonowania platformy MultiGenBank.
Dokumentacja ta ma być opracowana zgodnie z dobrymi praktykami inżynierii
oprogramowania w stopniu pozwalającym na podjęcie prac implementacyjnych
i wdrożeniowych. Na każdym etapie prowadzonych prac (specyfikacji modelu
konceptualnego, logicznego i fizycznego) kluczowe decyzje projektowe powinny być
wypracowywane przez zespoły z udziałem przedstawicieli Zamawiającego.
Sama platforma ma pełnić rolę narzędzia programowego pozwalającego na gromadzenie,
przetwarzanie
oraz
udostępnianie
danych
o
polimorfizmach
genetycznych,
immunogenetycznych oraz mikrobiologicznych użytkownikom wewnętrznym i zewnętrznym
za pośrednictwem przeglądarki internetowej. Ponadto powinna udostępniać API (ang.
Application Programming Interface) czyli interfejs programistyczny aplikacji, pozwalający na
komunikację z innymi systemami informatycznymi oraz rozszerzanie funkcji platformy
(zakłada się, iż platformę będzie można rozbudowywać nawet po zakończeniu realizacji
projektu, np. przez dokładanie kolejnych modułów i ich udostępnianie w oparciu
o rozbudowywalne menu).
Platforma ma obsługiwać użytkowników związanych merytorycznie z dwoma dziedzinami
nauki: immunogenetyką oraz mikrobiologią. Dlatego w projekcie funkcjonalnym należy
wyróżnić dwa specjalizowane obszary: moduł immunogenetyczny oraz moduł
mikrobiologiczny.
Poza wykorzystaniem tych samych komponentów i mechanizmów platformy (np.
z mechanizmów uwierzytelniania i autoryzacji) w założeniach co do implementacji tych
modułów należy uwzględnić specyficzność zdefiniowanych w nich funkcji oraz niezależność
i autonomiczność objętych nimi obszarów. Założenia co do zakresu funkcji modułu
immunogenetycznego oraz mikrobiologicznego opisano, odpowiednio, w załączniku 2
i załączniku 3.
Punktem dostępowym do funkcji platformy powinien być dwujęzyczny (j. polski i j.angielski)
portal internetowy. Portal ten powinien posiadać elementy o dającej się zarządzać treści
(część informacyjna) oraz elementy odpowiedzialne za realizację funkcji modułu
immunogenetycznego oraz modułu mikrobiologicznego (część specjalistyczna). Zarządzanie
treścią powinno być zrealizowane na zasadach, na jakich działają systemy CMS (ang. Content
Management System) pozwalające na pracę w trybie edycji i przeglądania, wykorzystanie
szablonów itp. Publikowanie informacji specjalistycznych powinno bazować na
mechanizmach pozwalających na dynamiczne generowanie zawartości stron internetowych
w oparciu o szablony i zawartość baz danych (na etapie implementacji pożądane będzie
uwzględnienie możliwości przetwarzanie skryptów po stronie klienta i po stronie serwera).
W architekturze logicznej platformy MultiGenBank powinny zostać zidentyfikowane
komponenty zapewniające bezpieczną, niezawodną i efektywne realizację określonych
funkcji. W zarysie do zestawu tych komponentów można zaliczyć:
 moduł bazy danych (centralna część platformy)
 moduł administracyjny
o moduł zarządzania użytkownikami (odpowiedzialny za rejestrację
użytkowników, edycję profili, zarządzanie uprawnieniami itp.)
o moduł zarządzania treścią (odpowiedzialny za konfigurację portalu i wygląd
poszczególnych stron)
o moduł konserwacji i utrzymania (odpowiedzialny za archiwizację i jej
harmonogramowanie, obsługę eksportu i importu danych itp.)
o moduł monitorowania oraz generowania raportów (odpowiedzialny za
rejestrowanie zmian w systemie oraz przygotowywanie zestawień)
 moduł zarządzania danymi (współpracujący z modułem przepływów pracy)
o moduł obsługi danych (odpowiedzialny za wprowadzanie danych, zarządzanie
danymi oraz publikowanie danych przez użytkowników z zachowaniem
uprawnień),
o moduł udostępniania danych (odpowiedzialny za przygotowywanie zestawień
danych do przeglądania przez użytkowników w trybie offline)
o moduł integracji i konwersji danych (odpowiedzialny za zapewnienie
interoperacyjność z oprogramowaniem analitycznym oraz zewnętrznymi
źródłami danych: usługami sieciowymi, urządzeniami itp.)
o moduł bibliograficzny (odpowiedzialny za wiązanie wykazów literatury do
danych oraz rejestrowanie innych zależności)
 moduł przepływów pracy (odpowiedzialny za monitorowanie realizacji sekwencji
działań wynikających z łańcuchów zależności prac wykonywanych przez
wyznaczonych użytkowników, posiadający mechanizm wersjonowania i powrotów)
o moduł wymiany danych z innymi podmiotami (odpowiedzialny za
udostępnianie danych zainteresowanym podmiotom w formie umożliwiającej
ich analizę przy użyciu oprogramowania zewnętrznego)
o moduł obiegu dokumentów (odpowiedzialny za realizację procedur
związanych ze standaryzacją, współpracę naukową, zarządzanie wynikami
badań i prawami do nich itp.)
 moduł analiz (odpowiedzialny za uruchamianie narzędzi służących do
przeprowadzania analiz na zgromadzonych danych, specyficznych dla określonego
typu danych)
Projekt funkcjonalny powinien zawierać elementy potrzebne do określenia wymogów
sprzętowych na potrzeby projektu technicznego (np. oszacowanie wolumenu przetwarzanych
danych, liczby użytkowników) oraz wytyczne do projektu graficznego tworzonego portalu
MultiGenBank (makiety interfejsu użytkownika, szablony formularzy).
Powyższa lista założeń ma charakter poglądowy. Jej dopracowanie i uściślenie ma nastąpić
podczas realizacji projektu funkcjonalnego.
Załącznik nr 2
Moduł immunogenetyczny
Platforma MultiGenBank ma obsługiwać użytkowników związanych merytorycznie z dwiema
dziedzinami nauki: immunogenetyką oraz mikrobiologią. Dlatego w projekcie funkcjonalnym
platformy należy uwzględnić istnienie dwóch rozłącznych jej części (działających
i zarządzanych
niezależnie):
modułu
immunogenetycznego
oraz
modułu
mikrobiologicznego. Części te, choć specyficzne, powinny wykorzystywać wspólne
komponenty i mechanizmy platformy.
Zakłada się, że głównym obiektem zainteresowania użytkowników modułu
immunogenetycznego będzie przetwarzanie danych immunogenetycznych dotyczących
polskiej populacji ludzkiej. Do populacji tej będą należeć zdrowi osobnicy oraz pacjenci
z różnymi jednostkami chorobowymi (chorobami autoimmunologicznymi, układu
krwiotwórczego, nowotworami itp.), scharakteryzowani pod względem wieku, płci,
występowania różnych typów polimorfizmów genetycznych oraz innych atrybutów zgodnie
z ogólnoeuropejskimi standardami. Planowane jest długoterminowe pozyskiwanie tych
danych z wykorzystaniem systemów obsługujących stanowiska badawcze w laboratoriach
Zamawiającego oraz z innych, zewnętrznych źródeł. Dokładny zakres treści bazy danych
powinien zostać zdefiniowany podczas prac analitycznych.
Moduł immunogenetyczny ma pełnić rolę rejestru referencyjnego. Dlatego powinien działać
na zasadach obowiązujących w rejestrach (jak wykorzystanie unikalnych identyfikatorów do
gromadzonych rekordów, zastosowanie standardów przy opisie i wymianie danych,
monitorowanie oraz rejestracja zmian wraz z ich autorami, zapewnienie trwałych referencji
do zasobów, anonimizacja udostępnianych danych itp.).
Ponadto moduł immunogenetyczny powinien pełnić rolę aplikacji pozwalającej na
przeprowadzanie badań naukowych. Oznacza to, że powinien dostarczać narzędzi do
przeprowadzania różnego typu analiz oraz zapewniać możliwość weryfikacji i dyskusji
uzyskanych wyników.
Przetwarzanie danych w tym kontekście powinno charakteryzować się szerokim spektrum
oferowanych opcji, pozwalając na dokonywanie analiz związanych zarówno z określoną
grupą genów, jak również z całymi przekrojami dostępnych informacji. Przewiduje się
badanie rozkładu alleli i genotypów, przeprowadzanie testów i obliczeń statystycznych (χ2,
OR, 95%CI, p, MAF, HWE, LD, częstości haplotypów, gen-gen itp.) i innych.
Ponadto zakłada się, że przetwarzanie danych będzie odbywać się wg scenariuszy, polityki
uprawnień oraz zasad bezpieczeństwa opracowanych podczas prac analitycznych. Zasady te
będą szczególnie istotne przy pracy na własnych bądź współdzielonych danych, zasilaniu
modułu nowymi danymi oraz ich udostępnianiu (gdzie mogą pojawić się: konieczność
weryfikacji poprawności wprowadzanych danych przed ich udostępnieniem, konieczność
monitorowania przepływu danych do i z systemu oraz kontrolowania iteracji wynikających
z ich obiegu itp.).
Wspomniana wcześniej weryfikacja i dyskusja wyników prac naukowych może odbywać się
poprzez odwołania do pozycji literaturowych, przeprowadzanie testów porównawczych itp.
Dlatego moduł immunogenetyczny powinien pozwalać na korzystanie z zewnętrznych,
referencyjnych źródeł danych. W szczególności powinien umożliwiać budowę grafów
zależności między danymi przechowywanymi we własnej bazie danych a danymi
zewnętrznymi. Przykładem takich zależności są referencje do pozycji literaturowych,
w których wykorzystano określone dane immunogenetyczne lub w jakiś inny sposób
odniesiono się do nich. Odwołania do tych pozycji, jak również do innych dziedzinowych
narzędzi i serwisów w najprostszym przypadku mogą przyjąć postać hiperlinków do
odpowiednich zasobów (np. zasobów serwisów www.ncbi.nlm.nih.gov, www.ensembl.org,
snpinfo.niehs.nih.gov), w bardziej zaawansowanej formie mogą polegać na uruchomieniu
mechanizmów integracji (z zewnętrznymi narzędziami i serwisami).
Wymienione powyżej założenia mają charakter poglądowy. Nakreślają one jedynie główne
ramy oczekiwanych funkcji modułu immunogenetycznego. Podczas opracowywania projektu
funkcjonalnego należy zidentyfikować w detalach wszystkie aspekty funkcjonowania tego
modułu (na podstawie rozmów z ekspertami dziedzinowymi i dostarczonych materiałów) oraz
wpisać je w architekturę logiczną budowanej platformy. Końcowy efekt tych prac, w postaci
dokumentu stworzonego zgodnie z dobrymi praktykami inżynierii oprogramowania, powinien
pozwolić na podjęcie prac implementacyjnych i wdrożeniowych.
Załącznik nr 3
Moduł mikrobiologiczny
1. Uwagi ogólne
Wszystkie funkcje bazy mają być dostępne jedynie przez stronę www dla zewnętrznych
użytkowników. Użytkownicy mogą być dowolni, jednak przewidujemy konieczność rejestracji przez
podanie adresu email oraz zabezpieczenia ograniczające działalność automatów przy korzystaniu z
bazy i narzędzi. Powinna istnieć możliwość ograniczenia akceptowanych adresów email, np. w celu
wyeliminowania adresów z ogólnodostępnych serwisów i zawężeniu jedynie do adresów służbowych
(związanych z instytucjami naukowymi lub firmami) użytkowników. Szacowana liczba rekordów w
bazie będzie wynosiła około 3000. Przy tworzeniu bazy danych może być konieczne przetworzenie
surowych danych, wyekstrahowanie informacji z innych baz oraz ich zaadaptowanie i wprowadzenie
do powstającej bazy, co będzie po stronie wykonawcy. Baza powinna mieć możliwość wprowadzenia
i przechowywania sekwencji całych genomów bakteryjnych.
2. Tabela z nagłówkami widoczna dla użytkownika:
Wersja angielska
Strain genotyping
Organism
name
Strain
number
Genotype
Taxonomy
1
2
3
4
Interesting features
Sequence
of main
markers
Sequence
of other
markers
Results of
RAPD
and other
methods
5
6
7
Resistance
genes
Useful
enzymes
Secondary
metabolites
8
9
10
Wersja polska
Genotypowanie szczepu
Nazwa
organizmu
Numer
szczepu
Genotyp
Taksonomia
1
2
3
4
Interesujące cechy
Sekwencja
głównego
markera
Sekwencje
innych
markerów
Wyniki
RAPD i
innych
metod
5
6
7
Geny
oporności
Użyteczne
enzymy
Wtórne
metabolity
8
9
10
3. Charakterystyka tabeli
Pole 1:
Nazwa naukowa organizmu: rodzaj i gatunek, np. Streptomyces coelicolor. Nazwa musi być taka
sama jak w bazie Polish Collection of Microorganisms (PCM): http://www.pcm.org.pl. Obie bazy
muszą być pod tym względem spójne. Zmiany dokonywane w jednej z baz muszą pociągać zmiany w
drugiej bazie.
Pole 2:
Numer szczepu. m.in. w kolekcji PCM, np. PCM-2324, z łączem do odpowiedniego rekordu w bazie
PCM - API, standard zapisu JSON (Java Script Object Notification). Z powodów historycznych może
być kilka numerów opisujących ten sam mikroorganizm.
Pole 3:
Informacje o genotypie: wprowadzone mutacje, charakterystyczne plazmidy i geny, według formatu
http://www.sigmaaldrich.com/life-science/molecular-biology/cloning-and-expression/learningcenter/definitions.html np.:
DeltaM15, Delta(lacZYA-argF), U169, recA1, endA1, hsdR17(rK-mK+), supE44, thi-1, gyrA96,
relA1.
Pole 4:
Nazwy grup taksonomicznych, np. Bacteria, Actinobacteria, Streptomycetaceae. Nazwa musi być
taka sama jak w bazie PCM. Obie bazy muszą być pod tym względem spójne. Zmiany dokonywane w
jednej z baz muszą pociągać zmiany w drugiej bazie.
Pole 5:
Nazwa głównego markera: 16S rRNA, ITS-1 lub ITS-2 z łączem do pliku tekstowego z ich sekwencją
w formacie FASTA z odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer
szczepu_nazwa markera. Wszystko czcionką Courier, np.:
>Streptomyces_coelicolor_2324_16SrRNA
ATCGTAGCTGGAGGAGATGGAGCGTAGCATGCTAGATAGTCTAGCTAGTA
ATCGTGATGCATGCATGCTGATGCTAGCTAGCTAGCTAGCTAGCTAGCTA
ATGAATGTAGCTAGCTTAGCTGACTGCTGCTGTAGCTGATCGTAGCTGAC
Po kliknięciu otworzy się łącze i wyświetli się jego zawartość.
Pole 6:
Nazwa innych markerów: dnaJ, sod A, tuf, rpoB, gyrB, elongation factor Tt, F-ATPase beta subunit;
16S-23S rRNA spacer; recA; groEL, dnaK; omp50; choE; hsp65, każdy z łączem:
- nazwa nt do pliku tekstowego z ich sekwencją nukleotydową w formacie FASTA z odpowiednim
nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa markera. Wszystko
czcionką Courier, np.:
>Streptomyces_coelicolor_2324_dnaJ
ATGCTGAGCTAGTACGTCGTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAG
AATAGATCGTAGCTAGCTAGCTAGCTAGCTAGTCGTCGCTGATCGATCGT
AATCGATGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT
- nazwa aa do pliku tekstowego z ich sekwencją aminokwasową w formacie FASTA z odpowiednim
nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa markera.
W tym polu może być więcej niż jedna nazwa. Zwykle nie więcej niż trzy nazwy.
Przykład:
dnaJ (nt, aa)
sod A (nt, aa)
tuf (nt, aa)
Pole 7:
Opis metody w której uzyskuje się dane, ze znacznikiem kontrolującym, że w analizach porównuje się
dane uzyskane tą sama metodą.
Nazwa Image z łączem do pliku rastrowego zwierającego zdjęcie obrazu elektroforezy, np.:
Nazwa Method_description_nr (nr oznacza numer metody w bazie) z łączem do opisu metody
genotypowania.
Nazwa Method_data_nr (nr oznacza numer metody w bazie) z łączem do pliku tekstowego
zwierającego długości sekwencji uzyskanych w wyniku RAPD, posortowanych rosnąco, np.:
300
320
550
620
750
1150
1700
Przykład: Image Method_description_nr Method_data_nr
Pole 8:
Nazwa genu związanego z opornością szczepu. Po nazwie genu:
- nazwa description z łączem do pełnej nazwy genu, kodowanego produktu i opisu związanego z
opornością,
- nazwa nt fasta z łączem do pliku tekstowego z ich sekwencją nukleotydową w formacie FASTA z
odpowiednim nagłówkiem: nazwa rodzajowa_nazwa gatunkowa_numer szczepu_nazwa genu,
- nazwa aa fasta z łączem do pliku tekstowego z ich sekwencją aminokwasową w formacie FASTA z
- nazwa nt genbank z łączem do pliku z sekwencją nukleotydową w formacie Genbank (gbk),
- nazwa aa genbank z łączem do pliku z sekwencją aminokwasową w formacie Genbank (gbk).
W tym polu może być więcej niż jedna nazwa i nie wszystkie mogą mieć aktywne łącza.
Przykład:
genA (description, nt fasta, aa fasta, nt genbank, aa genbank)
genB (description, nt fasta, aa fasta, nt genbank, aa genbank)
genC (description, nt fasta, aa fasta, nt genbank, aa genbank)
Pole 9:
Nazwa genu kodującego enzymy użyteczne przemysłowo (w tym enzymy z grzybów użyteczne w
biotransformacjach). Po nazwie genu:
funkcją enzymatyczną,
- nazwa aa genbank z łączem do pliku z sekwencją aminokwasową w formacie Genbank (gbk).
W tym polu może być więcej niż jedna nazwa i nie wszystkie mogą mieć aktywne łącza.
Przykład:
genA (description, nt fasta, aa fasta, nt genbank, aa genbank)
genB (description, nt fasta, aa fasta, nt genbank, aa genbank)
genC (description, nt fasta, aa fasta, nt genbank, aa genbank)
Po wejściu do description mogą w nim znajdować się łącza do produktów umieszczonych w
Platformie PCM.
Pole 10:
Nazwa cluster z łączem do schematu genów, ich produktów z domenami białkowymi i wytwarzanymi
lub modyfikowanymi produktami. Długości obiektów graficznych reprezentujące geny (strzałki),
produkty (prostokąty) i domeny (prostokąty) są proporcjonalne do ich długości, a odległości między
nimi odzwierciedlają względne położenie w sekwencji genomu lub białka. Obiekty będą odpowiednio
podpisane i po kliknięciu pojawi się ich opis. Pod domenami będą obiekty graficzne ze wzorami i
nazwami metabolitu wtórnego wytwarzanego lub modyfikowanego przez dane domeny. Pod obiektem
pierwszej domeny produktu pierwszego genu będzie obiekt reprezentujący substrat reakcji. Po
kliknięciu na obiekty substratów i metabolitów zostaną one wyświetlone w powiększeniu.
Przykład:
Gene A
Protein A
Gene B
Gene C
Protein B
Protein C
Nazwa genu związanego z syntezą metabolitów wtórnych (głównie poliketydów). Po nazwie genu:
funkcją enzymatyczną,
- nazwa aa genbank z łączem do pliku z sekwencją aminokwasową w formacie Genbank (gbk),
- nazwa ostatecznego metabolitu wtórnego wytwarzanego lub modyfikowanego przez dane białko z
łączem do pliku rastrowego (lub innego) z jego opisem i wzorem chemicznym. Wzory zapisywane są
w formacie SMILES lub innym dla wzorów chemicznych (http://pl.wikipedia.org/wiki/SMILES,
http://pubchem.ncbi.nlm.nih.gov/edit2/index.html).
W tym polu może być więcej niż jedna nazwa (nawet 49) i nie wszystkie muszą mieć aktywne łącza.
Przykład:
genA (description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite)
genB (description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite)
genC (description, nt fasta, aa fasta, nt genbank, aa genbank, metabolite)
Geny ułożone są zgodnie z ich kolejnością położenia w genomie i kolejnością przeprowadzania reakcji
chemicznych przez ich produkty.
Po wejściu do description poza opisem pojawi się wykaz modułów i domen białkowych.
Po wejściu do metabolite mogą w nim znajdować się łącza do produktów umieszczonych w
Platformie PCM.
4. Operacje na danych zwartych w bazie
1. Baza danych może być przeszukiwana w celu wylistowania rekordów posiadających dane
słowa kluczowe występujące w odpowiednich polach tabeli i łączach do nich. Jest możliwość
tworzenia zaawansowanych zapytań wykorzystując operatory AND, OR, NOT.
2. W polach (5, 6, 8, 9 i 10) przy łączach do sekwencji występuje pole wyboru z możliwością
jego zaznaczenia. W odpowiednim nagłówku tabeli jest dodatkowe pole lub pola
(odpowiednio dla typów sekwencji, np. nt fasta, aa fasta, nt genbank, aa genbank)
umożliwiające zaznaczenie wszystkich sekwencji w wylistowanych rekordach w danej
kolumnie tabeli. Zaznaczone sekwencję mogą zostać pobrane przez użytkownika w formie
pliku tekstowego, a na sekwencjach homologicznych (wszystkich sekwencjach z pola 5 i
odpowiednich grupach sekwencji z pola 6) mogą zostać wykonane analizy przy pomocy
programów wykonujących przyrównania sekwencji (np. Clustal, Mafft, Muscle) oraz
tworzących proste drzewa filogenetyczne. Programy będą uruchamiane lokalnie.
3. W polu 7 przy nazwie Method_data_nr występuje pole wyboru z możliwością jego
zaznaczenia. W nagłówku tabeli jest dodatkowe łącze umożliwiające wylistowanie wszystkich
metod (w formacie Method_nr, gdzie nr to numer metody) występujących w wylistowanych
rekordach. Zaznaczenie jednej metody będzie skutkowało wyborem wszystkich pól
Method_data_nr dla tej samej zaznaczonej metody w wylistowanych rekordach w kolumnie
tabeli. Zaznaczone dane mogą zostać pobrane przez użytkownika w formie pliku tekstowego
oraz mogą zostać wykonane dla nich analizy przy pomocy programu GelCompar,
GelQuest/ClusterVis lub innych (dane tabelaryczne mogą być również analizowane
programem statystycznym, np. w pakiecie R). Program będzie uruchamiany lokalnie.
4. Ma istnieć możliwość poszukiwania sekwencji zawartych w bazie w oparciu o podobieństwo
sekwencji przy pomocy lokalnie uruchamianego programu BLAST. Znalezione sekwencje
homologiczne mają łącza do swoich odpowiednich rekordów. Podobnie jak w punkcie 2 mogą
zostać wykonane na nich analizy przy pomocy programów wykonujących przyrównania
sekwencji (np. Clustal, Mafft, Muscle) oraz tworzących proste drzewa filogenetyczne.
5. Z danymi w polu 10 będzie skojarzone narzędzie pozwalające na wybieranie z bazy zestawu
genów lub ich fragmentów (modułów i domen białkowych) na podstawie podanego wzoru
chemicznego (formacie SMILES lub innym dla wzorów chemicznych) metabolitu
wytwarzanego lub modyfikowanego.

Zapytanie_ofertowe_4/12/2014 - Instytut Immunologii i Terapii

Transkrypt

Podobne dokumenty

Badania przemysłowe i prace rozwojowe w zakresie innowacyjnych

Moduł 6N - podświetlany panel listy lok.

Dotacje na innowacje. Inwestujemy w Waszą przyszłość.

MIĘDZYNARODOWA OCHRONA PATENTOWA ODMIAN

Dotacje na innowacje. Inwestujemy w Waszą przyszłość.

Lab04 - combio.pl

PROJEKT EDUKACYJNY - MATERIAŁY METODYCZNE Informuję

Dotacja Unijna z Programu Operacyjnego Innowacyjna Gospodarka