Optymalizacja dostępu do archiwum głębokiego
Transkrypt
Optymalizacja dostępu do archiwum głębokiego
Optymalizacja dostępu do archiwum głębokiego Tomasz Śliwiński Politechnika Warszawska Instytut Automatyki i Informatyki Stosowanej 29. stycznia – 1. lutego, 2016 CREDO – Cyfrowe Repozytorium Dokumentów projekt DEMONSTRATOR+ nr UOD-DEM-1-385/001 IAiIS Optymalizacja dostępu do archiwum głębokiego 1 / 15 Wprowadzenie Archiwum głębokie nie jest “chmurą” Dostęp rządzi się innymi prawami Klient nie wymaga szybkości IAiIS Optymalizacja dostępu do archiwum głębokiego 2 / 15 Ogólne kryteria optymalizacji pracy archiwum Bezpieczeństwo Użycie energii Zużycie nośników Wykorzystanie przestrzeni Brak wymagań odnośnie czasu dostępu IAiIS Optymalizacja dostępu do archiwum głębokiego 3 / 15 Architektura archiwum (model dla potrzeb optymalizacji) Archiwum podzielone na obszary Obszar – najmniejsza część archiwum, która może być włączana/wyłączana Obszar składa się z jednego lub wielu nośników Obszary zgrupowane w regiony (np. odseparowane geograficznie) IAiIS Optymalizacja dostępu do archiwum głębokiego 4 / 15 Bezpieczeństwo danych w CREDO – niezawodność Bezpieczeństwo na dwóch poziomach: repliki wysokopoziomowe – zarządzane przez PZA – możliwość okreslenia regionu repliki bezpieczeństwo niskopoziomowe (kopie lub inne mechanizmy systemu plików) Każda replika wysokiego poziomu może mieć inny wymagany poziom bezpieczeństwa Poziom bezpieczeństwa jest realizowany przez mechanizmy systemu plików (w CREDO liczba kopii niskopoziomowych Okresowe operacje konserwatorskie (odświeżanie magnetyczne, przewijanie taśm, itp) Kontrola stanu nośników (SMART), szacowanie prawdopodobieństwa awarii IAiIS Optymalizacja dostępu do archiwum głębokiego 5 / 15 Koszt działania archiwum Koszt uruchomień obszarów = koszt zużytej energii + szacunkowy koszt zużycia sprzętu Koszt działania = koszt zużytej energii + szacunkowy koszt zużycia sprzętu Parametryzacja kosztów IAiIS Optymalizacja dostępu do archiwum głębokiego 6 / 15 Organizacja pracy archiwum głebokiego – operacje Operacje korzystające z zasobów (obszarów): kopiowanie odczyt stanu archiwum liczenie sum kontrolnych czynności konserwatorskie (odświeżanie magnetyczne, przewijanie taśm, itp) Operacje nie używające zasobów (np. interakcja z użytkownikiem) IAiIS Optymalizacja dostępu do archiwum głębokiego 7 / 15 Organizacja pracy archiwum głebokiego – procedury Sekwencja zbiorów równolegle wykonywanych operacji Jednocześnie wykonywanych jest wiele procedur IAiIS Optymalizacja dostępu do archiwum głębokiego 8 / 15 Parametry operacji Przedział czasu, w którym operacja może zostać wykonana Zbiór możliwych obszarów do odczytu Zbiór możliwych obszarów do zapisu, wraz z okresleniem poziomu bezpieczeństwa Używane zasoby - zajmowana przestrzeń, dostęp na wyłączność Czasy zapisu/odczytu danych na każdym z obszarów źródłowych/docelowych Rozmiary zapisu na każdym obszarze IAiIS Optymalizacja dostępu do archiwum głębokiego 9 / 15 Obszary do zapisu – określenie poziomu zabezpieczeń Do przechowywania danych używane sa takie obszary i przy takim poziomie bezpieczeństwa (np. liczba kopii niskopoziomowych), aby spełnić wymagania danej repliki Ilość zajętego miejsca zależna od poziomu bezpieczeństwa IAiIS Optymalizacja dostępu do archiwum głębokiego 10 / 15 Decyzje modułu harmonogramowania Dla każdej operacji: chwila rozpoczęcia przydział obszaru do odczytu (jeśli potrzebny) przydział obszaru do zapisu (jeśli potrzebny) IAiIS Optymalizacja dostępu do archiwum głębokiego 11 / 15 Ograniczenia Kolejność poprzedzania operacji wewnątrz procedury Dostęp do zasobów (ograniczona maksymalna liczba operacji w obszarze, wyłączny dostęp, zajętość miejsca) Przedział czasu wykonania IAiIS Optymalizacja dostępu do archiwum głębokiego 12 / 15 Szczegółowe kryteria optymalizacji harmonogramu Koszt Równomierność zapełnienia obszarów Równomierność dostępu – liczba równoległych operacji i/o Zajętość miejsca – różna dla różnych obszarów w zależności od wymaganego poziomu zabezpieczenia Możliwość wyrażania preferencji odnośnie kryteriów - ważenie IAiIS Optymalizacja dostępu do archiwum głębokiego 13 / 15 Cechy algorytmu Elastyczny Szybki Grupuje operacje tak, aby z danego obszaru korzystały w zbliżonym czasie Przybliżony Sterowanie kryteriami IAiIS Optymalizacja dostępu do archiwum głębokiego 14 / 15 Podsumowanie Stworzono wysoko parametryzowalny system automatycznie organizujący prace archiwum Suboptymalne harmonogramy –zapewnieniu bezpieczeństwa, minimalizacja kosztów, dodatkowe kryteria Spełnienie wielu wymagań i ograniczeń Działanie automatyczne – ingerencja człowieka tylko w sytuacjach wyjątkowych IAiIS Optymalizacja dostępu do archiwum głębokiego 15 / 15