Analiza niezawodności nośników i obszarów w archiwum
Transkrypt
Analiza niezawodności nośników i obszarów w archiwum
Analiza niezawodności nośników i obszarów w archiwum długoterminowym dr inż. Piotr Pałka Długoterminowa archiwizacja zasobów cyfrowych – problemy i rozwiązania 29 lutego – 1 marca 2016 r. CREDO – Cyfrowe Repozytorium Dokumentów projekt DEMONSTRATOR+ nr UOD-DEM-1-385/001 Motywacja • Archiwum będzie pracowało długoterminowo, czyli dłużej niż czas wykorzystania danej technologii, nie mówiąc już o czasie życia danego nośnika • Nawet jeśli nośnik przetrwa bardzo długi czas, nic to nie da jeśli nie będziemy go w stanie odczytać! 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 2 Analiza niezawodności • Analiza dotyczy nośników i obszarów aby: – Przewidzieć awarie: • Migrować pakiety na nowsze nośniki – Przeciwdziałać awariom: • Odświeżać (np. magnetycznie) nośniki – Skorelować awarie typowe dla: partii, rodzajów nośników, nośników od danego producenta • Polityka zakupowa nowych nośników – Wybierać odpowiednie obszary do odczytu/zapisu pakietów 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 3 Skąd brać informacje? • Dyski twarde: S.M.A.R.T (ang. Self-Monitoring, Analysis and Reporting Technology): – system monitorowania i powiadamiania o błędach działania twardego dysku • Taśmy magnetyczne, dyski optyczne, karty pamięci, pamięć USB, … – brak odpowiednich systemów monitorowania i powiadamiania o błędach • Przyszłe technologie przechowywania danych – ??? 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 4 Abstrakcja niezawodności dla dowolnego typu nośnika • wspólny mechanizm przekazywania informacji o nośniku, partiach nośników do PZT • niezależny od rodzaju nośnika (dyski twarde, taśmy magnetyczne, dyski optyczne, ...) • rozwiązanie problemu braku odpowiednich rozwiązań technicznych dla monitorowania i zarządzania 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 5 Wymagania • Warstwa abstrakcji dla monitorowania i raportowania nośników: – Prawdopodobieństwo awarii nośnika w ciągu najbliższego roku – Percentyle (95/100, 98/100 i 99/100) niezawodności • np. wartość percentyla 99/100 równa 180, oznacza, że dany nośnik będzie działał poprawnie przez 180 dni, z prawdopodobieństwem co najmniej 99%. 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 6 Podstawy teoretyczne – Niezawodność (ang. reliability) − własność obiektu mówiąca o tym, czy: • pracuje on poprawnie (spełnia wszystkie powierzone mu funkcje i czynności) • przez wymagany czas • w określonych warunkach eksploatacji – Dla nośników zakłada się, że: −𝑡 • 𝑅 𝑡 = 𝑒 𝑀𝑇𝐵𝐹 • MTBF to parametr nośnika (podawany przez producentów np. dysków twardych) • t to czas pracy nośnika 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 7 Dane wejściowe • Zależne od typu nośnika • Gdy nie ma danych odnośnie nośnika, obliczenia parametrów na podstawie: – daty produkcji/zakupu nośnika – wytycznych NARA dotyczących czasu życia nośników • Abstrakcja dla dysków twardych: – korzysta ona z danych S.M.A.R.T odczytywanych cyklicznie przez system zarządzający nośnikami – na ich podstawie modyfikujemy parametry niezawodności, np.: • temperatura pracy nośnika – wpływa na wydłużenie/skrócenie czasu życia nośnika • Dane na temat włączeń/wyłączeń/czasy pracy nośnika 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 8 Dane wyjściowe • Parametry niezawodności: – Prawdopodobieństwo awarii nośnika w ciągu najbliższego roku – Percentyle (95/100, 98/100 i 99/100) niezawodności • Obliczane raz na dzień, na podstawie spływających danych 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 9 Niezawodność obszarów • Obszar → wiele nośników • Potrzeba obliczania parametrów niezawodności dla całych obszarów • Agregaty parametrów niezawodności nośników wchodzących w skład obszaru: – prawdopodobieństwo awarii obszaru w ciągu najbliższego roku := MAX (prawdopodobieństwa awarii nośników w ciągu najbliższego roku) – percentyle niezawodności dla obszaru := MIN(percentyle niezawodności nośników) 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 10 Wykorzystanie parametrów niezawodności • Wyznaczanie okresowych operacji na obszarach: – odświeżanie magnetyczne • Wyznaczanie przestarzałych nośników: – migracja pakietów z tych nośników na nowsze • Wykorzystanie przez mechanizm harmonogramowania 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 11 DZIĘKUJĘ ZA UWAGĘ! 29 lutego - 1 marca 2016 r. CREDO - Cyfrowe Repozytorium Dokumentów 12