Czym są urządzenia taśmowe
Transkrypt
Czym są urządzenia taśmowe
Technologie taśmowe – wprowadzenie i zastosowania Jacek Herold, WCSS Zagadnienia Czym są urządzenia taśmowe Czym różnią się od dysków twardych Podstawowe parametry urządzeo • Parametry streamerów • Parametry taśm Najczęściej używane technologie i kompatybilnośd Kiedy i dlaczego używamy technologii taśmowych Trochę głębiej w technologię • Systemy kodowania • Sposób zapisu Line Serpentine vs. Helical Track • Urządzenia blokowe vs znakowe • sposób dostępu do danych - szeregowe układanie danych. Zagadnienie kompresji - kompresja automatyczna vs. Konfigurowana Systemy automatyczne: autloadery, biblioteki RAIT Zagadnienia c.d. Oprogramowanie do archiwizacji tar, dump/restore IBM TSM Amanda, Bacula Veritas Czym są urządzenia taśmowe - historia Urządzenia taśmowe to napędy pozwalające na zapisywanie informacji na taśmach magnetycznych (nośnikach taśmowych). Służą przede wszystkim do archiwizacji i tworzenia kopii zapasowych. Ich historia sięga roku 1951 kiedy to firma Remington Rand wyprodukowała pierwszy na świecie napęd taśmowy. Napęd obsługiwał taśmy o „zawrotnej” ilości ośmiu ścieżek (6 użytecznych) i gęstości 128bpi. Taśma przesuwała się z prędkością ok. 2,5m/s a szybkość odczytu wynosiła 7200 znaków na sekundę. W 1984 roku firma DEC wprowadziła na rynek pierwszy napęd korzystający z technologii zapisu Line Serpentine. Co znacznie przyspieszyło szybkość wymiany danych pomiędzy taśmą a urządzeniem. Kolejnym krokiem było wprowadzenie w roku 1987 przez konsorcjum SONY i Exabyte technologii zapisu Helical Track, co przy ówczesnych prędkościach przesuwu taśm stanowiło kolejną rewolucję w prędkości zapis / odczyt. Czym są urządzenia taśmowe – c.d. Kasety do napędów dzielą się na dwa rodzaje – z dwoma szpulami i z jedną szpulą: Obecnie w zastosowaniach profesjonalnych stosuje się najczęściej taśmy z jedną szpulą: LTO, SDLT, natomiast w pozostałych taśmy z dwoma szpulami: DAT72, QIC. Czym są urządzenia taśmowe – c.d. Różne rodzaje napędów taśmowych: Czym są urządzenia taśmowe – c.d. Przykładowe system prowadzenia taśmy: Czym różnią się od dysków twardych Urządzenia taśmowe: •Szeregowy dostęp do danych •Wymienne nośniki •Długi czas przechowywania danych (30 lat) •Wydajne algorytmy korekcji błędów WH Error: 10-17 SW Error: 10-27 •Duża odporność na uszkodzenia nośnika •Bardzo szybki transfer liniowy – ok. 280MB/s (LTO-5 Comp.) •Potencjalnie bardzo długi czas oczekiwania na określowny fragment danych •Kodowanie: RLL, MPRL, NPML •Brak systemu plików (wyjątek LTFS) Twarde dyski •Blokowy dostęp do danych •Niewymienne nośniki – wyjątek MO •Nieznany maksymalny czas przechowywania •Słabsze algorytmy korekcji •Mała odporność na uszkodzenia mechaniczne •Transfer liniowy na poziomie 120MB/s •Stosunkowo krótki czas oczekiwania na określony fragment danych •Kodowanie RLL •Ściśle zdefinowane systemy plików Podstawowe parametry urządzeń i nośników Technologia: LTO, SDLT, AIT, DDS (DAT) Pojemność nośnika: nominalna, z kompresją Interface: SCSI, FC, SAS Szybkość transferu: nominalna, z kompresją Całkowity czas potrzebny na utworzenie odczytanie pełnego archiwum Szyfrowanie sprzętowe WORM Gwarantowany czas przechowania danych Maksymalna liczba przebiegów głowicy Maksymalna liczba montowań nośnika Cartidge Memory (CM) Korekcja błędów HW Error, SW Error Pamięć cache Wsteczna kompatybilność Podstawowe parametry urządzeń i nośników LTO-5: (przykładowo Quantum LTO-5 FH) •Pojemność nominalna: 1500GB, 3000GB (2:1) 4500GB (3:1 IBM) •Interface FC-8 •Szybkość transferu: 140MB/s, 280MB/s (2:1) •Czas potrzebny na utworzenie pełnego archiwum: 90 minut (2:1) – dla pewności należy przyjąć 120minut •Dostepność WORM-a: TAK •Szyfrowanie sprzętowe: NIE •Pamięć cache: 256MB Podstawowe parametry urządzeń i nośników Taśma LTO-5: Gwarantowany czas przechowywania archiwum 15..30 lat Pojemność 1500GB / 3000GB (2:1) Maksymalna liczba montowań taśmy: 5000 Maksymalna liczba przebiegów głowicy 1 000 000 co daje ok. 260 pełnych zapisów / odczytów nośnika. CM: jeśli występuje pozwala odczytać ważne informacje o taśmie: Liczbę montowań Liczbę przebiegów głowicy Ewentualne problemy Bar Code Najczęściej używane technologie i kompatybilność Technologie profesjonalne: •LTO (obecnie LTO-5) • 1500GB • 120MB/s •SDLT • 300GB (1:1) • 36MB/s (1:1) •AIT (oczekiwane AIT-6) • 800GB • 248MB/s •SAIT (oczekiwane SAIT-4) • 4000GB (1:1) • 240MB/s (1:1) •T10000 (T10000B) • 1000GB (1:1) • 120MB/s (1:1) •DLT-S4 • 800GB (1:1) • 60MB/s Najczęściej używane technologie i kompatybilność Technologie użytku domowego i małych firm • Digital Data Storage (DDS) (obecnie DAT-160) • 80GB • 6,9MB/s • VXA (obecnie VXA-320) • 160GB • 24MB/s • SLR (Scalable Linear Recording) • 70GB • 6MB/s Ponadto wiele innych formatów. Najczęściej używane technologie i kompatybilność Na co zwracać uwagę przy wyborze technologii: •Powszechność danej technologii •Lista kompatybilności •Dostępność serwisu •Współpraca z innymi urządzeniami •Możliwości rozwojowe technologii Najczęściej używane technologie i kompatybilność Kompatybilność technologii LTO-5 Najczęściej używane technologie i kompatybilność Kompatybilność technologii DDS Najczęściej używane technologie i kompatybilność Przyszłość technologii LTO: Najczęściej używane technologie i kompatybilność Przyszłość technologii DDS: Przyrost pojemności taśm Pojemność [MB] 10000000 1500000 400000 1000000 100000 12000 10000 1000 200 100 20 50 10 1 0,25 0,1 1951 1964 1974 1984 1996 2004 2010 •Rok 1974 – pierwsza „biblioteka” taśmowa (IBM) •Rok 1996 – zastosowanie algorytmu PRML (DDS-3) Kiedy i dlaczego używamy technologii taśmowych Stosujemy: •Archiwa długoterminowe •Bezpieczeństwo danych nie modyfikowanych (WORM) •Trwałość mechaniczna: dysk pracuje przez cały czas taśma tylko przez chwilę •Przechowywanie dużych pojemności •Archiwa multi-volume •Kopie bezpieczeństwa •Szybkość dostępu do danych jest drugorzędna •Wymagane mocne kody korekcyjne Nie stosujemy: •Szybki lub losowy dostęp do danych •Dane często ulegają zmianie •Krótki czas, życia danych •Dane małoistotne Kilka słów więcej o technologii •Systemy kodowania •Sposoby zapisu •Urządzenia blokowe i znakowe •Sposób dostępu do danych (partycje) Systemy kodowania danych na taśmach •Czym jest kodowanie i dlaczego je stosujemy •Rodzina LTO: • LTO-1: RLL1,7 • LTO 2,3,4: PRML • LTO-5: NPML •Rodzina DDS: • Helical scan (R-DAT, PRML od DDS3) Sposób zapisu danych – metody prowadzenia taśmy Sposób zapisu danych – ułożenie ścieżek Helical scan Line serpentine Sposób zapisu danych – ułożenie domen magnetycznych Urządzenia blokowe i znakowe •Sposób dostępu do danych •Szybkość liniowa vs czas dostępu • Odczyt danych z taśmy a ułożenie plików • Dane na „końcu” taśmy • Czas dostępu do danych na „końcu” taśmy •Partycje na taśmie vs partycje na dysku Kompresja danych i pojemność taśmy •Pojemność nominalna •Problem kompresji danych •Porównanie przykładowych wyników kompresji •Szybkość transferu a kompresja •Kompresja automatyczna (LTO) a kompresja konfigurowana Systemy automatyczne •Autoloadery •Biblioteki •Rodzaje elementów biblioteki: Data Transfer, Storage, Mail etc. •Zarządzanie biblioteką •Partycje biblioteki •VTL Systemy automatyczne – rodzaje bibliotek •Z pojedynczym robotem •Z wieloma robotami • Współdzielony obszar roboczy • Autonomiczne obszary robocze •Pojedyncza technologia zapisu lub wiele technologii zapisu •Wiele bibliotek w systemie Systemy automatyczne – zarządzanie biblioteką •Elementy biblioteki: napędy, roboty •Biblioteka podłączona bezpośrednio •Biblioteka w strukturze SAN •Partycje biblioteki RAIT •Co to jest RAIT •Poziomy – konfiguracje: 0,1,5 •Dlaczego stosujemy RAIT •Gdzie zastosowanie RAIT jest uzasadnione •HW RAIT vs Software RAIT dopasowanie nośników Oprogramowanie do archiwizacji •Istotne cechy oprogramowania • Wspierany sprzęt • Wspierane systemy operacyjne • Praca w sieci • Sposób zarządzania • Procedury awaryjne • Wsparcie od strony producenta • Wspierane technologie, Multi-Volume, VTL, RAIT, Disk Pool •Oprogramowanie • IBM TSM • Bacula • Amanda • CASTOR (CERN) • Veritas backup • tar, dump/restore, mt, mtx Oprogramowanie do archiwizacji HSM – ang. Hierarchical Storage Management Poziomy hierarchii HSM Parametry użytkowe i cechy systemu HSM Przykładowa realizacja HSM w PCSS Przyrost pojemności technologii taśmowych •Współczynnik 2x •Przyrost na przestrzeni lat Podsumowanie ... Technologie taśmowe Dziękujemy za uwagę Kontakt: [email protected] kmd.pcss.pl