Czym są urządzenia taśmowe

Transkrypt

Czym są urządzenia taśmowe
Technologie taśmowe –
wprowadzenie i zastosowania
Jacek Herold, WCSS
Zagadnienia



Czym są urządzenia taśmowe
Czym różnią się od dysków twardych
Podstawowe parametry urządzeo
•






Parametry streamerów
• Parametry taśm
Najczęściej używane technologie i kompatybilnośd
Kiedy i dlaczego używamy technologii taśmowych
Trochę głębiej w technologię
•
Systemy kodowania
•
Sposób zapisu Line Serpentine vs. Helical Track
•
Urządzenia blokowe vs znakowe
• sposób dostępu do danych - szeregowe układanie danych.
Zagadnienie kompresji - kompresja automatyczna vs. Konfigurowana
Systemy automatyczne: autloadery, biblioteki
RAIT
Zagadnienia c.d.

Oprogramowanie do archiwizacji




tar, dump/restore
IBM TSM
Amanda, Bacula
Veritas
Czym są urządzenia taśmowe - historia
Urządzenia taśmowe to napędy pozwalające na zapisywanie informacji
na taśmach magnetycznych (nośnikach taśmowych). Służą przede
wszystkim do archiwizacji i tworzenia kopii zapasowych.
Ich historia sięga roku 1951 kiedy to firma Remington Rand
wyprodukowała pierwszy na świecie napęd taśmowy. Napęd
obsługiwał taśmy o „zawrotnej” ilości ośmiu ścieżek (6 użytecznych) i
gęstości 128bpi. Taśma przesuwała się z prędkością ok. 2,5m/s a
szybkość odczytu wynosiła 7200 znaków na sekundę.
W 1984 roku firma DEC wprowadziła na rynek pierwszy napęd
korzystający z technologii zapisu Line Serpentine. Co znacznie
przyspieszyło szybkość wymiany danych pomiędzy taśmą a
urządzeniem.
Kolejnym krokiem było wprowadzenie w roku 1987 przez konsorcjum
SONY i Exabyte technologii zapisu Helical Track, co przy ówczesnych
prędkościach przesuwu taśm stanowiło kolejną rewolucję w prędkości
zapis / odczyt.
Czym są urządzenia taśmowe – c.d.
Kasety do napędów dzielą się na dwa rodzaje – z dwoma szpulami i z jedną szpulą:
Obecnie w zastosowaniach profesjonalnych stosuje się najczęściej taśmy z jedną
szpulą: LTO, SDLT, natomiast w pozostałych taśmy z dwoma szpulami: DAT72, QIC.
Czym są urządzenia taśmowe – c.d.
Różne rodzaje napędów taśmowych:
Czym są urządzenia taśmowe – c.d.
Przykładowe system prowadzenia taśmy:
Czym różnią się od dysków twardych
Urządzenia taśmowe:
•Szeregowy dostęp do danych
•Wymienne nośniki
•Długi czas przechowywania danych
(30 lat)
•Wydajne algorytmy korekcji błędów
WH Error: 10-17 SW Error: 10-27
•Duża odporność na uszkodzenia
nośnika
•Bardzo szybki transfer liniowy
– ok. 280MB/s (LTO-5 Comp.)
•Potencjalnie bardzo długi czas
oczekiwania na określowny fragment
danych
•Kodowanie: RLL, MPRL, NPML
•Brak systemu plików (wyjątek LTFS)
Twarde dyski
•Blokowy dostęp do danych
•Niewymienne nośniki – wyjątek MO
•Nieznany maksymalny czas
przechowywania
•Słabsze algorytmy korekcji
•Mała odporność na uszkodzenia
mechaniczne
•Transfer liniowy na poziomie 120MB/s
•Stosunkowo krótki czas oczekiwania
na określony fragment danych
•Kodowanie RLL
•Ściśle zdefinowane systemy plików
Podstawowe parametry urządzeń i nośników














Technologia: LTO, SDLT, AIT, DDS (DAT)
Pojemność nośnika: nominalna, z kompresją
Interface: SCSI, FC, SAS
Szybkość transferu: nominalna, z kompresją
Całkowity czas potrzebny na utworzenie odczytanie pełnego archiwum
Szyfrowanie sprzętowe
WORM
Gwarantowany czas przechowania danych
Maksymalna liczba przebiegów głowicy
Maksymalna liczba montowań nośnika
Cartidge Memory (CM)
Korekcja błędów HW Error, SW Error
Pamięć cache
Wsteczna kompatybilność
Podstawowe parametry urządzeń i nośników
LTO-5: (przykładowo Quantum LTO-5 FH)
•Pojemność nominalna: 1500GB, 3000GB (2:1) 4500GB (3:1 IBM)
•Interface FC-8
•Szybkość transferu: 140MB/s, 280MB/s (2:1)
•Czas potrzebny na utworzenie pełnego archiwum: 90 minut (2:1) – dla pewności
należy przyjąć 120minut
•Dostepność WORM-a: TAK
•Szyfrowanie sprzętowe: NIE
•Pamięć cache: 256MB
Podstawowe parametry urządzeń i nośników
Taśma LTO-5:

Gwarantowany czas przechowywania archiwum 15..30 lat

Pojemność 1500GB / 3000GB (2:1)

Maksymalna liczba montowań taśmy: 5000


Maksymalna liczba przebiegów głowicy 1 000 000 co daje ok. 260 pełnych zapisów /
odczytów nośnika.
CM: jeśli występuje pozwala odczytać ważne informacje o taśmie:

Liczbę montowań

Liczbę przebiegów głowicy

Ewentualne problemy

Bar Code
Najczęściej używane technologie i kompatybilność
Technologie profesjonalne:
•LTO (obecnie LTO-5)
• 1500GB
• 120MB/s
•SDLT
• 300GB (1:1)
• 36MB/s (1:1)
•AIT (oczekiwane AIT-6)
• 800GB
• 248MB/s
•SAIT (oczekiwane SAIT-4)
• 4000GB (1:1)
• 240MB/s (1:1)
•T10000 (T10000B)
• 1000GB (1:1)
• 120MB/s (1:1)
•DLT-S4
• 800GB (1:1)
• 60MB/s
Najczęściej używane technologie i kompatybilność
Technologie użytku domowego i małych firm
• Digital Data Storage (DDS) (obecnie DAT-160)
• 80GB
• 6,9MB/s
• VXA (obecnie VXA-320)
• 160GB
• 24MB/s
• SLR (Scalable Linear Recording)
• 70GB
• 6MB/s
Ponadto wiele innych formatów.
Najczęściej używane technologie i kompatybilność
Na co zwracać uwagę przy wyborze technologii:
•Powszechność danej technologii
•Lista kompatybilności
•Dostępność serwisu
•Współpraca z innymi urządzeniami
•Możliwości rozwojowe technologii
Najczęściej używane technologie i kompatybilność
Kompatybilność technologii LTO-5
Najczęściej używane technologie i kompatybilność
Kompatybilność technologii DDS
Najczęściej używane technologie i kompatybilność
Przyszłość technologii LTO:
Najczęściej używane technologie i kompatybilność
Przyszłość technologii DDS:
Przyrost pojemności taśm
Pojemność [MB]
10000000
1500000
400000
1000000
100000
12000
10000
1000
200
100
20
50
10
1
0,25
0,1
1951
1964
1974
1984
1996
2004
2010
•Rok 1974 – pierwsza „biblioteka” taśmowa (IBM)
•Rok 1996 – zastosowanie algorytmu PRML (DDS-3)
Kiedy i dlaczego używamy technologii taśmowych
Stosujemy:
•Archiwa długoterminowe
•Bezpieczeństwo danych nie modyfikowanych (WORM)
•Trwałość mechaniczna: dysk pracuje przez cały czas taśma tylko przez chwilę
•Przechowywanie dużych pojemności
•Archiwa multi-volume
•Kopie bezpieczeństwa
•Szybkość dostępu do danych jest drugorzędna
•Wymagane mocne kody korekcyjne
Nie stosujemy:
•Szybki lub losowy dostęp do danych
•Dane często ulegają zmianie
•Krótki czas, życia danych
•Dane małoistotne
Kilka słów więcej o technologii
•Systemy kodowania
•Sposoby zapisu
•Urządzenia blokowe i znakowe
•Sposób dostępu do danych (partycje)
Systemy kodowania danych na taśmach
•Czym jest kodowanie i dlaczego je stosujemy
•Rodzina LTO:
• LTO-1: RLL1,7
• LTO 2,3,4: PRML
• LTO-5: NPML
•Rodzina DDS:
• Helical scan (R-DAT, PRML od DDS3)
Sposób zapisu danych – metody prowadzenia taśmy
Sposób zapisu danych – ułożenie ścieżek
Helical scan
Line serpentine
Sposób zapisu danych – ułożenie domen magnetycznych
Urządzenia blokowe i znakowe
•Sposób dostępu do danych
•Szybkość liniowa vs czas dostępu
• Odczyt danych z taśmy a ułożenie plików
• Dane na „końcu” taśmy
• Czas dostępu do danych na „końcu” taśmy
•Partycje na taśmie vs partycje na dysku
Kompresja danych i pojemność taśmy
•Pojemność nominalna
•Problem kompresji danych
•Porównanie przykładowych wyników kompresji
•Szybkość transferu a kompresja
•Kompresja automatyczna (LTO) a kompresja konfigurowana
Systemy automatyczne
•Autoloadery
•Biblioteki
•Rodzaje elementów biblioteki: Data Transfer, Storage, Mail etc.
•Zarządzanie biblioteką
•Partycje biblioteki
•VTL
Systemy automatyczne – rodzaje bibliotek
•Z pojedynczym robotem
•Z wieloma robotami
• Współdzielony obszar roboczy
• Autonomiczne obszary robocze
•Pojedyncza technologia zapisu lub wiele technologii zapisu
•Wiele bibliotek w systemie
Systemy automatyczne – zarządzanie biblioteką
•Elementy biblioteki: napędy, roboty
•Biblioteka podłączona bezpośrednio
•Biblioteka w strukturze SAN
•Partycje biblioteki
RAIT
•Co to jest RAIT
•Poziomy – konfiguracje: 0,1,5
•Dlaczego stosujemy RAIT
•Gdzie zastosowanie RAIT jest uzasadnione
•HW RAIT vs Software RAIT dopasowanie nośników
Oprogramowanie do archiwizacji
•Istotne cechy oprogramowania
• Wspierany sprzęt
• Wspierane systemy operacyjne
• Praca w sieci
• Sposób zarządzania
• Procedury awaryjne
• Wsparcie od strony producenta
• Wspierane technologie, Multi-Volume, VTL, RAIT, Disk Pool
•Oprogramowanie
• IBM TSM
• Bacula
• Amanda
• CASTOR (CERN)
• Veritas backup
• tar, dump/restore, mt, mtx
Oprogramowanie do archiwizacji
HSM – ang. Hierarchical Storage Management
Poziomy hierarchii HSM
Parametry użytkowe i cechy systemu HSM
Przykładowa realizacja HSM w PCSS
Przyrost pojemności technologii taśmowych
•Współczynnik 2x
•Przyrost na przestrzeni lat
Podsumowanie

...
Technologie taśmowe
Dziękujemy za uwagę
Kontakt: [email protected]
kmd.pcss.pl

Podobne dokumenty