S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz

Transkrypt

S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
S.M.A.R.T. - Jak czytać oraz tabela atrybutów
by Silas Mariusz
1. Online
Silas Mariusz Administrator
TS-x79U 1 GbE
S.M.A.R.T. (ang. Self-Monitoring, Analysis and Reporting Technology) – system
monitorowania i powiadamiania o błędach działania dysku twardego.
Przewidywanie usterek
W założeniu miał to być system, który na bieżąco monitoruje stan najważniejszych
parametrów dysku i ostrzega o nadchodzącej awarii. Dyski twarde Seagate są
wyposażone w zdecydowanie skuteczniejszy od pozostałych producentów
mechanizm analizy i ostrzegania o możliwych awariach i błędach. W przypadku
dysków twardych Samsung lub WD, S.M.A.R.T. sprawdza się jako "czarna
skrzynka" niż jako system alarmowy. Ta czarna skrzynka zapisuje kilkanaście
kluczowych parametrów pracy dysku. Nie są to wprawdzie kompletne dane
diagnostyczne, ale w zupełności wystarczą do oceny kondycji dysku twardego i
jego użyteczności.
Błędne odczyty...
Ponadto nie wolno sugerować się "diagnozami" przeprowadzonymi przez
przeróżne programiki, które podają tylko "status" czy "kondycję" dysku, wyrażoną
najczęściej w procentach bądź tylko jako "OK". Takie "diagnozy" są nic nie warte.
Niektóre parametry S.M.A.R.T. nie mają wartości ostrzegawczych (zwykle mają
komentarz "zawsze pozytywnie" itp.), więc programy nie mają z czym porównać
bieżących odczytów. W takiej sytuacji nawet jeśli dysk dosłownie się sypie to
programy diagnostyczne stwierdzą że "SMART nie zgłasza problemów". Najlepiej
więc samemu zajrzeć do raportów S.M.A.R.T. i z podanych wartości odczytać
logiczny stan dysku twardego.
Odczytywanie stanu diagnozy
Raporty S.M.A.R.T. można odczytać zazwyczaj za pomocą dostarczonych od
producenta programów diagnostycznych lub sterowników kontrolerów dysków
twardych. Opisy parametrów S.M.A.R.T. wyrażonych w postaci Hex mogą różnić
się w prezentowanych raportach programów. Na przykład parametr "C4" w
programie SiSoft Sandra nazywa się "Realocated Data Count", a w EVEREST
"Realocation Event Count". Obie nazwy dotyczą tego samego parametru.
S.M.A.R.T. nie przechowuje informacji o nazwie danego parametru tylko jego
numer (właśnie owe "C4"). Nazwy dopisuje program (np. EVEREST) żeby jego
użytkownicy mogli łatwiej zdiagnozować usterkę. Dobór parametrów które
S.M.A.R.T. ma monitorować zależy wyłącznie od producenta, więc dostępne
mechanizmy przewidywania i diagnostyki mogą się różnić w poszczególnych
modelach dysków twardych, jednak zazwyczaj podyktowana jest to stosowaną
metodą kontroli przez producenta. Jeżeli więc S.M.A.R.T. Twojego dysku nie
podaje np. parametru "C4" to nie jest to żadne uszkodzenie czy błąd.
1/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
Self-Monitoring
Podczas pracy dysku system S.M.A.R.T na bieżąco monitoruje istotne parametry,
każdy z nich może przyjąć następujące stany:
Pre-failure warranty attribute (PW) - Wskazuje warunek przed awaryjny,
może uchronić od straty wielu danych.
Online collection attribute (OC) - Oznacza, że wartości są obliczane
podczas pracy dysku.
Performance attribute (PE) - Oznacza pogorszenie spowodowane
zużyciem lub wiekiem dysku.
Error rate attribute (ER) - Oznacza parametr częstości występowania
błędów.
Error count attribute (EC) - Oznacza parametr ilości zmierzonych błędów.
Self-preserving attribute (SP) - Oznacza parametr który jest automatycznie
ustawiany podczas testu S.M.A.R.T.
Atrybuty
Pojedynczy atrybut S.M.A.R.T zawiera następujące elementy:
ID (identyfikator): numer danego atrybutu
Attribute name (nazwa): nazwa danego atrybutu
Value (bieżący): obecna wartość każdego z atrybutów.
Worst (najgorszy): najgorsza zmierzona i zapamiętana wartość danego
atrybutu
Threshold (próg): najniższa wartość atrybutu ustawiona przez producenta
danego dysku dla każdego z atrybutów (wartość ta jest stała).
RAW value (wartość RAW): surowa (odczytana bezpośrednio) wartość
danego atrybutu ukazuje obecny stan dysku. Najczęściej wyświetlana jest w
postaci heksadecymalnej, ale niektóre programy podają wartości decymalne
(łatwiejsze do odczytania bez pomocy kalkulatora).
Atrybut jest prawidłowy, gdy jego wartość jest wyższa lub równa z progiem. Jeśli
próg jest równy 0 dla jakiegoś atrybutu, to atrybut nie powinien być brany pod
uwagę.
Tabela parametrów S.M.A.R.T.
Poniżej prezentujemy tabelę z zestawieniem i krótkim opisem każdego z atrybutów
S.M.A.R.T. Kolorem czerwonym zaznaczono atrybuty, które są uznawane za
krytyczne. Jeżeli ich parametry się pogarszają (są niższe od progu) jest to sygnał do
wykonania kopii zapasowej plików z danego dysku.
ID hex
01 01
Nazwa
atrybutu
Raw Read
Error Rate
Opis
Krytyczny Lepiej
Atrybut ten zależy od ilości błędów
odczytu i stanu powierzchni dysku,
wskazuje na częstość sprzętowych
błędów odczytu, które wystąpiły
podczas odczytu danych z powierzchni
dysku. Niskie wartości wskazują na
Tak
problem z powierzchnią dysku lub
głowicami odczytu/zapisu.
UWAGA: Dyski Seagate nie monitorują
parametru Raw Read Error Rate, stąd
tak wysokie wartości podczas testu
S.M.A.R.T.
Łączna (ogólna) sprawność dysku. Jeśli
↓--
2/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
02 02 Throughput wartość tego atrybutu się obniża jest
Nie
Performance duża szansa, że zbliżają się problemy z
dyskiem.
Średni czas na rozkręcenie talerzy (od 0
obr/min do pełnej prędkości). Wartość
03 03 Spin Up Time
Nie
RAW tego atrybutu wyraża czas w
sekundach lub milisekundach.
Start/Stop
Mount
Wartość RAW tego atrybutu jest liczbą
04 04
Nie
(Number of
cykli start/stop dysku.
spin-up times)
Ilość relokowanych sektorów. Kiedy
dysk napotyka błąd
odczytu/zapisu/weryfikacji, oznacza ten
sektor jako relokowany i przenosi dane
do specjalnego zarezerwowanego
Reallocated obszaru (obszaru rezerwowego). Proces
05 05
Tak
Sectors Count ten jest również określany mianem
remapowania a relokowane sektory
określa się remapami. To właśnie
dlatego, na nowoczesnych dyskach, nie
widzimy "bad bloków" podczas testów
powierzchni.
Rezerwa kanału podczas odczytu
Read Channel
06 06
danych. Funkcja tego atrybutu nie jest Nie
Margin
objęta specyfikacją.
Częstość błędów wyszukiwania głowic
magnetycznych. W razie uszkodzenia
mechanicznego systemu
pozycjonowania, uszkodzenia serwa
albo termicznej rozszerzalności dysku,
Seek Error
ilość błędów wyszukiwania wzrasta.
07 07
Nie
Rate
Więcej błędów wyszukiwania oznacza
pogarszanie się stanu powierzchni dysku
i podsystemu mechanicznego dysku. W
nowych dyskach firmy Seagate np. serii
7200.11 ten parametr jest wysoki i jest
to normalne dla tych dysków.
Przeciętna wydajność operacji
wyszukiwania głowic magnetycznych.
Seek Time
08 08
Jeśli wartość atrybutu maleje, jest to
Nie
Performance
oznaka problemów z podsystemem
mechanicznym dysku.
Ilość godzin w stanie zasilnia. Wartość
RAW atrybutu odpowiada łącznej ilości
godzin (lub minut, sekund, w zależności
od producenta) przepracowanych przez
dysk. Zmniejszenie się tej wartości do
Power-On
poziomu krytycznego (threshold)
09 09
Nie
Hours
wskazuje na zmniejszenie się parametru
MTBF (średni czas między awariami).
Niemniej, w rzeczywistości, nawet jeśli
MTBF zmaleje do zera, nie oznacza to
↑--
↓--
↓--
↓--
↑--
↓--
3/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
że zasoby MTBF całkowicie się
wyczerpały i dysk przestanie działać.
Ilość ponownych prób rozpędzenia
talerzy. Atrybut ten przechowuje łączną
ilość prób uruchomienia talerzy przed
Spin Retry
osiągnięciem pełnej szybkości
Count
10 0A
obrotowej (pod warunkiem, że pierwsza Tak
(Spin-up
próba nie powiodła się). Wzrost tego
retries)
atrybutu jest oznaką problemów z
podsystemem mechanicznym dysku np.
zbliżającym się uszkodzeniem łożyska.
Atrybut ten wskazuje liczbę żądań
rekalibracji (pod warunkiem, że
Recalibration
pierwsza próba nie powiodła się).
11 0B
Nie
Retries
Spadek tego atrybutu jest oznaką
problemów z podsystemem
mechanicznym dysku.
Device Power
Cycle Mount Atrybut ten wskazuje na łączną ilość
12 0C
Nie
(Start/stop
pełnych cykli zasilania dysku.
count)
Jest to ilość programowych błędów
Soft Read
13 0D
odczytu występujących podczas odczytu Nie
Error Rate
danych z powierzchni dysku.
Ten atrybut jest częścią technologii HP
w wersji S.M.A.R.T. IV generacji i
End-to-End
184 B8
informuje ,że na drodze pomiędzy
Tak
Error
pamięcią podręczna buforem a dyskiem
nastąpiły błędy.
Atrybut spotykany w dyskach Western
Head
185 B9
Digital.
Nie
Stability
Stabilizacja głowicy.
Atrybut spotykany w dyskach Western
Induced OpDigital.
186 BA Vibration
Nie
Detekcja wzrostu wibracji
Detection
indukcyjnych.
Ilość błędów, które nie mogą być
Reported
187 BB
odzyskane przy użyciu sprzętu
Nie
UNC Error
technologii korekcji sprzętowej ECC .
Ilość przerwanych operacji z powodu
nie odpowiadania dysku na komendy.
Normalnie ten parametr powinien
Command
188 BC
wynosić zero jeśli jest inaczej może to Tak
Timeout
świadczyć o poważnych problemach z
zasilaniem dysku (złączem zasilaczem
ect.)
Technologia monitorująca sposób zapisu
głowicy. Jeśli głowica podczas
High Fly
zapisywania wychodzi po za normalny
189 BD
Nie
Writes
zakres pracy nad powierzchnię talerza
operacja jest przerywana a zapis jest
ponawiany w bezpiecznym obszarze.
W dyskach WDC (Temperatura
↓--
↓--
↓--
↓--
↓--
↓--
↓--
4/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
otoczenia (powietrza))
UWAGA: Producenci różnie definiują
Airflow
190 BE
Temperature ten parametr np. w dyskach Seagate
ST3802110A wartość prawidłowa jest
równa 100.
191 BF
G-sense error
rate
192 BE
Power-off
retract count
193 C1
Load/Unload
Cycle Count
194 C2
HDA
Temperature
Hardware
195 C3 ECC
Recovered
196 C4
Reallocation
Event Count
Current
197 C5 Pending
Sector Count
Nie
Częstotliwość błędów w wyniku
oddziaływania przeciążenia. Atrybut ten
informuje o błędach pracy dysku w
Nie
wyniku drastycznego przeciążenia (np.
Upadek).
Ilość razy kiedy głowice są parkowane.
Głowice mogą być parkowane nawet
wtedy, gdy dysk nie jest wyłączony z
Nie
prądu. (or Emergency Retract Cycle
count - Fujitsu) Lub kiedy potrzebują
zliczać cykle.
Ilość cykli parkowania/wyparkowania ze
strefy parkowania (Landing Zone).
Niektóre dyski 2,5 calowe mają opcje Nie
parkowania głowicy przy bezczynności
dłuższej niż np. 5 minut.
Temperatura dysku twardego. Wartość
RAW tego atrybutu podaje wskazania Nie
wbudowanego czujnika ciepła (oC).
Częstotliwość występowania "błędów w
locie". Parametr technologii sprzętowej Nie
korekcji błędów ECC .
Ilość operacji remapowania
(przenoszenia danych z uszkodzonego
sektora do specjalnego
zarezerwowanego obszaru - obszaru
rezerwowego). Wartość RAW tego
Tak
atrybutu określa łączną ilość prób
transferu danych z relokowanego sektora
do obszaru rezerwowego. Liczone są
zarówno próby udane jak i nieudane.
Bieżąca ilość niestabilnych sektorów
(oczekujących na remapowanie).
Wartość RAW tego atrybutu wskazuje
na łączną ilość sektorów oczekujących
na rempowanie. Później, kiedy część z
tych sektorów uda się odczytać, wartość
jest zmniejszana. Jeśli błędy występują
Tak
ciągle podczas próby odczytu niektórych
sektorów, dysk podejmie próbę
odzyskania danych, przeniesienia ich do
zarezerwowanego obszaru (obszaru
rezerwowego) i oznaczenia sektora jako
remapowany.
↓--
↓--
↓--
↓--
↓--
↑--
↓--
↓--
Ilość nie korygowalnych błędów.
Wartość RAW tego atrybutu wskazuje
Uncorrectable łączną ilość nie korygowalnych błędów
5/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
Sector Mount podczas odczytu/zapisu sektora. Wzrost
Tak
(Offline scan wartości tego atrybutu wskazuje na
UNC sectors) ewidentne defekty powierzchni dysku
i/lub problemy z podsystemem
mechanicznym dysku.
Łączna ilość błędów CRC w trybie
UltraDMA. Wartość RAW atrybutu
wskazuje ilość błędów wykrytych przez
UltraDMA
CRC podczas przesyłania danych w
199 C7 CRC Error trybie UltraDMA. Najczęstszym
Nie
Count
powodem błędów są problemy z taśmąkablem komunikacji danych. Parametr
ten nie zmniejsza się po usunięciu
usterki kabla.
Częstość błędów zapisu. Atrybut ten
Write Error wskazuje na łączną ilość błędów zapisu
Rate
podczas zapisywania sektora. Im wyższa
200 C8
Nie
(Multi Zone wartość RAW, tym gorszy stan
Error Rate)
powierzchni dysku i/lub mechanicznego
podsystemu.
Krytyczny jeśli różny od zera, należy
Off-track
wykonać kopie bezpieczeństwa (im
201 C9
Tak
errors Mount mniejszy tym lepiej)
198 C6
Liczba adresów danych zaznaczonych
Data Address
202 CA
jako błędne (ilość błędów DAM) (lub Nie
Mark errors
specyficznych dla dostawcy).
Run Out
203 CB
Liczba błędów ECC
Nie
Cancel
Soft ECC
Liczba błędów poprawionych przez
204 CC
Nie
Correction
oprogramowanie ECC
Thermal
Liczba błędów spowodowanych wysoką
205 CD Asperity Rate
Nie
temperaturą
(TAR)
Wysokość głowicy powyżej
powierzchni dysku. (System analizy
wysokości głowicy nad powierzchnię
206 CE Flying Height platera. Jeśli głowica jest zbyt wysoko Nie
może dojść do błędów odczytu jeśli zbyt
nisko może dojść do zderzenia z
platerem)
Spin High
Ilość energii (prąd rozruchowy)
207 CF
Nie
Current
potrzebna do rozkręcenia dysku.
Liczba prób podczas rozpędzania się
dysku potrzebnych do uzyskania
prędkości obrotowej pracy. (przyp. 208 D0 Spin Buzz
Jeśli ten parametr rośnie może to
Nie
świadczyć o problemach z łożyskiem
lub niewystarczającym prądzie
rozruchowym.)
Określenie sprawności (self test)
Offline Seek
209 D1
podczas operacji wyszukiwania w trybie Nie
Performance
offline
↓--
↓--
↓--
↓--
↓-↓-↓-↓--
↓--
6/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
Wibracje w trakcie operacji zapisu.
Technologia ta ma służyć analizie i
Vibration
zabezpieczeniu przed przypadkowymi
211 D3
During Write wibracjami podczas pracy dysku
najczęściej pomocna w laptopach i
dyskach przenośnych (stałe wibracje).
Wstrząsy w czasie operacji zapisu.
Technologia ta ma służyć analizie i
zabezpieczeniu przed przypadkowymi
Shock During wstrząsami podczas pracy dysku
212 D4
Write
najczęściej pomocna w laptopach i
dyskach przenośnych (uderzenia nagłe
zmiany położenia).
220 DC Disk Shift
221 DD
G-Sense
Error Rate
222 DE
Loaded
Hours
223 DF
Load/Unload
Retry Count
224 E0 Load Friction
225 E1
Load/Unload
Cycle Count
Load 'In'226 E2 time
Nie
Nie
Przesunięcie dysków względem osi.
Przesunięcie to mogło być
Nie
spowodowane upadkiem lub wysoka
temperaturą.
Ilość błędów występująca w czasie
przeciążeń (G) dysku. Atrybut na
podstawie czujnika przeciążeń podaje
łączną ilość błędów spowodowanych np. Nie
upuszczeniem dysku czy nagłymi
zmianami położenia skutkującymi
przeciążeniami.
Czas użycia akutatora głowic
magnetycznych spowodowany normalną
Nie
eksploatacją. Liczy się tylko czas
działania akutatora.
Czas użycia głowic magnetycznych do
operacji takich jak: odczyt, zapis,
Nie
pozycjonowanie głowic. Czas pracy
zmian pozycji głowic w strefie danych.
Opór spowodowany przez tarcie w
mechanicznych częściach w czasie
eksploatacji. Stan spowodowany tarciem
Nie
części mechanicznych. (przyp. Parametr
ten informuje o problemach z systemem
mechanicznym dysku)
Łączna liczba cykli
parkowania/wyparkowania ze strefy
Nie
parkowania (Landing Zone).
Całkowity czas pracy głowic nad strefa
danych. (Czas nie spędzony w strefie
Nie
parkowania)
Torque
Ilość prób rozpędzenia talerzy. Ile razy
227 E3 Amplification dysk próbował rozpędzić dysk do
Nie
Count
uzyskania prędkości obrotowej pracy.
Ilość automatycznego zabezpieczenia
Power-Off
228 E4
mechanizmu magnetycznego w wyniku Nie
Retract Cycle
utraty zasilania.
GMR Head Amplituda drgań głowic (GMR-head) w
230 E6
Nie
Amplitude
czasie pracy.
↓--
↓--
↓--
↓--
↓-↓--
7/8
18.9.2014
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
231 E7 Temperature
Head Flying
240 F0
Hours
Total LBA-s
241 F1
Written
Total LBA-s
242 F2
Read
Read Error
250 FA
Retry Rate
254 FE
Free Fall
Protection
Temperatura Dysku
Nie
Czas w jakim głowica jest
Nie
pozycjonowana.
Całkowita liczba zapisanych sektorów.
Nie
(Parametr WD)
Całkowita liczba odczytanych sektorów.
Nie
(Parametr WD)
Częstotliwość występowania błędów
Nie
podczas odczytu danych z dysku.
Ilość odczytu z czujnika Free Fall
Sensor (Czujnik swobodnego upadku do
wykrywania monitorowanych
Nie
przenośnych urządzeń elektronicznych)
Czujnik ten ma za zadanie informować o
upadku dysku. Patent
↓--
↓--
↓--
Symbole:
↑-- - Im większa wartość tym lepiej (wartość nie powinna się zmniejszać)
↓-- - Im mniej tym lepiej
Polecane artykuły:
S.M.A.R.T. w dyskach twardych i dyskach SSD - Dyski Twarde/SSD - CDRinfo.pl
Opracowane w oparciu o informacje z:
S.M.A.R.T. (informatyka) – Wikipedia, wolna encyklopedia
S.M.A.R.T. - z czym to się je? - Przewodnik
S.M.A.R.T. - interpretacja parametrów - Forum PCLab.pl
Syntax error
8/8

Podobne dokumenty