S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
Transkrypt
S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz
18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz 1. Online Silas Mariusz Administrator TS-x79U 1 GbE S.M.A.R.T. (ang. Self-Monitoring, Analysis and Reporting Technology) – system monitorowania i powiadamiania o błędach działania dysku twardego. Przewidywanie usterek W założeniu miał to być system, który na bieżąco monitoruje stan najważniejszych parametrów dysku i ostrzega o nadchodzącej awarii. Dyski twarde Seagate są wyposażone w zdecydowanie skuteczniejszy od pozostałych producentów mechanizm analizy i ostrzegania o możliwych awariach i błędach. W przypadku dysków twardych Samsung lub WD, S.M.A.R.T. sprawdza się jako "czarna skrzynka" niż jako system alarmowy. Ta czarna skrzynka zapisuje kilkanaście kluczowych parametrów pracy dysku. Nie są to wprawdzie kompletne dane diagnostyczne, ale w zupełności wystarczą do oceny kondycji dysku twardego i jego użyteczności. Błędne odczyty... Ponadto nie wolno sugerować się "diagnozami" przeprowadzonymi przez przeróżne programiki, które podają tylko "status" czy "kondycję" dysku, wyrażoną najczęściej w procentach bądź tylko jako "OK". Takie "diagnozy" są nic nie warte. Niektóre parametry S.M.A.R.T. nie mają wartości ostrzegawczych (zwykle mają komentarz "zawsze pozytywnie" itp.), więc programy nie mają z czym porównać bieżących odczytów. W takiej sytuacji nawet jeśli dysk dosłownie się sypie to programy diagnostyczne stwierdzą że "SMART nie zgłasza problemów". Najlepiej więc samemu zajrzeć do raportów S.M.A.R.T. i z podanych wartości odczytać logiczny stan dysku twardego. Odczytywanie stanu diagnozy Raporty S.M.A.R.T. można odczytać zazwyczaj za pomocą dostarczonych od producenta programów diagnostycznych lub sterowników kontrolerów dysków twardych. Opisy parametrów S.M.A.R.T. wyrażonych w postaci Hex mogą różnić się w prezentowanych raportach programów. Na przykład parametr "C4" w programie SiSoft Sandra nazywa się "Realocated Data Count", a w EVEREST "Realocation Event Count". Obie nazwy dotyczą tego samego parametru. S.M.A.R.T. nie przechowuje informacji o nazwie danego parametru tylko jego numer (właśnie owe "C4"). Nazwy dopisuje program (np. EVEREST) żeby jego użytkownicy mogli łatwiej zdiagnozować usterkę. Dobór parametrów które S.M.A.R.T. ma monitorować zależy wyłącznie od producenta, więc dostępne mechanizmy przewidywania i diagnostyki mogą się różnić w poszczególnych modelach dysków twardych, jednak zazwyczaj podyktowana jest to stosowaną metodą kontroli przez producenta. Jeżeli więc S.M.A.R.T. Twojego dysku nie podaje np. parametru "C4" to nie jest to żadne uszkodzenie czy błąd. 1/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz Self-Monitoring Podczas pracy dysku system S.M.A.R.T na bieżąco monitoruje istotne parametry, każdy z nich może przyjąć następujące stany: Pre-failure warranty attribute (PW) - Wskazuje warunek przed awaryjny, może uchronić od straty wielu danych. Online collection attribute (OC) - Oznacza, że wartości są obliczane podczas pracy dysku. Performance attribute (PE) - Oznacza pogorszenie spowodowane zużyciem lub wiekiem dysku. Error rate attribute (ER) - Oznacza parametr częstości występowania błędów. Error count attribute (EC) - Oznacza parametr ilości zmierzonych błędów. Self-preserving attribute (SP) - Oznacza parametr który jest automatycznie ustawiany podczas testu S.M.A.R.T. Atrybuty Pojedynczy atrybut S.M.A.R.T zawiera następujące elementy: ID (identyfikator): numer danego atrybutu Attribute name (nazwa): nazwa danego atrybutu Value (bieżący): obecna wartość każdego z atrybutów. Worst (najgorszy): najgorsza zmierzona i zapamiętana wartość danego atrybutu Threshold (próg): najniższa wartość atrybutu ustawiona przez producenta danego dysku dla każdego z atrybutów (wartość ta jest stała). RAW value (wartość RAW): surowa (odczytana bezpośrednio) wartość danego atrybutu ukazuje obecny stan dysku. Najczęściej wyświetlana jest w postaci heksadecymalnej, ale niektóre programy podają wartości decymalne (łatwiejsze do odczytania bez pomocy kalkulatora). Atrybut jest prawidłowy, gdy jego wartość jest wyższa lub równa z progiem. Jeśli próg jest równy 0 dla jakiegoś atrybutu, to atrybut nie powinien być brany pod uwagę. Tabela parametrów S.M.A.R.T. Poniżej prezentujemy tabelę z zestawieniem i krótkim opisem każdego z atrybutów S.M.A.R.T. Kolorem czerwonym zaznaczono atrybuty, które są uznawane za krytyczne. Jeżeli ich parametry się pogarszają (są niższe od progu) jest to sygnał do wykonania kopii zapasowej plików z danego dysku. ID hex 01 01 Nazwa atrybutu Raw Read Error Rate Opis Krytyczny Lepiej Atrybut ten zależy od ilości błędów odczytu i stanu powierzchni dysku, wskazuje na częstość sprzętowych błędów odczytu, które wystąpiły podczas odczytu danych z powierzchni dysku. Niskie wartości wskazują na Tak problem z powierzchnią dysku lub głowicami odczytu/zapisu. UWAGA: Dyski Seagate nie monitorują parametru Raw Read Error Rate, stąd tak wysokie wartości podczas testu S.M.A.R.T. Łączna (ogólna) sprawność dysku. Jeśli ↓-- 2/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz 02 02 Throughput wartość tego atrybutu się obniża jest Nie Performance duża szansa, że zbliżają się problemy z dyskiem. Średni czas na rozkręcenie talerzy (od 0 obr/min do pełnej prędkości). Wartość 03 03 Spin Up Time Nie RAW tego atrybutu wyraża czas w sekundach lub milisekundach. Start/Stop Mount Wartość RAW tego atrybutu jest liczbą 04 04 Nie (Number of cykli start/stop dysku. spin-up times) Ilość relokowanych sektorów. Kiedy dysk napotyka błąd odczytu/zapisu/weryfikacji, oznacza ten sektor jako relokowany i przenosi dane do specjalnego zarezerwowanego Reallocated obszaru (obszaru rezerwowego). Proces 05 05 Tak Sectors Count ten jest również określany mianem remapowania a relokowane sektory określa się remapami. To właśnie dlatego, na nowoczesnych dyskach, nie widzimy "bad bloków" podczas testów powierzchni. Rezerwa kanału podczas odczytu Read Channel 06 06 danych. Funkcja tego atrybutu nie jest Nie Margin objęta specyfikacją. Częstość błędów wyszukiwania głowic magnetycznych. W razie uszkodzenia mechanicznego systemu pozycjonowania, uszkodzenia serwa albo termicznej rozszerzalności dysku, Seek Error ilość błędów wyszukiwania wzrasta. 07 07 Nie Rate Więcej błędów wyszukiwania oznacza pogarszanie się stanu powierzchni dysku i podsystemu mechanicznego dysku. W nowych dyskach firmy Seagate np. serii 7200.11 ten parametr jest wysoki i jest to normalne dla tych dysków. Przeciętna wydajność operacji wyszukiwania głowic magnetycznych. Seek Time 08 08 Jeśli wartość atrybutu maleje, jest to Nie Performance oznaka problemów z podsystemem mechanicznym dysku. Ilość godzin w stanie zasilnia. Wartość RAW atrybutu odpowiada łącznej ilości godzin (lub minut, sekund, w zależności od producenta) przepracowanych przez dysk. Zmniejszenie się tej wartości do Power-On poziomu krytycznego (threshold) 09 09 Nie Hours wskazuje na zmniejszenie się parametru MTBF (średni czas między awariami). Niemniej, w rzeczywistości, nawet jeśli MTBF zmaleje do zera, nie oznacza to ↑-- ↓-- ↓-- ↓-- ↑-- ↓-- 3/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz że zasoby MTBF całkowicie się wyczerpały i dysk przestanie działać. Ilość ponownych prób rozpędzenia talerzy. Atrybut ten przechowuje łączną ilość prób uruchomienia talerzy przed Spin Retry osiągnięciem pełnej szybkości Count 10 0A obrotowej (pod warunkiem, że pierwsza Tak (Spin-up próba nie powiodła się). Wzrost tego retries) atrybutu jest oznaką problemów z podsystemem mechanicznym dysku np. zbliżającym się uszkodzeniem łożyska. Atrybut ten wskazuje liczbę żądań rekalibracji (pod warunkiem, że Recalibration pierwsza próba nie powiodła się). 11 0B Nie Retries Spadek tego atrybutu jest oznaką problemów z podsystemem mechanicznym dysku. Device Power Cycle Mount Atrybut ten wskazuje na łączną ilość 12 0C Nie (Start/stop pełnych cykli zasilania dysku. count) Jest to ilość programowych błędów Soft Read 13 0D odczytu występujących podczas odczytu Nie Error Rate danych z powierzchni dysku. Ten atrybut jest częścią technologii HP w wersji S.M.A.R.T. IV generacji i End-to-End 184 B8 informuje ,że na drodze pomiędzy Tak Error pamięcią podręczna buforem a dyskiem nastąpiły błędy. Atrybut spotykany w dyskach Western Head 185 B9 Digital. Nie Stability Stabilizacja głowicy. Atrybut spotykany w dyskach Western Induced OpDigital. 186 BA Vibration Nie Detekcja wzrostu wibracji Detection indukcyjnych. Ilość błędów, które nie mogą być Reported 187 BB odzyskane przy użyciu sprzętu Nie UNC Error technologii korekcji sprzętowej ECC . Ilość przerwanych operacji z powodu nie odpowiadania dysku na komendy. Normalnie ten parametr powinien Command 188 BC wynosić zero jeśli jest inaczej może to Tak Timeout świadczyć o poważnych problemach z zasilaniem dysku (złączem zasilaczem ect.) Technologia monitorująca sposób zapisu głowicy. Jeśli głowica podczas High Fly zapisywania wychodzi po za normalny 189 BD Nie Writes zakres pracy nad powierzchnię talerza operacja jest przerywana a zapis jest ponawiany w bezpiecznym obszarze. W dyskach WDC (Temperatura ↓-- ↓-- ↓-- ↓-- ↓-- ↓-- ↓-- 4/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz otoczenia (powietrza)) UWAGA: Producenci różnie definiują Airflow 190 BE Temperature ten parametr np. w dyskach Seagate ST3802110A wartość prawidłowa jest równa 100. 191 BF G-sense error rate 192 BE Power-off retract count 193 C1 Load/Unload Cycle Count 194 C2 HDA Temperature Hardware 195 C3 ECC Recovered 196 C4 Reallocation Event Count Current 197 C5 Pending Sector Count Nie Częstotliwość błędów w wyniku oddziaływania przeciążenia. Atrybut ten informuje o błędach pracy dysku w Nie wyniku drastycznego przeciążenia (np. Upadek). Ilość razy kiedy głowice są parkowane. Głowice mogą być parkowane nawet wtedy, gdy dysk nie jest wyłączony z Nie prądu. (or Emergency Retract Cycle count - Fujitsu) Lub kiedy potrzebują zliczać cykle. Ilość cykli parkowania/wyparkowania ze strefy parkowania (Landing Zone). Niektóre dyski 2,5 calowe mają opcje Nie parkowania głowicy przy bezczynności dłuższej niż np. 5 minut. Temperatura dysku twardego. Wartość RAW tego atrybutu podaje wskazania Nie wbudowanego czujnika ciepła (oC). Częstotliwość występowania "błędów w locie". Parametr technologii sprzętowej Nie korekcji błędów ECC . Ilość operacji remapowania (przenoszenia danych z uszkodzonego sektora do specjalnego zarezerwowanego obszaru - obszaru rezerwowego). Wartość RAW tego Tak atrybutu określa łączną ilość prób transferu danych z relokowanego sektora do obszaru rezerwowego. Liczone są zarówno próby udane jak i nieudane. Bieżąca ilość niestabilnych sektorów (oczekujących na remapowanie). Wartość RAW tego atrybutu wskazuje na łączną ilość sektorów oczekujących na rempowanie. Później, kiedy część z tych sektorów uda się odczytać, wartość jest zmniejszana. Jeśli błędy występują Tak ciągle podczas próby odczytu niektórych sektorów, dysk podejmie próbę odzyskania danych, przeniesienia ich do zarezerwowanego obszaru (obszaru rezerwowego) i oznaczenia sektora jako remapowany. ↓-- ↓-- ↓-- ↓-- ↓-- ↑-- ↓-- ↓-- Ilość nie korygowalnych błędów. Wartość RAW tego atrybutu wskazuje Uncorrectable łączną ilość nie korygowalnych błędów 5/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz Sector Mount podczas odczytu/zapisu sektora. Wzrost Tak (Offline scan wartości tego atrybutu wskazuje na UNC sectors) ewidentne defekty powierzchni dysku i/lub problemy z podsystemem mechanicznym dysku. Łączna ilość błędów CRC w trybie UltraDMA. Wartość RAW atrybutu wskazuje ilość błędów wykrytych przez UltraDMA CRC podczas przesyłania danych w 199 C7 CRC Error trybie UltraDMA. Najczęstszym Nie Count powodem błędów są problemy z taśmąkablem komunikacji danych. Parametr ten nie zmniejsza się po usunięciu usterki kabla. Częstość błędów zapisu. Atrybut ten Write Error wskazuje na łączną ilość błędów zapisu Rate podczas zapisywania sektora. Im wyższa 200 C8 Nie (Multi Zone wartość RAW, tym gorszy stan Error Rate) powierzchni dysku i/lub mechanicznego podsystemu. Krytyczny jeśli różny od zera, należy Off-track wykonać kopie bezpieczeństwa (im 201 C9 Tak errors Mount mniejszy tym lepiej) 198 C6 Liczba adresów danych zaznaczonych Data Address 202 CA jako błędne (ilość błędów DAM) (lub Nie Mark errors specyficznych dla dostawcy). Run Out 203 CB Liczba błędów ECC Nie Cancel Soft ECC Liczba błędów poprawionych przez 204 CC Nie Correction oprogramowanie ECC Thermal Liczba błędów spowodowanych wysoką 205 CD Asperity Rate Nie temperaturą (TAR) Wysokość głowicy powyżej powierzchni dysku. (System analizy wysokości głowicy nad powierzchnię 206 CE Flying Height platera. Jeśli głowica jest zbyt wysoko Nie może dojść do błędów odczytu jeśli zbyt nisko może dojść do zderzenia z platerem) Spin High Ilość energii (prąd rozruchowy) 207 CF Nie Current potrzebna do rozkręcenia dysku. Liczba prób podczas rozpędzania się dysku potrzebnych do uzyskania prędkości obrotowej pracy. (przyp. 208 D0 Spin Buzz Jeśli ten parametr rośnie może to Nie świadczyć o problemach z łożyskiem lub niewystarczającym prądzie rozruchowym.) Określenie sprawności (self test) Offline Seek 209 D1 podczas operacji wyszukiwania w trybie Nie Performance offline ↓-- ↓-- ↓-- ↓-- ↓-↓-↓-↓-- ↓-- 6/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz Wibracje w trakcie operacji zapisu. Technologia ta ma służyć analizie i Vibration zabezpieczeniu przed przypadkowymi 211 D3 During Write wibracjami podczas pracy dysku najczęściej pomocna w laptopach i dyskach przenośnych (stałe wibracje). Wstrząsy w czasie operacji zapisu. Technologia ta ma służyć analizie i zabezpieczeniu przed przypadkowymi Shock During wstrząsami podczas pracy dysku 212 D4 Write najczęściej pomocna w laptopach i dyskach przenośnych (uderzenia nagłe zmiany położenia). 220 DC Disk Shift 221 DD G-Sense Error Rate 222 DE Loaded Hours 223 DF Load/Unload Retry Count 224 E0 Load Friction 225 E1 Load/Unload Cycle Count Load 'In'226 E2 time Nie Nie Przesunięcie dysków względem osi. Przesunięcie to mogło być Nie spowodowane upadkiem lub wysoka temperaturą. Ilość błędów występująca w czasie przeciążeń (G) dysku. Atrybut na podstawie czujnika przeciążeń podaje łączną ilość błędów spowodowanych np. Nie upuszczeniem dysku czy nagłymi zmianami położenia skutkującymi przeciążeniami. Czas użycia akutatora głowic magnetycznych spowodowany normalną Nie eksploatacją. Liczy się tylko czas działania akutatora. Czas użycia głowic magnetycznych do operacji takich jak: odczyt, zapis, Nie pozycjonowanie głowic. Czas pracy zmian pozycji głowic w strefie danych. Opór spowodowany przez tarcie w mechanicznych częściach w czasie eksploatacji. Stan spowodowany tarciem Nie części mechanicznych. (przyp. Parametr ten informuje o problemach z systemem mechanicznym dysku) Łączna liczba cykli parkowania/wyparkowania ze strefy Nie parkowania (Landing Zone). Całkowity czas pracy głowic nad strefa danych. (Czas nie spędzony w strefie Nie parkowania) Torque Ilość prób rozpędzenia talerzy. Ile razy 227 E3 Amplification dysk próbował rozpędzić dysk do Nie Count uzyskania prędkości obrotowej pracy. Ilość automatycznego zabezpieczenia Power-Off 228 E4 mechanizmu magnetycznego w wyniku Nie Retract Cycle utraty zasilania. GMR Head Amplituda drgań głowic (GMR-head) w 230 E6 Nie Amplitude czasie pracy. ↓-- ↓-- ↓-- ↓-- ↓-↓-- 7/8 18.9.2014 S.M.A.R.T. - Jak czytać oraz tabela atrybutów by Silas Mariusz 231 E7 Temperature Head Flying 240 F0 Hours Total LBA-s 241 F1 Written Total LBA-s 242 F2 Read Read Error 250 FA Retry Rate 254 FE Free Fall Protection Temperatura Dysku Nie Czas w jakim głowica jest Nie pozycjonowana. Całkowita liczba zapisanych sektorów. Nie (Parametr WD) Całkowita liczba odczytanych sektorów. Nie (Parametr WD) Częstotliwość występowania błędów Nie podczas odczytu danych z dysku. Ilość odczytu z czujnika Free Fall Sensor (Czujnik swobodnego upadku do wykrywania monitorowanych Nie przenośnych urządzeń elektronicznych) Czujnik ten ma za zadanie informować o upadku dysku. Patent ↓-- ↓-- ↓-- Symbole: ↑-- - Im większa wartość tym lepiej (wartość nie powinna się zmniejszać) ↓-- - Im mniej tym lepiej Polecane artykuły: S.M.A.R.T. w dyskach twardych i dyskach SSD - Dyski Twarde/SSD - CDRinfo.pl Opracowane w oparciu o informacje z: S.M.A.R.T. (informatyka) – Wikipedia, wolna encyklopedia S.M.A.R.T. - z czym to się je? - Przewodnik S.M.A.R.T. - interpretacja parametrów - Forum PCLab.pl Syntax error 8/8