Opplæringen

Enkle spørsmål: Hva er SMART og hva gjør det?

Mange av oss har opplevd feil på harddisken; Noen av oss har selv prøvd å finne ut mer om påliteligheten av harddisker og deres dypt skjulte prediksjonsfunksjon som er en del av en teknologi som kalles SMART. Man kan hevde at SMART ikke er like pålitelig som det ikke forutsier fiasko i alle tilfeller. Dette faktum er delvis sant, men selve selvbetjeningssystemets indre virkninger er ikke så enkle. Så la oss prøve å rette opp denne usikre situasjonen og undersøke hvordan SMART virkelig fungerer. La oss komme i gang:

SMART - En bit av historie

SMART, som noen ganger er skrevet som SMART (selvmonitoring, analyse og rapporteringsteknologi), er et system som overvåker den interne informasjonen til stasjonen. Den ble utviklet fra begynnelsen av 1992, og nå er den inkludert i alle moderne IDE- og Serial ATA-harddisker (HDD-er). Selvfølgelig er det en funksjon også i solid state drives (SSD).

Dens historie dekker en rekke navn som Predictive Failure Analysis eller IntelliSafe og inngang fra alle de store harddiskprodusentene: IBM, Seagate, Quantum, Western Digital. Endelig presenteres dokumentasjonen for første gang i 2004 innenfor Parallel ATA-standarden og mottatt regelmessige revisjoner til 2008.

Dens opprettelse var basert på behovet for å overvåke en disks status, og det vil angivelig fortelle deg om harddisken skal, vel, dø. Selv om du kanskje tror at SMART vil magisk gjette om stasjonen er sunn, viser den faktisk en rekke variabler hvis nummer og type varierer fra stasjon til stasjon, som er indikatorer for pålitelighet. For en fullstendig liste over attributter, da det er omtrent 50 av dem (for eksempel, rå lesfeil, spinntid, rapporterte feilkorrigerte feil, tid til strøm, belastningsgrad, etc.), kan du få tilgang til her.

Bortsett fra noen enkeltforsøk (Google, Backblaze), er de fleste SMART-dataene ikke dokumentert. Systemet gir en mengde interne data, men det er mange inkonsekvenser i statistikken, hovedsakelig fordi mange av harddiskprodusentene bruker forskjellige definisjoner og målinger. For eksempel lagrer noen produsenter strøm på ganger som timer, mens andre måler i minutter eller sekunder. Også, ingen av dem prøver å forklare hvilken av de forskjellige attributter eller variabler som er verdt vår oppmerksomhet, noe som gjør oss til å drukne i data.

Før du forsøker å forstå hvilke attributter som er relevante, må vi først skille mellom hovedtyper av feil: forutsigbar og ikke forutsigbar. Den første typen inkluderer feilene som vises i tid og som skyldes feil diskmekanikk eller skader på diskens overflate. Problemer blir verre over tid, og disken vil til slutt svikte. Ikke-forutsigbare feil skyldes plutselige hendelser, som vi kan nevne for eksempel plutselige strømforstyrrelser.

MERK: Det er viktig å forstå at SMART bare kan hjelpe deg med å oppdage forutsigbare feil.

Viktige SMART-attributter

Helse status på harddisken overvåkes kontinuerlig ved bruk av flere sensorer. Verdiene måles ved bruk av typiske algoritmer, og deretter blir de tilhørende egenskapene tilpasset i henhold til resultatene.

I et overvåkingsprogram du vil bruke alle SMART-attributter, vil disse feltene være:

  • Identifikator: definisjonen av attributtet. Den har vanligvis en standard betydning, og den er merket med et tall mellom 1 og 250 (for eksempel 9 er Power-on Count). Likevel gir alle diskovervåkings- og testverktøyene navnet og en tekstbeskrivelse av attributten.
  • Terskel: minimumsverdien for attributtet. Hvis denne verdien er nådd, kommer harddisken til å mislykkes.
  • Verdi: nåverdien av attributten. Algoritmen beregner dette nummeret basert på rå data. En ny harddisk vil ha et høyt antall, det teoretiske maksimumet (100, 200 eller 253 avhengig av produsenten), som vil redusere i løpet av harddiskens levetid.
  • Verste: Den minste verdien av attributten noensinne registrert.
  • Data: Råmålte verdier levert av en sensor eller en teller. Dette er dataene som brukes av algoritmen designet av produsenten av HDD. Innholdet avhenger av attributtet og produsenten av harddisken. Vanlige brukere bør hoppe over denne.
  • Flagg: Formålet med attributtet. Dette settes vanligvis av produsenten og vil derfor variere fra disk til disk. Hver av attributter er enten kritiske og kan forutsi en overhengende feil (for eksempel ID 5 reallokerte sektorer teller) eller statistisk uten direkte effekt på status (for eksempel ID 174 uventet strømttap telling).

MERK: Husk alltid, når du prøver å forstå statusen til et hvilket som helst SMART-attributt, kontroller verdiene av disse tre feltene: verdi, terskel og flagg. Husk også at mindre verdier er en indikasjon på redusert pålitelighet.

Disk temperatur er en svært debattert parameter. Likevel vurderes det at verdier over 60 ° C vil redusere levetiden til en harddisk og øke sannsynligheten for skade. Vi anbefaler at du bruker en vifte for å redusere temperaturen på harddiskene dine og kanskje forlenge livet.

Som vi nevnte ovenfor, er ikke alle SMART-attributter avgjørende for feilprognose. De to ovennevnte studiene på feilfrekvenser på harddisker og andre kilder er enige om at en viktig hjelp for å identifisere feilbare stasjoner er ID 5-omfordelte sektordeltall. Omfordeling skjer når stasjonens logikk remballerer en skadet sektor som følge av gjentatte myke eller harde feil, til en ny fysisk sektor fra sine ekstra enheter. Denne egenskapen gjenspeiler antall ganger en remapping har skjedd, og det er en indikasjon på HDDs overflatestyrke.

En annen nyttig egenskap som skal overvåkes, er ID 197 - Nåværende Venter Sektor Count. Dette teller "ustabile" sektorer, noe som betyr de skadede med lesefeil som venter på en remapping, en slags "probation" -system. SMARTs algoritmer har blandede følelser om dette bestemte attributtet, som det noen ganger er overbevisende, men det er sagt at det kan gi en tidligere advarsel om mulige problemer.

Den siste av disse indikatorene som må overvåkes, er ID 187 - Rapporterte feilkorrigerte feil. Det er antall feil som er umulig å gjenopprette, og det er nyttig fordi det ser ut til å ha samme betydning for alle produsenter.

MERK: Alle de ovennevnte SMART-egenskapene har en verdi som er lett å tolke. Hvis de rapporterer et nummer på 1 eller flere, er det svært mulig at stasjonen din feiler, så begynn å sikkerhetskopiere. Likevel, selv om disse er nyttige indikatorer for driftsikkerhet, er de ikke idiotsikre, og du bør sammenligne dem med rådene gitt av ditt valgte HDD-overvåkingsverktøy.

Konklusjon

Dette var vår korte studie om SMARTs indre arbeid og dets evne til å overvåke og forutsi harddiskfeil. Hovedsynet du bør huske er at dette selvovervåkingssystemet vil hjelpe deg å vurdere statusen til HDD. Hvis du vil bruke denne SMART-dataen for å se om din egen stasjon har problemer, les artiklene som er anbefalt nedenfor.