GUIDA | Le insicurezze di HDD ed SSD: come valutare i danni?

Dischi fissi tradizionali meccanici ed SSD sono le parti in cui custodiamo i nostri preziosi dati, ma anche loro non sono godibili in eterno: verrà il momento in cui vorranno abbandonarci (vuoi per l’età, vuoi per la qualità) e sicuramente bisognerà essere preparati. Un disco fisso malfunzionante o danneggiato però, può causare numerosi problemi anche durante il normale utilizzo del sistema e conviene testare un hard disk e controllarne lo stato di salute. Per fare ciò è possibile ricorrere a diversi strumenti a seconda che l’obiettivo sia quello di controllare se il disco fisso sia danneggiato oppure se si voglia provare a correggere i problemi eventualmente presenti.

I possibili sintomi di un hard disk danneggiato sono molteplici e non tutti, necessariamente, possono dipendere dal disco fisso malfunzionante: errori durante la lettura, la copia, lo spostamento o la cancellazione dei dati dal disco fisso; disco o sistema operativo che appare estremamente lento nel suo complesso o sistema operativo impossibile da avviare; errori random e riavvii inspiegabili.

Un po’ di teoria

Nel caso degli hard disk magnetomeccanici, i suoni emessi dal disco fisso spesso rappresentano indizi inequivocabili sullo stato di salute dell’unità, ancor prima che si manifestino errori a livello software. Il suono di un disco rotto o danneggiato sono, ad esempio, immediatamente riconoscibili e possono evidenziare un problema relativo alla testina presente su ogni piatto del disco. In questa pagina, che vi invitiamo a visitare, è pubblicata una raccolta di suoni emessi da un disco fisso danneggiato.

La prima regola, quindi, è quella di mettere al sicuro tutti i dati effettuandone un backup completo. Successivamente, quando si sarà certi di non poter subire perdite di dati, si potrà testare il funzionamento del disco fisso ed effettuare tutte le prove del caso. L’utility che Windows offre di default si chiama CHKDSK: utilizzando l’apposito switch /r è possibile fare in modo che il programma individui i settori danneggiati sul disco fisso e recuperi le informazioni leggibili. Per analizzare il contenuto dell’unità disco che contiene il sistema operativo, in Windows è possibile semplicemente aprire il prompt dei comandi coi diritti di amministratore quindi digitare quanto segue:

chkdsk c: /r

I dischi fissi oggi in commercio integrano una tecnologia di monitoraggio denominata S.M.A.R.T. che sta per Self Monitoring Analysis and Reporting Technology. Essa analizza continuamente i valori legati alle condizioni di funzionamento del supporto di memorizzazione ed è in grado di monitorare costantemente sino a 30 parametri che riflettono lo stato di salute del disco tra i quali frequenza degli errori in fase di lettura e scrittura, spin up time (indica quanto velocemente il disco fisso raggiunge il giusto numero di giri dopo l’avvio), seek error rate (frequenza con cui si verificano gli errori durante il posizionamento delle testine del disco), temperatura di lavoro e molti altri ancora. Nel caso in cui uno o più valori che indicano lo “stato di salute” del disco fisso dovessero superare dei “margini soglia”, più alte sono le probabilità di trovarsi a che fare con un imminente malfunzionamento dell’unità di memorizzazione.

I produttori di hard disk stimano la longevità dei loro dispositivi di storage ma spesso la valutazione sembra non essere corretta. Essi utilizzano una metrica denominata Mean Time Between Failures (MTBF) ovvero l’intervallo medio di tempo tra un guasto e l’altro. Questo parametro viene calcolato in base al funzionamento di un numero elevato di drive su un arco temporale della durata da settimane a mesi che garantisce letture per 1.5 milioni di ore – circa 200 anni – su hard disk ad uso enterprise. La metrica è un parametro valido ma la stima che viene effettuata ha poco a che vedere con il periodo di vita medio di un hard disk reale. Tuttavia, sebbene gli SMART siano abbastanza affidabili, è da ribadire che questi variano da produttore a produttore e anche ove vi sono attributi in comune le misurazioni vengono effettuate in maniera differente. Quindi un dispositivo Seagate e uno Western Digital di salute equivalente potrebbero ad esempio mostrare letture dei tassi di errore completamente diverse. Backblaze, un provider di servizi di backup in Cloud ha pubblicato uno studio interessante su come l’utilizzo dei diversi attributi S.M.A.R.T. può variare in modo incontrollato.

Prima di utilizzare qualsiasi utilità che s’interfaccia con la funzionalità SMART del disco fisso, è indispensabile che il supporto SMART sia effettivamente abilitato a livello BIOS oppure lato UEFI sui sistemi di più recente fattura. La SMART quindi ci permette di prevedere un malfunzionamento e/o invecchiamento del nostro amato supporto, facendo in modo di poter salvare i dati e provare a vedere se il malfunzionamento è riparabile. Ci sono 2 tipi di malfunzionamento: elettronico e meccanico

Quello elettronico è ciò che riguarda la scheda logica del disco, che vediamo capovolgendolo, ed è quella impiegata per la comunicazione col sistema, il posizionamento dei dati, lo spostamento delle testine, temperature, controllo C’è da dire che nei dischi moderni, a meno che non siano sottoposti a temperature incredibilmente elevate, le parti logiche difficilmente danno problemi.

Solitamente se il disco non da per nulla segni di vita è l’elettronica che è andata. In questo caso dovremmo cercare un hard disk della stessa marca,modello e capienza e sostituire la scheda elettronica, spesso facile da reperire nel mondo dell’usato. Scosse elettrostatiche o danni elettrici possono causare problemi su di essa e si possono rimediare su ebay da hard disk con la meccanica rotta ma la logica funzionante.

Il guasto meccanico invece è molto più complesso e frequente. Il malfunzionamento più comune è quello dei settori danneggiati che si dividono in 2 parti:errori logici o fisici

Se l’errore è logico basterebbe una formattazione a basso livello, se invece è fisico (es. la testina tocca il disco) si hanno settori danneggiati dovuti ad un errore fisico e i valori non faranno che peggiorare perchè ogni volta che azionate il disco, le testine non faranno altro che scavare solchi sulla superficie.

I problemi dovuti all’avviamento dell’hard disk che continua a cercar di raggiungere gli rpm senza riuscire indica o un problema all’alimentazione o all’elettronica, così anche quando sentite il fastidiosissimo “Clack-Clack” come nel nostro video.

La pratica SMART

Uno dei migliori software gratuiti per il controllo del disco fisso è CrystalDisk, applicazione che è in grado di recuperare i parametri SMART sia di SSD che di HDD pronosticando eventuali imminenti malfunzionamenti. Per i soli HDD invece, si può utilizzare HDtune, che è gratuito e permette di analizzare settore per settore del nostro disco e scoprire la sua reale condizione: molto utile richiedere la scansione HDtune prima di acquistare un disco fisso usato, per esempio.

CrystalDisk è un’utilità sia installabile che in versione portabile (che non richiede di essere installata sul sistema e basta averla su USB key): una volta prelevato il suo archivio compresso, basterà estrarne il contenuto in una cartella di propria scelta e fare doppio clic sul file

CrystalDisk (versione portable)

Download: crystalmark.info

Compatibile con: tutte le versioni di Windows

Licenza: Freeware

Il programma come si vede, ci dà tutti i valori dell’HDD o SSD e ci informa del suo stato di salute (Buono). Nel caso degli HDD, i settori danneggiati possono essere corretti (sino a un certo limite) ma se un SSD ha anche solo il 99% di integrità, è da sostituire. Per quanto riguarda i dati SMART che si trovano elencati, questi sono valutati tenendo conto di un valore soglia (Threshold) e del valore riscontrato (Value). Viene indicato anche il peggiore valore identificato (Worst).

In HDTUNE, che poi è uno dei più usati, abbiamo Current o Attuale indica il valore massimo o corretto, Threshold o Soglia indica il valore sotto il quale non si dovrebbe scendere, Worst o Peggiore indica il valore più basso raggiunto e infine DATA (valori) indica il valore effettivo in quel momento. I valori che vediamo nelle colonne sono delle stime che tendono a diminuire col tempo e con l’utilizzo del drive: quando raggiungono valori vicini a quello di soglia, bisogna attrezzarsi per un replacement del drive o un backup. Quando scendono sotto i livelli di soglia, probabilmente siete già spacciati.

RAW Read Error Rate: Questo valore indica una media degli errori di lettura avvenuti sul disco.

Spin Up Time: Questo valore indica all’incirca quanto tempo c’è voluto prima che i dischi abbiano raggiunto la loro massima velocità.

Start/Stop Count: Questo valore indica l’ammontare di cicli di avvio e interruzione del disco rigido.

Reallocated Sector Count: Questo valore indica il totale dei settori danneggiati e quindi riallocati. Un hard disk mette da parte dei settori di riserva che vengono utilizzati solo quando dei settori si danneggiano. In quel caso i settori di riserva sostituiscono quelli danneggiati (riallocazione). Nella tabella quindi vedremo nella colonna Current i settori messi da parte, nella colonna Threshold il limite di settori di scorta sotto il quale non dovremmo scendere e in DATA i settori effettivamente danneggiati e quindi riallocati.

Seek Error Rate: Questo valore rappresenta gli errori di posizionamento da parte delle testine alla ricerca di un dato (i fatidici clack o ticchettii), quindi evidenzia problemi attribuibili alla meccanica del disco e/o al limite problemi alla superficie del disco (meno frequente). Possono anche avvenire quando il disco raggiunge un’elevata temperatura di funzionamento.

Power On Hour Count: Questo valore indica per quanto tempo l’hard disk ha funzionato fino a quel momento. In media sono indicati le ore di vita di un hard disk ma in alcuni casi invece vengono segnati i minuti. Come scritto in un topic precedente riporto:

Spin Retry Count: Indica il numero di tentativi di un hard disk prima di raggiungere la massima velocità di rotazione per il funzionamento.

Calibration Retry Count: Indica il numero di tentativi della calibrazione di un hard disk che avviene subito dopo l’accensione.

Power Cycle Count: Indica il ciclo di accensione e spegnimento di un hard disk

Current Pending Sector Count: Indica il totale dei settori in attesa di essere riallocati.

Off-line Scan Uncorrectable Sector Count: Indica il totale il numero dei settori danneggiati che il firmware non è riuscito a correggere.

UltraDMA CRC Error Rate: Il controller UDMA esegue dei controlli di coerenza sui dati che vengono trasferiti tra host e hard disk. Ogni volta che avviene un errore, è richiesta una ritrasmissione. Questo attributo indica la media degli errori CRC (Controllo ridondanza ciclica).

HDTune

Download:

Compatibile con: Tutte le versioni di windows da XP

Licenza: Freeware (la versione non pro)

Altri programmi frewware che potreste voler provare:

Acronis Drive Monitor

Download:

Nota: per effettuare il download di Acronis Drive Monitor, è necessario indicare il proprio nome, cognome ed indirizzo e-mail.

Compatibile con: tutte le versioni di Windows (da Windows XP SP2 in poi)

Licenza: Freeware

DiskCheckup

Download:

Compatibile con: tutte le versioni di Windows (da Windows XP in poi)

Licenza: Freeware

Leave A Comment