checksum différent de 0

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Bonjour,
Par curiosité je suis allé dans Volume > sélectionné mon volume > volume status. Dans le tableau, colonne "Somme de contrôle", j'ai l'un de mes disques qui a un "2".
Sans titre.png

Qu'est-ce que cela signifie ?

Cordialement
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ca signifie que FreeNAS a détecté une erreur dans les checksums des données.
L'erreur a été corrigée (mais un zpool status permettra d'avoir plus d'info) mais ça peut valoir le coup d'essayer de comprendre pourquoi une erreur s'est produite.

L'origine peut être multiple:
  • l'erreur peut être survenue par une erreur sporadique lors de la transmission d'une donnée (ou corruption silencieuse), c'est l'avantage de FreeNAS et de la redondance de pouvoir détecter et corriger ces erreurs
  • le câble ou connecteur (côté disque ou carte mère) du disque peut avoir bougé ou avoir un problème
  • le disque peut avoir des problèmes, dans ce cas, on peut aller voir les données SMART du disques avec smartctl, même si les données SMART ne couvrent pas toutes les erreurs non plus...
Dans tous les cas, surveiller un peu le volume pour voir si ça se reproduit.
Peut-être lancer un nouveau scrub pour voir ce que ça dit...
Et il n'est jamais trop tard pour s'assurer que les sauvegardes sont correctes... :smile:
 

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Merci de ta rapide réponse.

J'ai redémarré le serveur, j'ai eu cette alerte critique qui est apparue :
Sans titre2.png


Par ailleurs, un "zpool status" donne :
[root@freenas ~]# zpool status

pool: Systeme
state: ONLINE
scan: resilvered 464M in 0h0m with 0 errors on Sun Oct 25 15:34:05 2020
config:

NAME STATE READ WRITE CKSUM
Systeme ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/xxxxxxxxxxxxxxxxxxxxx.eli ONLINE 0 0 0
gptid/xxxxxxxxxxxxxxxxxxxxx.eli ONLINE 0 0 0

errors: No known data errors

pool: freenas-boot
state: ONLINE
scan: scrub repaired 0 in 0h0m with 0 errors on Thu Oct 1 03:45:45 2020
config:

NAME STATE READ WRITE CKSUM
freenas-boot ONLINE 0 0 0
gptid/xxxxxxxxxxxxxxxxxxxxxxx ONLINE 0 0 0

errors: No known data errors
[root@freenas ~]#

Que recommandes-tu comme commande pour smartctl ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ah ben voilà.... une alerte sur ada1! ;-(
Cela semble confirmer un problème au niveau du disque lui même.
Et quand c'est comme ça, je me permets d'insister mais: sauvegardes, sauvegardes, sauvegardes!
C'est la première chose à faire si ce n'est pas déjà fait!

Pour les infos SMART: smartctl -a /dev/ada1
Ca peut être intéressant de voir si les tests SMARTS ont détecté des erreurs et voir ce que disent les attributs #5, #197 et #198, entre autres.
 

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Ah!
Voilà le retour de commande. Mais c'est bizarre, je n'arrive pas à avoir le début, je n'ai que la fin du retour de la commande . Je passe par le terminal disponible dans l'interface d'administration de freenas :
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 098 098 000 Old_age Always - 2107
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 728
193 Load_Cycle_Count 0x0032 001 001 000 Old_age Always - 1443515
194 Temperature_Celsius 0x0022 117 098 000 Old_age Always - 30
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 3
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 3729
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 53

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 36383 -
# 2 Extended offline Completed without error 00% 36279 -
# 3 Short offline Completed without error 00% 36240 -
# 4 Short offline Completed without error 00% 36096 -
# 5 Short offline Completed without error 00% 35952 -
# 6 Short offline Completed without error 00% 35809 -
# 7 Short offline Completed without error 00% 35641 -
# 8 Short offline Completed without error 00% 35498 -
# 9 Short offline Completed without error 00% 35443 -
#10 Short offline Completed without error 00% 35275 -
#11 Short offline Completed without error 00% 35132 -
#12 Short offline Completed without error 00% 34988 -
#13 Short offline Completed without error 00% 34844 -
#14 Short offline Completed without error 00% 34557 -
#15 Short offline Completed without error 00% 34414 -
#16 Short offline Completed without error 00% 34270 -
#17 Short offline Completed without error 00% 34127 -
#18 Short offline Completed without error 00% 33983 -
#19 Short offline Completed without error 00% 33815 -
#20 Extended offline Completed without error 00% 33711 -
#21 Short offline Completed without error 00% 33672 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@freenas ~]
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Le terminal par l'interface graphique c'est pas très pratique, vaut mieux passer par un client SSH type PuTTY.
Parce qu'effectivement, il manque un peu tout le début! :-D

Je sais pas quelle marque de disque c'est mais l'attribut #193 est très élevé... Si le disque est un WD green, blue ou red alors c'est très élevé (et probablement que les disques sont configurés pour se mettre en veille très rapidement)!

Sans trop de surprise l'attribut #197 est à 3.
Les tests SMART n'ont rient signalé, en tout cas, le dernier long a été exécuté à 36240 heures mais on sait pas combien d'heures au total (c'est l'attribut 8! :-O). Mais faut aussi savoir que les tests SMART ne font que des tests en lecture, donc ils ne "voient" pas tout.

Bref, en tout cas, le disque commence potentiellement à avoir des secteurs défectueux.... ou en tout cas, la probabilité que des secteurs défectueux apparaissent dans un avenir proche est grande.
Comme le volume est un miroir, les données ne sont pas impactées.
Tout dépend de la criticité des données mais on peut envisager un changement du disque ou une surveillance étroite de son état de santé.

Ca serait moi, je m'assurerai d'avoir des sauvegardes à jour puis je lancerai un badblocks destructif sur le disque pour voir comment il réagit.
Et si il n'y a pas d'autres alertes après ça, je le surveillerai de près...
 

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Le terminal par l'interface graphique c'est pas très pratique, vaut mieux passer par un client SSH type PuTTY.
je suis sous ubuntu, comment je peux ouvrir un terminal à distance sur mon serveur ?

Je sais pas quelle marque de disque c'est mais l'attribut #193 est très élevé... Si le disque est un WD green, blue ou red alors c'est très élevé (et probablement que les disques sont configurés pour se mettre en veille très rapidement)!
Il s'agit d'un Western Digital Blue 2.5
Il n'est pas configuré pour se mettre en veille. Il tourne en continu.

Ca serait moi, je m'assurerai d'avoir des sauvegardes à jour
Oui mes sauvegardes sont à jour. Et il n'y a rien de critique ici.

je lancerai un badblocks destructif sur le disque pour voir comment il réagit.
désolé je ne vois pas du tout de quoi tu parles . ;)

Merci en tout cas.
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ah ben si tu es sous Ubuntu, tu ouvres un terminal et tu fais une connexion ssh sur le serveur FreeNAS (ssh <adresse IP du serveur>).

Si c'est un WD blue alors il y a des chances qu'il ait un timer à 8 secondes. Il ne met pas en veille le disque mais il va "parquer" les têtes et c'est ça que compte l'attribut #193. Je n'ai plus en tête mais les disques sont spécifiés pour un certain nombre de "parquage", selon les modèles dans les 300 000 ou plus (pour les red).

Badblocks est un utilitaire qui permet de tester la surface d'un disque. Ca peut se faire en lecture (du coup comme un test SMART long) ou en écriture (et destructif dans ce cas, donc ne pas le faire sur un disque qui contient des données non sauvegardées).
Il est souvent utilisé pour le "rodage" des disques. C'est assez long car il fait plusieurs passes mais ça sert également de test de stress mécanique pour le disque.
 

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Bonjour,
Je ne savais que je pouvais ouvrir aussi facilement un terminal sur mon serveur! :)
Voici le retour complet :

xxx@xxx:~$ ssh NAS@192.168.x.xx -p xxxx
NAS@192.168.1.22's password:
Last login: Wed May 6 09:08:45 2020 from 192.168.x.xx
FreeBSD 9.3-RELEASE-p31 (FREENAS.amd64) #0 r288272+e7e804d: Mon May 16 21:29:59 PDT 2016

FreeNAS (c) 2009-2015, The FreeNAS Development Team
All rights reserved.
FreeNAS is released under the modified BSD license.

For more information, documentation, help or support, go here:
http://freenas.org
Welcome to FreeNAS
root@freenas:~ # smartctl -a /dev/ada1
smartctl 6.3 2014-07-26 r3976 [FreeBSD 9.3-RELEASE-p31 amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Scorpio Blue Serial ATA
Device Model: WDC WD5000BEVT-11ZAT0
Serial Number: WD-WXNY08NV1896
LU WWN Device Id: 5 0014ee 2025dce0f
Firmware Version: 01.01A01
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: 5400 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 2.6, 3.0 Gb/s
Local Time is: Sun Oct 25 21:41:14 2020 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (13200) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 154) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x303f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 2792
3 Spin_Up_Time 0x0027 157 147 021 Pre-fail Always - 3150
4 Start_Stop_Count 0x0032 090 090 000 Old_age Always - 10490
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 050 050 000 Old_age Always - 37017
10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 098 098 000 Old_age Always - 2107
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 728
193 Load_Cycle_Count 0x0032 001 001 000 Old_age Always - 1443515
194 Temperature_Celsius 0x0022 117 098 000 Old_age Always - 30
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 3
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 3729
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 53

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 36383 -
# 2 Extended offline Completed without error 00% 36279 -
# 3 Short offline Completed without error 00% 36240 -
# 4 Short offline Completed without error 00% 36096 -
# 5 Short offline Completed without error 00% 35952 -
# 6 Short offline Completed without error 00% 35809 -
# 7 Short offline Completed without error 00% 35641 -
# 8 Short offline Completed without error 00% 35498 -
# 9 Short offline Completed without error 00% 35443 -
#10 Short offline Completed without error 00% 35275 -
#11 Short offline Completed without error 00% 35132 -
#12 Short offline Completed without error 00% 34988 -
#13 Short offline Completed without error 00% 34844 -
#14 Short offline Completed without error 00% 34557 -
#15 Short offline Completed without error 00% 34414 -
#16 Short offline Completed without error 00% 34270 -
#17 Short offline Completed without error 00% 34127 -
#18 Short offline Completed without error 00% 33983 -
#19 Short offline Completed without error 00% 33815 -
#20 Extended offline Completed without error 00% 33711 -
#21 Short offline Completed without error 00% 33672 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

root@freenas:~ #

Si c'est un WD blue alors il y a des chances qu'il ait un timer à 8 secondes. Il ne met pas en veille le disque mais il va "parquer" les têtes et c'est ça que compte l'attribut #193. Je n'ai plus en tête mais les disques sont spécifiés pour un certain nombre de "parquage", selon les modèles dans les 300 000 ou plus (pour les red).
L'article est super intéressant!
J'ai un pool de donnée avec 4 WD red. J'aimerais bien vérifier le timer de mes disques. Mai je n'ai pas bien compris, il faut absolument l'utilitaire , ou bien on peut le vérifier plus simplement ?

Pour les données SMART, j'ai un peu de mal à comprendre. J'ai parcouru pas mal de doc sur internet, peu d'entre-elles parlent des colonnes. Quelle est la colonne à vérifier par rapport à quoi ? (VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE)

D'ailleurs, plus haut dans ce fil, tu as évoqué que "Sans trop de surprise l'attribut #197 est à 3", qu'est-ce que cela veut-il dire ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
il faut absolument l'utilitaire
Oui... il faut utiliser WDIDLE3.EXE pour pouvoir voir et changer le timer des disques (enfin à ma connaissance).
De préférence, faire ça sur une autre machine (ou la même) où seulement le disque désiré est branché.
A l'époque j'avais fait ça sur des disques 2 et 4To WD et j'avais utilisé une clé USB de démarrage et juste le disque branché.

Sur ton pool de 4 WD red, tu peux aussi regarder l'attribut #193 des info SMART des disques, ça te donnera déjà une idée (en rapport avec le nombre d'heures de fonctionnement).
Tu peux prendre l'exemple de ton disque WD blue: 37017h pour un LCC (Load Cycle Count) de 1443515.
Ce qui fait un LCC toutes les 92 secondes. Dont en gros, les têtes sont "parquées" toutes les 92s en moyenne.

Pour comparaison, j'ai un disque avec 24364h et un LCC de 2761, ce qui fait un LCC toutes les 8.8h en moyenne.

Pour les données SMART, j'ai un peu de mal à comprendre.
Oui, les données SMART c'est pas toujours simple, les constructeurs faisant un peu à leur tête évidemment... :tongue:
De manière générale, avec smartctl, on va regarder la dernière colonne "RAW_VALUE".
Celle-ci est parfois sujette à interprétation mais la colonne "VALUE" aussi... :-(
Bref, cette colonne "RAW_VALUE" peut être utilisée pour les attributs du genre #4, #5, #9, #12, #193, #194, #197, #198.
Probablement d'autres...
Aussi, selon le fabricant, les attributs ne sont pas les mêmes. Et c'est encore plus valable pour les SSD.

J'ai eu l'exemple d'un SSD dont les attributs SMART n'étaient pas cohérents. Par exemple, il me donnait des secteurs défectueux en hausse car l'attribut 198 Offline Uncorrectable augmentait régulièrement sauf que cela ne correspondait pas au nombre de secteurs défectueux pour ce disque mais smartctl le reportait comme tel.
Pour cela il faut faire attention à un détail tout au début du rapport:
Device is: In smartctl database [for details use: -P show]

Ca veut dire que ton disque est dans la base données de smartctl, dans mon cas, ce n'était pas le cas donc on peut s'attendre à des surprises.

"Sans trop de surprise l'attribut #197 est à 3", qu'est-ce que cela veut-il dire ?
Dans ton deuxième message, tu as mis une capture d'écran de l'alerte "3 currently unreadable (pending) sectors" ce qui est confirmé par l'attribut #197 de ton troisième message. C'est cohérent, donc sans trop de surprise. :smile:
L'attribut #197 veut dire que le disque a détecté 3 secteurs potentiellement non lisibles, sauf qu'il n'a pas encore pu le confirmer. En effet, puisque les tests SMART sont des tests non destructifs, uniquement en lecture. Il ne pourra le confirmer que lorsque ces secteurs se feront écrire.
On peut forcer cela avec un test de type badblocks (destructif), ou attendre qu'un fichier soit écrit... ce qui peut éventuellement ne jamais arriver... :smile:
 

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Voilà le smart d'un de mes disques WD :
root@freenas:~ # smartctl -a /dev/ada3
smartctl 6.3 2014-07-26 r3976 [FreeBSD 9.3-RELEASE-p31 amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Red
Device Model: WDC WD30EFRX-68EUZN0
Serial Number: WD-WCC4N5DVH902
LU WWN Device Id: 5 0014ee 20d954c65
Firmware Version: 82.00A82
User Capacity: 3,000,592,982,016 bytes [3.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2 (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Mon Oct 26 10:45:50 2020 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (38760) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 389) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x703d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 174 171 021 Pre-fail Always - 6266
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 60
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 065 065 000 Old_age Always - 25569
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 53
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 12
193 Load_Cycle_Count 0x0032 189 189 000 Old_age Always - 33609
194 Temperature_Celsius 0x0022 120 108 000 Old_age Always - 30
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 24944 -
# 2 Extended offline Completed without error 00% 24940 -
# 3 Short offline Completed without error 00% 24800 -
# 4 Short offline Completed without error 00% 24656 -
# 5 Short offline Completed without error 00% 24512 -
# 6 Short offline Completed without error 00% 24368 -
# 7 Short offline Completed without error 00% 24201 -
# 8 Short offline Completed without error 00% 24057 -
# 9 Short offline Completed without error 00% 23834 -
#10 Short offline Completed without error 00% 23690 -
#11 Short offline Completed without error 00% 23546 -
#12 Short offline Completed without error 00% 23402 -
#13 Short offline Completed without error 00% 23258 -
#14 Short offline Completed without error 00% 23115 -
#15 Short offline Completed without error 00% 22971 -
#16 Short offline Completed without error 00% 22827 -
#17 Short offline Completed without error 00% 22683 -
#18 Short offline Completed without error 00% 22539 -
#19 Short offline Completed without error 00% 22371 -
#20 Extended offline Completed without error 00% 22367 -
#21 Short offline Completed without error 00% 22227 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

root@freenas:~ #

Donc si je calcule bien, j'ai eu un "parquage" des têtes toutes les 45h.
Après je ne suis pas trop étonné, cette partie du NAS n'est pas sur-sollicité. Mes disques tournent depuis 4 ans non-stop.

Du coup, pour le logiciel WDIDLE3.EXE, est-ce que je peux l'utiliser pour lire les paramètres, sans risque pour les données ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Alors par défaut, les WD red ont un timer plus long que les autres si je ne me trompe pas. En plus, ils sont spécifiés pour supporter un nombre de LCC plus grand. Si je me souviens bien, sur les WD green, le timer est par défaut à 8s.

Oui, normalement, pas de problème pour utiliser WDIDLE3.EXE avec un disque contenant des données. Il va juste lire/écrire un paramètre de la configuration du disque.
Après, comme toujours, avant de faire des modifs dont on est pas sûr, une petite sauvegarde ne fait pas de mal... "Prudence est mère de sûreté" comme on dit... :-D
 

Paul042020

Contributor
Joined
May 4, 2020
Messages
119
Je viens de remarquer que les attributs #1, #3 et #5 sont estampillés "pre-failed" sur le retour smart du western digital red, dois-je m'inquieter ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ben.... j'avoue que je regarde pas trop la colonne TYPE! :-D
Et si je regarde pour mes disques, ils ont également "Pre-fail" pour les attributs #1, #3 et #5.... et ils se portent à merveille! :-O

En fait, de ce que j'en ai compris, la colonne TYPE est (plus ou moins) une interprétation/combinaison des colonnes VALUE et THRESH. Mais bon comme je regarde pas les colonnes VALUE et THRESH.... :tongue:
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Pour info, dans ce post, il y a un lien intéressant vers un article sur l'interprétation de certaines valeurs SMART pour les disques WD.
 
Top