Bonjour,
Ce qui est curieux, c'est que les rapports S.M.A.R.T. n'annoncent aucune erreur
Ca c'est étrange...
Comment sont connectés les disques? Sur quel type de contrôleur?
Ca peut aussi être pratique de poster le détail du matériel que tu as....
Peux-tu poster le résultat de
smartclt
(dans un terminal
smartctl -a /dev/sdb
et utilise de préférence avec les balises de code dans ton message pour que ce soit lisible)?
1 secteur offline c'est pas top quand même...
Sachant que tu es en RAIDz1, ça veut dire que tu peux supporter un disque de défaillance... Perso, ça me stresserait un peu (et dans ce cas, je préférerai être en RAIDz2 quoi!
).
Tout dépend aussi de ta stratégie de sauvegarde. Si tu n'en as pas alors là effectivement ça ajoute au stress. :-D
ce que je n'ai pas compris c'est la méthode pour corriger ce souci
Alors pour le secteur offline, y'a rien à corriger car en gros, c'est mort, tu as un secteur qui n'est plus utilisable sur ton disque et voilà. Heureusement, les disques ont généralement une provision de secteurs en rab'. Si tu souhaites conserver le disque, alors je te conseille de fortement surveiller cet attribut SMART (qu'on retrouver souvent dans le résultat de
smartctl
sous l'attribut
198 Offline_Uncorrectable
). Et si jamais il se met à augmenter alors il faudra rapidement changer le disque.
Pour certaines personnes, le fait d'avoir déjà un secteur offline est une raison suffisante pour changer de disque, cela dépend un peu de la sensibilité de chacun.
Par ailleurs, si le disque est sous garantie, alors c'est souvent un cas couvert par la garantie et il est recommandé de procéder au retour du disque.
Pour l'autre erreur (currently unreadable (pending) sector), il s'agit d'une erreur rencontrée par le disque mais qui n'est pas confirmée encore (car par exemple elle s'est produite lors d'une opération de lecture et donc difficile de savoir si le secteur est réellement endommagé ou pas). Elle sera confirmée (ou non) lorsque le secteur en question sera écrit. Mais il se peut que cela ne se produise jamais...
On peut alors éventuellement forcer une écriture sur ce secteur (soit avec
badblocks
en mode destructif sur tout le disque et c'est peut-être un peu radical soit avec d'autres commandes où on va venir écrire sur ce secteur en particulier mais c'est un peu plus complexe) pour confirmer ou pas le problème.
De manière générale, tout va dépendre de la criticité des données sur le disque. C'est surtout ça qui va motiver le remplacement éventuel du disque dès ces premiers symptômes ou pas.
Donc pas nécessairement surprenant que ZFS ne te donne aucune erreur.
Pour le secteur défectueux, il est bien identifié par le disque donc ce secteur ne sera jamais proposé à ZFS.
Pour le secteur en attente de confirmation, si ça se trouve encore aucune donnée n'a été écrite à cet endroit. Après si ZFS venait à écrire sur ce secteur et qu'il s'avère être effectivement défectueux, alors il pourrait y avoir une erreur de checksum dans ZFS (notamment dans le résultat de
zfs status
dans le volume en question).
Quelqu'un peut-il m'expliquer la démarche à suivre pour ne plus avoir ce message d'erreur ?
Je crois qu'on peut supprimer le message dans les notifications de l'interface web.... mais je suis pas sûr.
Toutefois c'est p'tet pas forcément une bonne chose de ne plus avoir le message... car c'est pas quelque chose que tu ne veux plus voir car, au contraire, tu veux pouvoir le surveiller pour t'assurer que ça n'augmente pas.
Est-ce dangereux pour ma pool ?
Oui et non... mais globalement non si tu as une redondance.
Non, si tu n'as pas encore de données sur ce secteur, alors aucun problème.
Oui, si jamais tu as des données et que ces dernières sont illisibles... Mais si tu as un volume en RAIDz1 ou 2 alors pas de problème.
Par contre, là ou ça peut aussi potentiellement devenir dangereux c'est si ce nombre augmente... Donc là encore, au niveau de ton volume de données, si tu as une redondance, pas de problème. Mais à terme ton disque deviendra inutilisable.
C'est justement aussi l'intérêt de TrueNAS (ou des système RAID) d'assurer une redondance en cas de défaillance afin qu'il n'y ait pas d'impact su les données stockées.