65528 Currently unreadable (pending) sectors

Status
Not open for further replies.

tom.too

Dabbler
Joined
May 12, 2015
Messages
39
Hallo,

das System zeigte mir vor ein paar Tagen folgenden kritischen Fehler an:

Device: /dev/ada0, 65528 Currently unreadable (pending) sectors

Ich baute die betroffene HD aus und lies einen Oberflächentest mit HD Tune Pro drüber laufen. Der zeigte keine Fehler an. Nachdem die HD wieder eingebaut ist, sind wieder so viele Sektoren (angeblich) unlesbar. Gibt es dafür eine logische Erklärung? Das sind ja auch nicht ganz wenige Sektoren. Nur, was soll mir das sagen, wenn FreeNAS haufenweise Fehler meldet, aber der HD-Test sagt, es sei alles in Ordnung.

Danke, tom.too

Konfig: FreeNAS-11.1-RELEASE auf 8GB USB2.0-Stick; Celeron G1820T; 8GB DDR3-RAM ECC, Supermicro X10SLL-F, 4x Seagate 3TB auf RAID-Z1
 

MrToddsFriends

Documentation Browser
Joined
Jan 12, 2015
Messages
1,338

DrKK

FreeNAS Generalissimo
Joined
Oct 15, 2013
Messages
3,630
Just for the record, Bruder:

Es gibt kein Universum, in dem 65528 pending sectors nicht schlecht ist. Sie müssen die Festplatte mit einer Wahrscheinlichkeit von 99,12% ersetzen
 

tom.too

Dabbler
Joined
May 12, 2015
Messages
39
Code:
login as: root
root@192.168.1.112's password:
Last login: Sun Jan  7 13:38:38 2018 from 192.168.1.134
FreeBSD 11.1-STABLE (FreeNAS.amd64) #0 r321665+d4625dcee3e(freenas/11.1-stable):																	  Wed Dec 13 16:33:42 UTC 2017

		FreeNAS (c) 2009-2017, The FreeNAS Development Team
		All rights reserved.
		FreeNAS is released under the modified BSD license.

		For more information, documentation, help or support, go here:
		http://freenas.org
Welcome to FreeNAS

Warning: settings changed through the CLI are not written to
the configuration database and will be reset on reboot.

root@freenas:~ # smartctl -a /dev/ada0
smartctl 6.5 2016-05-07 r4318 [FreeBSD 11.1-STABLE amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:	 Seagate Barracuda 7200.14 (AF)
Device Model:	 ST3000DM001-9YN166
Serial Number:	W1F0M1WR
LU WWN Device Id: 5 000c50 05241ca37
Firmware Version: CC4H
User Capacity:	3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:	 512 bytes logical, 4096 bytes physical
Rotation Rate:	7200 rpm
Device is:		In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:	Sun Jan  7 14:25:36 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
										was completed without error.
										Auto Offline Data Collection: Enabled.
Self-test execution status:	  (   0) The previous self-test routine completed
										without error or no self-test has ever
										been run.
Total time to complete Offline
data collection:				(  584) seconds.
Offline data collection
capabilities:					(0x7b) SMART execute Offline immediate.
										Auto Offline data collection on/off support.
										Suspend Offline collection upon new
										command.
										Offline surface scan supported.
										Self-test supported.
										Conveyance Self-test supported.
										Selective Self-test supported.
SMART capabilities:			(0x0003) Saves SMART data before entering
										power-saving mode.
										Supports SMART auto save timer.
Error logging capability:		(0x01) Error logging supported.
										General Purpose Logging supported.
Short self-test routine
recommended polling time:		(   1) minutes.
Extended self-test routine
recommended polling time:		( 328) minutes.
Conveyance self-test routine
recommended polling time:		(   2) minutes.
SCT capabilities:			  (0x3085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME		  FLAG	 VALUE WORST THRESH TYPE	  UPDATED  WHEN_																	 FAILED RAW_VALUE
  1 Raw_Read_Error_Rate	 0x000f   117   099   006	Pre-fail  Always	   -																			163302376
  3 Spin_Up_Time			0x0003   092   092   000	Pre-fail  Always	   -																			0
  4 Start_Stop_Count		0x0032   099   099   020	Old_age   Always	   -																			1624
  5 Reallocated_Sector_Ct   0x0033   100   100   036	Pre-fail  Always	   -																			0
  7 Seek_Error_Rate		 0x000f   077   060   030	Pre-fail  Always	   -																			56575176
  9 Power_On_Hours		  0x0032   088   088   000	Old_age   Always	   -																			10520
 10 Spin_Retry_Count		0x0013   100   100   097	Pre-fail  Always	   -																			0
 12 Power_Cycle_Count	   0x0032   100   100   020	Old_age   Always	   -																			720
183 Runtime_Bad_Block	   0x0032   099   099   000	Old_age   Always	   -																			1
184 End-to-End_Error		0x0032   100   100   099	Old_age   Always	   -																			0
187 Reported_Uncorrect	  0x0032   001   001   000	Old_age   Always	   -																			102
188 Command_Timeout		 0x0032   100   001   000	Old_age   Always	   -																			8 8 2866
189 High_Fly_Writes		 0x003a   100   100   000	Old_age   Always	   -																			0
190 Airflow_Temperature_Cel 0x0022   064   042   045	Old_age   Always   In_th																	 e_past 36 (0 14 39 21 0)
191 G-Sense_Error_Rate	  0x0032   100   100   000	Old_age   Always	   -																			0
192 Power-Off_Retract_Count 0x0032   100   100   000	Old_age   Always	   -																			322
193 Load_Cycle_Count		0x0032   097   097   000	Old_age   Always	   -																			6595
194 Temperature_Celsius	 0x0022   036   058   000	Old_age   Always	   -																			36 (0 15 0 0 0)
197 Current_Pending_Sector  0x0012   100   001   000	Old_age   Always	   -																			0
198 Offline_Uncorrectable   0x0010   100   001   000	Old_age   Offline	  -																			0
199 UDMA_CRC_Error_Count	0x003e   200   200   000	Old_age   Always	   -																			49
240 Head_Flying_Hours	   0x0000   100   253   000	Old_age   Offline	  -																			8956h+50m+14.067s
241 Total_LBAs_Written	  0x0000   100   253   000	Old_age   Offline	  -																			125343744499205
242 Total_LBAs_Read		 0x0000   100   253   000	Old_age   Offline	  -																			81385361635554

SMART Error Log Version: 1
ATA Error Count: 80 (device log contains only the most recent five errors)
		CR = Command Register [HEX]
		FR = Features Register [HEX]
		SC = Sector Count Register [HEX]
		SN = Sector Number Register [HEX]
		CL = Cylinder Low Register [HEX]
		CH = Cylinder High Register [HEX]
		DH = Device/Head Register [HEX]
		DC = Device Command Register [HEX]
		ER = Error register [HEX]
		ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 80 occurred at disk power-on lifetime: 10325 hours (430 days + 5 hours)
  When the command that caused the error occurred, the device was active or idle																	 .

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a0 00 40 00  Error: UNC at LBA = 0x004000a0 = 4194464

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 a0 00 40 40 00	  00:05:33.582  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:33.492  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:30.740  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:30.658  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:27.906  READ FPDMA QUEUED

Error 79 occurred at disk power-on lifetime: 10325 hours (430 days + 5 hours)
  When the command that caused the error occurred, the device was active or idle																	 .

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a0 00 40 00  Error: UNC at LBA = 0x004000a0 = 4194464

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 a0 00 40 40 00	  00:05:30.740  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:30.658  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:27.906  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:27.808  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:25.056  READ FPDMA QUEUED

Error 78 occurred at disk power-on lifetime: 10325 hours (430 days + 5 hours)
  When the command that caused the error occurred, the device was active or idle																	 .

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a0 00 40 00  Error: UNC at LBA = 0x004000a0 = 4194464

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 a0 00 40 40 00	  00:05:27.906  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:27.808  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:25.056  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:24.966  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:22.145  READ FPDMA QUEUED

Error 77 occurred at disk power-on lifetime: 10325 hours (430 days + 5 hours)
  When the command that caused the error occurred, the device was active or idle																	 .

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a0 00 40 00  Error: UNC at LBA = 0x004000a0 = 4194464

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 a0 00 40 40 00	  00:05:25.056  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00	  00:05:24.966  READ LOG EXT
  60 00 e0 a0 00 40 40 00	  00:05:22.145  READ FPDMA QUEUED
  61 00 10 ff ff ff 4f 00	  00:05:22.075  WRITE FPDMA QUEUED
  61 00 10 ff ff ff 4f 00	  00:05:22.075  WRITE FPDMA QUEUED

Error 76 occurred at disk power-on lifetime: 10325 hours (430 days + 5 hours)
  When the command that caused the error occurred, the device was active or idle																	 .

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a0 00 40 00  Error: UNC at LBA = 0x004000a0 = 4194464

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 a0 00 40 40 00	  00:05:22.145  READ FPDMA QUEUED
  61 00 10 ff ff ff 4f 00	  00:05:22.075  WRITE FPDMA QUEUED
  61 00 10 ff ff ff 4f 00	  00:05:22.075  WRITE FPDMA QUEUED
  61 00 10 90 02 40 40 00	  00:05:22.074  WRITE FPDMA QUEUED
  60 00 10 ff ff ff 4f 00	  00:05:22.074  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description	Status				  Remaining  LifeTime(hours)  LBA																	 _of_first_error
# 1  Short offline	   Completed without error	   00%	  4525		 -
# 2  Short offline	   Completed without error	   00%	  4513		 -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
	1		0		0  Not_testing
	2		0		0  Not_testing
	3		0		0  Not_testing
	4		0		0  Not_testing
	5		0		0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Das ist mir selbstverständlich klar, daß defekte Sektoren nicht gut sind. Ich verstehe nur nicht, wie FreeNAS so viele defekte Sektoren findet, aber eine spezielle HD-Testsoftware (HD Tune Pro) im Oberflächentest nicht. HD Tune Pro hat ca. 3h für diesen Test gebraucht, was m.E. nach höherer Gründlichkeit spricht, als das, was FreeNAS macht. Oder läuft neuerdings im FreeNAS ständig ein Oberflächentest mit nebenher??
 

MrToddsFriends

Documentation Browser
Joined
Jan 12, 2015
Messages
1,338
Beim smartctl-Output von Seagte Platten komme ich leider regelmäßig in's Schleudern, habe selber nur WD. Wäre gut, wenn jemand anderes drüber schaut.

Warum verwendest Du (am Desktop-Rechner) nicht die Seatools vom Hersteller der Festplatten und stattdessen HD Tune Pro (sorry, kenne ich auch nicht)?

https://www.seagate.com/de/de/support/downloads/seatools/
http://knowledge.seagate.com/articles/en_US/FAQ/203971en

In FreeNAS sollte man sehr wohl regelmäßige SMART-Tests konfigurieren (short und long). Das hast Du bisher allem Anschein nach unterlassen, zu sehen am Abschnitt "SMART Self-test log structure revision number 1" Deines smartctl-Outputs.

http://doc.freenas.org/11/tasks.html#s-m-a-r-t-tests

Sowie regelmäßige Scrubs, falls die in Deiner Konfiguration auch noch fehlen.

http://doc.freenas.org/11/storage.html#scrubs
 

mkninc

Dabbler
Joined
Jan 8, 2014
Messages
23
HD Tune Pro hat ca. 3h für diesen Test gebraucht, was m.E. nach höherer Gründlichkeit spricht...
In 3 Stunden bekommt man eine 3TB Festplatte nicht mal komplett gelesen, also ist der Test eher nicht gerade sehr gründlich.
Unabhängig davon, der Festplatte kann man nicht mehr trauen. Also Festplatte austauschen, Fertig.
 
Last edited:

MrToddsFriends

Documentation Browser
Joined
Jan 12, 2015
Messages
1,338
In 3 Stunden bekommt man eine 3TB Festplatte nicht mal komplett gelesen, also ist der Test eher nicht grade sehr gründlich.

Das ist wohl wahr. Eine Schätzung wie lange ein komplettes Lesen des Laufwerks dauern würde steht im smartctl-Output und ist dort mit 328 Minuten angegeben (etwa 5.47 Stunden). Eigentlich ist das eine Schätzwert für die Zeitdauer, die ein SMART Long Test dauern würde, aber ein solcher tut typischerweise genau das: Einmaliges komplettes Lesen des Laufwerks.
 

tom.too

Dabbler
Joined
May 12, 2015
Messages
39
Entschuldigung, daß das mit 3h für 3TB jemand auf die Goldwaage legt, habe ich nicht gedacht. Das war nur ein geschätzter Wert. Ich hab mir das noch mal angesehen, im Außenbereich scannt HD Tune PRO mit 160-170MB/s so eine Platte. Innen wird es logischerweise langsamer. Damit kommt man auf ca. 6h. Gut nun? Ob HD Tune PRO, Seatools, SMART Long Test oder mit was auch immer für einem Tool - einigen wir uns darauf, daß alle die Oberfläche komplett scannen?

Das ist ja die Frage: wie kann es kommen, daß FreeNAS def. Sektoren findet, aber ein Oberflächentest der HD am Desktop-Rechner bestätigt das nicht?

HD Tune PRO nehme ich, weil es viel mehr Informationen anzeigt und Benchmarking enthält. Aber ich kann sicherlich auch mal Seatools nehmen.
 

mrkl

Cadet
Joined
Feb 14, 2014
Messages
9
In den SMART-Werten kann ich keine Current_Pending_Sector erkennen.
Vielleicht wurde dieser Wert auch zurückgesetzt beim Testen/ Auslesen oder formatieren der HDD.

Der Load_Cycle_Count scheint mir hoch zu sein.

Wie sind die SMART-Werte der anderen HDDs?
/dev/ada0 muss nicht immer die gleiche HDD sein, vor allem wenn HDDs im laufenden Betrieb hinzugefügt werden.
Anhand der Seriennummer im Webinterface kann die HDD identifizert werden.


Gesendet von meinem SM-T580 mit Tapatalk
 

MrToddsFriends

Documentation Browser
Joined
Jan 12, 2015
Messages
1,338
Entschuldigung, daß das mit 3h für 3TB jemand auf die Goldwaage legt, habe ich nicht gedacht.

Eine schlechte Zeitabschätzung auf die Goldwaage zu legen war sicher niemandes Absicht hier, dafür dürfte den meisten Forenteilnehmern die Zeit zu schade sein. Es ging bei den drei Stunden höchstens um die Abschätzung ob irgendeiner hier nicht näher bezeichneten HD Tune PRO Version getraut werden kann.

Ich würde einer Desktop-PC Software weniger trauen als den Tools aus dem Lieferumfang von FreeNAS, selbst wenn es die neueste HD Tune PRO Version mit allen Bugfixes wäre. FreeNAS bringt alles mit, um Platten regelmäßig zeitgesteuert automatisch zu testen (SMART Tests). Sowie auch die darauf gespeicherten Daten (Scrubs).

Hauptsache Du kommst nicht in ein paar Wochen mit einem nicht importierbaren RaidZ1 Pool ohne Backup hier angeschissen. Andernfalls ist alles gut.
 
Status
Not open for further replies.
Top