> Не роняли, не пинали. Этот системник с райдом второго уровня включается раз
> в неделю, делает свои дела и выключается. Наработка то совсем маленькая. рейд второго уровня - это что?
> Что могло случиться?
> # smartctl -a /dev/sdb
> smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.12.12-300.fc26.x86_64] (local build)
> Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
> === START OF INFORMATION SECTION ===
> Model Family: Western Digital Blue Mobile
> Device Model: WDC WD10JPVX-22JC3T0
для рейд Вы взяли: WD Blue Mobile?
>[оверквотинг удален]
> Always -
> 100271
> 3 Spin_Up_Time
> 0x0027 178 175
> 021 Pre-fail Always
> - 2058
> 4 Start_Stop_Count 0x0032
> 091 091 000
> Old_age Always
> - 9449
вот
> 5 Reallocated_Sector_Ct 0x0033 191
> 191 140 Pre-fail Always
> -
> 413
появилось что-то
>[оверквотинг удален]
> 000 Old_age Always
> - 0
> 12 Power_Cycle_Count 0x0032
> 099 099 000 Old_age
> Always -
> 1774
> 191 G-Sense_Error_Rate 0x0032 093
> 093 000 Old_age
> Always -
> 7
не роняли?
> 192 Power-Off_Retract_Count 0x0032 200 200 000
> Old_age Always
> - 137
> 193 Load_Cycle_Count 0x0032
> 195 195 000 Old_age
> Always -
> 15930
и вот - 4,193 - шпиндель up/down
> 194 Temperature_Celsius 0x0022 123
> 086 000 Old_age Always
> -
> 24
> 196 Reallocated_Event_Count 0x0032 162 162 000
> Old_age Always
> - 38
появились
> 197 Current_Pending_Sector 0x0032 200 200
> 000 Old_age Always
> - 58
появились сектора с намеком на бед в будущем
>[оверквотинг удален]
> # 1 Conveyance offline Completed: read failure
> 90% 2362
> 2262201
> # 2 Conveyance offline Completed: read failure
> 90% 2362
> 2262201
> # 3 Short offline Completed:
> read failure 90%
> 2358
> 1026040
short не прошел и два offline тоже не прошли, если Вы все время
включаете и выключаете - неудивительно.
Да и зачем offline, short и long тесты прогнать, но как если шпиндель
up/down?
>[оверквотинг удален]
> 0 0 Not_testing
> 3
> 0 0 Not_testing
> 4
> 0 0 Not_testing
> 5
> 0 0 Not_testing
> Selective self-test flags (0x0):
> After scanning selected spans, do NOT read-scan remainder of disk.
> If Selective self-test is pending on power-up, resume after 0 minute delay.
Отключать apm, поможет ли или wdidle
> dmesg
> 2468.216597] sd 6:0:0:0: [sdb] Attached SCSI disk
> [ 2472.346413] sd 6:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
> [ 2472.346421] sd 6:0:0:0: [sdb] tag#0 Sense Key : Medium Error [current]
ошибка поверхности если не ошибаюсь
> [ 2472.346426] sd 6:0:0:0: [sdb] tag#0 Add. Sense: Unrecovered read error
> [ 2472.346433] sd 6:0:0:0: [sdb] tag#0 CDB: Read(10) 28 00 00 60
> 16 c5 00 00 08 00
> [ 2472.346438] blk_update_request: critical medium error, dev sdb, sector 6297285
> [ 2476.179034] sd 6:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
unrecovered - непоправимая ошибка чтения
>[оверквотинг удален]
> [ 2483.737800] sd 6:0:0:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
> [ 2483.737808] sd 6:0:0:0: [sdb] tag#0 Sense Key : Medium Error [current]
> [ 2483.737812] sd 6:0:0:0: [sdb] tag#0 Add. Sense: Unrecovered read error
> [ 2483.737819] sd 6:0:0:0: [sdb] tag#0 CDB: Read(10) 28 00 00 60
> 17 88 00 00 08 00
> [ 2483.737825] blk_update_request: critical medium error, dev sdb, sector 6297480
> [ 2483.737835] Buffer I/O error on dev sdb3, logical block 0, async
> page read
> [ 2483.737843] Buffer I/O error on dev sdb3, logical block 1, async
> page read
WD Blue, да еще mobile под RAID?!
Резюме:
- WD Blue да еще Mobile в RAID... нет слов
- smart говорит о том что роняли или были удары
- medium error скорей всего это подтверждает
- ну и spin up/down регулярно - это не для RAID
Отдайте его в notebook, там ему место, предварительно:
- отрубить apm и попробовать wdidle утилиту
- после верхнего, выполнить два-три раза dd на запись
- после чего прогнать smart test short и затем long
посмотреть результат, посмотреть значение reallocation secorts
- попробовать dd на чтение
Сделать вывод: на свалку или в нотебук