Добрый день Товарищи!Помогите продиагностировать, есть файловая хранилка. Находится в холодном ДЦ, где t=18C стабильно.
Корпус продувается, сегодня съезжу ещё пальцем потрогаю сами диски, но пока опишу по ним вопрос:Работающий на этом серваке smartd выдаёт в логи постоянно по всем дискам такие сообщения
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 59 to 60
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 194 Temperature_Celsius changed from 41 to 40
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 59
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 41
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 59
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 41
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 56 to 57
/var/log/daemon.log.2.bz2:Dec 28 02:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 194 Temperature_Celsius changed from 44 to 43
/var/log/daemon.log.2.bz2:Dec 28 02:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 60 to 61
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 194 Temperature_Celsius changed from 40 to 39
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 60 to 61
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 194 Temperature_Celsius changed from 40 to 39
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 59 to 60
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 194 Temperature_Celsius changed from 41 to 40
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 59 to 60
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 194 Temperature_Celsius changed from 41 to 40
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 69 to 70
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 57 to 58
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 194 Temperature_Celsius changed from 43 to 42
/var/log/daemon.log.2.bz2:Dec 28 03:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 70 to 69
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 69 to 70
/var/log/daemon.log.2.bz2:Dec 28 03:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 59
/var/log/daemon.log.2.bz2:Dec 28 03:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 41
/var/log/daemon.log.2.bz2:Dec 28 04:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 70 to 69
/var/log/daemon.log.2.bz2:Dec 28 04:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 83 to 72
При этом zpool status говорит с пулами всё в порядке, в messages никаких сообщений об ошибках чтения/записи нет. t процессора = 33C. Помогите интерпретировать эту информацию, это вообще нормально?
> Добрый день Товарищи!
> Помогите продиагностировать, есть файловая хранилка. Находится в холодном ДЦ, где t=18C
> стабильно.
> Корпус продувается, сегодня съезжу ещё пальцем потрогаю сами диски, но пока опишу
> по ним вопрос:...
> Работающий на этом серваке smartd выдаёт в логи постоянно по всем дискам
> такие сообщения...
> При этом zpool status говорит с пулами всё в порядке, в messages
> никаких сообщений об ошибках чтения/записи нет. t процессора = 33C.
> Помогите интерпретировать эту информацию, это вообще нормально?а что, yandex/google у Вас забанили? Найти и почитать SMART?
сгруппировал для ada0:
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
произошла аппаратная корреция ошибок ECC/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 60 to 61
повысилась температура.../var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 194 Temperature_Celsius changed from 40 to 39
понизилась температура и далее см логи ниже:
изменилось значение 195'ого параметра, уменьшилось, равно как и Raw_Read_Error_Rate changed, который кстати уже Prefailure/var/log/daemon.log.2.bz2:Dec 28 03:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 04:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 83 to 72диски в корпусе у вас греются однако, возможно проблема с вентиляторами в корпусе
>[оверквотинг удален]
>> Корпус продувается, сегодня съезжу ещё пальцем потрогаю сами диски, но пока опишу
>> по ним вопрос:
> ...
>> Работающий на этом серваке smartd выдаёт в логи постоянно по всем дискам
>> такие сообщения
> ...
>> При этом zpool status говорит с пулами всё в порядке, в messages
>> никаких сообщений об ошибках чтения/записи нет. t процессора = 33C.
>> Помогите интерпретировать эту информацию, это вообще нормально?
> а что, yandex/google у Вас забанили? Найти и почитать SMART?Лучше подскажите ему настройки настройки smartd, чтоб отфильтровывать малоинформативные сообщения :)
> Лучше подскажите ему настройки настройки smartd, чтоб отфильтровывать малоинформативные
> сообщения :)Мужики, чё вы сразу огрызаетесь :) Как нелюди прямо :)
Всё разобрался я, эти значения - это нерпиведённые значения, которые не являются теми самыми цельсиями. Это во-первых, во-вторых они не ниже пороговых значений после которых имеет смысл бить тревогу, и в-третьих
Hardware_ECC_Recovered changed from ....
это несмотря на всю грозность формулировок ECC.. recovered... - конкретно для Seagate'ов не имеет практического смысла. Типа просто лог повседневной работы контроллера любого жёсткого диска.А вы сразу забанили... гугол.. яндекс...