URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 97828
[ Назад ]

Исходное сообщение
"Сообщения от smartd"

Отправлено Кровосток , 21-Фев-22 12:28 
Добрый день Товарищи!

Помогите продиагностировать, есть файловая хранилка. Находится в холодном ДЦ, где t=18C стабильно.
Корпус продувается, сегодня съезжу ещё пальцем потрогаю сами диски, но пока опишу по ним вопрос:

Работающий на этом серваке smartd выдаёт в логи постоянно по всем дискам такие сообщения


/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 59 to 60
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 194 Temperature_Celsius changed from 41 to 40
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 59
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 41
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 59
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 41
/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 56 to 57
/var/log/daemon.log.2.bz2:Dec 28 02:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 194 Temperature_Celsius changed from 44 to 43
/var/log/daemon.log.2.bz2:Dec 28 02:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 60 to 61
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 194 Temperature_Celsius changed from 40 to 39
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 60 to 61
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 194 Temperature_Celsius changed from 40 to 39
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 59 to 60
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 194 Temperature_Celsius changed from 41 to 40
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 59 to 60
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 194 Temperature_Celsius changed from 41 to 40
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 69 to 70
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 57 to 58
/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 194 Temperature_Celsius changed from 43 to 42
/var/log/daemon.log.2.bz2:Dec 28 03:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada1, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada2, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada3, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 70 to 69
/var/log/daemon.log.2.bz2:Dec 28 03:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 03:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 69 to 70
/var/log/daemon.log.2.bz2:Dec 28 03:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 59
/var/log/daemon.log.2.bz2:Dec 28 03:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada5, SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 41
/var/log/daemon.log.2.bz2:Dec 28 04:13:03 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada4, SMART Usage Attribute: 194 Temperature_Celsius changed from 70 to 69
/var/log/daemon.log.2.bz2:Dec 28 04:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 83 to 72

При этом zpool status говорит с пулами всё в порядке, в messages никаких сообщений об ошибках чтения/записи нет. t процессора = 33C.  Помогите интерпретировать эту информацию, это вообще нормально?

Содержание

Сообщения в этом обсуждении
"Сообщения от smartd"
Отправлено lavr , 21-Фев-22 18:00 
> Добрый день Товарищи!
> Помогите продиагностировать, есть файловая хранилка. Находится в холодном ДЦ, где t=18C
> стабильно.
> Корпус продувается, сегодня съезжу ещё пальцем потрогаю сами диски, но пока опишу
> по ним вопрос:

...
> Работающий на этом серваке smartd выдаёт в логи постоянно по всем дискам
> такие сообщения

...
> При этом zpool status говорит с пулами всё в порядке, в messages
> никаких сообщений об ошибках чтения/записи нет. t процессора = 33C.  
> Помогите интерпретировать эту информацию, это вообще нормально?

а что, yandex/google у Вас забанили? Найти и почитать SMART?

сгруппировал для ada0:

/var/log/daemon.log.2.bz2:Dec 28 02:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 12 to 10
произошла аппаратная корреция ошибок ECC

/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 60 to 61
повысилась температура...

/var/log/daemon.log.2.bz2:Dec 28 02:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 194 Temperature_Celsius changed from 40 to 39
понизилась температура и далее см логи ниже:
изменилось значение 195'ого параметра, уменьшилось, равно как и Raw_Read_Error_Rate changed, который кстати уже Prefailure

/var/log/daemon.log.2.bz2:Dec 28 03:13:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 10 to 9
/var/log/daemon.log.2.bz2:Dec 28 04:43:02 <daemon.info> BSD-BACKUP smartd[37055]: Device: /dev/ada0, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 83 to 72

диски в корпусе у вас греются однако, возможно проблема с вентиляторами в корпусе


"Сообщения от smartd"
Отправлено universite , 22-Фев-22 03:03 
>[оверквотинг удален]
>> Корпус продувается, сегодня съезжу ещё пальцем потрогаю сами диски, но пока опишу
>> по ним вопрос:
> ...
>> Работающий на этом серваке smartd выдаёт в логи постоянно по всем дискам
>> такие сообщения
> ...
>> При этом zpool status говорит с пулами всё в порядке, в messages
>> никаких сообщений об ошибках чтения/записи нет. t процессора = 33C.
>> Помогите интерпретировать эту информацию, это вообще нормально?
> а что, yandex/google у Вас забанили? Найти и почитать SMART?

Лучше подскажите ему настройки настройки smartd, чтоб отфильтровывать малоинформативные сообщения :)


"Сообщения от smartd"
Отправлено Кровосток , 22-Фев-22 11:23 
> Лучше подскажите ему настройки настройки smartd, чтоб отфильтровывать малоинформативные
> сообщения :)

Мужики, чё вы сразу огрызаетесь :) Как нелюди прямо :)

Всё разобрался я, эти значения - это нерпиведённые значения, которые не являются теми самыми цельсиями. Это во-первых, во-вторых они не ниже пороговых значений после которых имеет смысл бить тревогу, и в-третьих

Hardware_ECC_Recovered changed from ....

это несмотря на всю грозность формулировок ECC.. recovered... - конкретно для Seagate'ов не имеет практического смысла. Типа просто лог повседневной работы контроллера любого жёсткого диска.

А вы сразу забанили... гугол.. яндекс...