<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Раздел полезных советов: Мониторинг аппаратных проблем в&amp;nbsp;&amp;nbsp;x8...</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html</link>
    <description>Для мониторинга аппаратных проблем в 64-разрядных сборках Linux удобно использовать пакет mcelog,&lt;br&gt;анализирующий MCE (Machine Check Exception) состояние в CPU AMD и Intel, которое может указать на &lt;br&gt;проблемы с памятью и с кэшем CPU, ошибки обмена данными между CPU и чипсетом материнской платы.&lt;br&gt;&lt;br&gt;В RHEL / CentOS / Fedora Linux ставим нужный пакет (работает только с 64-разрядной сборкой ядра):&lt;br&gt;&lt;br&gt;   # yum install mcelog&lt;br&gt;&lt;br&gt;В Debian / Ubuntu :&lt;br&gt;&lt;br&gt;   # apt-get install mcelog&lt;br&gt;&lt;br&gt;&lt;br&gt;Прописываем запуск mcelog в crontab для пользователя root:&lt;br&gt;&lt;br&gt;   */5 * * * *   /usr/sbin/mcelog --ignorenodev --filter &amp;gt;&amp;gt; /var/log/mcelog&lt;br&gt;&lt;br&gt;Проверяем лог:&lt;br&gt;&lt;br&gt;   # tail -f /var/log/mcelog&lt;br&gt;   # grep -i &quot;hardware error&quot; /var/log/mcelog&lt;br&gt;   # grep -c &quot;hardware error&quot; /var/log/mcelog&lt;br&gt;&lt;br&gt;Для автоматической отправки предупреждения в случае проблем в вызов из crontab нужно добавить:&lt;br&gt;&lt;br&gt;    &#091; $(grep -c &quot;hardware error&quot; /var/log/mcelog) -gt 0 &#093; &amp;&amp; echo    &quot;Hardware Error Found $(hostname) &#064; $(date)&quot; &#092; &lt;br&gt;    &amp;#124; mail -s &apos;H/w Error&apos; pager&#064;exam</description>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (pavlinux)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#9</link>
    <pubDate>Wed, 10 Jun 2009 18:51:37 GMT</pubDate>
    <description>&amp;gt;не память не трогал, работает на заявленной частоте 1066 &lt;br&gt;&amp;gt;а CPU c 2.66 -&amp;gt; 3.33&lt;br&gt;&lt;br&gt;Дык это ж на 25&#037; от номинала.... сдохнет до играешься... не более 12&#037; &lt;br&gt;</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (i)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#8</link>
    <pubDate>Wed, 10 Jun 2009 11:34:47 GMT</pubDate>
    <description>не память не трогал, работает на заявленной частоте 1066 &lt;br&gt;а CPU c 2.66 -&amp;gt; 3.33&lt;br&gt;</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (pavlinux)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#7</link>
    <pubDate>Wed, 10 Jun 2009 10:39:52 GMT</pubDate>
    <description>&amp;gt;у меня при высокой загрузке CPU линукс паникует &lt;br&gt;&amp;gt;CPU context corrupt что то там... отключил пока MCE добавив nomce при &lt;br&gt;&amp;gt;загрузке. Пока все ок. &lt;br&gt;&amp;gt;Разгон проца может влиять ? &lt;br&gt;&lt;br&gt;Может, может... &lt;br&gt;Память тоже разогнал? &lt;br&gt;&lt;br&gt;&lt;br&gt;Вот тут утиль, http://www.codemonkey.org.uk/cruft/parsemce.c&lt;br&gt;Парсит на человеческий язык логи МСЕ &lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (i)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#6</link>
    <pubDate>Wed, 10 Jun 2009 08:16:02 GMT</pubDate>
    <description>у меня при высокой загрузке CPU линукс паникует&lt;br&gt;CPU context corrupt что то там... отключил пока MCE добавив nomce при загрузке. Пока все ок.&lt;br&gt;Разгон проца может влиять ? &lt;br&gt;PS перегрева точно нет.&lt;br&gt;</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (pavlinux)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#4</link>
    <pubDate>Sat, 06 Jun 2009 15:16:45 GMT</pubDate>
    <description>Ну и от себя, если у Вас появляются ошибки, которые выдаёт MCE, &lt;br&gt;надо срочно задуматься о выявлении причины и замене сбойного железа&lt;br&gt;или фирмвари, если железо прошиваемое.&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (prapor)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#3</link>
    <pubDate>Sat, 06 Jun 2009 08:18:51 GMT</pubDate>
    <description>Спасибо, занятное HOWTO :)&lt;br&gt;</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (pavlinux)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#2</link>
    <pubDate>Fri, 05 Jun 2009 21:42:36 GMT</pubDate>
    <description>А так же, &lt;br&gt;&lt;br&gt;Каждый логический процессор в системе, имеет директорию &lt;br&gt;&lt;br&gt;/sys/devices/system/machinecheck/machinecheckN&lt;br&gt;(где N - номер процессора)&lt;br&gt;&lt;br&gt;Эти директории содержат файлы для динамической конфигурации, а именно:&lt;br&gt;&lt;br&gt;* bankNctl&lt;br&gt;&lt;br&gt;Содержит 64-х битную маску, включающая или отключающая определенные сообщения, &lt;br&gt;об исключениях, для текущего ЦПУ. Если все биты маски равны нулю, тогда никакие&lt;br&gt;сообщения не выдаются.&lt;br&gt;&lt;br&gt;Остальные файлы конфигурации, хотя и находятся в каждой папке sysfs, но изменения &lt;br&gt;в любом из них влияют на все процессоры. (думается тяжело было бы реализовывать &lt;br&gt;различные степени толерантности для разных ядер на одном CPU) &lt;br&gt;&lt;br&gt;* check_interval &lt;br&gt;&lt;br&gt;Интервал опроса процессора, в минутах, по умолчанию 5 минут.&lt;br&gt;&lt;br&gt;* tolerant &lt;br&gt;Уровни толерантности:&lt;br&gt;&lt;br&gt;0: Всегда генерировать panic на неисправимых ошибках или записывать в лог исправленные.&lt;br&gt;1: Генерировать panic или ошибку шины (SIGBUS) на неисправимых ошибках или записывать &lt;br&gt;    в лог исправленные.&lt;br&gt;2: Генерировать ошибку шины (SIGBUS) на</description>
</item>

<item>
    <title>Мониторинг аппаратных проблем в  x86_64 сборке Linux (pavlinux)</title>
    <link>https://opennet.dev/openforum/vsluhforumID3/55483.html#1</link>
    <pubDate>Fri, 05 Jun 2009 20:53:19 GMT</pubDate>
    <description>Угу, только не забыть указать ядру при загрузке, &lt;br&gt;&lt;br&gt;mce=3 &lt;br&gt;&lt;br&gt;Дабы всё узнать о своём железе&lt;br&gt;&lt;br&gt;А для для AMD ещё и &lt;br&gt;&lt;br&gt;mce=bootlog   &lt;br&gt;&lt;br&gt;так как для амд их (эксепшоны) отключают при загрузке&lt;br&gt;&lt;br&gt;&lt;br&gt;И чё самое интересное, MCE появилось на Pentium PRO, Pentium II и AMD K6..., и это совсем не фишка x86_64 &lt;br&gt;&lt;br&gt;</description>
</item>

</channel>
</rss>
