1.1, Misery (?), 01:43, 07/10/2010 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Несколько лет уже использую Munin (серверов порядка 10-12), есть ли кто-нибудь, который знаком и с сабжем и с мунином? Если да, стоит ли тратить время и перебраться на сабж и за какими выгодами?
| |
|
2.2, Fcuku (ok), 03:35, 07/10/2010 [^] [^^] [^^^] [ответить]
| +6 +/– |
> Если да, стоит ли
Слушай анекдот и запоминай его:
Админ, приклеившись носом к монитору.
Сынишка 5-ти лет.
-- Папа, папа! А почему солнышко утром восходит, а вечером заходит?
-- Ты уверен?
-- Да!
-- Ничего не трогай!!!
| |
|
3.3, XoRe (ok), 04:03, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
>> Если да, стоит ли
> Слушай анекдот и запоминай его:
> Админ, приклеившись носом к монитору.
> Сынишка 5-ти лет.
> -- Папа, папа! А почему солнышко утром восходит, а вечером заходит?
> -- Ты уверен?
> -- Да!
> -- Ничего не трогай!!!
+1
Менять стоит только в том случае, если существующая система вас не устраивает.
А если просто хочется новых ощущений...
# echo "oh yea" > /etc/password
И бегом в серверную =)
| |
|
4.5, Аноним (-), 04:53, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
как-то вы мимо кассы нынче. нагиос (исинга) и мунин совершенно разные продукты, если нужно мониторить сервера постоянно, а не время от времени графики смотреть, и узнавать от юзеров, что у тебя уже как час лежит какой-нить сервис, то нагиос очень даже. и совсем другой компот, что с помощью pnp, в нагиосе, можно тоже графики рисовать.
| |
|
5.48, XoRe (ok), 16:47, 09/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> как-то вы мимо кассы нынче. нагиос (исинга) и мунин совершенно разные продукты,
> если нужно мониторить сервера постоянно, а не время от времени графики
> смотреть, и узнавать от юзеров, что у тебя уже как час
> лежит какой-нить сервис, то нагиос очень даже. и совсем другой компот,
> что с помощью pnp, в нагиосе, можно тоже графики рисовать.
Я в кассу.
У человека уже есть настроенная и рабочая среда.
Т.е. у него есть потребности, которые эта среда удовлетворяет.
И переходить на новую, которая как вы описали - совершенно разный продукт, нужно только в том случае, если текущая среда не удовлетворяет потребностям.
| |
|
|
5.29, zazik (ok), 12:07, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> # echo "oh yea" > /dev/hda1
Ну и что там такого невосстановимого в первых шести байтах раздела?
| |
5.49, XoRe (ok), 16:48, 09/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> # echo "oh yea" > /dev/hda1
От этого ваш сервер продолжить работу.
И можно даже удаленно починить.
А если вы похерите /etc/passwd, могут перестать запускаться многие процессы.
И вы тупо уже не зайдете по ssh.
| |
|
4.28, zazik (ok), 12:05, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
А потом pwd_mkdb -p /etc/master.passwd
Учитесь отращивать админское брюхо, молодой человек.
| |
|
5.43, Денис Юсупов (?), 14:06, 08/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
И даже после этого ничего не произойдёт. :) А всё потому что исходный файл будет в левом виде.
man pwd_mkdb:
===
The file must be in the correct format (see
passwd(5)).
===
Я даже это дело опробовал сейчас. Как и ожидалось, защита от дурака работает :)
| |
|
6.44, zazik (ok), 14:11, 08/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> И даже после этого ничего не произойдёт. :) А всё потому что
> исходный файл будет в левом виде.
> man pwd_mkdb:
> ===
> The file must be in the correct format (see
> passwd(5)).
> ===
> Я даже это дело опробовал сейчас. Как и ожидалось, защита от дурака
> работает :)
После этого и не должно ничего страшного произойти. Учитесь читать маны и понимать смысл сказанного.
| |
|
7.58, Денис Юсупов (?), 00:12, 21/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
>[оверквотинг удален]
>> исходный файл будет в левом виде.
>> man pwd_mkdb:
>> ===
>> The file must be in the correct format (see
>> passwd(5)).
>> ===
>> Я даже это дело опробовал сейчас. Как и ожидалось, защита от дурака
>> работает :)
> После этого и не должно ничего страшного произойти. Учитесь читать маны и
> понимать смысл сказанного.
Учитесь читать сообщения и понимать смысл написанного: своим ответом вы подтвердили то, что я и написал. И смысл?
| |
|
|
5.50, XoRe (ok), 16:56, 09/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> А потом pwd_mkdb -p /etc/master.passwd
> Учитесь отращивать админское брюхо, молодой человек.
Це только на фряхе.
А, помнится, на линуксе затирание /etc/passwd приводило к очень веселым последствиям.
P.S.
Админское брюхо - это не интересно.
А вот очень удаленное выполнение команды:
"ee /etc/ipfw.conf ; kldload ipfw ; ipfw -f /etc/ipfw.conf; sysctl net.inet.ip.fw.enable=1"
куда интереснее.
Развивает наблюдательность и крепость нервов =)
| |
|
6.51, zazik (ok), 17:20, 09/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> Це только на фряхе.
> А, помнится, на линуксе затирание /etc/passwd приводило к очень веселым последствиям.
В линуксе же shadow.passwd(или как-то так) есть, не?
> P.S.
> Админское брюхо - это не интересно.
> А вот очень удаленное выполнение команды:
> "ee /etc/ipfw.conf ; kldload ipfw ; ipfw -f /etc/ipfw.conf; sysctl net.inet.ip.fw.enable=1"
> куда интереснее.
> Развивает наблюдательность и крепость нервов =)
А тут в чём проблема? Первым правилом что-нибудь вроде "allow tcp from any to my_host ssh_port keep state"(синтаксис ipfw подзабыл уже) и никаких проблем.
| |
|
7.52, XoRe (ok), 03:43, 10/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
>> Це только на фряхе.
>> А, помнится, на линуксе затирание /etc/passwd приводило к очень веселым последствиям.
> В линуксе же shadow.passwd(или как-то так) есть, не?
Неа.
Только /etc/shadow, но это аналог master.passwd.
А данные о юзерах берутся из /etc/passwd.
Теперь вникаете в суть прикола?)
>> P.S.
>> Админское брюхо - это не интересно.
>> А вот очень удаленное выполнение команды:
>> "ee /etc/ipfw.conf ; kldload ipfw ; ipfw -f /etc/ipfw.conf; sysctl net.inet.ip.fw.enable=1"
>> куда интереснее.
>> Развивает наблюдательность и крепость нервов =)
> А тут в чём проблема? Первым правилом что-нибудь вроде "allow tcp from
> any to my_host ssh_port keep state"(синтаксис ipfw подзабыл уже) и никаких
> проблем.
Тогда надо 2 правило, from any to me и from me to any.
А суть в том, что в указанной команде применение правил фаерволла начинается сразу же после выхода из редактора.
Так что надо быть очень внимательным)
| |
|
8.54, zazik (ok), 19:28, 10/10/2010 [^] [^^] [^^^] [ответить] | +/– | Да что вы говорите А как же файлы два с расширением db Или в линуксе и этог... текст свёрнут, показать | |
|
|
|
|
|
|
2.4, Gular (ok), 04:25, 07/10/2010 [^] [^^] [^^^] [ответить]
| +1 +/– |
ну, мунин - это не альтернатива нагиосу и исинга. последние два - это алертилки. мунин строит графики.
| |
2.34, ьтл (?), 12:56, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
я бы советовал связку, мониторинг работы, моргания и т.д. - нагиос, графики - мунин.
| |
|
|
2.8, Stanislavvv (?), 07:50, 07/10/2010 [^] [^^] [^^^] [ответить]
| –1 +/– |
> zabbix не?
Заббикс при всех его достоинствах - слишком много кушать для мониторинга. То есть, того компа, что выделили для этого, элементарно не хватило на ~40 серверов (2xP4 2.4GHz/512Mb).
С нагиосом - загрузка минимальна.
| |
|
3.9, daevy (ok), 08:27, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
потому что по дефолту, система сохраняет все значения опрашиваемых параметров, для постройки графиков. если эту байду выключить (т.е. стать обыкновенной опрашивалкой), то нагрузка на sql уменьшится до нужд хранения только конфигурационных данных.
p.s. спецы нагиоса объясните мне такое поведение плагина check_snmp_storage
http://s43.radikal.ru/i100/1010/ef/675b40bb850e.png
я вот никак не в восторге от этого)))) что мне теперь подгонять теперь в шаблонах везде "-R" и вручную подставлять процент под каждую файловую систему?
| |
|
4.11, padvo (??), 08:55, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> p.s. спецы нагиоса объясните мне такое поведение плагина check_snmp_storage
Не то чтобы я был "спецом нагиоса", но я бы начал с nagios -v <конфиг нагиоса>. Если где-то есть ошибка - данные не обновляются.
| |
|
5.13, daevy (ok), 09:21, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
не видимо я плохо объяснил, данные снимаются как надо, nagios -v отрабатывает на отлично. покажу следующую картину,
картина на узле
prol ~ # df -h /
Filesystem Size Used Avail Use% Mounted on
/dev/md0 9.2G 7.9G 932M 90% /
prol ~ # df /
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/md0 9621816 8179384 953660 90% /
картина на мониторинге
kvm520-sm nagios # check_snmp_storage -H prol -C gJilIogg -w 90% -c 95% -m / -r
OK : /: 85%used(7988MB/9396MB) : < 90 % | /=7987MB;8456;8926;0;9396
kvm520-sm nagios # check_snmp_storage -H prol -C gJilIogg -R 6% -w 90% -c 95% -m / -r
WARNING : /: 90%used(7988MB/8833MB) : > 90 % | /=7987MB;7949;8390;0;8832
-R 6% это чтобы подогнаться к ext3, для reiserfs - 5% , и этот -R нужно обязательно вводить чтобы получить значения которые соответствуют действительности, иначе получим немного обрезанные данные (без каких-то зарезервированных блоков для рута)
имхо это лишняя фича, и вводит в заблуждение новичков, когда они видят расхождение в значениях)))
и сейчас осваиваю нагиос, наталкиваюсь на такие фокусы почти через раз:)
| |
|
6.25, oops (ok), 10:46, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
эээм, а агента на хост поставить и check_disk юзать никак?
| |
|
7.30, daevy (ok), 12:09, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
к сожалению нельзя, нужно использовать только snmp, т.к. дефицит ресурсов.
| |
|
8.38, oops (ok), 16:54, 07/10/2010 [^] [^^] [^^^] [ответить] | +1 +/– | хохох, это вы при дифиците запускаете на наблюдаемой машине snmpd ... текст свёрнут, показать | |
|
9.41, daevy (ok), 09:15, 08/10/2010 [^] [^^] [^^^] [ответить] | +/– | подскажите мне другие варианты, будет интересно выслушать вообще по моим наблю... текст свёрнут, показать | |
|
10.55, oops (ok), 10:56, 11/10/2010 [^] [^^] [^^^] [ответить] | +/– | аргумент использования snmpd какой-то не очень На сетевый девайсах - понятно, н... текст свёрнут, показать | |
|
|
|
|
6.39, FM (??), 18:12, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
как-то математика не сходится:
(7.9G / 9.2G) * 100% = 85%\
и даже
(8179384 / 9621816) * 100% = 85%
ну никак не 90% %)
так что Nagios тут непричем.
| |
|
7.42, daevy (ok), 09:32, 08/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> как-то математика не сходится:
> (7.9G / 9.2G) * 100% = 85%\
> и даже
> (8179384 / 9621816) * 100% = 85%
> ну никак не 90% %)
> так что Nagios тут непричем.
погуглив узнал что есть такая штука как reserved block ? как оказалось, просто плугин не считает эти зарезервированые блоки, а df - считает. получается расхождение)))
так что вроде и причем, и не причем... просто имхо, подсчет блоков должен быть включен по умолчанию. опять же как я уже писало, разные фс при форматировании по разному определяют процент резервирования.
в ext3 это -m reserved-blocks-percentage ... The default percentage is 5%.
| |
|
|
5.15, daevy (ok), 09:34, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
вот еще один момент, плугин check_snmp , запрашивает значение OID и выдает warn или crit если полученное значение !БОЛЬШЕ! (и только "больше") образца.
Вот, а мне к примеру надо отслеживать uptime и мне надо получать warn когда значение меньше.
check_snmp -H odion -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 43200
SNMP WARNING - *292528060* | iso.3.6.1.2.1.1.3.0=292528060
как мне указать, что варнинг должен вылазить, только когда полученное значение меньше задаваемого образца?
условий вобщем нехватает мне, или я еще ненашел:)
| |
|
6.23, padvo (??), 10:35, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> check_snmp -H odion -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 43200
Если склероз мне не изменяет, там есть еще параметр "-с", для critical, указываете значение для срабатывания, которое вам надо для critical
| |
|
7.31, daevy (ok), 12:15, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> Если склероз мне не изменяет, там есть еще параметр "-с", для critical,
> указываете значение для срабатывания, которое вам надо для critical
нет не изменяет, "-с" конечно желательно указывать во всех проверках как второй порог, который говорит что настал совсем ахтунг... но деле не в этом, в моем случае это не решит, проблемы. вот смотрите:
аптайм машины - 80 дней. мне нужен одиночный алерт если вдруг аптайм окажется меньше 1 часа. и всё. я поставлю -w 3600 -с 1800, но это бессмысленно, плугин будет возвращать warn когда аптайм будет больше 3600 и crit когда больше 1800 но меньше 3600. вот как мне сделать чтоб warn был только когда значение меньше 3600 ?
| |
|
6.26, oops (ok), 10:50, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> вот еще один момент, плугин check_snmp , запрашивает значение OID и выдает
> warn или crit если полученное значение !БОЛЬШЕ! (и только "больше") образца.
> Вот, а мне к примеру надо отслеживать uptime и мне надо получать
> warn когда значение меньше.
> check_snmp -H odion -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 43200
> SNMP WARNING - *292528060* | iso.3.6.1.2.1.1.3.0=292528060
> как мне указать, что варнинг должен вылазить, только когда полученное значение меньше
> задаваемого образца?
> условий вобщем нехватает мне, или я еще ненашел:)
товарищ! ну запусти ты check_snmp --help и воткни в пороги типа -w 1:10 и сразу придумаешь как тебе выполнить твою задачу
| |
|
7.32, daevy (ok), 12:19, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
> товарищ! ну запусти ты check_snmp --help и воткни в пороги типа -w
> 1:10 и сразу придумаешь как тебе выполнить твою задачу
пробовал не работает((((
# check_snmp -H torre -C gJilIogg -o 1.3.6.1.2.1.1.3.0 -w 0:3600
SNMP WARNING - *232208713* | iso.3.6.1.2.1.1.3.0=232208713
это как какая-то идиотская аксиома, аптайм выходит за диапазон, => warning.
| |
|
8.35, Gular (ok), 13:28, 07/10/2010 [^] [^^] [^^^] [ответить] | +/– | если решения не удается найти действительно, то как крайний вариант - плагины мо... текст свёрнут, показать | |
8.57, oops (ok), 11:44, 11/10/2010 [^] [^^] [^^^] [ответить] | +/– | а если подумать и попробовать что-то типа check_snmp -H torre -C gJilIogg -o 1 ... текст свёрнут, показать | |
|
9.59, Серега (?), 23:52, 14/11/2010 [^] [^^] [^^^] [ответить] | +/– | ----------------- Да, двоеточие надо, а еще интервал можно указать -w 3600 4000 ... текст свёрнут, показать | |
|
|
|
|
|
|
|
2.10, padvo (??), 08:36, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
На одном из моих прежних мест работы (крупный хостер, более 1000 серверов в нескольких ДЦ + N-ное количество цисок), ходили легенды про то, как заббикс подавился такими объемами. Дело было до моего там появления, поэтому подробностей не знаю. Собственноручно поднимал там систему мониторинга на нагиосе (5 серверов мониторили хозяйство, шестой собирал и отображал сводные данные и мониторил остальные нагиосы) - этого вполне хватало, LA выше 7-8 не взлетал, и тормозов не наблюдалось. 2-ядерный Xeon, 4G RAM, nagios, apache2, FreeBSD. Может, заббикс был неудачно приготовлен, но нагиос и до сих пор там живет и пасется.
| |
|
3.12, Nerian (?), 09:12, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
А каким образом это было сделано? Чтобы 5 серверов мониторили, а 1 собирал?
Единственное что приходит в голову это то что этот единственный сервер запускал на той стороне npre плагины... Или как это сделать в nagios?
| |
|
4.14, daevy (ok), 09:25, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
да интересно послушать про реализацию.. в заббиксе это делается на раз-два через заббикс-прокси, наверняка такие же плюшки есть и в нагиосе
| |
|
5.18, nagioser (?), 10:10, 07/10/2010 [^] [^^] [^^^] [ответить]
| +1 +/– |
Отвечу за него. В нагиосе есть несколько механизмов, nrpe самый плохой из них, т.к. приходится на каждую проверку запускать новый процесс. Есть merlin (советую посмотреть http://www.op5.org/op5media/op5.org/downloads/merlin-scenarios.pdf ) и есть Distributed Nagios Executor ( http://dnx.sourceforge.net/ ). Это NEB модули, которые работают в адресном пространстве нагиоса, поэтому у них нет дополнительных расходдов как в случае nrpe.
Вообще очень странно, что на 1000 хостов автор использует несколько машин. У нас тоже более 1000 хостов, и справляются 2 виртуальных контейнера, один под сам нагиос, второй под базу для хранения всех результатов проверок.
| |
|
6.20, padvo (??), 10:22, 07/10/2010 [^] [^^] [^^^] [ответить]
| +1 +/– |
> Вообще очень странно, что на 1000 хостов автор использует несколько машин.
На каждом из этих хостов мониторилось весьма большое количество сервисов. Согласен, это некоторая избыточность, но очень не хотелось лишиться мониторинга, либо его актуальности - это больше политическое, чем техническое решение. А в подходящем железе недостатка не было. И конфигурилось оно централизованно (svn+puppet).
| |
|
|
4.19, padvo (??), 10:14, 07/10/2010 [^] [^^] [^^^] [ответить]
| +2 +/– |
Плюшка называется send_nsca. Есть среди плагинов. Хост-коллектор настраивается на мониторинг всего хозяйства (все, что мониторится, должно быть указано в конфиге). Все эти проверки на хосте-коллекторе определяются как пассивные. На остальных хостах - активные. Вот конфиг для этой штуки (пути фряшные, в линуксах будут другие, адаптируйте).
# send_nsca command path
CMD="/usr/local/sbin/send_nsca"
# send_nsca config file
CFG="/usr/local/etc/nagios/send_nsca.cfg"
# where to send passive checks
PASSIVEHOST=<master_host> # Имя хоста-коллектора
# where to log send events
LOG="/opt/nagios/send_host_nsca.log"
# how often send events (per min)
OFTEN="6"
# mv log before send
TMPSEND="/tmp/passive_host_event.log.$$"
# log
TMPREC="/tmp/passive_host_event.log"
А по поводу -R - Вы, похоже правы, у нас было некоторое количество линукс-машин с ext3, но диски мониторил самописный демон, а не этот плагин.
| |
|
5.33, daevy (ok), 12:24, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
в том и незадача, при использовании nagios часто приходится прибегать каким то третьим инструментам, например jabber-уведомления, пришлось приделать через pl-скрипт, веб-морда для виндо-админов - nagiosql, графики - cacti или pnp4nagios
хочется пожелать icingа-девелоперам удачи в работе, чтобы они сделали прекрасный инструмент, где все это будет в одном месте:)
| |
|
6.36, Gular (ok), 16:22, 07/10/2010 [^] [^^] [^^^] [ответить]
| +1 +/– |
не. на самом деле не надо. нагиос - это конструктор. идея как раз в том, чтобы делать только то что нужно. если же требуется уже готовое со всеми возможностями, то используйте лучше заббикс или зеносс.
| |
|
7.37, daevy (ok), 16:38, 07/10/2010 [^] [^^] [^^^] [ответить]
| +/– |
желательно чтоб детали конструктора находились хотя бы в одной коробке)))) а так любая система является по сути конструктором.
| |
|
8.47, mootal (?), 16:33, 09/10/2010 [^] [^^] [^^^] [ответить] | +/– | unix-way Тут приходится выбирать - либо конструктор, из которого можно собрать ... текст свёрнут, показать | |
|
|
|
|
|
|
|
1.53, Гога (?), 07:05, 10/10/2010 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Спасибо автору анонса! Поставил у себя - просто "песня души". Особенно порадовал мануал на сайте разработчиков - под фряху, по-крайней мере. Сотня хостов за какую-то пару часов :). С заббиксом как-то тяжелее оказалось - уж больно он на трафик прожорлив оказался. Посмотрю, сколько исинга/нагиос кушаеть.
| |
|