Сегодня я представляю вашему внимаю пост моего друга и "коллеги по цеху" Антона TheInspire.
Не сочтите за рекламу. Вряд ли бесплатный проприетарный продукт
нуждается в таковой. Хотя компания Mikrotik
и занимается производством сетевых устройств высокого уровня и данный
продукт изначально разрабатывался под управление сетями на базе таковых,
протокол SNMP - штука универсальная, хоть и не такая простая, как может
показаться из расшифровки аббревиатуры. Итак, если у вас сеть, насчитывающая несколько десятков/сотен/тысяч
сетевых устройств, серверов и прочего железа, на котором она - великая
ЛВС и держится, и вы можете в любой момент времени с уверенностью выше
95% утверждать, что в эту секунду устройство N работает, загрузка
серверов не зашкаливает, а кондиционер в серверной не вышел из строя, то
можете не читать дальше. Телепатов, умеющих опередить события и
предупредить бунт пользователей, вовремя почуяв и подняв упавший сервис
тоже вряд ли данная тематика заинтересует. Для всех остальных сообщу: вы все еще не используете SNMP-мониоринг?
Тогда мы идем к вам! Итак. Не отходя от кассы наглядный пример:
Примерно так выглядит основная карта сети в моем случае. Что мне это
дает?
- Состояние важных устройств и сервисов отражается в режиме реального
времени. Вот, например, сервер, который на карте обозначен красным
прямоугольником выключен, потому что было отключение электроэнергии,
находится он в двухстах с лишним километрах. Пока на нем нет iLO, как на
двух других удаленных серверах, но в понедельник утром мой инженер уже
будет названивать пользователям, пришедшим на работу пораньше, чтобы те
включили сервер самостоятельно.
- Производительность. Анализируя
ежедневные/еженедельные/ежемесячные/ежегодные отчеты, выполненные в виде
удобно настраиваемых графиков, я могу вовремя понять, что пора
модернизировать устаревающий сервер, или перераспределить ресурсоемкие
сервисы.
- Доступность. MPLS-сервис, предоставляемый нашим провайдером очень
сложно назвать стабильным. Как нельзя кстати приходится возможность
формировать отчеты по выходам из строя. Правда есть недостаток - экспорт
производится только в pdf-формат. Приходится обходными путями
перетаскивать это все в Excel, там уже фильтровать и отсылать провайдеру
в качестве предъявы на возврат денег. Кроме того, данные отчеты - суть
качественный показатель состояния ИТ-инфраструктуры.
- Оперативность. На особо критичные узлы настроены оповещения. При
выходе оного из строя сразу отправляется SMS админу с указанием того что
и когда отвалилось. Настраивается по желанию и способ оповещений и
временной интервал информирования. Админ ночью не проснется от тревожной
SMSки - The Dude знает
границы дозволенного. К тому же и мы работаем не в режиме 24/7. К тому
же флажок консоли висит в трее у ответственных работников и по всем
остальным срабатываниям они тоже оперативно уведомляются. Пользователи
нас уже телепатами считают: у них что-то ломается, не работает, они
хватаются за трубку, а там им вежливо говорят, что проблема на стадии
устранения и в течении такого-то времени все заработает, о чем они будут
непосредственно уведомлены.
- Централизация и упрощение управления. Есть возможность добавить свои
инструменты и при необходимости, тычком на нужном девайсе, запустить
нужную оболочку: ssh, rdc, web-интерфейс, попинать девайс. В последней
версии в стандартный набор добавили какое-то страшное спектральное
сканирование. Но я с ним пока не разбирался.
- Гибкость. Если бы можно подключить бухгалтера к сети патч-кордом от
головного мозга, то The Dude, наверное мог бы мониторить и состояние
нервной системы в период сдачи годовой отчетности и посылать инженера с
валокордином в случае чего… Но кофе варить я пока его не научил еще. Я
его просто не пью. А пока, чувак преспокойно согласился мониторить
температуру, влажность в серверной, отобразил состояние главного UPSа и
пообещал предупреждать меня сообщениями при отключении питания и
зловещим таймером обратного отсчета жизнеспособности автономного
питания.
- Удобство расположения панелей. Там ведь не только карта (кстати,
карт самих может быть несколько): там еще и несколько информативных
панелей, которые тоже хорошо бы видеть перед глазами. Основное окно
позволяет расположить все панели так, как душе угодно, хоть так:
- Удобство использования. Кроме всего прочего, имеется
Web-интерфейс с авторизацией, с помощью которого любой желающий, имеющий
на то право, полюбопытствовать здоровьем сети.
Теперь о недостатках. Как и любой продукт The Dude не идеален. Увы… - Неудобный MIB-броузер. Чтобы добавить нужный oid в текстовую метку
приходится потрудиться. Связано это с тем, что не туда ткнув или не так
ткнув броузер закрывается и приходится искать метку заново. Я не
заморачиваюсь и использую сторонние браузеры для snmp-walking’a и
исследования OID-ов.
- Как говорилось выше - неудобный экспорт данных.
- Не очень удобный веб-интерфейс. Лично я им не пользуюсь.
Теперь о непосредственном функционале. - Для мониторинга серверов под управлением ОС Windows самых разных
редакций необходимо доставить компоненты SNMP Services. После их
установки в остнастке Services появятся службы SNMP Trap и SNMP Service.
Собственно, базовая настройка заключается на вкладках Security и Agent в
свойствах службы SNMP Service. За подробностями и описанием сюда
- В системах FreeBSD я настраивал bsnmpd примерно как тут
- Сетевые устройства, поддерживающие SNMP-протокол настраивались в
соответствующих интерфейсах. Кстати, железки от D-Link’a работают с SNMP
довольно криво. Поэтому к ним применял способ ниже:
- Все остальные устройства третьего уровня и выше, но не
поддерживающие SNMP мониторились простым пингом.
Но кроме того, в сети присутствовали устройства известных
производителей (например, APC Network Management Card), которые также
поддерживали работу по SNMP, но для расширенной диагностики
потребовалось загрузить с офсайта файлик с MIB и подгрузить его на
сервер мониторинга. Тут сложностей тоже никаких. Вот только официальной
документации по OID’ам я не нашел, но, как оказалось, она не нужна, т.к.
описание OID’ов содержится в самой MIB. Это дало мне возможность
мониторить температуру и влажность в серверном шкафу с помощью выносного
температурного датчика, а также состояние UPS’a (питание от
сети/питание от батарей) Да, кстати, я уже упоминал, что MIB-Browser у чувака ну очень уж не
удобный. Поэтому пришлось для работы с MIB установить iReasoning MIB browser в
бесплатной редакции. Дальше мне захотелось получать данные с UPS’ов и температурных
показателей в удаленных серверных. Правда, там нет таких устройств как
Network Management Card и специальных выносных датчиков, но сами упсы
серии Smart, подключаемые через последовательный интерфейс к dom0 под
Citrix XenServer. Но об этом в другой раз.
|