Приветствую Вас Гость | RSS

Простыми словами про IT

Пятница, 03.05.2024, 08:00
Главная » 2010 » Январь » 24 » The Dude - чувак, который рулит
22:59
The Dude - чувак, который рулит

Сегодня я представляю вашему внимаю пост моего друга и "коллеги по цеху" Антона TheInspire.

Не сочтите за рекламу. Вряд ли бесплатный проприетарный продукт нуждается в таковой. Хотя компания Mikrotik и занимается производством сетевых устройств высокого уровня и данный продукт изначально разрабатывался под управление сетями на базе таковых, протокол SNMP - штука универсальная, хоть и не такая простая, как может показаться из расшифровки аббревиатуры.

Итак, если у вас сеть, насчитывающая несколько десятков/сотен/тысяч сетевых устройств, серверов и прочего железа, на котором она - великая ЛВС и держится, и вы можете в любой момент времени с уверенностью выше 95% утверждать, что в эту секунду устройство N работает, загрузка серверов не зашкаливает, а кондиционер в серверной не вышел из строя, то можете не читать дальше. Телепатов, умеющих опередить события и предупредить бунт пользователей, вовремя почуяв и подняв упавший сервис тоже вряд ли данная тематика заинтересует.

Для всех остальных сообщу: вы все еще не используете SNMP-мониоринг? Тогда мы идем к вам!

Итак. Не отходя от кассы наглядный пример:


Примерно так выглядит основная карта сети в моем случае. Что мне это дает?
  1. Состояние важных устройств и сервисов отражается в режиме реального времени. Вот, например, сервер, который на карте обозначен красным прямоугольником выключен, потому что было отключение электроэнергии, находится он в двухстах с лишним километрах. Пока на нем нет iLO, как на двух других удаленных серверах, но в понедельник утром мой инженер уже будет названивать пользователям, пришедшим на работу пораньше, чтобы те включили сервер самостоятельно.
  2. Производительность. Анализируя ежедневные/еженедельные/ежемесячные/ежегодные отчеты, выполненные в виде удобно настраиваемых графиков, я могу вовремя понять, что пора модернизировать устаревающий сервер, или перераспределить ресурсоемкие сервисы.
  3. Доступность. MPLS-сервис, предоставляемый нашим провайдером очень сложно назвать стабильным. Как нельзя кстати приходится возможность формировать отчеты по выходам из строя. Правда есть недостаток - экспорт производится только в pdf-формат. Приходится обходными путями перетаскивать это все в Excel, там уже фильтровать и отсылать провайдеру в качестве предъявы на возврат денег. Кроме того, данные отчеты - суть качественный показатель состояния ИТ-инфраструктуры.
  4. Оперативность. На особо критичные узлы настроены оповещения. При выходе оного из строя сразу отправляется SMS админу с указанием того что и когда отвалилось. Настраивается по желанию и способ оповещений и временной интервал информирования. Админ ночью не проснется от тревожной SMSки - The Dude знает границы дозволенного. К тому же и мы работаем не в режиме 24/7. К тому же флажок консоли висит в трее у ответственных работников и по всем остальным срабатываниям они тоже оперативно уведомляются. Пользователи нас уже телепатами считают: у них что-то ломается, не работает, они хватаются за трубку, а там им вежливо говорят, что проблема на стадии устранения и в течении такого-то времени все заработает, о чем они будут непосредственно уведомлены.
  5. Централизация и упрощение управления. Есть возможность добавить свои инструменты и при необходимости, тычком на нужном девайсе, запустить нужную оболочку: ssh, rdc, web-интерфейс, попинать девайс. В последней версии в стандартный набор добавили какое-то страшное спектральное сканирование. Но я с ним пока не разбирался.
  6. Гибкость. Если бы можно подключить бухгалтера к сети патч-кордом от головного мозга, то The Dude, наверное мог бы мониторить и состояние нервной системы в период сдачи годовой отчетности и посылать инженера с валокордином в случае чего… Но кофе варить я пока его не научил еще. Я его просто не пью. А пока, чувак преспокойно согласился мониторить температуру, влажность в серверной, отобразил состояние главного UPSа и пообещал предупреждать меня сообщениями при отключении питания и зловещим таймером обратного отсчета жизнеспособности автономного питания.
  7. Удобство расположения панелей. Там ведь не только карта (кстати, карт самих может быть несколько): там еще и несколько информативных панелей, которые тоже хорошо бы видеть перед глазами. Основное окно позволяет расположить все панели так, как душе угодно, хоть так:

  1. Удобство использования. Кроме всего прочего, имеется Web-интерфейс с авторизацией, с помощью которого любой желающий, имеющий на то право, полюбопытствовать здоровьем сети.

Теперь о недостатках. Как и любой продукт The Dude не идеален. Увы…

  1. Неудобный MIB-броузер. Чтобы добавить нужный oid в текстовую метку приходится потрудиться. Связано это с тем, что не туда ткнув или не так ткнув броузер закрывается и приходится искать метку заново. Я не заморачиваюсь и использую сторонние браузеры для snmp-walking’a и исследования OID-ов.
  2. Как говорилось выше - неудобный экспорт данных.
  3. Не очень удобный веб-интерфейс. Лично я им не пользуюсь.

Теперь о непосредственном функционале.

  • Для мониторинга серверов под управлением ОС Windows самых разных редакций необходимо доставить компоненты SNMP Services. После их установки в остнастке Services появятся службы SNMP Trap и SNMP Service. Собственно, базовая настройка заключается на вкладках Security и Agent в свойствах службы SNMP Service. За подробностями и описанием сюда
  • В системах FreeBSD я настраивал bsnmpd примерно как тут
  • Сетевые устройства, поддерживающие SNMP-протокол настраивались в соответствующих интерфейсах. Кстати, железки от D-Link’a работают с SNMP довольно криво. Поэтому к ним применял способ ниже:
  • Все остальные устройства третьего уровня и выше, но не поддерживающие SNMP мониторились простым пингом.

Но кроме того, в сети присутствовали устройства известных производителей (например, APC Network Management Card), которые также поддерживали работу по SNMP, но для расширенной диагностики потребовалось загрузить с офсайта файлик с MIB и подгрузить его на сервер мониторинга. Тут сложностей тоже никаких. Вот только официальной документации по OID’ам я не нашел, но, как оказалось, она не нужна, т.к. описание OID’ов содержится в самой MIB. Это дало мне возможность мониторить температуру и влажность в серверном шкафу с помощью выносного температурного датчика, а также состояние UPS’a (питание от сети/питание от батарей)

Да, кстати, я уже упоминал, что MIB-Browser у чувака ну очень уж не удобный. Поэтому пришлось для работы с MIB установить iReasoning MIB browser в бесплатной редакции.

Дальше мне захотелось получать данные с UPS’ов и температурных показателей в удаленных серверных. Правда, там нет таких устройств как Network Management Card и специальных выносных датчиков, но сами упсы серии Smart, подключаемые через последовательный интерфейс к dom0 под Citrix XenServer. Но об этом в другой раз.

Категория: Software | Просмотров: 5476 | Добавил: nhc-it
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]