Мониторинг сетевой инфраструктуры защитит от сбоев

Светлана Врублевская, заместитель директора департамента телекоммуникаций компании КРОК по сервису

Стабильность бизнес-процессов любой компании во многом зависит от того, как функционирует ее ИТ оборудование. Сбой в работе критически важных сервисов, отказ оборудования могут привести к серьезным финансовым потерям.

Инновационные инструменты диагностики помогают оперативно распознавать наличие сетевых проблем и определять, насколько качественно работают приложения. В ситуации, когда на поиск неполадок в сети тратится гораздо больше времени, чем на их устранение, компанию спасает эффективный мониторинг.

Мониторинг сетевой инфраструктуры позволяет проводить постоянный онлайн контроль основных показателей ее работы, а именно: доступность, производительность оборудования и каналов связи. Как результат – существенная экономия времени на локализацию ошибок. Более того, анализ тенденций позволяет заранее выявлять ключевые риски в работе сети и автоматически информировать заинтересованных лиц, чтобы предотвратить развитие данных рисков в инциденты.

В рамках сетевого мониторинга осуществляется снятие телеметрических данных с объектов корпоративной сети. Этот процесс включает в себя постоянную проверку узлов сети, анализ данных, получаемых от оборудования, с выводом основных показателей на экран диспетчера. В случае возникновения сбоя поиск «источника» выполняется ИТ-специалистами по следующему алгоритму: во-первых, уточняется, не связана ли проблема с провайдером каналов связи, во-вторых, выясняется, не было ли отключения электропитания; в-третьих, устанавливается связь с самим сетевым объектом. Если в течение пяти-десяти минут все эти действия не приводят к решению вопроса, на объект выезжает инженер службы технической поддержки. Специалисты из офиса, оперируя данными датчиков и сервисными инструкциями, направляют действия инженера уже на месте. Выявив и устранив причину неполадки, инженер составляет отчет.

Самые распространённые инциденты в практике мониторинга, как правило, связаны с нарушением в функционировании телефонной связи. В 80% случаев причиной является отключение электропитания.

На втором месте — отказ в работе одного из каналов связи с удалённым объектом заказчика. При этом связь автоматически переключается на резервные каналы и, если речь идет, к примеру, о магазине в регионе, то кассовые аппараты там продолжают работу и заказчик может ничего не заметить. Если бы система мониторинга сети не была внедрена, то с момента возникновения проблемы до её выявления прошли бы часы или даже дни (резервные каналы проверяют далеко не всегда). Применяя мониторинг, инженеры знают, что именно вышло из строя, и предпринимают действия сразу же.

Следующий по частоте штатный вызов — выход из строя одного из клиентских устройств, например, беспроводного DECT-телефона или Wi-Fi точки доступа, раздающей сеть на офис. В этом случае мы узнаём о проблеме из мониторинга и почти сразу получаем подробности из телефонного разговора с сотрудниками клиента.

Система мониторинга сетевой инфраструктуры, в зависимости от бизнес-потребностей и масштабов деятельности заказчика, может быть выстроена либо на основе классического Zabbix, либо — более специализированных систем, например, компании Infosim. Немного информации по этим двум вариантам, в чём их преимущества и различия:

Zabbix является продуктом open-source, распространяется свободно, при этом обеспечивает необходимый и достаточный контроль за состояниями различных сервисов компьютерной сети, серверов и сетевого оборудования. Преимуществами базового режима работы Zabbix, простой сетевой проверки, является то, что внедрение системы мониторинга происходит в короткие сроки, не требует каких-либо изменений в сети заказчика и эффективно с финансовой стороны.

Есть и более сложный режим работы Zabbix — с установкой на сетевые объекты клиента специальных программ-агентов, что позволяет вести расширенный мониторинг параметров конкретных устройств с помощью анализа отправляемых ими SNMP-событий. Протокол Simple Network Management Protocol позволяет системе мониторинга получать массу параметров: инвентарные данные сетевых объектов, загрузку процессора, памяти, дисков, сетевых интерфейсов и прочих датчиков, которыми они обладают.

В свою очередь, коммерческая платформа вендора Infosim объединяет в рамках мониторинга несколько подсистем: управление отказами, что обеспечивает контроль сбоев и привязку их к событиям; управление производительностью; инвентаризацию и автоматическое обнаружение сетевых устройств с построением карты их топологии; управление базами конфигураций.

Infosim поддерживает внушительный список сетевого оборудования «из коробки», легко внедряется в их внутренний обмен информацией и получает доступ ко всем техническим параметрам. Встроенный модуль инвентаризации помогает не только обнаруживать сетевые объекты, но и вести их актуальную базу с возможностью определения простаивающего ИТ-оборудования. Решение также позволяет отслеживать версии прошивок устройств, чтобы вовремя проводить обновления ПО и жизненный цикл, чтобы заранее спланировать замену оборудования на новое. Это удобно для большого и среднего бизнеса, особенно для компаний с территориально распределенной инфраструктурой.

Помимо внедрения и настройки подобных систем на площадках заказчиков, существует ещё одна модель мониторинга сетевой инфраструктуры — с помощью облачных решений. Преимущество данной модели состоит в том, что заказчик существенно экономит на развертывании собственной системы, получая мониторинг как услугу и оплачивая только реально потребляемый объем. КРОК предлагает услуги собственной сети коммерческих дата-центров и своего публичного облака, строит частные и гибридные облака на базе центров обработки данных (ЦОД) заказчиков. На сегодняшний день ЦОД КРОК единственный в России прошел полную сертификацию на TIER III в Uptime Institute.

Приведем пример с компанией «Мон’дэлис Русь», для которой систему сетевого мониторинга КРОК развернул в собственном дата-центре.

Ранее поддержка сети осуществлялась из зарубежных офисов компании Mondelēz International и её глобальных партнеров. С момента возникновения проблемы до её обнаружения и устранения мог пройти не один час. Длительный простой каналов передачи данных между центральным офисом, заводами и складами приводил к сбоям при отгрузке продукции, что оборачивалось значительными убытками для компании. Благодаря внедрённой системе мониторинга и поддержки типичную сетевую проблему сегодня удаётся диагностировать в течение 10-15 минут, затраты на управление ИКТ-инфраструктурой снизились на 60%, уменьшились потери бизнеса от простоя каналов связи.

При этом, обратная связь с заказчиком позволяет оперативно корректировать как базу объектов мониторинга, так и логику работы с ними.

 

Похожие записи