Добавил:
мой вк: vk.com/truecrimebitch больше работ здесь: https://github.com/alisadex Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Администрирование_в_информационных_системах_Беленькая_М_Н_

.pdf
Скачиваний:
7
Добавлен:
11.05.2025
Размер:
3.3 Mб
Скачать

Протоколы, используемые для программирования систем

341

 

 

ReporterAnalyzer — модуль для анализа и подсчета объемов трафика на базе протокола Cisco NetFlow.

Аппаратно NMS NetQos реализована в виде трех серверов на базе HP Proliant DL360 с предустановленным программным обеспечением под управлением ОС Windows Server 2003:

SuperAgent Master Console — сервер для создания отчетов и анализа данных, полученных от модулей (коллекторов) SuperAgent.

SuperAgent Collector — сервер (коллектор) SuperAgent для сбора данных зеркалированного трафика контролируемых приложений.

ReporterAnalyzer — сервер для сбора, анализа и создания отчетов на базе статистики Cisco IOS Netflow.

Рассмотрим более подробно работу с модулем NetQos Superagent. Архитектурная схема подключения серверов продукта NetQoS SuperAgent приведена на рис. 12.8.

В ходе проведения работ администратор системы выполнил следующие действия:

подключил два сервера SuperAgent к КСПД, задав им соответствующие настройки для работы в сети (IP-адрес, маску подсети и др.);

ввел в конфигурационные данные SuperAgent имена серверов приложений, названия приложений, подлежащих мониторингу, список удаленных филиалов, работающих с приложениями, подлежащими мониторингу, и соответствующие им IP-адреса подсетей;

настроил протокол SNMP на сетевых устройствах и серверах с указанием спецификации протокола, SNMP read community string;

настроил специальные средства зеркалирования трафика ОС Cisco IOS (SPAN), чтобы иметь возможность анализировать дублированные данные коллекторами SuperAgent. Это позволяет SuperAgent «не мешать» работе КСПД;

провел анализ времени отклика и инцидентов ключевых приложений с помощью NetQoS SuperAgent.

Рассмотрим последние действия подробнее для лучшего понимания работы NMS.

Для контролируемых централизованных приложений NetQoS SuperAgent автоматически измеряет время отклика

342

Глава 12

 

 

Рис. 12.8. Схема подключения серверов NetQoS SuperAgent

(бизнес-метрика Total Transaction Time), получаемое пользователями удаленных подсетей (филиалов). Коллектор получает копию реального трафика с серверов приложений с помощью технологии SPAN IOS Cisco (зеркалирования трафика). SuperAgent анализирует заголовки всех пакетов, автоматически формирует нормативные показатели (так называемые baseline) и допустимые отклонения времени отклика этих приложений для разных подсетей.

Расчет нормативных характеристик работы сети необходим специалистам служб администратора сети для выявления замедлений в работе серверов, приложений и сети в целом. Нормативные (базовые) значения качественных показателей работы сети формируются для каждого дня недели и времени суток. Кроме того, система в автоматическом режиме устанавливает пороговые значения, благодаря которым специалисты могут анализировать замедления в работе отдельных узлов.

Протоколы, используемые для программирования систем

343

 

 

 

Рис. 12.9. Диаграмма качества работы пользователей филиала в Нягани с централизованными приложениями

344

Глава 12

 

 

При возникновении замедлений в работе конечных пользователей с централизованными приложениями основной задачей является поиск источника проблем. Проблема может быть на стороне сети, сервера или приложения.

На диаграмме рисунка 12.9 представлена информация о работе пользователей филиала в Нягани с централизованными приложениями. В отчете видно, что были замедления в работе пользователей с приложением SA, а также при обращении к серверам msk-fe-02.corp.N.ru и cism2.corp.N.ru. Причиной возникновения замедлений является деградация метрик Network Round Trip Time и Effective Round Trip Time. Отсюда понятно, что проблема заключается в ухудшении работы сети, причем сразу указаны «виновные» метрики.

Effective Round Trip Time — это метрика, характеризующая потраченное сетью время на доставку пакетов. В отчете по этой метрике видно, что было превышено пороговое значение. В пиковых значениях пакеты от сервера к пользователю передавались с задержкой в 568 мс (рис. 12.10).

На рисунке 12.11 представлен отчет о работе пользователей филиала в Нижневартовске сервером apltu01.corp.N.ru за один рабочий день — 12 марта 2009 г.

На данном отчете хорошо видно изменение количества обращений к серверу в течение рабочего дня. С 9 до 10 утра наблюдалось наибольшее количество обращений пользователей, затем количество запросов постепенно снижалось. Пользовательские транзакции обозначены кривой серого цвета, измеряются по логарифмической шкале, расположенной справа от графика. Примерно в 13.30 время отклика сервера резко увеличилось (метрика Server Response Time ), что может быть вызвано передачей большого объема данных.

Таким образом, SuperAgent позволяет немедленно зафиксировать возникновение проблемы с замедлением времени отклика (формирует инцидент) и локализует его источник.

Для контроля производительности приложений в сети в NetQoS SuperAgent существует понятие инцидентов. При превышении пороговых значений система в автоматическом режиме создает инцидент, который фиксируется в базе данных, ему присваивается уникальный идентификационный номер и возможно отправление уведомления в виде SNMP-trap во внешнюю систему, например Service Desk. Инциденты делятся

Протоколы, используемые для программирования систем

345

 

 

Рис. 12.10. График метрики Effective Round Trip Time

Рис. 12.11. Отчет о работе пользователей филиала в Нижневартовске с сервером apltu01.corp.N.ru за один рабочий день

346

12 Глава

Протоколы, используемые для программирования систем

347

 

 

Рис. 12.12. Детали инцидента

Рис. 12.13. Расследование причин инцидента

348

12 Глава

Протоколы, используемые для программирования систем

349

 

 

на сетевые и серверные. Кроме того, система в автоматическом режиме может провести то или иное расследование, чтобы получить дополнительную детальную информацию для облегчения разбора ситуации.

На примере отчета, представленного на рис. 12.12, видно, что инцидент возник при работе пользователей Нижневартовска с приложением SAP, с серверами cism2.corp.N.ru и apltu01. corp.N.ru. Замедления произошли по причине деградации метрики Retransmission Delay. Это значит, что в сети пропадают пакеты и появляется задержка из-за повторной передачи пакетов.

На диаграмме суммарного времени отклика виден скачок, связанный с увеличением задержек, вызванных повторной передачей пакетов. Также видна задержка, вносимая метрикой Retransmission Delay (рис. 12.13).

С помощью системы мониторинга и контроля времени отклика приложений NetQos SuperAgent администратор системы сократил время на расследование причин деградации производительности за счет четкой идентификации причины инцидента и оповещения соответствующей группы специалистов. Контроль отклонений времени отклика приложений от обычных значений дает возможность осуществлять проактивный мониторинг, то есть специалисты служб администратора системы компании N узнают о появившейся проблеме до звонка пользователя.

12.3.Системы оперативного сопровождения

èподдержки — OSS

Под термином OSS (Operations Support System) обычно понимают систему, выполняющую функции управления, инвентаризации, планирования и восстановления для провайдеров и операторов телекоммуникационных услуг и их сетей [12]. Эти управляющие системы выделены в особый класс из-за особых задач ИС операторов связи (например, биллинга). Кроме того, технологические процессы операторов связи тесно связаны с задачами контроля, учета и диагностики. В результате возникает необходимость одновременно управлять прикладными задачами (например, предоставление телепрограмм) и задача-

350

Глава 12

 

 

ми сопровождения системы (например, управление производительностью городской сети передачи данных).

Наиболее перспективной моделью управления оператора связи сегодня является модель еТОМ. Согласно идеологии eTOM, система OSS должна быть независимой от используемого сетью оборудования, что особенно актуально при наличии большого количества разнородного оборудования сети доступа разных компаний-производителей.

Обычно в состав OSS входят следующие основные компоненты:

средства взаимодействия (mediation) обеспечивают сопряжение решений OSS с разнородным оборудованием различных производителей;

управление инвентаризацией (Resource/Inventory Management) отвечает за учет физических и логических ресурсов сети;

управление производительностью (Performance Management) осуществляет мониторинг параметров сети и анализ ее производительности;

управление неисправностями (Fault Management) представляет собой систему контроля и управления аварийными сигналами, которая предназначена для их фильтрации и корреляции в целях выявления причины, породившей поток взаимосвязанных аварийных сообщений;

контроль выполнения задач по устранению неисправностей (Trouble Ticketing) обеспечивает анализ и отслеживание соответствующих процессов;

управление качеством предоставляемых услуг (SLA Management) обеспечивает оперативный мониторинг сервисов, доступных внутренним и внешним пользователям;

управление нарядами на активацию услуг (Order Management) необходимо для отслеживания всех этапов исполнения заказа на предоставление услуги;

система предупреждения мошенничества (Fraud Management), предназначена для пресечения и упреждения случаев несанкционированного и неоплаченного использования услуг операторов связи;

модуль планирования и развития услуг (Service Provisioning Management) служит для прогнозирования развития событий и моделирования разнообразных сценариев;