Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Техдиагностика.doc
Скачиваний:
437
Добавлен:
11.03.2015
Размер:
6.21 Mб
Скачать

Утилиты мониторинга сети

Хорошие программы мониторинга и управления сетью помогают администратору:

  • выявлять условия, приводящие к возникновению проблем;

  • решать сетевые проблемы;

  • предотвращать сбои сети.

Поскольку этот подход экономит время и деньги, сохраняет оборудование, данные и нервы пользователя, в долгосрочной перспективе именно ему будет отдано предпочтение, а не выяснению причин сбоя уже после того, как он возник.

Если управление сетью ведется правильно, его можно рассматривать и как заблаговременное решение проблем. ISOопределила пять категорий управления сетями, непосредственно связанных с заблаговременным решением проблем.

1.Управление учетными записями для регистрации и выдачи отчетов о работе сетевых ресурсов.

2.Управление конфигурацией для контроля за компонентами сети и их параметрами.

3.Предотвращение отказов для поиска и локализации сетевых проблем.

4.Управление производительностью для отслеживания, анализа и контроля потоков данных в сети.

5.Управление безопасностью для отслеживания и контроля за доступом к сетевым ресурсам.

Средства управления —это средства решения проблем. Сначала Вам потребуется некоторое время, чтобы понять, какую статистическую информацию Вы должны постоянно получать. Вам придется набирать данные, чтобы потом на их основе сделать вывод о характеристиках нормального режима работы сети. Зная, как сеть должна работать в нормальном режиме, можно отслеживать изменения этих данных (они часто указывают на потенциальные проблемы в сети).

В современные сетевые операционные системы встроены утилиты мониторинга сети. Они помогут Вам контролировать работу сети, строить эталонный график ее поведения (как часть программы заблаговременного устранения проблем). Эти средства используют информацию трех видов:

журналы событий, где регистрируются ошибки, действия и ситуации, затрагивающие

систему безопасности, или другие факты, важные для диагностики проблем;

статистику доступа к ресурсам, хранящую сведения о том, кто и как пользуется ресурсами сети;

статистику производительности, которая отражает загрузку процессора, пропускную способность сервера и использование памяти.

В MicrosoftWindowsNTServer, например, есть утилитаPerformanceMonitor, которая выдает общую картину состояния и деятельности системы.

Администратор сети может воспользоваться PerformanceMonitor:

  • для анализа работы сети как в реальном режиме времени, так и в записи;

  • определения тенденций в ее работе;

  • выявления узких мест;

  • регистрации эффектов от изменений в системе и в конфигурации;

  • определения пропускной способности системы;

  • мониторинга локального или удаленных компьютеров;

  • уведомления администраторов о критических событиях;

  • отслеживания производительности процессоров, жестких дисков, памяти и процессов;

  • просмотра ключевых параметров системы в целом.

Эталонный график

Знание того, как сеть ведет себя в нормальном рабочем состоянии так же важно, как и знание того, как устранять проблемы, которые привели к отказу сети. Мониторинг и подробное документирование нормальной работы сети даст Вам информацию, на основе которой Вы сможете создать эталонный график ее поведения. А в случае каких-либо проблем Вы сравните текущее поведение сети с эталонным.

Эталонный график создается заранее, когда сеть нормально функционирует. Он поможет Вам определить:

общую картину загруженности сети в течение суток;

узкие места;

общую картину использования сети отдельными компьютерами;

общую картину графика различных протоколов.

Утилита PerformanceMonitorпредназначена для контроля за работой компьютера в реальном времени, что позволяет находить практически все узкие места. На рисунке8,4показана кривая %ProcessorTime, которая достигает 100процентов. Если такое происходит часто (в течение продолжительного периода эта цифра находится вблизи100процентов), узким местом является процессор.

Анализируя график поведения системы, Вы сможете предупредить возникновение проблем, поскольку он подскажет:

сеть необходимо разделить на несколько сегментов;

следует увеличить количество файл-серверов;

требуется заменить сетевые адаптеры на более производительные.

Программы управления сетью и заблаговременное устранение проблем

Современное программное обеспечение для управления сетями предлагает ряд мер, которые приведут к заблаговременному устранению сетевых проблем.

Перекрестный контроль и постоянный мониторинг взаимодействующих компонентов сети (чтобы убедиться в том, что неисправность одного компонента не выглядит, как неполадка в другом, исправном).

Определение некорректных или ошибочных пакетов.

Периодическая проверка сетевых компонентов, тестирование интерфейсов и отслеживание сетевых действий.

Уведомление о необходимости расширить сеть с помощью новых компьютеров (или других компонентов) и технологий.

Ведение журнала (файла) ошибок (в адаптерах, кабелях и в других компонентах) и уведомление о них администратора. Передовые программы управления могут даже предложить Вам одно из решений возникшей проблемы.

Мониторинг работы серверов (в том числе принт-серверов и шлюзов), запись результатов и уведомление администратора в случае сетевых проблем.

Ведение истории трафика сети и статистики ошибок. Сюда входит и информация о состоянии маршрутов между компьютерами и между ЛВС.

Программа управления может сохранять всю интересную информацию в своем журнале и импортировать ее в другие файлы или базы данных. Чтобы представить эту информацию в другом виде, администратору надо воспользоваться другими прикладными программами.

В большой сети хорошие программы управления передают эту информацию на центральный компьютер, где администратор обычно хранит подробную историю удаленной ЛВС.

Резюме

Управление сетью —многоаспектный процесс. Он включает в себя и мониторинг поведения сети, который можно рассматривать как способ заблаговременного устранения проблем. Если планирование, мониторинг и управление проводить правильно, то и проблемы будут возникать гораздо реже. При планировании сети администратор должен реализовать концепции и процедуры, разработанные с одной целью —предупредить проблему до ее возникновения. В эти планы входит резервное копирование, унификация, постоянное совершенствование и ведение документации.

Решать эти задачи администратору сети помогают специальные утилиты. WindowsNTимеет встроенные программы мониторинга и управления сетью, которые ведут статистику производительности и доступа к ресурсам, а также журналы событий.

Важная часть управления сетью —эталонный график ее поведения. Он создается постепенно, причем очень аккуратно и подробно. Если сеть начинает «сбоить», администратор прежде всего должен обратиться к этому графику. Он сравнивает с ним текущие графики загруженности, ищет потенциальные узкие места, анализирует число ошибок и общую статистику производительности.

Решение сетевых проблем

Методика

Несмотря на самые изощренные планы, мониторинг и поддержку, сетевые проблемы все равно будут возникать. Администратор сети или инженер поддержки сможет быстрее определить и устранить их, если воспользуется структурным подходом, а не будет пытаться применить все возможные решения по очереди.

Структурный подход

Структурный подход состоит из пяти шагов.

1.Определение приоритета проблемы.

2.Сбор информации для выявления симптомов.

3.Разработка списка возможных причин.

4.Изоляция проблемы.

5.Анализ результатов проверки для выработки решения.

Определение приоритета

Первый шаг при структурном подходе —разграничить проблемы по степени их важности. Каждому пользователю, естественно, хочется, чтобы его компьютер «починили» раньше остальных. Поэтому сначала администратор или инженер по поддержке получив сигнал о проблеме, должен установить ее приоритет.

Установить приоритеты для решения сетевых проблем —значит установить степень воздействия, оказываемого на сеть каждой проблемой. Например, в мониторе сгорела плата, и он перестал работать. Плату надо просто заменить, что гораздо менее интересно для администратора, чем разбираться с чьим-нибудь CD-ROM-дисководом или звуковой системой. Но, скорее всего, важнее исправить монитор пользователя, чемCD-ROMлюбителя игр.

Нельзя все проблемы решить сразу. И все ли они требуют немедленного решения? Какие проблемы надо решить в первую очередь?

Сбор информации

Сбор информации —фундамент для безошибочной изоляции проблемы. Администратор должен иметь эталонный график поведения сети, чтобы сравнивать с ним ее текущее поведение. Кроме того, собирая информацию, необходимо осмотреть сеть и выявить очевидные причины проблемы. Быстрый обзор должен включать и проверку! сетевой документации, чтобы выяснить, возникала ли данная проблема раньше и какое решение было принято.

Опрос пользователей

Если пользователям задавать правильные вопросы, их ответы помогут прояснить ситуацию. Инженер должен спросить: «Почему Вы думаете, что сеть не в порядке?» Следующие наблюдения пользователей могут подсказать Вам симптомы проблемы.

«Сеть работает медленно».

«Я не могу связаться с сервером».

«Я был связан с сервером, но связь разорвалась».

«Одно из моих приложений не работает».

«Я не могу печатать на принтере».

Опытный администратор или инженер поддержки, учитывая наблюдения пользователя, задает ему серию вопросов типа или/илиида/нет,чтобы сузить круг возможных причин. Например:

Кого затронул сбой: всех, кого-то конкретно или случайно то одного, то другого пользователя?

Вышла из строя вся сеть или только один компьютер?

Возникала ли эта проблема до модернизации?

Эта проблема существует постоянно или возникает время от времени?

Со всеми приложениями возникает данная проблема или с каким-нибудь одним?

Было ли что-нибудь похожее раньше?

Появились ли в сети новые пользователи? Появилось ли в сети новое оборудование?

Было ли установлено какое-нибудь приложение перед возникновением проблемы? Не перемещали ли в последнее время какое-нибудь оборудование?

Продукты каких поставщиков задействованы?

Не наблюдается ли какой-нибудь закономерности возникновения проблем, связанной с определенным поставщиком или определенными компонентами (платами, концентраторами, дисковыми накопителями, прикладными программами или сетевым программным обеспечением)?

Не пытался ли кто-нибудь решить эту проблему?

Кроме того, администратор сети или инженер поддержки должен рассмотреть следующие факторы:

версии приложений, операционных систем и другого программного обеспечения;

изменение конфигурации компонентов сети или сетевой операционной системы.

Когда Вы станете администратором сети или инженером поддержки, Вы лучше узнаете компоненты и прикладные программы своей сети и будете догадываться, где в первую очередь стоит искать возможные причины проблем.

Разбиение сети на сегменты

Если предварительный осмотр сети не выявил причину проблемы, администратор или инженер поддержки должен мысленно разбить сеть на максимально возможное число сегментов, чтобы иметь дело не со всей сетью, а с небольшим ее участком.

Выделив сегмент, в котором, предположительно, скрывается проблема, администратор или инженер поддержки должен по очереди проверить все компоненты этого сегмента:

адаптеры;

концентраторы;

кабели и соединители;

клиенты;

серверы;

связующие компоненты (репитеры, мосты, маршрутизаторы и шлюзы);

протоколы.

Особое внимание надо уделить сетевым протоколам: они разработаны именно для того, чтобы пытаться преодолеть любые ошибки сети.

В большинство протоколов встроен механизм повторного выполнения неудачных операций, который старается автоматически восстановить работоспособность сети. Запуск этого механизма сразу становится заметным, поскольку работа сети замедляется благодаря большому количеству повторных попыток.

Такой механизм повышает надежность сети, но в то же время затрудняет выявление причин некоторых сетевых проблем, так как один и тот же симптом иногда указывает на несколько проблем.

Здесь снова пригодится список вопросов, направленный на сужение круга возможных причин. На этой стадии важно понимать, как должен работать каждый компонент и к чему может привести его отказ. Пригодится также и эталонный график поведения сети.

Вопросы могут быть такими:

Какие компьютеры могут функционировать в сети?

Может ли компьютер, не функционирующий в сети, работать автономно?

Работает ли сетевой адаптер компьютера, не функционирующего в сети?

Обычный ли трафик в сети?

Возможные причины

Суммировав всю информацию, какую удалось собрать, разработайте список возможных причин проблемы. Попытайтесь расположить их в порядке убывания вероятности.

Изоляция проблемы

Выбрав наиболее вероятную причину, протестируйте «подозреваемый» компонент и выясните, насколько Ваши догадки справедливы. Например, если Вы подозреваете, что в одном из компьютеров неисправна плата сетевого адаптера, попробуйте заменить ее на другую, заведомо работоспособную.

Анализ результатов

Если тест подтвердил Ваше предположение, значит, причина (или одна из причин) найдена. Если же тестирование не дало результатов. Вам следует повторить все сначала. А если список возможных причин иссяк, не раскрыв проблему. Вам придется либо вернуться на стадию сбора информации, либо просить помощи.

Посторонняя помощь

Большинство сетевых администраторов и инженеров поддержки гордятся тем, что могут идентифицировать и устранять сетевые проблемы без посторонней помощи. Они стремятся завоевать уважение и авторитет как классные специалисты. Однако бывают ситуации, когда без чужого вмешательства не обойтись.

Во-первых, в Вашей компании есть и другие специалисты, которые наверняка помогут Вам. Во-вторых, можно обратиться к технической поддержке производителя аппаратного или программного обеспечения. Не будет лишним обратиться за информацией к поставщику, продавшему Вам сетевые компоненты.

Лучшие администраторы и инженеры поддержки —это те, кто знает, когда и куда им следует обратиться за помощью (именно их больше всего уважают пользователи).