
- •1. Введение
- •1.1. Основные задачи оптимизации локальных сетей
- •1.2. Критерии эффективности работы сети
- •1.2.1. Время реакции
- •1.2.2. Пропускная способность
- •1.2.3. Показатели надежности и отказоустойчивости
- •2. Параметры оптимизации транспортной подсистемы
- •2.1. Влияние на производительность сети типа коммуникационного протокола и его параметров
- •2.1.1. Номинальная и эффективная пропускная способность протокола
- •2.1.2. Влияние на производительность алгоритма доступа к разделяемой среде и коэффициента использования
- •2.1.3. Влияние размера кадра и пакета на производительность сети
- •2.1.4.Назначение максимального размера кадра в гетерогенной сети
- •2.1.5. Время жизни пакета
- •2.1.6. Параметры квитирования
- •2.1.7. Сравнение сетевых технологий по производительности: Ethernet, TokenRing, fddi, 100vg-AnyLan, FastEthernet, atm
- •2.1.8. Сравнение протоколов ip, ipx и NetBios по производительности
- •2.2. Влияние широковещательного служебного трафика на производительность сети
- •2.2.1. Назначение широковещательного трафика
- •2.2.2. Поддержка широковещательного трафика на канальном уровне
- •2.2.3. Широковещательный шторм
- •2.2.4. Поддержка широковещательного трафика на сетевом уровне
- •2.2.5. Виды широковещательного трафика
- •2.2.5.1. Широковещательный трафик сетей NetWare
- •2.2.5.2. Широковещательный трафик сетей tcp/ip
- •2.2.5.3. Широковещательный трафик сетей NetBios
- •2.2.5.4. Широковещательный трафик мостов и коммутаторов, поддерживающих алгоритм SpanningTree
- •2.2.5.5. Ограничение уровня широковещательного трафика в составных сетях с помощью техники спуфинга
- •2.3. Влияние топологии связей и производительности коммуникационных устройств на пропускную способность сети
- •2.3.1. Разделяемая среда передачи как причина снижения производительности сети
- •2.3.2. Повышение производительности путем сегментации сети мостами и коммутаторами
- •2.3.2.1. Разделение общей среды с помощью локальных мостов
- •2.3.2.2. Требования к пропускной способности моста
- •2.3.2.3. Сегментация сетей с помощью коммутаторов
- •2.3.2.4. Оценка необходимой общей производительности коммутатора
- •2.3.3. Влияние маршрутизаторов на производительность сети
- •2.3.4. Как интерпретировать результаты тестирования мостов, коммутаторов и маршрутизаторов
- •2.4. Типичные ошибочные ситуации: влияние на производительность и диагностика
- •2.4.1. Типичные ошибки в кадрах
- •2.4.1.1. Ошибки в кадрах, связанные с коллизиями
- •2.4.1.2. Диагностика коллизий
- •2.4.1.3. Ошибки кадров Ethernet, связанные с длиной и неправильной контрольной суммой
- •2.4.1.4. Ошибки кадров Ethernet в стандарте rmon
- •2.4.2. Типичные ошибки при работе протоколов
- •2.4.2.1. Несоответствие форматов кадров Ethernet
- •2.4.2.2. Потери пакетов и квитанций
- •2.4.2.3. Несоответствие разных способов маршрутизации в составной сети
- •2.4.2.4. Несуществующий адрес и дублирование адресов
- •2.4.2.5. Превышение значений тайм-аута и несогласованные значения тайм-аутов
- •2.5. Настройка параметров аппаратных и программных средств конечных узлов
- •2.5.1. Оптимизация операционных систем
- •2.5.1.1. Критерии оптимизации ос
- •2.5.1.2. Понятие "узкое место"
- •2.5.2. Процедуры оптимизации WindowsNt с помощью утилиты PerformanceMonitor
- •2.5.2.1. Характеристика PerformanceMonitor
- •2.5.2.2. Наблюдение за потреблением ресурсов процессора, дисков и памяти
- •2.5.2.3. Оптимизация сетевого оборудования
- •2.5.2.4. Оптимизация сервиса рабочей станции
- •2.5.2.5. Оптимизация сервера
- •2.5.2.6. Оптимизация режима работы протокола smb
- •2.5.3. Настройка подсистемы ввода-вывода рабочих станций и серверов
- •2.5.3.1. Оптимизация дискового кэша
- •2.5.3.2. Использование raid-массивов для повышения производительности
- •3. Инструменты мониторинга и анализа сети
- •3.1. Классификация средств мониторинга и анализа
- •3.1.1. Системы управления
- •3.1.2. Встроенные средства мониторинга и анализа сетей
- •3.1.2.1. Агенты snmp
- •3.1.2.2. Агенты rmon
- •3.1.3. Анализаторы протоколов
- •3.1.4. Оборудование для диагностики и сертификации кабельных систем
- •3.1.4.1. Основные электромагнитные характеристики кабельных систем
- •3.1.4.2. Сетевые анализаторы
- •3.1.4.3. Кабельные сканеры
- •3.1.4.4. Тестеры
- •3.2. Продукты для мониторинга и анализа
- •3.2.1. Обзор популярных систем управления: hpOpenView, SunSoftSolstice, CabletronSpectrum, ibmNetView
- •3.2.2. Система управления сетями Optivity
- •3.2.2.1. Динамическое обнаружение конфигурации сети
- •3.2.2.2. Программное конфигурирование сети
- •3.2.2.3. Интегрированное управление маршрутизаторами
- •3.2.2.4. Анализ и управление производительностью на основе стандарта rmon
- •3.2.2.5. Упреждающий анализ ошибок и проблем
- •3.2.2.6. Управление устройствами в реальном масштабе времени
- •3.2.2.7. Дополнительные управляющие средства и утилиты
- •3.2.3. Технические характеристики популярных анализаторов протоколов
- •3.2.4. Продукты мониторинга и анализа сетей компании NetworkGeneral
- •3.2.4.1. Foundation Agent, Foundation Probe, Foundation Manager
- •3.2.4.2. Семействопродуктов Distributed Sniffer System
- •3.2.4.3. Портативные анализаторы
- •3.2.4.4. Дополнительные продукты
- •3.2.5. Анализатор протоколов laNalyser компании Novell
- •3.2.6. Продукты компании Microtest
- •3.2.6.1. Многофункциональное устройство Compas компании Microtest
- •3.2.6.2. Кабельные сканеры компании Microtest
- •3.2.7. Средства мониторинга и анализа компании Fluke
- •3.2.7.1. Особенности 68x Enterprise lanMeter
- •3.2.7.2. Функциональные возможности
- •3.2.7.3. Средства анализа протоколов стека NovellNetWare
- •3.2.7.4. Средства анализа протоколов стекаTcp/ip
- •3.2.7.5. Дополнительные функции анализа стека tcp/ip
- •3.2.7.6. Средства анализа протокола NetBios
- •3.2.7.7. Функции проверки аппаратуры и кабелей
- •4. Использование моделирования для оптимизации производительности сети
- •4.1. Методы аналитического, имитационного и натурного моделирования
- •4.2. Модели теории массового обслуживания
- •4.3. Специализированные системы имитационного моделирования вычислительных сетей
- •4.4. Система имитационного моделирования comnet компании caciProducts
- •4.4.1. ComnetBaseliner
- •4.4.2. Comnetiii
- •4.4.2.1. Общая характеристика
- •4.4.2.2. Типы узлов
- •4.4.2.3. Каналы связи и глобальные сети
- •4.4.2.4. Рабочая нагрузка
- •4.4.2.5. Протоколы
- •4.4.2.6. Представление результатов
- •4.4.3. ComnetPredictor
- •4.5. Построение пилотных проектов проектируемых сетей
1.2.3. Показатели надежности и отказоустойчивости
Важнейшей характеристикой вычислительной сети является надежность - способность правильно функционировать в течение продолжительного периода времени. Это свойство имеет три составляющих: собственно надежность, готовность и удобство обслуживания.
Повышение надежности заключается в предотвращении неисправностей, отказов и сбоев за счет применения электронных схем и компонентов с высокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры. Надежность измеряется интенсивностью отказов и средним временем наработки на отказ. Надежность сетей как распределенных систем во многом определяется надежностью кабельных систем и коммутационной аппаратуры - разъемов, кроссовых панелей, коммутационных шкафов и т.п., обеспечивающих собственно электрическую или оптическую связность отдельных узлов между собой.
Повышение готовностипредполагает подавление в определенных пределах влияния отказов и сбоев на работу системы с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления циркуляции информации в сети после обнаружения неисправности. Повышение готовности представляет собой борьбу за снижение времени простоя системы.
Критерием оценки готовности является коэффициент готовности, который равен доле времени пребывания системы в работоспособном состоянии и может интерпретироваться как вероятность нахождения системы в работоспособном состоянии. Коэффициент готовности вычисляется как отношение среднего времени наработки на отказ к сумме этой же величины и среднего времени восстановления. Системы с высокой готовностью называют также отказоустойчивыми.
Основным способом повышения готовности является избыточность, на основе которой реализуются различные варианты отказоустойчивых архитектур. Вычислительные сети включают большое количество элементов различных типов, и для обеспечения отказоустойчивости необходима избыточность по каждому из ключевых элементов сети. Если рассматривать сеть только как транспортную систему, то избыточность должна существовать для всех магистральных маршрутов сети, то есть маршрутов, являющихся общими для большого количества клиентов сети. Такими маршрутами обычно являются маршруты к корпоративным серверам - серверам баз данных, Web-серверам, почтовым серверам и т.п. Поэтому для организации отказоустойчивой работы все элементы сети, через которые проходят такие маршруты, должны быть зарезервированы: должны иметься резервные кабельные связи, которыми можно воспользоваться при отказе одного из основных кабелей, все коммуникационные устройства на магистральных путях должны либо сами быть реализованы по отказоустойчивой схеме с резевированием всех основных своих компонентов, либо для каждого коммуникационного устройства должно иметься резервное аналогичное устройство.
Переход с основной связи на резервную или с основного устройства на резервное может происходить как в автоматическом режиме, так и вручную, при участии администратора. Очевидно, что автоматический переход повышает коэффициент готовности системы, так как время простоя сети в этом случае будет существенно меньше, чем при вмешательстве человека. Для выполнения автоматических процедур реконфигурации необходимо иметь в сети интеллектуальные коммуникационные устройства, а также централизованную систему управления, помогающую устройствам распознавать отказы в сети и адекватно на них реагировать.
Высокую степень готовности сети можно обеспечить в том случае, когда процедуры тестирования работоспособности элементов сети и перехода на резервные элементы встроены в коммуникационные протоколы. Примером такого типа протоколов может служить протокол FDDI, в котором постоянно тестируются физические связи между узлами и концентраторами сети, а в случае их отказа выполняется автоматическая реконфигурация связей за счет вторичного резервного кольца. Существуют и специальные протоколы, поддерживающие отказоустойчивость сети, например, протокол SpanningTree, выполняющий автоматический переход на резервные связи в сети, построенной на основе мостов и коммутаторов.
Существуют различные градации отказоустойчивых компьютерных систем, к которым относятся и вычислительные сети. Приведем несколько общепринятых определений:
высокая готовность (highavailability) - характеризует системы, выполненные по обычной компьютерной технологии, использующие избыточные аппаратные и программные средства и допускающие время восстановления в интервале от 2 до 20 минут;
устойчивость к отказам (faulttolerance) - характеристика таких систем, которые имеют в горячем резерве избыточную аппаратуру для всех функциональных блоков, включая процессоры, источники питания, подсистемы ввода/вывода, подсистемы дисковой памяти, причем время восстановления при отказе не превышает одной секунды;
непрерывная готовность (continuousavailability) - это свойство систем, которые также обеспечивают время восстановления в пределах одной секунды, но в отличие от систем устойчивых к отказам, системы непрерывной готовности устраняют не только простои, возникшие в результате отказов, но и плановые простои, связанные с модернизацией или обслуживанием системы. Все эти работы проводятся в режиме online. Дополнительным требованием к системам непрерывной готовности является отсутствие деградации, то есть система должна поддерживать постоянный уровень функциональных возможностей и производительности независимо от возникновения отказов.
Так как сети обслуживают одновременно большое количество пользователей, то при расчете коэффициента готовности необходимо учитывать это обстоятельство. Коэффициент готовности сети должен соответствовать доле времени, в течение которого сеть выполняла с должным качеством свои функции для всех пользователей. Очевидно, что в больших сетях очень трудно обеспечить значения коэффициента готовности, близкие к единице.
Между показателями производительности и надежности сети существует тесная связь. Ненадежная работа сети очень часто приводит к существенному снижению ее производительности. Это объясняется тем, что сбои и отказы каналов связи и коммуникационного оборудования приводят к потере или искажению некоторой части пакетов, в результате чего коммуникационные протоколы вынуждены организовывать повторную передачу утерянных данных. Так как в локальных сетях восстановлением утерянных данных занимаются как правило протоколы транспортного или прикладного уровня, работающие с тайм-аутами в несколько десятков секунд, то потери производительности из-за низкой надежности сети могут составлять сотни процентов.