
Оптические системы связи / 3_Volokonno-opticheskie_sistemy_svyazi_Friman_R
.pdf12.4. Сетевая архитектура и безотказность
Сетевая архитектура может оказывать огромное влияние на доступность системы. Кольцевые топологии применяются почти везде на сетях с секциями большой протяженности. Кольцо состоит из пары или нескольких пар волокон. В одном варианте, по одному из волокон информационный поток идет в одном направлении, по другому в противоположном. На таких сетях, часто взаимодействующих с сетями общего пользования, трафик симметричен. Значительный процент такого трафика обслуживает клиентов телефонных услуг, которые используют полнодуплексный сервис. Другие сервисы обслуживают пользователей Интернет, передачу данных по корпоративным сетям, связь с другими сетями передачи данных типа Frame Relay, IP и ATM. Можно также ожидать, что этот трафик симметричный и полнодуплексный. Некоторые сети передачи видео могут использовать и асимметричный трафик. Телеконференц связь обычно двусторонняя. В разделе 12.4.7 описаны основные кольцевые конфигурации, используемые производителями ВОСП.
12.4.1. Автоматическое защитное переключение (APS)
Транспортные ВОСП, как правило, имеют топологию кольца, для защиты трафика от отказов оборудования. В архитектуре кольца трафик может быть направлен в одном, либо в обоих, направлениях вокруг кольца, состоящего из нескольких узлов. Такая кольцевая топология обеспечивает защиту от отказа промежуточных узлов, хотя трафик начинающийся или заканчивающийся в таком узле не может быть восстановлен, пока не будет обеспечено его резервирование. Если это будет обеспечено, то может оказаться возможным восстановить 100% трафика, следующего через отказавший узел в кольце. Автоматическое защитное переключение (APS)
дает возможность восстановить трафик.
APS было разработано и определено как для систем, которые
мониторят ухудшение и отказ отдельных каналов или маршрутов, так и для систем, которые мониторят сигнал в целом. Когда установлен факт ухудшения сигнала или отказа системы, то полное соединение, или его часть, например, один канал из всего набора каналов, может быть переключен на резервное оборудование.
12.4.2. Активирование переключения
Защитное переключение в ВОСП активируется тогда, когда ВЕК сигнала на активном волокне (работающей, либо резервной линии) больше, чем порог инициализации переключателя, и доступно резервное волокно, группа волокон, или кабель (либо в защитной конфигурации, либо в исходной работающей конфигурации) с лучшим значением BER. В общем случае порог активации возникает, когда BER находится в диапазоне 10-6 — 10-9. Для того, чтобы приспособиться к разным ситуациям, можно сделать значение порога переключаемым. Обычно, в дополнение к этому, система может поддерживать второй порог инициализации переключателя, так чтобы можно было дать приоритет линии с серьезной деградацией сигнала. Второй порог инициализации переключателя обычно устанавливается в диапазоне
BER 10-3 – 10-4.
Время обнаружения - время, требуемое для системы управления, чтобы определить, что произошел отказ оборудования, или, что порог BER был превышен, а также для того, чтобы инициировать действие защитного переключения, если это необходимо. Время обнаружения должно быть меньше 10 мс.
Активирование или деактивирование переключения запускается определенной бит-последовательностью в байтах К1 и К2 заголовка SONET,
см. табл. 12.2.

|
|
Таблица 12.2 |
Структура кадра (по умолчанию) на основе байтов К1 и К2 |
||
|
|
|
Байт К1 |
|
Байт К2 |
X X X X 0 0 0 0 |
0 0 0 0 |
X X X X |
X - может быть любым (1 или 0)
Источники. Таблица основана на ANSI T1-105.01 [12.8] и Telcordia GR-1230 [12.7].
Время завершения переключения, после того, как оно было инициировано, должно быть не более 50 мс. Специалисты по управлению могут осуществить такое переключение вручную. Это означает, что трафик может быть прерван на 50 мс при ручном переключении. Некоторые пользователи, возможно, найдут, что 50 мс - слишком большое время для переключения. Telcordia, поэтому, сформировала определенные требования для ручного переключения. В определенных случаях действие переключателя должны быть безошибочны. Действие ручного переключения предваряет время обнаружения, следовательно, действие по переключению может занять много меньше 50 мс.
12.4.3. Восстановление
Когда BER рабочей линии улучшится, трафик может продолжать передаваться по резервной линии (эта ситуация называется безвозвратным переключением), или он может быть переключен назад на рабочую линию (эта ситуация называется возвратным переключением). Telcordia рекомендует при этом устанавливать порог восстановления, значение которого равно Т/10 (где Т — порог инициализации переключателя, который мы обсуждали раньше).
После того, как ВЕR на рабочей линии станет лучше порога восстановления, начнет отсчитываться период ожидания восстановления (WTR) - 5-12 мин, до того, как осуществится возвратное переключение, если только резервная линия на потребуется для других целей, таких как защита
других деградирующих линий. Если резервная линия требуется для других целей, то возвратное переключение, инициируется сразу, как только ВЕR на рабочей линии станет лучше порога восстановления.
Рациональность использования WTR в том, что позволяет исключить частые переключения между рабочей и резервной линиями, которые могут быть вызваны промежуточными отказами. Этот механизм применяется только для автоматического переключения, вызванного отказом или деградацией рабочих линий. Он не применяется после того, как инициированные вручную переключатели были возвращены в исходное состояние, или после отказа или деградации защитных линий.
12.4.3.1. Активация APS-функции
В результате отказа, вызванного обрывом волокна или отказом узла, с помощью кадра, сформированного байтами К1 и К2 в заголовке SONET, активируется APS-функция. В табл. 12.2 показана структура кадра (Kl, K2), формируемая по умолчанию. Код APS формируется с помощью бит этих двух байтов (Kl, K2).
Байты К1 и К2 для кольца могут быть либо в нейтральном состоянии, либо в состоянии включения. Если К1/К2 для кольца находятся в нейтральном состоянии, то они имеют следующий смысл:
К1 (биты 1-4) 0000 (код отсутствия запроса)
К1 (биты 5-8) идентификатор узла назначения (NODE ID) К2 (биты 1-4) идентификатор узла источника (NODE ID) К2 (бит 5) 0 (код короткого маршрута)
К2 (биты 6-8) 000 (код нейтрального состояния)
Когда байты для кольца находятся в состоянии переключения, то они имеют следующий смысл:
К1 (биты 1-4) (статус) код запроса на установление перемычки К1 (биты 5-8) идентификатор узла назначения (NODE ID)
К2 (биты 1-4) идентификатор узла источника (NODE ID)
К2 |
(бит 5) |
1/0 (код длинного/короткого маршрута) |
К2 |
(биты 6-8) |
статус-код (STATUS) |
Мы выбрали следующую схему группирования бит в байте К2. Эта схема соответствует общему критерию формирования байтов К1 и К2. Для примера показаны только данные байта К2.
Назначение бит байта К2
биты 1-4 указывают идентификатор того узла, который готовит запрос бит 5 указывает является ли код запроса на установление перемычки в байте
К1 (биты 1-4) кодом запроса на короткий (0) или длинный (1) маршрут биты 6-8 111 = линейный AIS (сигнал индикации аварийного состояния)
110 = линейный RDI (индикатор дефекта на удаленном конце) 101 = зарезервирован для последующего использования 100 = зарезервирован для последующего использования 011 = избыточный трафик (ЕТ) на резервном канале
010 = установлена перемычка и осуществлено переключение (Br&Sw)
001 = установлена перемычка (Вr)
000 = нейтральное состояние
Источник. Данные взяты из [12.7, 12.8].
12.4.4. Надежность и доступность защитного переключения
12.4.4.1. Тихий отказ
Не все отказы афишируются, т.е. приводят к генерации сигнала индикации аварийного состояния (аларма, AIS). Те отказы, которые не афишируются (не показываются как аварийные) системой защитного переключения, которая предохраняет от переключения на резервную линию, называются тихими отказами. Эти отказы, вместе с тем, вызывают перерыв сервиса и их регистрация важна. Могут существовать другие отказы резервных линий, генерирующие AIS, или ассоциированные с ними функции управления. Предполагается, что эти отказы будут оперативно скорректированы. Существуют три типа тихих отказов:
1. Отказы общего оборудования, который предохраняет от
переключения всех N сервисных каналов или рабочих линий в системе резервного переключения MXN.
2.Отказы оборудования, которые предохраняют от переключения данного сервисного канала или рабочей линии, но могут быть обнаружены путем завершения финальной стадии переключения.
3.Отказы оборудования, которые предохраняют от переключения данного сервисного канала или рабочей линии, но могут быть обнаружены без завершения финальной стадии переключения.
12.4.4.2. Имитация отказов
Имитация отказов для оборудования защитного переключения является формой профилактического обслуживания. Ее цель - обнаружить проблемы, возникающие при переключении, до того, как они вызовут отказ при переключении. Резервные переключатели проверяются на всех этапах переключения вплоть до финальной стадии. Telcordia, см. [12.6], утверждает, что в цифровых ВОСП отказов, вызванных тихими отказами, должно быть не более 10% от общего числа отказов.
При профилактике отказов применяются следующие правила:
1.Частота проверок должна устанавливаться пользователем.
2.Программа проверки должна включать проверку того, что передача сделана от начала до конца.
3.Программа проверки должна включать проверку того, что приемлемый сигнал обеспечивается до финального переключения передачи.
4.Система переключения должна прекращать программу проверки при отказе сервисной линии.
5.Если проверка переключения дала сбой, то локально должен быть выдан явный сигнал аварийного состояния, причем нужно иметь возможность отключать выдачу такого сигнала, как локально, так и дистанционно.
6.Если проверяющий имеет опцию завершения финальной стадии переключения, то нужно иметь возможность отключать такую опцию, как
локально, так и дистанционно.
7. Если отказ сервиса произошел в результате завершения финальной стадии переключения, то система должна вернуться к режиму нормального функционирования в течение 50 мс [12.6].
12.4.5. Варианты защиты линейных сегментов
12.4.5.1. Вариант защиты линии передачи (1+1)
В этом разделе мы покажем, что защита (1 + 1) очень эффективна для достижения полного резервирования. Этот тип резервирования обычно широко используется в кольцевой архитектуре. В основной конфигурации кольцевой архитектуры трафик от источника одновременно передается по обоим направлениям и решение о переключении между основной и резервной линиями принимается в месте назначения. В этой ситуации только потеря сигнала (LOS) или аналогичные AIS требуются для инициализации перехода на резерв, и не требуется никакой информации управления или команд, чтобы перейти между двумя этими состояниями. Предполагается, что после отказа основной линии, ремонтники восстановят ее работоспособность. Вместо того, чтобы вернуть отремонтированную линию назад в состояние «основной линии», она назначается как «новая резервная». Следовательно, имеет место прерывание только одной линии, и процесс ремонта/восстановления не требует второго перерыва сервиса.
Лучший способ конфигурирования 1 + 1 сервиса - расположить резервную линию географически удаленной от основной линии. Это позволяет минимизировать отказы общего типа. В силу простоты такого подхода, он обеспечивает наиболее быстрое восстановление с минимальными требованиями на осуществление сложного мониторинга и специального управляющего оборудования. Однако, это дорого и менее эффективно, с точки зрения использования оборудования, чем использование резервирования типа N+1. Это неэффективно, потому что резервное оборудование остается неиспользуемым практически все время, не принося
прибыли.
12.4.5.2. Защита типа N+1
Более эффективное использование резервного оборудования можно получить при использовании метода защиты линии передачи по схеме N+1. Этот метод можно рассматривать как расширение рассмотренного ранее метода 1+1. Учитывая высокую надежность современного оборудования, можно быть уверенным, что на одном маршруте не может случиться два одновременных отказа. Это дает возможность иметь только одну резервную линию на N работающих.
Защита линии передачи N+1 делает использование оборудования более эффективным экономически, но требует более сложного управления и не может предложить того же уровня доступности, как при использовании схемы защиты 1+1. Также трудно провести деление маршрутов на рабочие и резервные [12.8].
12.4.6. Самовосстанавливающееся кольцо (SHR) SONET
Самовосстанавливающееся кольцо SONET состоит из 4 или более сетевых элементов, связанных вместе в последовательность с помощью двух или четырех волокон. Начало и конец этой последовательности замыкаются, образуя кольцо. Сетевые элементы кольца SONET это мультиплексоры ввода/ вывода ADM, позволяющие организовать доступ к кольцу для источников PDH/SDH. Существует предел для числа мультиплексоров, которые могут быть соединены в кольцо. Это число обычно равно 16. Кольцо SHR технологии SONET уже было рассмотрено нами в гл. 9, разд. 9.2.6 и 9.2.7.
Существуют два принципиальных типа кольца SHR: кольцо с переключаемыми линиями и с переключаемыми маршрутами. В кольце с переключаемыми линиями входящий трафик направляется только в одном направлении вокруг кольца, до тех пор пока не произойдет защитное переключение
(неважно какого типа, 1+1 или N+1). Переключение координируется узлами на любой стороне кольца с помощью протокола сигнализации. Результирующая типовая (по умолчанию) конфигурация — двунаправленный поток трафика.
В кольце с переключаемыми маршрутами трафик ввода (для мультиплексоров ввода-вывода) всегда направляется по обоим направлениям вокруг кольца (конфигурация 1+1). Защитное переключение осуществляется селектором. Он выносит свое решение отдельно по каждому маршруту. Результирующая типовая (по умолчанию) конфигурация приводит к однонаправленному потоку трафика, но после того, как было активировано защитное переключение, трафик для некоторых соединений становится двунаправленным. Если используется безвозвратное переключение, то трафик остается двунаправленным.
12.4.6.1. Защитное переключение линейных сегментов в SHR
Кольцо SHR с переключаемыми линиями использует линейный уровень ОАМ индикации SONET для запуска механизма защитного переключения. Это переключение выполняется на линейном уровне для восстановления трафика после отказа, имевшего место на кольце. Оно не затрагивает маршрутный уровень ОАМ. Линейный уровень ОАМ включает дефекты линейного уровня, такие как LOF — потеря фрейма, и сигналы обслуживания, такие как AIS-L — сигналы индикации аварийного состояния на уровне линии. Между узлами происходит обмен сообщениями сигнализации, которые влияют на координированные действия защитных переключений на уровне линии.
12.4.6.2. Защитное переключение маршрута в SHR
Этот тип архитектуры SHR использует маршрутный уровень ОАМ индикации SONET для запуска механизма защитного переключения. Это переключение выполняется на маршрутном уровне STS или VT для

восстановления трафика после отказа на кольце. Оно не затрагивает линейный уровень ОАМ индикации. Маршрутный уровень ОАМ включает дефекты маршрутного уровня, такие как LOP-P — потеря указателя на уровне маршрута, и сигналы обслуживания, такие как AIS-P — сигналы индикации аварийного состояния на уровне маршрута. Переключение на каком-то определенном маршруте, не зависит от какого-то другого маршрутного статуса.
Рис. 12.1. Различие между однонаправленным (а) и двунаправленным (б) кольцами SONET. (ADM — мультиплексор ввода-вывода)
Здесь мы имеем дело с реализацией двойного однонаправленного кольца с переключаемыми маршрутами (UPSR) [12.10]. В этом типе SHR оба направления рабочего трафика между любым узлом кольца А и любым другим узлом кольца В распространяются по кольцу с одним волокном в том же направлении вокруг кольца, прибывая в пункты своего назначения по различным маршрутам. Это означает, что каждый из этих маршрутов проходит через различные узлы кольца. Второе кольцо переносит дубликат (копию) маршрутного сигнала в противоположном направлении вокруг того же