Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Оптические системы связи / 3_Volokonno-opticheskie_sistemy_svyazi_Friman_R

.pdf
Скачиваний:
141
Добавлен:
23.05.2015
Размер:
14.25 Mб
Скачать

функционирующей определенное и довольно большое (в процентном отношении) время. При расчете этого времени принимают во внимание вероятность отказа элемента, то, как быстро система может быть восстановлена после отказа элемента, и то, как быстро она может быть возвращена к нормальному сервису после катастрофического отказа.

12.1.1. Определения доступности и безотказности

Определим безотказность как понятие, характеризующее, насколько хорошо система может противостоять катастрофическим событиям. Мы имеем ввиду обрыв кабеля в одном месте. Тогда доступность будет означать процент от общего времени (например, длиной в год), в течение которого система работоспособна. Определим, формально, доступность, как «возможность для элемента выполнять требуемые функции в течении установленного периода времени (при определенных условиях, наложенных на надежность, ремонтопригодность и поддержку обслуживания), или как отношение времени безотказной работы к полному времени работы и обслуживания» [12.1]. Доступность обычно выражается в процентах (например, 99, 993%).

Другой термин, который мы будем использовать - недоступность. Если доступность определенной ВОСП равна 99,997, то чему равна недоступность? Это просто, она равна (1-доступность), т.е. в нашем случае, 1 - 99,997 = 0,003%. Если это недоступность, то что такое простой в расчете на год? Один год - это 8760 часов, 8760 0,00003 = 0,2628 часов или 15,768

минут.

Доступность часто выражается формулой:

А% = [MTBF/(MTBF + MTTR)] 100, (12.1)

где MTBF — время между отказами, измеренное в часах, a MTTR —

среднее время ремонта, измеренное в часах.

Следующий пример объясняет использование уравнения 12.1. Предположим, что MTBF некоторого волоконно-оптического усилителя (ВОУ) - 10000 часов и что MTTR равно 1 часу. Вычислим доступность ВОУ:

А% = [10000/(10000 + 1)] 100 = 99,990001%

MTBF является популярной мерой надежности. Другой мерой надежности является FIT, расшифровываемая, как «число отказов за определенный про-

межуток времени». Обычно это число отказов за 109 часов.

В формуле (12.1) наиболее трудным параметром для вычисления с большой степенью вероятности является MTTR. В MTTR включаются: а) время достижения места отказа, б) время поиска неисправностей: дефектной части, узла, карты. Время, требуемое технику-ремонтнику понять, где можно достать запасную карту для замены (в местном или центральном складе). Для центрального склада мы должны включить в MTTR время доставки карты в место отказа, время ее замены и тестирования, затем время восстановления сервиса на линии после ремонта.

Допустим, что нужной карты не было на центральном складе и она должна быть заказана у изготовителя. В этом случае потребуется день или даже неделя для ее доставки на нужное место.

Ниже мы рассмотрим MTBF, MTTR и доступность более подробно. Существует ряд путей сделать этот процесс более эффективным. Один

из них состоит в том, чтобы уменьшить номенклатуру используемых деталей, узлов, карт, 2) обеспечить избыточность на уровне схемотехники в тех местах, где имеется плохая статистика отказов. Нужно также использовать светодиодную индикацию или другие средства визуального контроля, показывающие линейные карты с цветовой индикацией (например, красным цветом) тех карт, которые требуют замены. Большинство из этих схем встроенного контроля (BITE) построено по типу «работает» — «не работает».

12.1.2. Безотказность и форс-мажорные обстоятельства

Большинство контрактов на установку систем написаны так, что включают параграф, описывающий «форс-мажорные обстоятельства». Форсмажор - легальный термин, означающий действие стихийных сил природы, которые могут представлять лесной пожар, ураган, землетрясение,

извержение вулкана, наводнение, лавину. Эти жестокие возмущения могут разрушить ВОСП на большом участке. Подобные разрушения могут потребовать недели и месяцы для их полной ликвидации и восстановления работоспособности системы. Многие аспекты требуют анализа доступности системы, но все они допускают форс-мажорные обстоятельства. Другими словами, при вычислении доступности системы мы не должны учитывать выход системы из строя из-за форс-мажорных обстоятельств. Это одно из любимых «выходов из строя» для подрядчика, так как такие гибельные для системы условия не могут быть предсказаны.

Существуют много действий, которые подрядчик может предпринять либо изучая действие форс мажорных событий, либо устраняя результаты разрушений. Кабель, зарытый в землю может противостоять этим событиям лучше, чем кабель, подвешенный на опорах. Но даже в этом случае кабельные колодцы должны иметь резервные петли для устранения излишнего натяжения кабеля. Это особенно необходимо в случае устранения последствий землетрясения. Для устранения таких последствий могут быть использованы и другие меры. В комнатах, где установлено оборудование, или в удаленных аппаратных, стойки монтируются к полу и потолку, используя резиновые или эластичные крепления для гашения толчков. Эти помещения сами по себе должны быть сделаны устойчивыми к землетрясениям.

Другой важной мерой является добавление специальных механических креплений при пересечении водных преград для предотвращения последствий весенних паводков, наводнений и движений ледяных масс. Прокладчики ВОЛС должны укладывать кабель в траншею или кабелеукладчиком с плугом на высоких местах, где нельзя ожидать наводнений.

12.1.3. Определение отказа канала

Стандарт Telcordia TSGR [12.6] так определяет выход канала из строя (отказ): «Канал цифровой передачи считается недоступным, или в

находящимся в состоянии простоя, если его показатели ошибок падают ниже заданного порога и остаются ниже этого порога в течении некоторого времени». Это определение основано на рекомендации ITU-T G.821 (см. также G.826), которая частично цитируется ниже:

Период времени недоступности начинается тогда, когда коэффициент битовых ошибок (BER) в каждой секунде хуже, чем 10-3, для периода в 10 последовательных секунд. Эти 10 секунд включаются в период времени недоступности.

Время недоступности начинается с первой секунды с серьезными ошибками (SES) в передаваемой последовательности. В дополнении к этому:

Период времени недоступности заканчивается тогда, когда коэффициент битовых ошибок (BER) в каждой секунде лучше, чем 10-3, для периода в 10 последовательных секунд. Эти 10 секунд включаются в период времени доступности.

Время доступности начинается с первой секунды в передаваемой последовательности, в которой нет ошибок. Следовательно, недоступность, или время простоя канала, начинается тогда, когда наблюдается первая из 10

последовательных секунд с серьезными ошибками, после последовательности, где такие ошибки отсутствовали. SES — является секундой, в которой BER > 10-3. Эти определения относятся ко всем случаям деградации, влияющим на показатели ошибок канала, включая отказ (незащищенных) каналов и другие факторы, вносящие свой вклад в ухудшение показателей [12.6].

12.1.4. Показатели доступности короткой секции (Telcordia)

Для короткой секции Telcordia устанавливает показатели доступности на уровне 99,98% (недоступность - 0,02%) в 400 км двусторонней широкополосной линии. Будучи переведенными во время простоя, эти показатели дают 105 минут в год. Для систем с протяженностью меньше 400 км время простоя сокращается линейно с коэффициентом 0,26 мин/год/км.

Для конфигурации DS3 показатели доступности для интерфейсов DSX- 3-DSX-3 принимаются равными 0,75 от указанных для канала DS1: 79 мин/ год/В83 канал для систем с 400 км трактом.

Для конфигураций систем с длиной тракта короче, чем 400 км, время простоя уменьшается линейно с коэффициентом 0,2 мин/год/км. Из них 75% отводится на среду передачи и 25% — на терминалы и регенераторы.

12.1.5. Ссылки на стандарты по надежности электронного оборудования и систем

Среди специалистов по надежности существуют три приемлемые ссылки. Они включают MIL-STD-217E [12.2] и Telcordia TR-332 [12.3], если вопросы касаются надежности оборудования, и GR-929-CORE [12.4], если вопросы касаются измерений надежности/доступности телекоммуникационных систем. Для ВОСП они включают также ITU-T G.911 [12.5].

12.1.6. Основные требования для систем передачи (TSGR): оценка надежности оборудования

Существуют три приемлемых метода вычисления надежности оборудования:

Метод I относится к методам «суммирования показателей составляющих частей», когда оценка интенсивности отказов всего оборудования равна сумме интенсивностей отказов составляющих его частей. При этом могут быть использованы различные уровни нагрузки (см. MIL-STD-217E [12.2]). Они называются у Telcordia коэффициентами качества устройств. Интенсивности отказов приборов могут меняться при изменении температурных условий и факторов, вызванных электрической нагрузкой. Если фактические рабочая температура устройства и уровни нагрузки прибора неизвестны, то предполагается, что приборы работают при 40°С и 50% номинальной электрической нагрузке. Фактор окружающей

среды применяется к показателю интенсивности отказов блока в случае, если он применяется в условиях окружающей среды, отличных от стандартных.

Метод II объединяет данные, полученные при лабораторном тестировании с тем, что дают оценки по методу I. Интенсивность отказов вычисляется как взвешенное среднее измеренной интенсивности отказов и суммы известных интенсивностей отказов составляющих частей, при условии, что весовой коэффициент определяется уровнем доверия к лабораторным данным. Программа оценки надежности (RPP) дает информацию типа: «сколько устройств или блоков нужно тестировать», «как долго должно проходить тестирование» и «как они должны тестироваться».

Метод III основан на статистических оценках фактических, полученных в процессе эксплуатации, данных программы исследования надежности. Такие параметры, которые существенны для оценки интенсивности отказов тщательно контролируются в этой программе, результат зависит от опыта в оценке надежности тех, кто фактически оперирует оборудованием в условиях естественной эксплуатации. Эти параметры включают число изучаемых блоков, число блоков получивших отказ, временной интервал, в течение которого исследовался каждый блок, и оценку статистической точности той оценки, которая получена для интенсивности отказов. Как можно ожидать, исследуемые образцы и окружающая среда должны соответствовать продукту, находящемуся в эксплуатации. Если этого нельзя воспроизвести, то нужно использовать аналитический подход для достижения необходимой коррекции. В процессе анализа/изучения должен учитываться каждый исследуемый блок. Если зафиксирован отказ, то нужно быть внимательным при подтверждении каждого такого отказа. Нужно делать различие между блоками дефектными изначально, блоками, отказавшими в начале срока службы, и блоками с большим сроком службы, отказавшими во время эксплуатации. Мы должны быть также уверены, что были зарегистрированы все случаи отказов.

Следует использовать рекомендацию ITU-T G.911 [12.5] для

вычисления доступности ВОСП. Однако, наш подход ниже в значительной степени упрощен. Он описан в следующих разделах.

12.2. Взаимосвязь показателей надежности

FIT — это сокращение от Failure In Time - число отказов за определенное время. Оно определяется числом отказов за 109 часов. Для того, чтобы получить из него число отказов за 106 часов, достаточно умножить на 10-3. В большинстве работ для интенсивности отказов блоков, устройств или систем в целом используется обозначение . Если мы измеряем , как число отказов за миллион часов, то нам достаточно взять обратную величину, чтобы получить эквивалент величины MTBF. Если устройства соединены последовательно, то интенсивность отказов такой конфигурации равна сумме интенсивностей отказов составляющих ее устройств.

Если интенсивность отказов измеряется в FIT (F), то MTBF (M) равна М = (1,14 105)/F, (12.2)

где М измеряется в годах на отказ.

Первый пример, требуется вычислить MTBF схемного модуля. Суммируем интенсивности отказов каждого из составляющих его элементов. Пусть он состоит из:

1

интегрированного узла

FIT/элемент = 1500

всего в FIT = 1500 1 = 1500

6

интегральных схем

FIT/элемент = 300

всего в FIT = 300 6

= 1800

5

резисторов

FIT/элемент = 123

всего в FIT = 123 5

= 615

8

конденсаторов

FIT/элемент = 57

всего в FIT = 57 8 = 456

1

разъем

FIT/элемент = 27

всего в FIT = 27 1 = 27

1

РСВ (печатная плата)

FIT/элемент = 27

всего в FIT = 27 1

= 27

итого 4425 FIT

Следовательно, для схемного модуля MTBF = 1,14 105/4425 = 25,76

лет.

Второй пример, серия простых вычислений показателей для ВОСП. Снова суммируем интенсивность отказов для каждого из подключенных сетевых элементов (и другого оборудования, которое не входит в их состав), из которых составлена ВОСП. Для этого примера имеем:

6

канальных модулей

FIT/элемент = 8000

всего в FIT = 8000 6

= 48000

5

источников питания

FIT/элемент = 6500

всего в FIT = 6500 5

= 32500

5

регенераторов

FIT/элемент = 12050

всего в FIT = 12050 5 = 60250

1

плата микропроцессоров FIT/элемент = 12300

всего в FIT = 12300 1 = 12300

1

плата мониторинга

FIT/элемент = 3400

всего в FIT = 3400 1

= 3400

итого 156450 FIT

Следовательно, для системного MTBF = 1,14 105/156450 = 0,7286673

лет = 6383 часа.

Предположим, мы решили, что 6383 часа — это недостаточная надежность. Что можно сделать в этом случае? Один из вариантов — добавить полную резервную линию. Если мы сделаем это с использованием защитного переключения, то можно возвести в квадрат значение MTBF. Это даст надежность в 40 744 292 часа, что выглядит вполне приемлемо.

Другой, более экономичный подход, перевести устройство с худшим значением интенсивности отказов в схему с дублированием 1+1. В нашем случае это системные регенераторы, их всего пять, причем для каждого из них FIT равен 12050. Не погружаясь в сложности Марковских цепей и стохастических процессов, преобразуем FIT в MTBF, возведем вычисленное значение в квадрат, а затем вычислим эквивалентное значение FIT.

Вычислим эквивалентное MTBF для FIT = 12050. MTBF = 109 час/FIT = 109/12050 = 82987 час

(82987 час)2 = 6,886933765 109 час F = 109/6,8869 109 = 1/6,8869 = 0,1452

Пересчитаем MTBF с учетом резервирования регенераторов, подставляя 5 0,1452 в качестве значения, используемого для регенераторов. Общее FIT для системы уменьшится до величины 96201. С учетом этого,

новое значение MTBF будет равно:

MTBF = (1,14 105)/96201 = 1,1875 года.

Это значение немного лучше того, что было раньше.

Если MTBF измеряется в часах и мы хотим сконвертировать это значение в FIT, то

FIT = 109/MTBF.

(12.3)

Если же интенсивность отказов задана в FIT и мы хотим получить

эквивалентное значение MTBF, измеренное в часах, то

 

MTBF = 109 / FIT (час).

(12.4)

Помните, что в году 8760 часов (24 365).

 

12.3. Вычисление доступности системы

При наших вычислениях доступности системы, перерывы, вызванные форс-мажорными обстоятельствами, не включаются в период времени простоя системы.

12.3.1. Доступность и недоступность

Предположим, что для какой-то ВОСП доступность принята равной 99,0%. Это значит, что на отрезке длиной в год система будет работоспособной, удовлетворяющей требованиям по BER, в течение 0,99 8760 = 8672,4 часа. Что же касается оставшейся части года, 8760— 8672,4 = 87,6 часов, то в это время можно ожидать, что система не будет удовлетворять требованиям BER, т.е. будет неработоспособной, или недоступной. То есть 87,6 часа представляют системную недоступность. Если мы представим, что А — это доступность, a U — недоступность, то, зная одно из них, мы можем вычислить другое, а именно:

U = 1 - A. (12.5)

Например, если недоступность равна 0, 01%, чему равна эквивалентная

доступность? Преобразуя проценты в десятичную дробь, получим 0,0001, тогда

0,0001 = 1 - А, А=1- 0,0001 = 0, 9999, или 99,99%

Стандартное выражение для доступности имеет вид, см. выражение

(12.1):

А% = [MTBF/(MTBF + MTTR)] 100

Предположим, что показатель MTBF терминального мультиплексора равен 50000 FIT, или 109/5 104 = 20000 часов и мы изменяем значение MTTR, полагая его равным 30 мин, 1, 2, 4, 6, 8 и 10 час, тогда значение доступности будет таким, как это указано в табл. 12.1.

Таблица 12.1 Изменение доступности при изменении MTTR и постоянном MTBF = 20000.

MTTR (часы)

Доступность, %

 

 

Комментарий

 

 

 

 

 

0,5

99,9975

Готовность ремонтников 24 часа/день, запасные части

 

 

— немедленно, установлена продвинутая

система

 

 

ВIТЕа)

 

 

 

 

 

1,0

99,9950

Готовность ремонтников 24 часа/день, запасные части

 

 

- немедленно, хорошая ремонтопригодностьб)

 

2,0

99,9900

Значение,

рекомендованное

TSRG

для

 

 

обслуживаемых

узлов,

таких

как

центры

 

 

коммутациив)

 

 

 

 

 

4,0

99,9800

Значение,

рекомендованное

TSRG

для

 

 

необслуживаемых узлов, допускается 3 часа на

6,0

99,9700

дорогу к узлув)

 

 

 

 

 

 

 

 

 

 

 

8,0

99,9600

 

 

 

 

 

 

10,0

99,9500

 

 

 

 

 

 

а) BITE (Built-in Test Equipment) - встроенное оборудование для тестирования. Это означает, что есть сигнализация типа «работает», «не работает», позволяющая ремонтникам свести проблему ремонта к замене карты (платы). Эта сигнализация может быть удаленной (на центральной системе управления). Другое усовершенствование может касаться фронтального доступа ко всем точкам тестирования.

б) MTTR = 1 часу, что дает (по сравнению с 30 мин) больше времени на поиск неисправности. Можно предположить, что уровень ремонтопригодности меньше, чем в предыдущем случае.

в) TSGR (Transport System Generic Requirements) - Основные требования к транспортным системам (стандарт Telcordia [12.6]). Этот документ устанавливает 2 часа недоступности для центров коммутации, включая оборудование передачи, установленное в том же здании, что и коммутаторы. MTTR устанавливается равным 4 часам для другого удаленного оборудования. Для ВОСП это могут быть мультиплексоры ADM, питающие телефонный узел, регенератор, оптический усилитель, который находится на кабельной линии.