
- •IP ТЕЛЕФОНИЯ
- •Содержание
- •Предисловие
- •Глава 1 Конвергенция сетей связи
- •1.1 Пропорции в телекоммуникациях
- •1.3 Транспортные технологии пакетной коммутации
- •1.5.1 Построение сети по рекомендации H.323
- •1.5.2 Сеть на базе протокола SIP
- •1.5.3 Сеть на базе MGCP и MEGACO
- •2.1 Три основных сценария IP телефонии
- •2.2 Проект TIPHON
- •2.3 Установление телефонного соединения в IP сети
- •2.4 Эффективность IP телефонии
- •3.1.1 Задержки
- •3.1.3 Устройства ограничения эффектов эха
- •3.2 Принципы кодирования речи
- •3.2.1 Кодирование формы сигнала
- •3.2.2 Кодеры исходной информации (вокодеры) и гибридные алгоритмы
- •3.2.4 Основные алгоритмы кодирования речи, используемые в IP телефонии
- •3.3.1 Кодек G.711
- •3.3.2 Кодек G.723.1
- •3.3.3 Кодек G.726
- •3.3.4 Кодек G.728
- •3.3.5 Кодек G.729
- •3.5 Передача сигналов DTMF
- •3.6 Передача факсимильной информации
- •Глава 4 Протоколы сети Интернет
- •4.1 Интернет ab ovo
- •4.2 Стандарты в сфере Интернет
- •4.3 Адресация
- •4.4 Уровни архитектуры Интернет
- •4.5 Протокол IP версии 4
- •4.6 Протокол IP версии 6
- •4.7 Протокол TCP
- •4.7.1 Потоки, стек протоколов, механизм портов и мультиплексирование
- •4.7.3 Механизмы обеспечения достоверности
- •4.7.4 Механизм управления потоком данных
- •4.7.5 Состав и назначение полей заголовка
- •4.8 Протокол UDP
- •4.10 Протоколы RTP и RTCP
- •4.11 Многоадресная рассылка

Глава 3 Передача речи по IP сетям
3.1Особенности передачи речевой информации по IP – сетям
Если проблемы ограничения задержки и подавления эха в тради ционной телефонии существовали всегда, а при переходе к IP сетям лишь усугубились, то потери информации (пакетов) и стохастический характер задержки породили совершенно новые проблемы, реше ние которых сопряжено с большими трудностями. Этим объясняет ся тот факт, что понадобился длительный период развития сетевых технологий, прежде чем появились коммерческие приложения IP те лефонии, хотя, справедливости ради, нужно отметить, что трудно назвать другую телекоммуникационную технологию, которая смогла «повзрослеть» столь же быстро.
3.1.1 Задержки
При передаче речи по IP сети возникают намного большие, чем в ТфОП, задержки, которые, к тому же, изменяются случайным обра зом. Этот факт представляет собой проблему и сам по себе, но кро ме того, усложняет обсуждаемую далее в этой главе проблему эха. Задержка (или время запаздывания) определяется как промежуток времени, затрачиваемый на то, чтобы речевой сигнал прошел рас стояние от говорящего до слушающего. Покажем, что и как оказыва ет влияние на количественные характеристики этого промежутка времени.
68 |
Глава 3 |
|
|
Влияние сети
Во первых, неустойчиво и плохо предсказуемо время прохожде ния пакета через сеть. Если нагрузка сети относительно мала, мар шрутизаторы и коммутаторы, безусловно, могут обрабатывать па кеты практически мгновенно, а линии связи бывают доступны почти всегда. Если загрузка сети относительно велика, пакеты могут до вольно долго ожидать обслуживания в очередях. Чем больше мар шрутизаторов, коммутаторов и линий в маршруте, по которому про ходит пакет, тем больше время его запаздывания, и тем больше ва риация этого времени, т.е. джиттер. В главе 10, посвященной каче ству обслуживания (QoS), будет показано, каким образом и с исполь зованием каких протоколов и алгоритмов следует строить сети, что бы минимизировать задержки и их джиттер.
Влияние операционной системы
Большинство приложений IP телефонии (особенно клиентских) представляет собой обычные программы, выполняемые в среде ка кой либо операционной системы, такой как Windows или Linux. Эти программы обращаются к периферийным устройствам (платам об работки речевых сигналов, специализированным платам систем сиг нализации) через интерфейс прикладных программ для взаимодей ствия с драйверами этих устройств, а доступ к IP сети осуществля ют через Socket интерфейс.
Большинство операционных систем не может контролировать распределение времени центрального процессора между разными процессами с точностью, превышающей несколько десятков милли секунд, и не может обрабатывать за такое же время более одного прерывания от внешних устройств. Это приводит к тому, что задерж ка в продвижении данных между сетевым интерфейсом и внешним устройством речевого вывода составляет, независимо от используе мого алгоритма кодирования речи, величину такого же порядка, или даже больше.
Из сказанного следует, что выбор операционной системы являет ся важным фактором, влияющим на общую величину задержки. Что бы минимизировать влияние операционной системы, некоторые про изводители шлюзов и IP телефонов используют так называемые ОС реального времени (VxWorks, pSOS, QNX Neutrino и т.д.), которые используют более сложные механизмы разделения времени процес сора, действующие таким образом, чтобы обеспечивать значитель но более быструю реакцию на прерывания и более эффективный обмен потоками данных между процессами.
Другой, более плодотворный подход – переложить все функции, которые необходимо выполнять в жестких временных рамках (обмен данными между речевыми кодеками и сетевым интерфейсом, под

Передача речи по IP сетям |
69 |
|
|
держку RTP и т.д.), на отдельный быстродействующий специализи рованный процессор. При этом пересылка речевых данных осуще ствляется через выделенный сетевой интерфейс периферийного устройства, а операционная система рабочей станции поддержива ет только алгоритмы управления соединениями и протоколы сигна лизации, т.е. задачи, для выполнения которых жестких временных рамок не требуется. Этот подход реализован в платах для приложе ний IP телефонии, производимых фирмами Dialogic, Audiocodes, Natural Microsystems. По такой же технологии выполнен и шлюз IP те лефонии в платформе Протей IP что позволило обеспечить высокое качество передачи речи.
Влияние джиттер буфера
Проблема джиттера весьма существенна в пакетно ориентиро ванных сетях. Отправитель речевых пакетов передает их через фик сированные промежутки времени (например, через каждые 20 мс), но при прохождении через сеть задержки пакетов оказываются не одинаковыми, так что они прибывают в пункт назначения через раз ные промежутки времени. Это иллюстрирует рис. 3.1.
|
|
Сеть IP телефонии |
|
|
|
Шлюз |
Шлюз |
|
|
отправитель |
получатель |
|
ТфОП |
|
Интернет |
|
|
ТфОП |
|
A |
B |
C |
Отправитель передает |
|
|||
|
|
|
t |
|
A |
|
B |
|
C |
Получатель принимает |
|
|
|
|
|
|
|
|
|
T1 |
|
T2 = T1 |
|
T3 = T2 |
|
t |
|
|
|
|
|
|
|
|
|
Рис. 3.1 Различие интервалов между моментами прибытия пакетов (джиттер)
Задержка прохождения пакетов по сети Т может быть представ
лена как сумма постоянной составляющей T (время распростране
ния плюс средняя длительность задержки в очередях) и переменной величины j, являющейся результатом джиттера: Т = T ± j .
Для того, чтобы компенсировать влияние джиттера, в терминалах используется т.н. джиттер буфер. Этот буфер хранит в памяти при
70 |
Глава 3 |
|
|
бывшие пакеты в течение времени, определяемого его емкостью (длиной). Пакеты, прибывающие слишком поздно, когда буфер за полнен, отбрасываются. Интервалы между пакетами восстанавлива ются на основе значений временных меток RTP пакетов. В функции джиттер буфера обычно входит и восстановление исходной очеред ности следования пакетов, если при транспортировке по сети они оказались «перепутаны».
Слишком короткий буфер будет приводить к слишком частым по терям «опоздавших» пакетов, а слишком длинный – к неприемлемо большой дополнительной задержке. Обычно предусматривается динамическая подстройка длины буфера в течение всего времени существования соединения. Для выбора наилучшей длины исполь зуются эвристические алгоритмы.
Влияние кодека и количества передаваемых в пакете кадров
Большинство современных эффективных алгоритмов кодирова ния/декодирования речи ориентировано на передачу информации кадрами, а не последовательностью кодов отдельных отсчетов. По этому в течение времени, определяемого длиной кадра кодека, долж на накапливаться определенной длины последовательность цифроых представлений отсчетов. Кроме того, некоторым кодекам необходим предварительный анализ большего количества речевой информации, чем должно содержаться в кадре. Это неизбежное время накопле ния и предварительного анализа входит в общий бюджет длительно сти задержки пакета.
На первый взгляд, можно было бы заключить, что чем меньше дли на кадра, тем меньше должна быть задержка. Однако, как будет по казано ниже, из за значительного объема служебной информации, передаваемой в RTP/UDP/IP пакетах, передача маленьких порций данных очень неэффективна, так что при применении кодеков с ма лой длиной кадра приходится упаковывать несколько кадров в один пакет. Кроме того, кодеки с большей длиной кадра более эффектив ны, поскольку могут «наблюдать» сигнал в течение большего време ни и, следовательно, могут более эффективно моделировать этот сигнал.
ITU T в рекомендации G.114 определил требования к качеству передачи речи. Оно считается хорошим, если сквозная задержка при передаче сигнала в одну сторону не превышает 150 мс (рис. 3.2). Современное оборудование IP телефонии при включении «спина к спине» (два устройства – шлюза – соединяются напрямую) вносит задержку порядка 60 70 мс. Таким образом, остается еще около 90 мс на сетевую задержку при передаче IP пакета от отправителя к пункту назначения, что говорит о возможности обеспечить при современ ном уровне технологии передачу речи с достаточно хорошим каче ством.

Передача речи по IP сетям |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
71 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
Задержка при передаче через спутник |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задержка |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задержка при факсимильной |
|
|
|
|
||||||||||||||
|
|
при высокое |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и широковещательной передаче |
|
|
|
|
|||||||||||||||||
|
|
качестве речи |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
100 |
|
200 |
|
300 |
400 |
500 |
600 |
700 |
|
800 |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Время (мс) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Приемлемое время задержки
Рис. 3.2 Задержка при передаче
Авторам отнюдь не хотелось бы, чтобы у читателя сложилось впе чатление, будто временные задержки – проблема исключительно IP телефонии. Именно поэтому на рис. 3.2 приведены также харак теристики спутниковой передачи, при которой требуется примерно 250 мс для того, чтобы сигнал достиг спутника и вернулся обратно к Земле (без учета затрат времени на обработку сигнала). Таким об разом, полное время задержки превышает 250 300мс. Согласно ре комендации G.114, такая задержка выходит за границы диапазона, приемлемого для передачи речи. Тем не менее, ежедневно значи тельное количество разговоров ведется по спутниковым линиям свя зи. Следовательно, приемлемое качество речи определяется, преж де всего, требованиями пользователей.
3.1.2 Эхо
Феномен эха вызывает затруднения при разговоре и у говоряще го, и у слушающего. Говорящий слышит с определенной задержкой свой собственный голос. Если сигнал отражается дважды, то слушаю щий дважды слышит речь говорящего (второй раз – с ослаблением и задержкой).
Эхо может иметь электрическую и акустическую природу.
ОтражениявдифсистемеявляютсянеотъемлемымсвойствомТфОП. Поэтому они проявляются при взаимодействии ТфОП и IP сетей.
С целью экономии кабеля в ТфОП для подключения абонентских терминалов с давних пор используются двухпроводные линии, по которым речевые сигналы передаются в обоих направлениях. Более того, во многих телефонных сетях передача сигналов обоих направ лений по двум проводам используется и в соединительных линиях между электромеханическими АТС [6] (хотя теперь для организации связи между АТС всё чаще используется раздельная передача сиг налов разных направлений, т.е. четырехпроводная схема их переда чи). Для разделения сигналов разных направлений в терминалах або нентов (телефонных аппаратах) и на АТС применяются простые мос товые схемы, называемые дифсистемами (hybrid). Работа этих мос