Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Задания к лабам / 3 / 03-Lit / __Ещё2__ / И звукам не тесно, и мыслям просторно

.htm
Скачиваний:
70
Добавлен:
16.04.2013
Размер:
41.07 Кб
Скачать

И звукам не тесно, и мыслям просторно 6'96

И звукам не тесно, и мыслям просторно Александр Новосельский Алгоритмы сжати информации ИКМ и связанные с ней методы сжатия информации Клиппирование речевого сигнала Статистическое уплотнение Избыточность речевого сигнала

Принцип действи вокодера Образование речевого сигнала Принципы построени вокодеров с линейным предсказанием Виды вокодеров Литература

Еще никогда в истории по каналам связи не передавалось так много информации, как сегодня. Как эффективно передать самый естественный сигнал - речь? Как защитить его от перехвата?

Алгоритмы сжати информации     С возникновением электрической связи ученые и инженеры начали неустанный поиск способов компактного представления данных, то есть хранения и передачи информации меньшим потоком цифровых данных или в более узком частотном диапазоне. Весьма важное место в технике связи занимает передача речи. Поэтому понятно стремление представить речь в возможно более компактной форме. Сформировался термин "компандирование речевых сигналов", т. е. КОМпрессия/эксПАНДИрование - сжатие/расширение.

    Существующие алгоритмы сжати информации можно разделить на две большие группы: 1) алгоритмы сжатия без потерь: алгоритм Лемпеля-Зива (Lempel-Ziv, LZ);

RLE (Run Length Encoding);

кодирование Хаффмена (Huffman Encoding);

2) алгоритмы сжатия с потерями: JPEG (Joint Photographic Expert Group);

M-JPEG;

MPEG (Motion Picture Expert Group).

    Алгоритм Лемпеля-Зива лежит в основе архиваторов (pkzip, arj, lha) и программ динамического сжатия дисков (Stacker, DoubleSpace).

    Основная идея: второе и последующие вхождения некоторой строки символов в сообщение заменяются ссылкой на ее первое появление в сообщении. Применяются варианты LZ77, LZSS, LZW (файлы формата GIF, TIFF), BTLZ (Рекомендация МККТТ V.42bis). Используется для сжатия текстов и графики.

    RLE применяется для сжатия графики (файлы формата PCX) и видео. Последовательность одинаковых символов заменяется 2 байтами. В первом байте - символ, во втором - счетчик, то есть число, которое показывает, сколько таких символов идет подряд.

    Кодирование Хаффмена состоит в замене информационных символов кодовыми последовательностями различной длины. Чем чаще используется символ, тем короче кодова последовательность. Aналогично построена азбука Морзе. К примеру, наиболее часто встречаетс латинская буква "е", которая передаетс одной точкой.

    JPEG ориентирован на сжатие неподвижных изображений. Он базируется на дискретном косинусном преобразовании (ДКП) неподвижного изображения, отбрасывании малых высокочастотных компонентов получаемого спектра и последующем энтропийном сжатии полученных данных.

    M-JPEG - алгоритм для компрессии видео, в котором каждый отдельный кадр сжимается по методу JPEG.

    MPEG ориентирован на обработку видео. При формировании потока данных исходят из предположения о том, что два соседних кадра в видеопоследовательности мало отличаются. Опорные кадры сжимают по методу JPEG и

передают относительно редко. В основном передаются изменения между соседними кадрами.

    Из приведенного краткого обзора алгоритмов сжатия очевидны два соображения: нет алгоритма, одинаково эффективного для данных разной природы;

приведенные алгоритмы рассчитаны на сжатие данных, в которых есть последовательности одинаковых символов или одни символы встречаются чаще других.

    Оцифрованный звук плохо поддаетс алгоритмам сжатия без потерь.

Очевидно, что для сжатия речи в виде цифрового или аналогового сигнала надо применять алгоритмы сжатия с потерями, которые могут быть приемлемы. Наибольшее распространение получили:

применение вместо линейной импульсно-кодовой модуляции (ИКМ) логарифмической (то есть с компандированием по А- и мю-закону), адаптивной ИКМ (АИКМ), дифференциальной ИКМ (ДИКМ), адаптивной дифференциальной ИКМ (АДИКМ), адаптивной дельта-модуляции (АДМ);

клиппирование речевого сигнала;

статистическое уплотнение;

применение вокодеров (устройств дл сжатия, кодирования и передачи речи).

    Применяются также и алгоритмы сжатия без потери информации: сжатие за счет пауз в сигнале (паузы удаляются из исходного сигнала, а их длительность запоминается);

при хранении и передаче музыки вместо оцифрованного звука - использование информации о том, какие ноты, когда и на каком инструменте нужно исполнять (интерфейс MIDI).

    Разумеется, все эти алгоритмы можно реализовать и аппаратно, и программно. Первый пункт списка - варианты преобразовани аналогового сигнала в цифровой, то есть применяется ИКМ и ее ближайшие "родственники" - АИКМ, ДИКМ, АДМ, АДИКМ. Некоторые уже известны читателям журнала (см. "Компьютеры + Программы" 1'96, С. 66 - 69), а подробнее - в [1, 2, 5]. Поэтому, ограничившись напоминанием связанных с ИКМ

способов компрессии, основное внимание уделим другим пунктам списка. ИКМ и связанные с ней методы сжатия информации     Компандирование дл оцифровки телефонного сигнала описано в Рекомендациях МККТТ (Международный консультативный комитет по телефонии и телеграфии, CCITT) G.711 и G.712 для A- и мю-законов: частота дискретизации 8000 Гц;

число двоичных разрядов на отсчет 8;

скорость передачи 64000 бит/c.

    Оно рассчитано на мгновенный охват всего динамического диапазона для каждого квантуемого отсчета. Поэтому его называют мгновенным компандированием.

    Из различных систем АИКМ наибольшее распространение получила система блочной ИКМ (БИКМ), которую часто называют системой с почти мгновенным компандированием (NIC - Near Instantaneous Companding) [1].

    Отсчеты n-разрядного АЦП разбивают на блоки по N отсчетов (см. рис. 1). В каждом блоке находят отсчет с максимальным для данного блока уровнем (на рис. 1 это второй отсчет сверху). Этому уровню соответствует определенный номер старшего ЗНАЧАЩЕГО разряда (j), и все старшие разряды в комбинациях этого блока будут нулевыми (заштрихованы). Записанный в двоичном коде номер этого разряда образует масштабную информацию, которая из-за своей важности, как правило, защищается помехоустойчивым кодом. В результате масштабная информация вместе с проверочными символами образует m-значную комбинацию, которую добавляют к основной информации.     Основная же информаци формируется выбором k разрядов из n исходных разрядов, причем первым (старшим) разрядом является разряд с номером, описанным в масштабной информации.

    Основная информация для каждого из блоков объединяется с масштабной в единый цифровой поток. Результирующая скорость цифрового потока на выходе системы БИКМ R = fд (k + m/N), где fд - частота дискретизации. Используют следующие параметры: fд = 8 кГц

n = 10...13

k = 6... 8

N = 8...16

m = 6... 8     При одинаковых условиях передачи БИКМ дает лучшее качество чем ИКМ. Поэтому можно снизить скорость передачи до 32-56 кбит/с.

    При дифференциальной (разностной) ИКМ (ДИКМ, Differencial PCM, DPCM) вместо кодирования отсчетов кодируются разности между соседними отсчетами. Обычно разности отсчетов меньше самих отсчетов. Скорость передачи цифрового потока снижается до 48-56 кбит/c. В системах с логарифмической ДИКМ используют А- и мю-законы компандирования дл реализации неравномерного квантования.

    Адаптивная ДИКМ (АДИКМ, Adaptive Differencial PCM, ADPCM) - система ДИКМ с адаптацией квантователя (АЦП и ЦАП) и предсказателя. При АДИКМ оцифровываетс не сам сигнал, а его отклонение от предсказанного значения (сигнал ошибки, ошибка предсказания). Применяются следующие разновидности АДИКМ: Рекомендация G.721 МККТТ (скорость передачи 32 кбит/c);

Рекомендация G.722 МККТТ (fд = 16 000 Гц);

Рекомендация G.723 МККТТ (скорость передачи 24 кбит/c);

Creative ADPCM (4, 2,6 или 2 бита на отсчет);

IMA/DVI ADPCM (4, 3 или 2 бита на отсчет);

Microsoft ADPCM.

    В компакт-дисках типа CD-I (Interactive) звук кодируется с использованием АДИКМ Level A (fд = 37 800 Гц, 8 бит на отсчет)

Level B (fд = 37 800 Гц, 4 бит на отсчет)

Level C (fд = 18 900 Гц, 4 бит на отсчет)

    Дельта-модуляция (ДМ, Delta Modulation, DM) - при выбранном приращении передаютс сведения только о его знаке. Для этого достаточно передавать 1 бит в каждый момент отсчета. ДМ можно рассматривать как частный случай ДИКМ, при котором ошибка предсказания квантуется только на 2 уровня. Кодек (то есть КОдер/ДЕКодер) ДМ реализуется довольно просто.

    Использование одного разряда дл представления ошибки предсказания приводит к специфическим особенностям (рис. 2.): при кодировании сигналов постоянного уровня аппроксимирующий сигнал "скачет" относительно кодируемого уровня (гранулярный шум);

при кодировании быстроизменяющихс сигналов появляются ошибки, обусловленные невозможностью изменения аппроксимирующего сигнала более, чем на один шаг квантовани (перегрузка по крутизне).

Рис. 2. Специфические ошибки ДМ-кодека     При одинаковых шумах квантования тактовая частота или скорость цифрового потока для ДМ будет больше, чем для ИКМ. Поэтому классическая ДМ практически не используется, а применяются ее разновидности: ДМ с задержкой,

дельта-сигма-модуляция (ДСМ),

ДМ с двойным интегрированием.

    При использовании адаптивной ДМ на основе анализа передаваемой информации меняют шаг квантования. Например, в ДМ с непрерывно изменяющейся крутизной (continuousely variable slope) информация о размере

шага квантования в кодере и декодере извлекаетс из передаваемого цифрового потока: если подряд идут 4 нуля или единицы, шаг квантовани уменьшается/увеличивается вдвое. Эта иде реализована в серийно выпускаемых микросхемах. Клиппирование речевого сигнала     Клиппирование - предельное амплитудное ограничение сигнала, которое применяется только для обработки речи. Речевой сигнал превращается в последовательность прямоугольных импульсов разной ширины, то есть передается информация только о моментах перехода сигнала через ноль (рис. 3.). Рис. 3. Клиппирование     Цифровой вариант клиппирования можно назвать ИКМ с одним битом на отсчет: если сигнал в момент отсчета положителен, он кодируется единицей, если отрицателен - нулем.

    Удивительно, что при таком, мягко говоря, компактном представлении речи ее разборчивость остается весьма высокой. Естественность, конечно, теряется. Речь приобретает специфичное жесткое звучание. Разработано много методов улучшения звучани клиппированной речи, например, дополнительна передача огибающей речи, выделенной до клиппирования. Статистическое уплотнение     В процессе телефонного разговора между 2 абонентами каждое направление передачи по телефонному каналу (канал тональной частоты, канал ТЧ) в среднем используется только в течение половины времени разговора. Кроме того, время активного состояния канала сокращается за счет пауз между отдельными словами и фразами. Все это приводит к тому, что время активного состояния канала ТЧ составляет лишь 25%.

    Для лучшего использования пропускной способности канала естественно занять остальные 75% времени, организовав во время пауз одного абонента передачу речевых сигналов других абонентов. Это и есть статистическое уплотнение, а системы, его использующие, называютс статистическими системами передачи (ССП).

    Примером аналоговых ССП являютс системы типа TASI (Time Assignment Speech Interpolation): в TASI-A 72 абонента обслуживаются 36 каналами,

в TASI-B 275 абонентов - 100 каналами.

    Статистическое уплотнение применяется также в цифровых системах с ИКМ и временным разделением каналов. Например, система ИКМ-C2x30/30 предназначена для статистического объединения двух групповых потоков систем ИКМ-30 со скоростью передачи 2048 кбит/c в один цифровой поток с той же скоростью.

    В цифровых системах спутниковой связи получили распространение два метода статистического уплотнения [1]: цифровая интерполяция речи (ЦИР, DSI) - цифровой вариант системы TASI;

система с предсказанием речи (СПР, SPEC).

Избыточность речевого сигнала     При ИКМ с А- и мю-законами, ДИКМ, АДИКМ, АДМ, клиппировании сжатие речи достигается за счет компактного описания формы звукового сигнала. При этом не учитываетс природа речеобразования. Если же при анализе и синтезе речи ее учесть, то речь можно сжать значительно сильнее. Это и делают ВОКОДЕРЫ.

    В русском языке 42 фонемы: 6 гласных звуков, остальные - согласные. Чтобы закодировать их номера нужно 6 бит. Человек произносит в секунду около 10 звуков. То есть от центральной нервной системы к речевому аппарату сигналы управления передаются со скоростью 10 [log 2 42] = 60 бит/с.     В то же время в цифровой телефонии используется скорость 64 кбит/c (8 бит на отсчет, частота дискретизации 8 кГц). Как говорят в рекламе, почувствуйте разницу. Откуда же эта разница (то есть избыточность) берется? B речевой аппарат поступает сигнал небольшого объема, а создается сигнал с большим объемом. Причинa этого - способ образования речевого сигнала.

    Линейная модель речеобразовани представляет речь как систему, состоящую из генератора сигнала возбуждения (генераторна функция) и линейной системы с медленно изменяющимися параметрами (фильтровой функции), которая им возбуждается. В такой модели не учитывается взаимное влияние голосовой щели и голосового тракта. Это не соответствует действительности, зато сильно упрощает анализ и синтез.

Для экономичной передачи или хранения речи надо определить параметры генераторной и фильтровой функции. У генераторной функции изменяютс частота и амплитуда основного тона (то есть высота и громкость голоса) и происходит смена вида функции (основной тон или шум), а у фильтровой функции происходит непрерывное изменение коэффициента передачи, проявляющеес в форме огибающей спектра. Для передачи этих параметров достаточно скорости передачи 1000 бит/с.

    Для воссоздания речи необходимо создавать "несущую" (с помощью генераторов основного тона и шума) и возбуждать полученным сигналом фильтр с передаточной функцией, соответствующей огибающей спектра и изменяющейся во времени со скоростью произнесения звуков речи.

    Эта идея была осуществлена в конце 30-х годов Дадли (Dudley). Он разработал устройство, которое преобразовывало речь в аналоговый сигнал с полосой частот шириной 300 Гц дл передачи по каналу связи, т.е. с компрессией речи в 10 раз. Это устройство было названо вокодером (VOice - голос, CODER - кодировщик) и давало синтезированную речь низкого качества. За прошедшие 60 лет вокодеры

стали вполне пригодными для коммерческой телефонии (рис. 4.).

Анализатор

А - анализатор спектра

Т-Ш - выделитель сигнала тон-шум

ВОТ - выделитель основного тона

УО - устройство объединения сигналов Синтезатор

УР - устройство разъединения сигналов

С - синтезатор спектра

П - переключатель вида спектра

ГОТ - генератор основного тона

ГШ - генератор шума Рис. 4. Схема вокодера Принцип действи вокодера     Bокодеры можно разделить на два класса: речеэлементные;

параметрические.

    В первых при передаче распознаются произнесенные элементы речи (например, фонемы) и передаются только их номера. На приеме эти элементы создаются по правилам речеобразования или берутся из памяти устройства. Область применения фонемных вокодеров - линии командной связи, речевое управление и говорящие автоматы информационно-справочной службы. В таких вокодерах происходит скорее автоматическое распознавание слуховых образов нежели определение параметров речи.

    В параметрических вокодерах из речевого сигнала выделяют два типа параметров и по этим параметрам на приеме синтезируют речь: параметры, характеризующие огибающую спектра речевого сигнала (фильтровую функцию);

параметры, характеризующие источник речевых колебаний (генераторную функцию) - частота основного тона, ее изменение во времени, моменты появления и исчезновения основного тона, шумового сигнала.

Образование речевого сигнала    При разговоре грудная клетка сжимаетс и расширяется, поток воздуха проходит из легких через трахею и гортань в полости глотки, рта и носа. Голосовой тракт простирается от голосовой щели (отверстия между голосовыми складками в гортани) до губ. В процессе речеобразования его форма меняется.

   Если произносятся звонкие звуки (гласные, носовые, звонкие согласные), голосовые складки в гортани смыкаются и размыкаются с той или иной частотой, которая называется частотой основного тона (pitch). Получается последовательность импульсов воздушного потока, которые возбуждают полости голосового тракта. Говоря, человек меняет геометрические размеры этих полостей, соответственно меняются и их резонансные частоты, которые называются формантами. Звонкие звуки называются также вокализованными (voiced).

   При произнесении глухих (невокализованныx, devoiced) звуков голосовые складки расслаблены. Проходя по суженному голосовому тракту, воздух создает турбулентный поток (завихрения), то есть в полости рта и носа возбуждаются шумоподобным сигналом.

   Взрывные (смычные, stop) звуки получаютс путем кратковременного выхлопа - полного перекрытия речевого тракта, нагнетания давлени и внезапного открытия тракта. Взрывные звуки бывают звонкие (б, д, г) и глухие (п, т, к), то есть могут образовываются с участием голосовых складок и без них.

   Можно сказать, что когда человек говорит, он производит спектрально-временную модуляцию широкополосного сигнала, генерируемого голосовыми складками и представляющего своего рода несущую. Полезная информация в этой несущей есть только в интонации (изменении частоты основного тона) и в смене вида спектра с тонального на шумовой и наоборот.

Принципы построения вокодеров с линейным предсказанием    Для прогноза текущего отсчета речевого сигнала можно использовать линейно взвешенную сумму предшествующих отсчетов, то есть предсказываемый отсчет где ak - коэффициенты предсказания (k = 1, 2,..., P).

Ошибка предсказания e (n) = s (n) - s (n).

   Kоэффициенты предсказания должны быть такими, чтобы для временного окна длиной N отсчетов сумма была минимальна. Задача минимизации приводит к системе линейных уравнений относительно ak . Коэффициенты уравнения оказываются равными значениям автокорреляционной функции отрезка речи. В липредерах сначала для каждого кадра длиной 10 - 20 мс вычисляются коэффициенты корреляции, а по ним находят коэффициенты предсказания (или коэффициенты частной корреляции, или коэффициенты отражения), которые передаются на приемную сторону вместе с информацией о функции возбуждения. Коэффициенты линейного предсказания (КЛП) обретают простой смысл. Передаточная функция фильтра, который имеет только полюсы где p - порядок фильтра.    Алгоритмы, которые используют коэффициенты частной корреляции (PARtial CORrelation), называются PARCOR.

    Все методы анализа речи предполагают достаточно медленное изменение свойств речевого сигнала во времени. Характеристики голосового тракта можно считать неизменными на интервале 10-20 мс, то есть параметры надо измерять с частотой порядка 1/20 мс = 50 Гц.

    Передающая часть вокодера называетс анализатором, приемная - синтезатором. B вокодеры обязательно входят два типа блоков: фильтровой и генераторный. Обычно для создания генераторной функции в синтезаторе используются генераторы основного тона (ГОТ) и шумового сигнала (ГШ) с переключателем тон-шум (П). В анализаторе, соответственно, есть выделители основного тона (ВОТ) и сигнала смены вида спектра (ТШ). Дл выделения и воссоздания фильтровой функции нужны устройства анализа и синтеза спектра речевых сигналов.

    При вводе в канал сигнал-параметры должны быть объединены в один сигнал. При выводе этого сигнала его надо разделить на отдельные сигнал-параметры, что и выполняют соответствующие устройства.

    При разработке первых вокодеров использовались аналоговые сигналы на всем протяжении тракта - от микрофона до телефона. В последние годы вокодеры стали создавать целиком на цифровой основе. Из речевого сигнала после его преобразования в цифровую форму (то есть дискретизации, квантования и кодирования) выделяются сигнал-параметры (также в цифровой форме) и вводятся в канал связи. На приеме по сигнал-параметрам синтезируется дискретный речевой сигнал, превращаемый затем в непрерывный.

    Применение цифровых сигнальных процессоров (ЦСП) несет новые возможности: так, на основе ЦСП TMS 32020 фирмы Texas Instruments создан вокодер с линейным предсказанием речи (липредер) со скоростью передачи 2400 бит/с. Виды вокодеров     По принципу определени параметров фильтровой функции речи различают вокодеры: полосные (канальные, channel);

формантные;

ортогональные;

липредеры (с линейным предсказанием речи);

гомоморфные.

    В полосных вокодерах спектр речи делится на 7 - 20 полос (каналов) аналоговыми или цифровыми полосовыми фильтрами. Большее число каналов в вокодере дает большую натуральность и разборчивость. С каждого полосового фильтра сигнал поступает на детектор и фильтр низких частот с частотой среза 25 Гц. Таким образом, сигналы на выходе каждого канала изменяются с частотой менее 25 Гц. Их передача возможна в аналоговом или цифровом виде.

    В формантных вокодерах огибающа спектра речи описывается комбинацией формант (резонансных частот голосового тракта). Основные параметры формант - центральная частота, амплитуда и ширина.

    В ортогональных вокодерах огибающа мгновенного спектра раскладывается в ряд по выбранной системе ортогональных базисных функций. Вычисленные коэффициенты этого разложения передаются на приемную сторону. Распространение получили гармонические вокодеры, использующие разложение в ряд Фурье [3].

    Вокодеры c линейным предсказанием (Linear Prediction Coding, LPC) или липредеры основаны на оригинальном математическом аппарате.

    Гомоморфная обработка позволяет разделить генераторную и фильтровую функции, образующие речевой сигнал.

    Из-за сложности определени параметров генераторной функции появились полувокодеры (Voice Excited Vocoder, VEV), в которых вместо сигналов основного тона и тон-шума используетс полоса речевого сигнала. Полоса частот до 800 - 1000 Гц кодируется АДИКМ, АДМ или с помощью линейного предсказания малого порядка, а в некоторых моделях передается в аналоговом виде.

    Есть разные типы полувокодеров-липредеров: вокодеры VELP (Voice Excited Linear Prediction);

вокодеры RELP (Residual Excited Linear Prediction).

Гомоморфные вокодеры    Гомоморфная обработка разделяет речевой сигнал на генераторную и фильтровую функции. Для этого последовательность отсчетов речевого сигнала длиной около 40 мс взвешиваетс временным окном и подвергается прямому дискретному преобразованию Фурье (ДПФ). Затем находится логарифм модуля спектра, к нему применяется обратное ДПФ. Результат называетс кепстром.

   По области 4 - 40 мс кепстра можно определить признак "тон-шум" и частоту основного тона. Если участок вокализованный, то в кепстре будет пик в точке, равной периоду основного тона.

   В начале кепстра (0 - 4 мс) содержитс информация об огибающей спектра речи. Чтобы ее получить, нужно обнулить в кепстре участок 4 - 40 мс и подвергнуть кепстр прямому ДПФ.

   В литературе [4, C. 764 - 766 и другие источники] описан гомоморфный вокодер. Автору неизвестно о производстве вокодеров, основанных на гомоморфной обработке.

    Вокодеры VELP используют голосовое возбуждение (и коэффициенты линейного предсказания, КЛП). В вокодерах RELP по исходному сигналу также вычисляются КЛП. Так как КЛП описывает фильтровую функцию, то сигнал ошибки предсказания (сигнал-остаток предсказания, prediction residual) содержит информацию о генераторной функции речи. Он и передается на приемную сторону (возможно его сжатие АДИКМ, АДМ или с помощью линейного предсказания малого порядка).

    В последнее время все шире используются липредеры с кодовым возбуждением (Code Excited Linear Prediction, CELP). Такие вокодеры имеют на приемном и передающем концах кодовую книгу (codebook). Кодовая книга - это матрица, строки которой являются последовательностями чисел (отсчетов сигналов генераторных функций, то есть это сигналы возбуждения).

    По исходному сигналу вычисляются КЛП. Затем на фильтр с найденными КЛП подаются по очереди все сигналы возбуждения из кодовой книги. По каждому сигналу возбуждени синтезируется речь. На приемную сторону передаются КЛП и номер того сигнала из кодовой книги, для которого разница между исходным и синтезированным сигналом минимальна.

    В США приняты два федеральных стандарта на применение CELP: 1015 (LPC-10E, 2400 бит/c);

1016 (E-CELP, 4800 бит/c).

    ITU (Международный союз электросвязи, МСЭ) разработал Рекомендацию G.728 на алгоритм LD-CELP (16 кбит/c).

    В таблице 1 [6] приведены основные виды вокодеров и требуемая пропускная способность канала связи.

Сегодня вокодеры применяют для кодировани телефонных сигналов в военных и коммерческих цифровых системах связи. Перспективно применение вокодеров для организации служебной телефонной связи со скоростью передачи данных 1 200 - 2 400 бит/с. Формантные и полосные вокодеры находят применение также при цифровой передаче телефонных сигналов по КВ-каналам радиосвязи. Вид вокодера

Полоса пропускания канала связи в режиме передачи

аналоговом, Гц

цифровом, бит/с

Фонемный

-

75

Формантный

140

1 200

Полосный, ортогональный, липредер

400

2 400

Полувокодер

900

9 600

Таблица 1. Основные виды декодеров     Современные вокодеры обеспечивают хорошее качество речи при скорости передачи 4 800 - 2 400 бит/с и качество речи, пригодное для ведения служебных переговоров, при скорости передачи 1 200 бит/с.

    В таблице 2 приведен краткий список вокодеров, которые производятся в настоящее время.

Зачем платить такие большие деньги за то, чтобы услышать речь, уступающую в натуральности и разборчивости естественной? Дело в том, что вокодеры используют в основном не для уплотнени каналов связи, а для их защиты от прослушивания. Только преобразовав речь в цифровую форму и применив шифрование, можно гарантированно защититься от перехвата. Аналоговые устройства для защиты речевых каналов связи (скремблеры) дают лишь временную, не криптостойкую защиту речи, что бы ни говорили их производители.

    Автора всегда удивляло, что никто не предлагает чисто программную реализацию засекречивающего вокодера. Быстродействие центрального процессора компьютера вполне это позволяет (естественно, при наличии звуковой платы и модема*). Возможно, причина заключается в том, что аппаратное средство можно продать значительно дороже программного. Наименование

Фирма-производитель

Страна

Скорость передачи, бит/c

Цена,$

3600

AT&T

США

4 800

3 500

4100

AT&T

США

1 200 2 400 9 600

1 800

SecurePhone

Cylink

США

4 800 9 600

4 400

Sectel 9600

Motorola

США

9 600

8 000

Oripset 100

Siemens

ФРГ

2 400

3 900

Omnisec 210

Omnisec

Швейцария

1 200 2 400

18 000

Vodacoder 9600

нет данных

Австрия

2 400

нет данных

CVAS-III

A-O Electronics

США

2 400

нет данных

Telecrypt-VOC

ANT Telecom-munication

нет данных

2 400

нет данных

1,2/2,4

Ин-B

Россия

1 200 2 400

нет данных

AT-240

Анкрипт

Россия

нет данных

4 100

Орех-4M

Орех

Украина

2 400 4 800 9 600 12 000

1 200

VoiceCrypt

Финтроник

Украина

4 800

800

Таблица 2. Перечень вокодеров, которые производятся в настоящее время *) Кстати, фирма Aztech выпустила универсальную карту Audio Telephony Card, котора объединяет функции звуковой карты, факса, модема, автоответчика и интерфейса CD-ROM. Литература: 1. Банкет В.Л., Дорофеев В.М. Цифровые методы в спутниковой

связи. - M, 1988. 2. Беллами Дж. Цифровая телефония. - M, 1986. 3. Вокодерная телефония. Методы и проблемы. /Под ред. А.А. Пирогова. - M: Связь, 1974. 4. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. - М: Мир, 1978. 5. Рабинер Л.Р., Шафер Р.В. Цифрова обработка речевых сигналов. - М: Радио и связь, 1981. 6. Сапожков М.А., Михайлов В.Г. Вокодерна связь. - M: Радио и связь, 1983. 7. Стил Р. Принципы дельта-модуляции. - M, 1979. 6'96