Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Константинов П.А. Авиационная радиосвязь

.pdf
Скачиваний:
25
Добавлен:
30.10.2023
Размер:
20.56 Mб
Скачать

дов модуляции радиосигнал по сравнению с речевым сообще­ нием занимает более широкий спектр частот. Подробнее»системы связи с различными видами модуляции рассматриваются в гл. VI.

Компрессия спектра телефонного сигнала может быть полу­ чена также за счет увеличения времени передачи. Если речь предварительно записать на пленку и затем уменьшить скорость вращения магнитофона против нормальной в я раз, в такое же число раз сузится спектр речи. На приемной стороне для вос­ становления нормальной речи скорость вращения должна быть увеличена в я раз.

Указанные методы не исчерпывают всех возможных методов компрессии спектра. Так, в {23.] описан метод компрессии спект­ ра, основанный на делении и умножении частоты. На передаю­

щей стороне сигнал.F(t) —UF {t) cos 9 {t) преобразуется

к виду

cos(p(£) и затем с помощью однополосной модуляции

к виду

cos

-+- <р(/) j. Сигнал такого вида подается на я-кратный де­

литель частоты, на выходе которого

получается сигнал

 

 

mt + Т/ (Л

 

 

 

co s --------—— .

 

 

 

я

 

 

 

Спектр

выходного сигнала, по мнению

авторов метода,

будет

в я раз уже, чем спектр сигнала cos

+

<р1^)| •На приемной сто­

роне поделенный сигнал подается на я-кратный умножитель, в

результате

чего

на выходе

умножителя

будет

сигнал

cos|u>£+ <p

который с помощью синхронного детектирования

превращается в исходный сигнал costp(0 -

 

 

Несмотря на простоту идеи, этот метод компрессии не нахо­

дит практического

применения.

Оказывается,

что он

не дает

существенного сужения спектра без значительной потери инфор­ мации. Этот метод компрессии дает не лучшие результаты по сравнению с простым ограничением спектра речи до той же ве­ личины. Следует иметь в виду, что, в отличие от обычных де­ лителей, делитель в данной системе должен делить не одну час­ тоту, а спектр частот, имеющих различную интенсивность. Про­ цесс в таком делителе связан С потерей информации и не являет­ ся делением частоты в обычном смысле. Исходный спектр не мо­

жет быть восстановлен путем я-кратного умножения

исходного

спектра. Различные вопросы, связанные с

применением

этого

метода в линиях связи, рассмотрены в [1.],

[24], [25],

[26],

[27].

На основании изложенного можно сделать следующий вы­

вод. Методы непосредственной частотной

компрессии имеют

практическое значение. Однако сжатие спектра речи в этом слу­ чае получается небольшим, очень далеким от предельно воз­

можного сжатия.

Теоретический предел возможного сжатия спектра телефон­ ного сигнала может быть установлен на основе формулы Шен-

210

нона. Согласно этой формуле, максимальная скорость передачи информации, т. е. пропускная способность канала связи, при передаче сигналов с ограниченной средней мощностью равна-

где Д/ — ширина спектра сигнала;

P/N — отношение мощности сигнала к мощности флуктуационной помехи.

Можно считать, что нормальный разговор ведется со ско­ ростью V = 10 букв/сек*. При идеальном кодировании количе­ ство двоичных единиц, необходимое для передачи каждой бук­

вы, близко к энтропии сообщения,

т. е. Н =

2

de.ed.j6. Следова­

тельно, при разговоре скорость передачи равна

 

 

= VH =

20 de.ed.jceK.

 

Предположим,

что

отношение

сигнала

к

помехе в канале

связи равно

0

Р

=

л

] / 2 о

о,

т. е. —

9, что необходимо иметь для

 

 

N

 

 

 

 

систем связи с амплитудной модуляцией. Для передачи сигна­ ла при таких условиях в соответствии с формулой Шеннона требуется полоса частот

Это и есть предел возможного сжгатия спектра речи. Оно может быть получено лишь при идеальном кодировании. Применяю­ щиеся на практике системы телефонной радиосвязи с непосред­ ственной компрессией занимают значительно большую полосу частот. Более эффективными являются методы компрессии спектра с функциональным преобразованием речи, рассматри­ ваемые ниже.

В р е м е н н а я к о м п р е с с и я . Временная компрессия теле­ фонного сигнала заключается в сокращении времени передачи и основана на избыточности речи, определяемой ее временными характеристиками. Указанная избыточность . характеризуется наличием повторяющихся участков во временной функции. Так, при рассмотрении спектрограмм гласных звуков (рис. 5.3) лег­ ко обнаружить повторяющиеся участки, следующие друг за дру­ гом с частотой основного тона. Спектрограммы многих соглас­ ных звуков по своим свойствам приближаются к шумам и, сле­ довательно, не обладают периодичностью. Но и в этом случае ■некоторые параметры колебания (например, интенсивность про­ тяжных согласных X, Ш) на достаточно большом отрезке вре­ мени остаются постоянными.

* Правильнее говорить о количестве фонем в секунду (см. гл. VI, § 3). Здесь пока не делается различия между буквами и фонемами.

1 4 *,

211

Рис. 5.38. Кривые разборчивости преры­ ваемой речи в зависимости от средней частоты следования нерегулярных выре­ зающих импульсов

Для понимания звуков не обязательно передавать их в тече­ ние всего интервала времени, занимаемого ими в речевом сооб­ щении. Чтобы понять звук речи, требуется интервал времени около 10 мсек [1], тогда как длительность ряда звуков достигает

Рис. 5.37. Кривые разборчивости преры­ ваемой речи в зависимости от частоты следования регулярных вырезающих им­ пульсов

200—300 мсек. Следовательно, имеется возможность сокраще­ ния времени передачи путем устранения временной избыточ­ ности.

Изложенные соображения подтверждаются эксперименталь­ но. Оказывается, что можно вырезать половину или да­ же больше половины от об­ щей длительности речи при сохранении достаточно вы­ сокой разборчивости ее [28].

Соответствующие графики приведены на рис. 5.37 и 5.38. Вырезание производи­ лось при помощи прямо­ угольных импульсов, имею­ щих определенную или слу­ чайную частоту следования. Значения частоты следова­ ния отложены по оси абс­ цисс. По оси ординат отло­ жены значения артикуляции слов W%, полученные при

отсутствии восстановления вырезаемых участков. Параметром является коэффициент заполнения d, равный отношению дей-

212

ствительного времени передачи прерываемого речевого сообще­ ния к длительности непрерываемого речевого сообщения, т. е.

 

d = t* ~ Е Х1_

2 xs

где ts,

— длительности передаваемых участков речи и вы­

резающих импульсов соответственно,

ts — длительность непре­

рываемой речи. Очевидно, что для нерегулярных вырезающих

импульсов

можно

 

говорить

 

 

 

 

 

-,§•3

лишь о среднем коэффициенте

fS

Я б

В Г А Е Ж 3

заполнения и о средней частоте

 

V

следования.

 

 

 

 

 

 

 

 

 

 

ЧO

 

 

 

 

 

 

 

 

 

 

 

 

 

t j i

 

Из

рассмотрения

 

рис.

5.37

2

й

в

д

Ж

)

о,

 

 

J в

«ь

видно,

что

при

коэффициенте

 

 

 

 

 

■g'S-g

заполнения

d =

0,5,

т. е. при

з

Я'

6 '

д '

Ж'

|

I

вырезании

половины

от общей

С;

длительности речи, разборчи­

 

 

 

 

 

 

 

вость

сохраняется

достаточно

 

 

 

 

Ж1

\ Оч

 

высокой. Только при

частотах

ч

Я'

в 1

л ’

 

J 5т= сч

следования

вырезающих

им­

 

 

 

 

 

а6разо)5/ приемы стороне

пульсов 400—800 гц разборчи­

5) А

В

А

Ж

 

 

вость существенно

уменьшает­

 

 

 

 

 

 

 

ся. Особенно сильное уменьше­

6}

Я № В вд А тж жи| g g

ние разборчивости наблюдается

 

 

---Г-

---

 

 

при

коэффициенте

заполнения

Ямс. 5.39. Принцип сжатия спект-

d =

0,25. Из сравнения рис. 5.37

и 5.38

видно, что

понижение

ра

на 0CHQBe

прерывания

речи

 

разборчивости будет менее зна­ чительным при использовании нерегулярных, прерывающих им­ пульсов.

Прерывание речи может быть использовано для уплотнения канала связи несколькими передачами путем размещения дру­ гих сообщений в вырезаемых интервалах времени. Это может быть использовано и для сужения спектра речи, например, по принципу Габора, сущность которого сводится к следующему.

На передающей стороне фонограмма сигнала делится на не­

которое число

отрезков

постоянной

длины

А, Б, В, Г, Д

(рис. 5.39— 1\ А,

Б, В,... обозначают участки фонограммы, а не

соответствующие

звуки).

Некоторые

отрезки

исключаются,

а оставшиеся участки растягиваются на весь следующий за ним исключенный интервал. На рис. 5.39—2 оставшиеся и исключен­ ные участки имеют одинаковую длительность. Это значит, что все оставшиеся участки могут быть растянуты во времени в два раза (рис. 5.39—3), благодаря чему спектр сузится в два раза.

На приемной стороне принятые участки А', В', Д', Ж' (рис. 5.39—4) подвергаются сжатию до первоначальной длины нафонограмме, в результате чего получим участки речи, чере­ дующиеся с пропусками (рис. 5.39—5). Пропуски можно совсем

213

не восстанавливать и принимать прерываемую речь. Можно за­ полнять их повторением предыдущих принятых участков, так что принятое сообщение будет иметь вид: А А, В В, Д Д, Ж Ж , ...

Однако лучшие результаты могут быть получены при восста­ новлении утраченных участков на основе корреляционных за­ висимостей между отдельными участками (рис. 5 .39—6).

Длина оставшихся и исключенных участков не обязательно должна быть одинакова, поэтому сжатие времени (спектра) не обязательно будет двукратным. Можно, например, исключен­ ные участки взять в два раза длиннее оставленных (10 мсек и 5 мсек), тогда сжатие будет трехкратным. Опыт показывает, что из-за возникающих искажении этот метод не позволяет полу­ чить сжатие спектра более чем в 2—3 раза.

Следует отметить, что вопрос о разборчивости прерываемой речи имеет большое значение и при оценке влияния импульсных помех при приеме телефонных сигналов. Одной из мер борьбы с импульсными помехами является выключение сигнала и по­ мехи на время действия последней. Из предыдущего ясно, что до некоторых пор такие выключения допустимы. Количествен­ ные значения минимально допустимого коэффициента заполне­ ния зависят от отношения сигнала к помехе и от характера рас­ пределения импульсов во времени.

Методы компрессии с функциональным преобразованием речи

П о л о с н ы й в о к о д е р . Методы компрессии телефонного сигнала с функциональным преобразованием речи основаны на

замене речи ее

параметрами, сведения о которых

передаются

в линию связи

для восстановления сообщения

в приемном

устройстве. Выбираются параметры, медленно меняющиеся во времени, поэтому для передачи сведений о таких параметрах требуется более узкая полоса, чем для передачи самой речи.

Устройства, с помощью которых производятся функциональ­ ные преобразования речи, называются вокодерами (по англий­ ски: войс—голос, кодер—кодировщик). Вокодер состоит из двух основных частей: анализатора, который производит выделение параметров из речи, т. е. анализ речи, и синтезатора, который синтезирует, т. е. восстанавливает речь по ее параметрам. Прин­ ципы построения вокодеров могут быть различными, в зависи­ мости от вида используемых параметров речи.

В полосном вокодере (рис. 5.40) в качестве параметров ис­ пользуются спектральные уровни в узких полосах частотного диапазона [1]. Число полос (каналов), на которые разбивается весь диапазон речи набором фильтров Ф\, Ф2, ..., Ф„, в первом вокодере Дадли (1939 г.) равнялось десяти. В последующем стали конструировать чаще шестнадцатиканальные вокодеры; содержащие шестнадцать фильтров.

2 1 4

Амплитудными детекторами Д х, Д2, ... , Д„, включенными на выходе фильтров, определяется средний уровень речи в соот­ ветствующей полосе за промежутки времени около 40—70 мсек.

Анализатор

%■4,

м

c h

%

л г

Дп

измеритеньча­ %

стоты 0-50гц оснобн.

тона

I

L ->

---------------- *°

Рис. 5.40. Блок-схема полосного вокодера

Р и с. 5.41. Средние уровни речи в каналах полос­ ного вокодера

В некоторый момент времени частотный спектр речи будет иметь ступенчатую форму (рис. 5.41). С течением времени уровень в каждой полосе будет изменяться. Зависимости средних уро'в-

215

ней от времени, т. е. спектральные огибающие уровней, пред­ ставляющие напряжения спектральных каналов на выходе ана­ лизатора речи, передаются в линию связи на одной несущей частоте одним из методов уплотнения (гл. VIII).

В синтезаторе приемного устройства процесс восстановления речи происходит в обратном порядке. Спектр частот, аналогич­ ный речевому спектру, создается специальным источником зву­ ковой энергии. Таким источником является генератор узкопо­ лосных импульсов, создающих широкий дискретный спектр, ана­ логичный спектру голосовых связок, и генератор шума, создаю­ щий спектр, аналогичный спектру глухих согласных звуков.

Спектр источника звуковой энергии с помощью ряда фильт­ ров, аналогичных фильтрам в анализаторе, делится на узкие полосы частот. Напряжения с выхода фильтров поступают па амплитудные модуляторы М i, М2 , ..., УИ,,, куда, кроме того, по­ ступают принятые выходные напряжения спектральных кана­ лов. В результате на выходе модуляторов получим изменяю­ щиеся во времени уровни, аналогичные уровням на выходе со­ ответствующих фильтров в анализаторе речи. Поэтому суммар­ ный процесс, полученный смешиванием всех напряжений на выходе модуляторов, представляет сигнал, примерно совпадаю­ щий с исходным, т. е. синтезированную речь.

Таким образом, можно обеспечить достаточно высокую раз­ борчивость речи, но нельзя обеспечить узнаваемость голоса. Для узнаваемости голоса используется еще один параметр — частота основного тона, характеризующая высоту голоса. С этой целью высота голоса определяется в анализаторе измерением частоты основного тона. Полученная информация о частоте ос­ новного тона передается в линию связи для управления часто­

той следования импульсов генератора. В этом

случае синтези-

_ рованная речь будет звучать более естественно.

 

В образовании глухих согласных звуков

основной тон

не

участвует, поэтому при их произношении по каналу связи

ин­

формация об основном тоне не передается, и на приемной сто­ роне источник звуковой энергии создает шум, заменяющий шум глухих звуков. Выбор источника дискретного или непрерывного шума определяется электронным переключателем Я в синтеза­ торе в зависимости от наличия или отсутствия сигнала основно­ го тона.

Полосные вокодеры позволяют получить примерно восьми­ десятикратное сжатие полосы частот. Эта возможность дости­ гается за счет того, что выходные напряжения спектральных ка­ налов, описывающие изменения средних уровней в каждой уз­ кой полосе, являются медленно изменяющимися функциями времени и могут быть переданы по каналу связи в узкой полосе. Практически установлено, что полоса 25 гц или даже 15 гц для каждого спектрального канала обеспечивает достаточно высо­ кую артикуляцию, хотя некоторые звуки, характеризующиеся

2 1 6

резкими изменениями звукового давления, например взрывные согласные звуки, будут несколько искажаться. Для передачи вы­ ходных напряжений шестнадцати каналов потребуется полоса шириной 240—400 гц.

Для передачи основного тона требуется полоса около 25— ■50 гц. Сужение этой полосы нецелесообразно, так как сглажи­ вание фронтов основного тона приведет к постепенному измене­ нию частоты управляемого им генератора в приемном устрой­ стве. При этом начальные участки звуков речи будут воспроиз­ водиться при изменяющейся частоте, что вызовет искажение естественного речевого процесса.

Из сказанного следует, что с учетом полосы, занимаемой ос­ новным тоном., общая полоса частот, занимаемая шестнадца­ тиканальным вокодером, будет равна 265—450 гц. Если еще учесть запас для устранения взаимных помех между каналами, общая полоса частот должна быть увеличена примерно до 350—• '600 гц.

Хотя идея использования основного тона для повышения ■естественности звучания речи проста, практическое ее осу­ ществление затруднено. Это объясняется тем, что основной тон изменяется в широком диапазоне частот — примерно от 80 до 350 гц, а также тем, что речевой процесс содержит состав­ ляющие, интенсивность которых часто превышает интенсивность 'Составляющей основной частоты. При таких условиях трудно обеспечить четкое выделение частоты основного тона из общего речевого процесса. Передача основного тона также связана со значительными трудностями, так как сужение отводимой для этого полосы приводит, как уже говорилось, к искажениям.

Следовательно, основные недостатки полосного вокодера связаны с трудностью построения канала основного тона. В си­ лу этого в таких вокодерах до сих пор не удается получить хо­ рошей узнаваемости голоса. Но поскольку при таком методе передачи уже в настоящее время обеспечивается высокая раз­ борчивость, полосный вокодер может найти применение в слу­ жебных устройствах связи в тех случаях, когда не ставится тре­ бование узнаваемости голоса, а основное значение имеет раз­ борчивость речи.•

Для решения вопроса о целесообразности применения полос­ ного вокодера в войсковых устройствах связи необходимо учи­ тывать надежность его работы в условиях помех. Имеются ■экспериментальные данные, указывающие на низкую помехо­ устойчивость пятиканального вокодера (19]. Дальнейшие иссле­ дования этого вопроса с учетом возможного улучшения кон­ струкции полосного вокодера позволят определить области его применения.

Лучшее качество звучания и хорошую узнаваемость голоса обеспечивают полувокодеры [1]. В полувокодере, в отличие от полосного вокодера, в линию связи вместо основного тона пере­

2 1 7

дается полоса частотного диапазона непреобразованной речи без всяких изменений. Эта полоса выделяется в анализаторе из низкочастотной части речевого спектра и имеет ширину 200— 300 гц (например, полоса 100—350 гц, или при передаче муж­ ского голоса 100—250 гц). В синтезаторе полоса «размножает­

 

 

ся», т. е. ее спектр с помощью

s(Q)

 

нелинейных устройств

расши­

 

ряется до 3000—4000 гц. Раз­

 

 

 

 

множенный спектр в синтеза­

 

 

торе используется вместо спек­

 

 

тра импульсного генератора

 

 

(пунктир на рис. 5.40).

более

 

 

Полувокодер требует

 

 

широкой полосы частот по срав­

 

 

нению с полосным вокодером и

 

 

не позволяет получить

сжатие

Рис. 5.42. Мгновенный спектр речево­

частотного

диапазона

выше

го

сообщения

пятикратного.

 

в о ­

кодер.

Принцип построения

Г а р м о н и ч е с к и й

гармонического

вокодера осно­

ван на разложении в ряд Фурье мгновенного спектра речевого со­ общения с последующим синтезом речи по найденным коэффици­ ентам разложения.

Известно, что любая функция f(x), удовлетворяющая в ин­

тервале 0 с л < 1 условиям Дирихле,

может

быть разложена

в этом интервале в ряд Фурье

 

 

2Kkx

,

2я&Л'

cos----------о* sin---------

I

k

I

где коэффициенты Фурье ак, Ъкопределяются следующими формулами:

 

ак

 

 

?

 

 

,

2

Г , . 2Tckx

,

■>

 

bk =

у

f{ x) sin - j -

dx .

 

Функция fi (x)

 

 

о

 

 

является периодической с периодом / и в интер­

вале 0 <^х<С1

совпадает с функцией f(x). На этом

основании

мгновенный спектр речевого сообщения s (2) (рис. 5.42), задан­

ный на интервале частот(0 , QMaKC), также

может быть

разложен

в ряд:

 

 

 

 

2тг/гй +

bksin 2-xkQ

(5.16)

+ S ( a * cos О

Q

 

k= 1

■'‘'макс

макс

 

 

 

 

218

причем

 

макс

 

 

аУ=

/Л \

 

_jf\

s (Q) cos------- dQ

 

v '

о

 

 

макс

 

(5.17)

 

 

 

ьк =

s (й)s i n

d й.

Й.

 

2....

 

Разбивая интервал (О, йшкс) на 2 п узких полос, приближенные значения коэффициентов можно записать в следующем виде:

2л-1

п

cos Kki

 

 

1=0

 

(5.18)

 

2п=1

izki

 

 

 

ьк -

я . ,

sin — ,

 

n

 

 

1=0

 

 

где st — значения спектра

s (2)b точках отсчета

(рис. 5.42).

Из формул (5.18) видно, что для определения коэффициен­ тов Фурье необходимо определить ординаты s,- и затем образо­ вать определяемые этими формулами суммы.

В качестве ординат st могут быть использованы, например, спектральные уровни на выходе фильтров полосного вокодера.

Для образования сумм вида (5.18) могут быть применены, электрические схемы со специально подобранными делителями напряжений, составленными из активных сопротивлений [29]. Одна из возможных схем приведена на рис. 5.43. Эта схема со­ держит восемь фильтров Фь Ф2, ... ,Фв и может вычислять семь

коэффициентов Фурье:

аь а2, Оз,

bu b2, b3.

 

Соотношения между величинами

сопротивлений могут быть

установлены из формул

(5.18). Так,

для образования напряже-

ния, пропорционального

постоянной

0/Q

о

составляющей — ,

равной

 

2 л - 1

 

 

2 п ‘

1=0

необходимо на некотором общем сопротивлении все ординаты s( сложить с равными весами. На схеме, изображенной на рис. 5.43; общее сопротивление равно 1 £2 ,а сопротивление на выходе каждого фильтра равно 20 0 Ш-

219

Соседние файлы в папке книги из ГПНТБ