Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Константинов П.А. Авиационная радиосвязь

.pdf
Скачиваний:
24
Добавлен:
30.10.2023
Размер:
20.56 Mб
Скачать

Коэффициент а, на основании (5.18) равен

 

 

Qj =

1

/

.

тс

2тс

Зтс

S4 C O S

4тс

---

S0

+

$1 C O S ------

1- s2C O S -------

(- s 3 C O S ---

-------\-

 

4

\

 

4

4

4

 

4

 

 

 

5tc

6tc

7tc\

 

 

 

+

s5cos — +

s6cos------

h s7cos —

,

 

 

 

 

 

4

4

4 )

 

 

или

«1 = -j (s0 + 0,707 s, - 0,707s, - s4 - 0,707 s5 + 0,707 s7).

Отсюда видно, что для образования напряжения, пропорцио­ нального коэффициенту а7, необходимо общее сопротивление

 

 

ф,

фг

 

 

 

 

J

_L.

I

 

 

 

фз

фч

 

 

%

 

-

Ф7

 

 

 

 

 

п

П [ г iп

i 3 iп

ГЗ

 

п

 

п

£ 7

 

 

 

ClX.

1' 1 11 11 1

1 . ~L

I s

1

1

 

 

 

 

 

 

 

а 1а

 

 

£ 1’х£ X X X X X х + X X X X

1

5 + X X

 

 

 

>

 

|

 

i f

1

 

i f

|

 

 

 

 

 

1(Г

 

'

 

'

 

If"

 

 

 

 

 

 

<

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 г

 

 

 

 

.

 

gf™ о1

с <

 

 

 

п?

 

1

 

 

 

 

'

 

 

i n

& г

 

 

01

1

 

 

 

 

 

*§200

52

1

'

 

■'

о и

§

 

 

i n

 

3 1

 

 

 

 

 

»Ч}200

 

|г

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.

5.43.

Схема

устройства для

вычисления

коэффициентов Фурье

 

 

 

 

спектра

речи

 

 

 

 

 

 

 

 

е з я т ь

равным 2 k9.

т. е.

в два раза больше по сравнению с общим

сопротивлением, соответствующим коэффициенту

 

Сопротив­

ления на выходе фильтров Ф[

и Ф8 должны быть одинаковыми

с сопротивлениями на выходе этих фильтров, соответствующими коэффициенту -^.т. е- должны быть равны 200 kQ . Сопротивле­

ния на

выходе фильтров Ф2, Ф.\, Фв и Ф8 должны быть взяты

280 kQ,

так как ординаты sb S3, s5 и s7 входят в выражение для

Д| с весом 0,707.

При

вычислении коэффициентов Фурье необходимо прини­

мать во внимание знаки весовых коэффициентов. В выражении

220

для я, весовые коэффициенты при s3, s4 и Ss отрицательные. Именно поэтому сопротивления на выходе фильтров Ф4, Ф5 и Фд

включены в цепь выпрямителей со стороны отрицательного на­ пряжения.

Аналогично может быть составлена схема устройства для вычисления любого числа коэффициентов Фурье. Пр'и этом по­ требуется увеличение числа фильтров 2 п, так, чтобы оно пре­ восходило число вычисляемых, коэффициентов Фурье, т. е. чтобы выполнялось условие

2п > 7k + 1.

Полученные в результате анализа напряжения, пропорцио­ нальные коэффициентам Фурье, передаются в линию связи од­ ним из методов уплотнения (см. гл. VIII). В приемном устрой­ стве эти напряжения используются для синтеза речи (рис. 5.44).

Рис. 5.44. Блок-схема гармонического вокодера

Синтез речи заключается в воспроизведении на приемной стороне спектра передаваемого сообщения, определяемого вы­ ражением (5.16) [30], [31.]. На вход синтезатора поступает на­ пряжение от источника звуковой энергии. Таковым является ли­ бо генератор импульсов, создающий дискертный спектр, либо генератор шумов, создающий сплошной спектр. Выбор того или иного генератора производится с помощью различителя глухих и звонких звуков на передающей стороне и переключателя Я на приемной стороне.

221

Различитель глухих и звонких звуков представляет собой два фильтра — фильтр нижних частот и фильтр верхних час­ тот [31]. Граничные частоты обоих фильтров равны 1000 гц. На­ пряжения на выходе фильтров выпрямляются детекторами. Ин­ тенсивные колебания основной частоты лежат в пределах поло­ сы первого фильтра, колебания глухих согласных звуков лежат в области высоких частот, т. е. в пределах полосы второго фильт­ ра. Поэтому, когда произносится звонкий звук с участием голо­ совых связок, более сильным будет сигнал в фильтре нижних частот. При произношении глухого звука более сильным будет сигнал в фильтре верхних частот. Соответственно этому на вы­ ходе образуется постоянное напряжение положительной или от­ рицательной полярности. Это напряжение передается на прием­ ное устройство для управления переключателем П, который подключает ко входу синтезатора либо импульсный генератор, либо генератор шумов.

cosQt

Рис. 5.45. Принцип получения частот­ ной характеристики, управляемой коэф­ фициентами оо, at

Кроме того, на вход синтезатора поступают принятые напря­ жения, пропорциональные коэффициентам Фурье ао, аь а2, ..., ak, bi, Й2, В результате частотная характеристика синтезато­ ра будет иметь вид (5.16), поэтому спектр процесса на выходе синтезатора будет совпадать со спектром передаваемой речи. Это и означает, что синтезатор восстанавливает исходное пере­ даваемое сообщение.

Поясним принцип создания в синтезаторе частотной харак­ теристики, совпадающей со спектром речи. Предположим, что на вход линии задержки поступает косинусоидальное напряжение от генератора Г (рис. 5.45). Задержки подобраны так, что с трех

222

отводов снимаются следующие напряжения:

«о = ^т о cos 9.t ;

И\ — U т\COS 2 (^+т);

и" = Uтх COS 2 [t—т).

Всуммирующем устройстве складываются напряжения и.\ и поэтому на его выходе получим напряжение

их = Uml [cos 2 [t + х) + cos 2 (t — т) ] = 2Umx cos 2т cos 9.t .

Это напряжение, а также напряжение u0 поступают на модуля­ торы М Хаи М „ а, куда, кроме того, поступают напряжения с при­ емного устройства, пропорциональные коэффициентам Фурье а х

иВ результате амплитуды напряжении на выходе модулято-

ров также будут пропорциональны коэффициентам Фурье, т. е.

 

«о =

cos ;

к,

= ахcos 2 т cos 21 .

Сложив эти два напряжения, получим

«0 + и х =

 

ф a, cos 2 tj cos 2 t .

Если теперь в линии задержки добавить еще два отвода, отстоя­ щие от центрального отвода на расстоянии 2 т, при сложении напряжений на выходе суммирующего устройства получим на­ пряжение

щ — и 2' ф- я2" = 2U m 2 cos 22т cos 2^ .

Вообще сумма напряжений с двух отводов, отстоящих от цент­

рального на расстоянии k x ,

даст напряжение вида

u k = и к' + uk"

= 2U k cos k9.x cos 2/ .

При суммировании напряжений на выходе всех модуляторов получим следующее напряжение:

и 0 -f- и х -f- w2 “Ь' ‘ ' +% ==

—h^i cos 2

~ -f-

cos2 2 t + •■•-{-

 

 

+ a k cos k9x) cos 2

1.

 

Если взять задержку

x = —-—■,

где

F uакс

— максимальная

частота спектра речи,

■^.макс

 

 

 

будем иметь:

 

 

 

 

и0 ил+

н 2+ •••+ ик —

 

■(Ло

 

2и2

 

 

2тг£2

+ ахcos --------1-------h

cos ——

j cos й(.

\ 2

 

 

 

 

 

 

•' 223

Из последнего выражения следуй, что устройство, 'схема которого изображена на рис. 5.45, будет иметь частотную харак­ теристику, выражаемую четным рядом Фурье.

Для получения нечетных, т. е. синусоидальных составляю­ щих ряда, надо напряжения ик и ик" вычесть. Чтобы получить разность напряжений ик , ик", фаза одного из них с помощью

фазовращателя изменяется на 180°. В результате вычитания будем иметь

= “ к ~ “ к" = Uн[cos Q [t - kx) - cos 9. (t + frc) ] =

= 2Uksin k9.~ sin 9.t .

Таким образом, могут быть получены разностные напряжения &2, ■■•, соответствующие отводам, отстоящим от центрального отвода на т, 2 - , . . . Это показано на рис. 5.46, на котором изо­

бражена блок-схема синтезирующего устройства гармоническо­ го вокодера.

Р и с . 5 .4 6 . Б л ок -схем а си н тези р ую щ его устр ой ства гарм онического

вокодера

Перед суммированием косинусоидальных и синусоидальных составляющих последние поворачиваются по фазе на 90°. Прак­ тически это достигается поворотом с помощью фазовращате­ лей фазы косинусоидальных составляющих на — 45° и фазы синусоидальных составляющих на +45°. В результате поворота

224

фаз й суммирования напряжение на выходе синтезирующего устройства будет иметь вид

г,вых = (—— b °i

cos —-------г

••■ +

акcos —-------- h

 

\ "

“ макс

 

“ макс

 

-t- bxnis--------- 1- ■•■ +

bksin

----- Jcos 2 t.

(5.19)

“ макс

 

‘"макс /

 

Выражение в скобках равенства (5.19) определяет частотную характеристику синтезатора. Оно совпадает с выражением (5.16), определяющим спектр речи. Это означает, что при подаче на вход линии задержки напряжения с равномерным сплошным или дискретным спектром на выходе синтезирующего устрой­ ства сигнал будет иметь спектр, совпадающий со спектром пере­ даваемой речи. Тем самым и доказывается возможность синте­ за речи с помощью описанного устройства.

Количество гармоник спектральной функции, которые нуж­ но передавать по линии связи и восстанавливать в приемном устройстве, зависит от требований к натуральности звучания речи. Речь получается разборчивой при восстановлении только первой гармоники спектральной функции, т. е. при передаче и восстановлении коэффициентов Яо, яь и bt [30]. При восстанов­ лении спектра с точностью до 4—5 гармоник натуральность син­ тезированной речи будет не хуже, чем в обычных телефонных каналах. В [31] для улучшения синтезированной речи рекомен­ дуется при звонких звуках добавлять к дискретному спектру ге -1 нератора импульсов небольшое напряжение от шумового гене­ ратора. Это связано с тем, что большинство звонких звуков, по­ мимо дискретных компонент, содержат также и шумовые ком­ поненты, имеющие высокочастотный спектр. Добавление не­ большого количества шума с частотами выше 1500 гц улучшает качество синтезированной речи.

Для передачи каждого сигнала управления, как и в полосном вокодере, требуется полоса порядка 15—25 гц. Следовательно, при передаче гармоник вплоть до пятой, требуется полоса 165—280 гц. С учетом полосы, которая потребуется для переда­ чи информации об основном тоне, общая полоса, занимаемая гармоническим вокодером, будет равна примерно 200—300 гц.

Рассмотренный здесь принцип анализа и синтеза речи с по­ мощью гармонических функций не является единственно воз­ можным. Некоторые варианты применения этого принципа ука-. зываются в работах [30], [32], [33].

Ф о р м а н т н ы й в о к о д е р . В формантном вокодере в ка­ честве параметров речи используются форманты, а именно частоты формант и их уровни. Схема формантного вокодера изо­ бражена на рис. 5.47 [1].

В анализаторе формантного вокодера частотный диапазонречи с помощью фильтров Фо, Фь Фг, Фз делится на четыре

15. п . А. Константинов

225

части. Фильтр Ф0 предназначен для выделения диапазона основ­ ного тона 0—350 гц. Фильтр Ф{ выделяет полосу частот 300— Ю00 гц, фильтр Ф2 — полосу частот 700—2400 гц, фильтр Ф3 — полосу частот 2400—3500 гц. Эти полосы частот примерно со­ ответствуют местоположениям первой, второй и третьей фор­ мант на оси частот. Кроме того, имеется специальное устрой­ ство — выделитель глухих звуков.

Р и с . 5 .4 7 . Б л ок -схем а ф ор м а н тн ого в о к о д е р а с

раздельным

управлением уровням и ф орм ан т звонких

зв ук ов

После разделения спектра речи в каждом из диапазонов про-’ изводится определение указанных ранее параметров речи. На выходе фильтра Ф0 определяется частота основного тона F0, на выходе фильтров Ф\, Ф2 и Ф3 определяются частоты первой, второй и третьей формант F\, F2 и F3 и их уровни Uu U2 , U$. На выходе выделителя глухих звуков также определяются частота шума Fm и уровень шума С/ш.

Определение уровней производится с помощью амплитудных детекторов Д\, Д2, Дг и Д ш с постоянной времени около 40 мсек, определение частот — с помощью «частотных детекторов» Чь Ч2, Чз, Чш. Но определение частот сложнее. Дело в том, что форманты могут охватывать несколько максимумов спектра и значения частот становятся неоднозначными, если их опреде­ лять по спектральным максимумам. Возможны различные спо­ собы выделения формантных частот.

226

Один из таких способов сводится к следующему. Диапазон частот речи разбивается на полосы набором узкополосных фильтров с шириной полосы; равной примерно 100 гц для диа­ пазона первой форманты, и с увеличивающейся шириной поло­ сы до 450 гц для высокочастотных частей речевого диапазона. Общее количество фильтров равно 36. Выходы узкополосных фильтров переключаются со скоростью 60 раз в секунду, и мес­ тоположение максимального напряжения фиксируется. При ме­ ханическом переключении время переключения соизмеримо с длительностью формант и такой способ будет недостаточно точ­ ным.

Для повышения точности измерения целесообразно произ­ водить разделение всех 36 фильтров на 3 группы соответственно трем формантным областям и осуществлять коммутацию фильт­ ров и поиск максимального напряжения внутри каждой груп­ пы. При этом для увеличения скорости коммутации фильтров лучше применять электронную схему искателя максимально­ го напряжения.

Определение формантной частоты может быть произведено также при помощи счетчика переходов через нуль. При этом речь предварительно дифференцируется и определяется количе­ ство пиков в единицу времени, равное числу переходов через нуль.

Сплошной спектр глухих звуков обычно сосредоточен в об­ ласти частот выше 3000 гц и часто не имеет явно выраженного максимума или имеет несколько максимумов. В этом случае удобнее определять среднюю частоту спектра, называемую центроидом спектра, равную

F = —------------

2 u t '

i

где Д/г — ширина /-той полоски спектра; Ui— уровень спектра в этой полоске.

Измерение средней частоты может производиться измере­ нием частоты переходов через нуль для области спектра выше 3000 гц [41]. Уровень глухих звуков характеризуется суммой

и может быть определен с помощью детектора Д ш. Информация о найденных параметрах передается в линию

связи и поступает в приемное устройство. В схеме, приведенной на рис. 5.47, определяются уровни всех трех формант и общее число определяемых параметров, а следовательно, и число управляющих .сигналов, передаваемых по линии связи, равно девяти. В целях уменьшения числа управляющих сигналов воз­ можно управление уровнем синтезированной речи производить

15*

227

сразу для всех трех формант звонких звуков. При этом число управляющих сигналов сокращается до семи. Если считать, что для передачи каждого параметра требуется полоса 15—25 гц,. тогда общая полоса частот будет равна примерно 100— 175 гц. Указывается на возможность дальнейшего сокращения полосы частот примерно до 60 гц за счет более рационального выбора определяемых параметров.

В синтезаторе формантного вокодера имеются генератор им­ пульсов, управляемый основным тоном, и генератор шума. Со­ здаваемые ими колебания поступают на входы фильтров Ki, Кг? Кг и Кш соответственно. В отличие от синтезатора полосного вокодера эти фильтры настраиваемые и их число равно числу формант. Фильтры имеют переменную емкость (на реактивной лампе) или переменную индуктивность (на пермалое). Их на­ стройка осуществляется изменением резонансной частоты под

действием

управляющих сигналов, соответствующих

частотам

F1, /-’г, Е3,

в пределах диапазона соответствующей

форман­

ты. Напряжения с выхода фильтров поступают на модуляторы /И|, М2, М3, Мш вместе с управляющими сигналами, соответ­ ствующими уровням U|, U2, U3, Um. В результате суммирова­ ния процессов на выходе всех модуляторов будет синтезировать­ ся речь.

Ранее указывалось, что методы определения частоты основ­ ного тона пока разработаны недостаточно. Поэтому временно применяются полувокодерные схемы с передачей основного то­ на без преобразования его с использованием для этого всей за­ нимаемой им полосы частот. На приемной стороне полоса час­ тот непреобразованной речи с помощью нелинейных устройств «размножается», т. е. ее спектр расширяется до 3000—4000 гц. На рис. 5.47 элементы, относящиеся к полувокодерному вариан­ ту, показаны пунктиром.

Формантные вокодеры менее разработаны, чем полосные во­ кодеры. Однако возможность большего по сравнению с полос­ ными вокодерами сокращения полосы частот делает формант­ ные вокодеры весьма перспективными.

Ф о н е м н ы й в о к о д е р . В фонемном вокодере в качестве параметров используются фонемы. Фонемой называют фоне­ тические элементы речи, т. е. типизированные звуки, освобож­ денные от индивидуальных особенностей говорящего, служащие основным признаком для различения слов данного языка. Раз­ личные люди произносят звуки по-разному. Но имеются какието признаки, которые позволяют отличить одну фонему от дру­ гой независимо от произношения. Здесь подходящей является аналогия с письмом. Независимо от почерка различных людей каждая буква имеет определенное типовое начертание, т. е. определенные признаки, позволяющие отличить ее от других букв. Звук речи данного лица отличается от своей фонемы по­ добно тому, как написанная обычным почерком буква отличает­

228

ся от ее типового начертания. Фонемы весьма приближенно со­ ответствуют буквам письма.

Коротко принцип действия

фонемного вокодера сводится'

к следующему. В анализаторе

производится определение фо­

нем произносимой речи (рис. 5.48). В линию связи каждая фо­ нема передается в виде некоторой кодовой комбинации, подоб­ но кодовым комбинациям букв в системах телеграфии. В синте­ заторе имеется запись всех фонем речи. Принимаемые кодовые

Р а с ^ 5 .4 8 . Б л ок -схем а ф он ем ного вокодера

комбинации включают на телефон соответствующие им фонемы, благодаря чему восстанавливается речь.

Особенностью фонемного вокодера является то, что восста­ новленный в синтезаторе голос не передает индивидуальных особенностей говорящего и при данном источнике звука будет всегда одним и тем ж/е. Такую систему связи называют звуко­ вым телеграфом. Путем усложнения устройства можно и в дан­ ном случае обеспечить передачу и воспроизведение некоторых индивидуальных особенностей голоса. Можно, например, в син­ тезаторе иметь несколько комплектов фонем, записанных для различных по высоте голосов. Включаться будет та фонема, ко­ торая по высоте окажется наиболее близкой к голосу говоря­ щего. Однако и в этом случае кодовая комбинация, соответ­ ствующая данной фонеме, не несет индивидуальных особенно­ стей голоса, поскольку она отображает признак фонемы, инва­ риантный по отношению к различным голосам. В этом состоит существенное различие фонемного вокодера от ранее рассмот­ ренных, в которых передаваемые по линии связи параметры ото­ бражали речь говорящего (например, спектр речи, частоты фор­ мант, их интенсивности и т. п.) и в какой-то мере еще сохраня­ ли особенности данного голоса.

Количество различных фонем невелико. Считается, что нор­ мальный человек может издавать и последовательно различать сотни различных звуков. Однако все звуки в языке не исполь­ зуются. Слова русского языка могут быть составлены из 40 ос­ новных фонетических элементов речи—фонем. С учетом слу­ жебных знаков необходимое число кодовых комбинаций должно быть несколько увеличено.

Если кодовые комбинации составляются на основе равно­ мерного двоичного кода, тогда можно считать, что достаточным окажется шестизначный код, позволяющий передать 26 = 64 комбинации. Так как нормальная речь произносится со ско-

2 2 9

Соседние файлы в папке книги из ГПНТБ