Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Занимат. анатомия роботов. Мацкевич.DOC
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
2.34 Mб
Скачать

4. Моделирование речи искусственная речь и свя­занные с ней проблемы

Говорящие машины уже суще­ствуют. Словарь их пока небольшой и состоит из слов, произнесенных человеком и записанных на маг­нитный барабан. Наиболее известный тому пример — говорящие часы, работающие на многих телефонных станциях.

Машины, использующие предварительно записан­ную речь, довольно дешевы и очень удобны, если чис­ло сообщений невелико, но непригодны, если требует­ся обычная непрерывная речь. Одна из причин состоит в том, что с возрастанием числа хранимых слов хранилище записанных слов становится слишком боль­шим и дорогим. Другой причиной является то, что в разговорной речи одно и то же слово может уча­ствовать в предложениях разного типа, с различными ударениями, интонациями и несколькими вариантами произношения. Поэтому невыгодно использовать не­посредственную запись речи для говорящих машин более общего типа. Выгоднее машины, в некотором смысле моделирующие работу голосовой системы че­ловека. Машины, которые не воспроизводят ранее за­писанную речь, а синтезируют ее, называют «синтеза­торами речи».

История синтезаторов речи очень стара. Наиболее ранние были непосредственными копиями человече­ского речевого аппарата и использовали воздухо­дувные меха, язычки и резонаторы. Управляли этими машинами, как правило, вручную, с помощью набора рычагов. Одна из таких машин была построена Во­льфгангом фон Кемпелиа в конце XVIII века. Извест­но, что она очень хорошо имитировала речь, хотя не совсем правильно воспроизводила некоторые звуки. В 1920 году акустическая модель Р. Пэджета произно­сила целые фразы, например: «Алло, Лондон, вы слу­шаете?» или «О, Лейла, я люблю Вас!». Для этого ав­тору приходилось руками очень искусно изменять форму резонирующей полости машины.

При дальнейшем моделировании оказалось (как ча­сто бывает при моделировании функций человеческого организма), что воспроизведение человеческой речи ис­ключительно сложно. Развитие говорящих машин ста­ло действительно возможным только с появлением со­временной электронной техники, которая позволяет достигнуть необходимого уровня сложности.

Убедиться в сложности речевых сигналов позво­ляют спектрографы или анализаторы спектра. Про­стейшим прибором для частотного анализа является резонансный частотомер, содержащий ряд упругих стальных пластин с различной частотой собственных колебаний. При подаче на электромагнит этого прибо­ра сигналов речи поле электромагнита возбуждает только ту пластину, собственная частота которой со­впадает с частотой исследуемого сигнала.

На рис. 23 показан получающийся таким способом частотно — временной спектр звука сирены с постепенно повышающейся частотой, а на рис. 24 — спектр звука отдельного слова, произнесенного человеком. Как вид­но из рисунков, звуковые колебания, образующие речь (в отличие от речи автомата — сирены), содержат много составляющих, которые в сумме создают сложную звуковую картину. К сожалению, эти картины очень отличаются не только у различных дикторов, но даже у одного и того же человека в разное время.

Рис. 23. Спектр звука сирены Рис. 24. Спектр слова, произне­сенного человеком

Взгляните на шесть контурных диаграмм англий­ского слова «You» (рис. 25) — и вы убедитесь в этом.

Рис. 25. Контурные диаграммы англий­ского слова "You"

Диаграммы получены от пяти различных людей, толь­ко нижние две диаграммы — от одного человека (на диаграммах контурные линии отображают различную интенсивность звучания).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]