![](/user_photo/1334_ivfwg.png)
- •Оглавление
- •Введение
- •Глава 1. МИКРОПРОЦЕССОРНЫЕ СИСТЕМЫ
- •1.1. Понятие архитектуры вычислительной системы. Структура аппаратной части и назначение основных функциональных узлов
- •1.2. Базовые параметры и технические характеристики ЭВМ
- •Контрольные вопросы к главе 1
- •Глава 2. СТРУКТУРА И ФУНКЦИОНИРОВАНИЕ ПРОЦЕССОРА
- •2.2. Устройство управления с программируемой логикой
- •2.3. Устройство управления с жесткой логикой
- •2.4. Слово состояния процессора
- •2.5. Микроконтроллеры
- •2.6. Особенности организации однокристальных и секционных микропроцессоров
- •2.8. Архитектура и функционирование микропроцессора
- •Контрольные вопросы к главе 2
- •Глава 3. СИСТЕМЫ КОМАНД МИКРОЭВМ
- •3.1. Язык микроопераций для описания вычислительных устройств
- •3.2. Структура и формат команд микропроцессора и МПС
- •3.3. Программирование микропроцессора
- •Контрольные вопросы к главе 3
- •Глава 4. ТЕНДЕНЦИИ РАЗВИТИЯ АРХИТЕКТУРЫ И АППАРАТНОГО ОБЕСПЕЧЕНИЯ ЭВС
- •4.1. Требования различных задач к вычислительным ресурсам и ограничения фон-Неймановской архитектуры
- •4.2. Распараллеливание процессов обработки информации
- •4.3. Принцип совмещения операций. Конвейерная обработка информации
- •4.4. Архитектура процессоров с сокращенным набором команд
- •4.5. Применение кэш-памяти и повышение пропускной способности
- •4.6. Транспьютеры
- •4.7. Развитие новых архитектурных принципов
- •4.8. Оценка производительности скалярного процессора
- •Контрольные вопросы к главе 4
- •Глава 5. ОПЕРАТИВНАЯ ПАМЯТЬ
- •5.1. Классификация и иерархическая структура памяти ЭВМ
- •5.2. Запоминающие элементы статических ОЗУ
- •5.3. Запоминающие элементы динамических ОЗУ
- •5.4. Структуры матриц накопителей информации
- •5.5. Структура построения БИС статических ОЗУ и модулей памяти
- •5.6. Структура построения БИС динамических ОЗУ
- •5.7. Элементная база и организация постоянных запоминающих устройств
- •Контрольные вопросы к главе 5
- •Глава 6. ВНЕШНИЕ ЗАПОМИНАЮЩИЕ УСТРОЙСТВА НА МАГНИТНЫХ НОСИТЕЛЯХ
- •6.1. Принцип записи двоичной информации на магнитную поверхность
- •6.3. Методы записи цифровой информации на магнитный носитель
- •6.4. Воспроизведение информации и повышение ее достоверности
- •6.5. Накопители на гибких магнитных дисках и их контроллеры
- •6.6. Накопители на жестких магнитных дисках типа винчестер и их контроллеры
- •6.7. Накопители на сменных магнитных дисках
- •6.8. Накопители на магнитной ленте
- •Контрольные вопросы к главе 6
- •Глава 7. ОПТИЧЕСКИЕ И МАГНИТООПТИЧЕСКИЕ ВЗУ
- •7.1. Лазерные системы и их применение в устройствах внешней памяти
- •7.2. Оптические диски
- •7.3. Магнитооптические диски
- •7.4.Устройство накопителя на оптических дисках
- •Контрольные вопросы к главе 7
- •Глава 8. ВЗУ НА ЦМД-СОДЕРЖАЩИХ МАТЕРИАЛАХ
- •8.1. Принципы возникновения цилиндрических магнитных доменов
- •8.2. Организация продвижения ЦМД
- •8.4. Структура ЦМД-микросхем памяти
- •8.5. Устройство ЦМД-накопителя
- •Контрольные вопросы к главе 8
- •Глава 9. ВЗУ НА ОСНОВЕ ГОЛОГРАФИИ
- •9.1. Носители информации голографических ЗУ
- •9.2. Создание голограмм
- •9.3. Воспроизведение голограмм
- •9.4. Голографические ЗУ двоичной информации
- •Контрольные вопросы к главе 9
- •Глава 10. ОРГАНИЗАЦИЯ БЕЗАДРЕСНОЙ И ВИРТУАЛЬНОЙ ПАМЯТИ
- •10.1. Стековая память
- •10.2. Ассоциативная память
- •10.3. Виртуальная память со страничной организацией
- •10.4. Структура виртуальной памяти при сегментном распределении
- •Контрольные вопросы к главе 10
- •Глава 11. НАЗНАЧЕНИЕ ПЕРИФЕРИЙНЫХ УСТРОЙСТВ
- •11.1. Классификация периферийных устройств
- •Контрольные вопросы к главе 11
- •Глава 12. УСТРОЙСТВА АВТОМАТИЧЕСКОГО СЧИТЫВАНИЯ ТЕКСТОВ
- •12.1. Устройства автоматического ввода печатных текстов
- •12.2. Методы распознавания образов печатных знаков
- •12.3. Устройства автоматического ввода рукописных текстов
- •12.4. Средства считывания и хранения графических изображений поврежденных рукописных текстов
- •12.5. Кодирование текстов для электронных публикаций
- •Контрольные вопросы к главе 12
- •Глава 13. УСТРОЙСТВА АВТОМАТИЧЕСКОГО ВВОДА ИЗОБРАЖЕНИЙ
- •13.1. Устройства автоматического ввода одноконтурных изображений
- •13.2. Устройства автоматического ввода многоконтурных и полутоновых изображений
- •13.3. Считывание цветных изображений
- •Контрольные вопросы к главе 13
- •Глава 14. УСТРОЙСТВА ПОЛУАВТОМАТИЧЕСКОГО ВВОДА ГРАФИЧЕСКОЙ ИНФОРМАЦИИ - ДИГИТАЙЗЕРЫ
- •14.1. Устройство рабочего поля планшета
- •14.2. Структурная схема дигитайзера и ее функционирование
- •Контрольные вопросы к главе 14
- •Глава 15. УСТРОЙСТВА ВВОДА - ВЫВОДА РЕЧЕВОЙ ИНФОРМАЦИИ
- •15.1. Модель речи
- •15.2. Структурная схема анализатора речи
- •15.3. Структура устройств ввода речи
- •15.4.Устройства вывода речевой информации - синтезаторы
- •Контрольные вопросы к главе 15
- •Глава 16. УСТРОЙСТВА ОТОБРАЖЕНИЯ ИНФОРМАЦИИ - ДИСПЛЕИ
- •16.1. Классификация дисплеев
- •16.2. Способы формирования изображения на экране телевизионного дисплея
- •16.3. Структурная схема текстового телевизионного дисплея
- •16.4. Структурная схема графического телевизионного дисплея
- •16.5. Устройство плоских экранов
- •Контрольные вопросы к главе 16
- •Глава 17. АВТОМАТИЧЕКИЕ УСТРОЙСТВА РЕГИСТРАЦИИ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ - ГРАФОПОСТРОИТЕЛИ
- •17.1. Классификация и устройство графопостроителей
- •17.2. Принципы работы графопостроителя по вычерчиванию
- •17.3. Структурная схема планшетного графопостроителя
- •17.4. Структурная схема растрового графопостроителя
- •Контрольные вопросы к главе 17
- •Глава 18. АППАРАТУРА ПРИЕМА-ПЕРЕДАЧИ ИНФОРМАЦИИ
- •18.1. Обобщенная структурная схема аппаратуры передачи дискретной информации
- •18.2. Характеристики аппаратуры передачи данных
- •18.3. Принципы организации интерфейсов
- •18.4. Классификация интерфейсов
- •Контрольные вопросы к главе 18
- •Глава 19. АВТОМАТИЧЕСКИЕ УСТРОЙСТВА ВВОДА-ВЫВОДА АНАЛОГОВОЙ ИНФОРМАЦИИ В ЭВМ
- •19.1. Назначение устройств ввода-вывода аналоговой информации в ЭВМ
- •19.2. Принципы построения ЦАП и АЦП
- •19.3. Принципы построения и программирование системы ввода-вывода аналоговой информации в ЭВМ
- •Контрольные вопросы к главе 19
- •Глава 20. КАНАЛЫ ВВОДА-ВЫВОДА И АППАРАТУРА СОПРЯЖЕНИЯ
- •20.2. Организация обмена массивами данных
- •20.3. Мультиплексный канал
- •20.4. Селекторный канал
- •20.5. Устройства сопряжения - мультиплексоры передачи данных
- •Контрольные вопросы к главе 20
- •Глава 21. УСТРОЙСТВА ЗАЩИТЫ ОТ ОШИБОК В ПЕРЕДАВАЕМОЙ ИНФОРМАЦИИ
- •21.1. Причины возникновения ошибок в передаваемой информации
- •21.2. Краткая характеристика способов защиты от ошибок
- •21.3.Обнаруживающие коды - с проверкой на четность и итеративный код
- •21.4. Корректирующий код Хэмминга
- •21.5. Циклические коды
- •21.6. Циклический код Файра как средство коррекции пакетов ошибок
- •Контрольные вопросы к главе 21
- •ЗАКЛЮЧЕНИЕ
- •Приложение 2
- •Приложение 3
- •Приложение 4
- •Приложение 5
- •Приложение 6
- •Приложение 7
- •Приложение 8
- •Приложение 9
- •Приложение 10
- •Приложение 11
- •Приложение 12
- •Приложение 13
- •Приложение 14
- •Приложение 15
- •Приложение 16
- •Приложение 17
- •Приложение 18
- •Приложение 19
- •Приложение 20
- •Приложение 22
- •Приложение 23
- •Приложение 24
- •Приложение 25
- •Приложение 26
- •Предметный указатель
- •Список литературы
Глава 15. Устройства ввода - вывода речевой информации |
219 |
Тембры голосов разных операторов порой сильно отличаются друг от друга, |
осо- |
бенно велико отличие между женскими и мужскими голосами. Это объясняется отличающимися спектральными характеристиками звуковых колебаний из-за наличия разного набора гармонических составляющих одного и того же звука, произносимого разными операторами. Машинное описание фонем будет также различаться для разных операторов и будет отличным от эталонов, что приведет в дикторо-зависимых системах к нераспознаванию некоторых фонем (в худшем случае всех) и к ошибкам в вводимой информации. Поэтому при смене операторов требуется предварительная настройка системы путем записи новых эталонов с голоса пользователя. Этот прием в интеллектуальных системах называется обучением.
Второй вариант настройки на голос оператора - индивидуальная подстройка ампли- тудно-частотных характеристик полосовых фильтров анализатора. Для этого вводится сложная система частотно-зависимой отрицательной обратной связи, обеспечивающая постоянство частотного спектра сигнала независимо от индивидуальных свойств голоса оператора. Наибольший эффект достигается, когда тембры голосов близки.
Пока еще в дикторо-зависимых, тоесть настраиваемых, системах ввода речи удается получить в 4 раза меньшее количество ошибок распознавания , чем в дикторо-независимых.
На особо важных объектах, к управлению которыми допущен ограниченный круг лиц, необходима настройка аппаратуры под речевые параметры конкретного оператора, которыми являются тембр, скорость произнесения слов, акцент, дефекты речи.
При проектировании новых универсальных устройств ввода речевых сообщений ставится основная цель - разработка дикторо-независимых методов и систем распознавания слитной речи с большим словарем. Для достижения этого разработчиками в настоящее время решаются последовательно следующие задачи: вначале прогнозируется создание дикто- ро-зависимых систем распознавания дискретной речи со словарем ограниченного объема (от 15000 до 20000 слов); затем - адаптивных (настраиваемых на конкретного диктора в процессе работы) систем распознавания дискретной речи с большим словарем (более 20000 слов); и, наконец, ожидается создание дикторо-независимых систем распознавания слитной речи со словарем в 200 - 300 слов для использования в системах речевого управления.
15.4.Устройства вывода речевой информации - синтезаторы
Задача вывода речевой информации сводится к преобразованию машинных кодов, поступающих от ЭВМ, ПЗУ или линии связи, в колебания звуковых частот, составляющих речевой сигнал. Устройства вывода речевых сообщений при любой реализации аппаратно и программно проще, чем устройства ввода и не требуют больших системных ресурсов. Особенно экономится память при синтезе по фонетическим правилам.
Синтезаторы подразделяются на классы и группы по тем же признакам, что и анализаторы. Классам анализаторов речевых сигналов и сообщений соответствуют такие же классы синтезаторов: речевых сигналов и речевых сообщений. Синтезаторы речевых сообщений, как и анализаторы речевых сообщений (рис. 15.6), делятся на две группы: синтезаторы ограниченного словаря - компиляторы (рис. 15.7, а) и универсальные (рис. 15.7, б).
В компиляторах любое сложное речевое сообщение может быть получено путем компиляции (простого соединения) элементов речи. Этот метод называется методом синтеза по образам (по образцам). Элементы речи заранее начитываются диктором, соответствующие им сигналы компрессируются, кодируются и записываются в ПЗУ( рис. 15.8). Закодированные таким образом речевые элементы в процессе вывода считываются в нужной последовательности и одновременно восстанавливается речевой сигнал.
Вместо генераторов звуковых частот могут быть использованы цифровые полосовые фильтры. На рис. 15.9 приведена структурная схема компилятора. Электрические сигналы с
![](/html/1334/288/html_lWzDNqkTWr.70HG/htmlconvd-VplQW_220x1.jpg)
Глава 15. Устройства ввода - вывода речевой информации |
220 |
генератора основного тона (при формировании звонких звуков) и генератора шума (при формировании глухих звуков) через переключатель поступают на многозвеньевой управляющий цифровой фильтр. Фильтр и ЦАП управляются от ЗУ кадров, куда заранее из памяти описаний образцов заносится выбранное устройством управления описание сообщения, представляющее собой последовательность кадров. Каждый кадр содержит параметры громкости, частоты основного тона, длительности синтезируемого звука и ряд других. Кадры опрашиваются с интервалом квантования по времени, равным 20 мс. Если основной тон модулировать по частоте в соответствии с таблицей частот музыкальных нот, приведенной в приложении, можно синтезировать пение.
При использовании в качестве элементов речи отдельных словоформ, подставляемых в определенное место стандартной фразы, компиляционный метод позволяет получить удовлетворительный по качеству синтез речи. Попытки добиться высококачественного синтеза фонем или аллофонов не привели пока к положительным результатам, поскольку все эти элементы тесно связаны между собой внутри фразы. В слитной речи не существует аналогов этих элементов, произнесенных изолированно, и, наоборот, речь из изолированно произнесенных элементов звучит ненатурально. В связи с этим подготовка словаря в компиляторах представляет собой самостоятельную и сложную проблему.
Номер |
|
Компилятор |
|
|
Синтезатор |
|
сообщений |
|
|
речи |
|
||
|
|
|
|
|||
|
|
|
|
|
|
|
ЭВМ
ПЗУ
словаря
а)
Текст |
Лингвистический |
|
|
Синтезатор |
|
|
|
|
процессор |
|
|
речи |
|
|
|
|
|
|
|
|
ЭВМ
База знаний
б)
Рис. 15.7. Структуры устройств вывода речевых сообщений: а - ограниченного словаря - компилятор, б - универсальное
![](/html/1334/288/html_lWzDNqkTWr.70HG/htmlconvd-VplQW_221x1.jpg)
Глава 15. Устройства ввода - вывода речевой информации |
221 |
Динамики
Генератор f1=50 Гц
|
|
|
|
|
|
|
Дешифратор |
|
Генератор f2 |
|
Смеситель |
Машинный |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
код фонемы |
|
|
|
|
|
от ЭВМ или |
|
|
|
|
|
ПЗУ |
|
|
|
|
|
|
|
Генератор fn=5 КГц |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 15.8. Схема синтеза звуковых сообщений
от |
УУ выборкой и |
Память описаний |
|
ЭВМ |
ЗУ кадров |
||
|
синхронизацией |
образцов |
|
Выбор |
|
|
|
Fосн |
Коммутатор |
|
|
|
|
|
Генерат. высоты основн. тона
Многозвен.
Перекл. цифр. упр.
ЦАП фильтр
Генератор
шума
Динамик
Усил. |
Синтезатор
Рис. 15.9. Структурная схема компилятора
При разработке универсальных синтезаторов речевых сообщений стремятся получить функциональную модель речеобразования, адекватную реально существующим языковым и акустическим явлениям. Речь формируется по правилам фонетики языка, поэтому метод получил также названия синтеза по правилам и фонетический метод. На входе такой модели - орфографический или фонемный текст произвольного содержания, на выходе - звучащая речь. По своему существу такие синтезаторы являются кибернетической функциональ-
Глава 15. Устройства ввода - вывода речевой информации |
222 |
ной моделью чтения текста человеком. В базе знаний синтезатора хранится не только информация об элементарных единицах речи (эталоны фонем, аллофонов и интонем), но и алгоритмические правила их модификации в зависимости от конкретного контекста звуковой реализации. Процесс применения этих правил к эталонам фонем и интонем для входного синтезируемого текста реализуется лингвистическим процессором. Универсальные синтезаторы отличаются малым расходом памяти на один элемент речи и неограниченностью словаря синтезируемых сообщений.
Одним из основных параметров, характеризующих синтезаторы речи, является емкость памяти, необходимая для хранения объема речи, произносимого за 1секунду. Эта емкость составляет примерно 1,5 - 2 слова. В таблице приведены некоторые параметры синтеза по образцам (компиляция) и по правилам фонетики слова “алло”, произносимого за 0,3 с.
Таблица 15.1. Сравнение методов синтеза речи
__________________________________________________________________________
Метод синтеза |
Скорость, |
Объем памяти |
Время звучания речевой |
|
бит/с |
для хранения |
информации, хранимой в |
|
|
описания |
памяти ЭВМ емкостью |
|
|
слова “алло”, |
48 Кбайт |
|
|
|
байт |
__________________________________________________________________________
Формирование |
1200 |
45 |
5 |
мин 20 с |
по образцам |
5000 |
188 |
1 |
мин 17 с |
(компиляция) |
|
|
|
|
Формирование |
100 |
4 |
1 |
ч 4 мин |
по правилам |
800 |
30 |
8 мин |
|
(фонетический) |
|
|
|
|
__________________________________________________________________________
При формировании по образцам словарь компилируемых слов ограничен объемом описаний образцов, хранимых в ПЗУ; при формировании по правилам словарь практически не ограничен.
Примером высококачественного синтезатора, с помощью которого можно воспроизвести близкую к естественной речь различного темпа и оттенка непосредственно по тексту неограниченного словаря является устройство типа DЕCtolk. Устройство представляет собой блок размером 10х45х30 см, на задней панели которого расположены разъемы для подключения ЭВМ, видеотерминала и печатающего устройства, различных устройств вывода речевой информации, в том числе телефона, индикатора на светодиодах, регулятора громкости. Пользователь может выбрать 7 различных голосов, в том числе стандартные женский, мужской и детский, а также низкий мужской, высокий женский и голос пожилого человека. Высокое качество обусловлено большой библиотекой используемых правил, возможностью выбора словаря по желанию пользователя и качеством аппаратных средств для преобразования речи.
Контрольные вопросы к главе 15
1. Назовите два типа речевых процессоров.
2.В чем заключаются основные трудности при вводе речевых сообщений?
3.Назовите единицы речи при распознавании речевых сообщений.
4.Назовите три характеристики речи, реализующие интонацию и ударение в слитной речи.
5.Назовите три метода анализа речи.
6.Как и для чего производится сегментация речи на этапе анализа?
7.Назовите шесть спектральных параметров, которые оцениваются на этапе анализа речевого сообщения.
8.Назовите две группы анализаторов речевых сообщений.
9.Какие операции выполняет лингвистический процессор?
Глава 15. Устройства ввода - вывода речевой информации |
223 |
10. Какова разрядность АЦП в речевом предпроцессоре?
11. Каким образом определяются границы фонем при анализе слитной речи/ 12. Назовите значение емкости памяти эталонов команд языка программирования, включающего порядка 65 команд и знаков (язык Си).
13. В чем заключается настройка анализатора речи на голос оператора? Назовите два варианта настройки. 14. Какова ошибка распознавания дискретной речи? Слитной речи?
15. Назовите классы и группы, на которые подразделяются устройства вывода речевых сообщений - синтезаторы речи.
16. Что хранится в базе знаний устройства вывода речевых сообщений - речевого синтезатора ? 17. Сравните два метода синтеза речи - по образцам (компиляция) и по правилам (фонетический).