Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture 3.doc
Скачиваний:
12
Добавлен:
14.09.2019
Размер:
1.02 Mб
Скачать
  1. Структура приемника информации – машины

Для решения задачи коммуникации со стороны машины должны быть реализованы те же функции, что и со стороны человека – реципиента речевой посылки. Следовательно, и архитектура ее алгоритмов должна быть такой же, или похожей. Необходимо заметить, что эта тождественность реализуется на верхних уровнях отображения информации, на нижних же, в силу специфики обработки информации человеком (строго параллельно) и машиной (сугубо последовательно), в машинном варианте используются специфические алгоритмы обработки сигналов, имеющие строгое математическое обоснование. Хотя и в этом случае иногда привлекается психологическая эмпирика.

Традиционно в лингвистике рассматриваются следующие уровни представления речевой информации [10]: (1) уровень субфонемных элементов; (2) фонем; (3) корневых и флективных морфем, слогов; (4) слов; (5) уровень фразовых структур. Семантический и прагматический уровни представления знаний реализуются на стыке речевой и многомодальной моделей мира.

Акустико-фонетический уровень (АФУ) обработки информации формирует представление классов фонотипов, фонем или аллофонов в зависимости от степени детальности представления акустического сигнала.

На входе АФУ речевая акустическая информация подвергается первичной обработке с целью уменьшения отношения сигнал/шум, уменьшения корреляции, а также уменьшения вариативности входной информации.

На вход АФУ подается обучающая выборка из реализации слов фонетически сбалансированного словаря (ФСС). Под фонетически сбалансированным словарем понимается набор слов, содержащих все варианты фонем, вероятность появления которых в речи превышает некоторую заданную.

Для упрощения задачи формирования словаря фонетического уровня возможна предварительная сегментация и разметка ФСС: выбор только сегментов, точно соответствующих интересующим нас фонетическим элементам и формирование уже из них обучающей выборки.

В АФУ формируется представление речевой информации фонетического уровня в виде словаря фонетических элементов. Детальность словаря зависит от детальности акустического описания входных реализаций, т.е. от способа первичной обработки.

Если в качестве первичного описания используются -параметры в двух частотных каналах, будут сформированы только классы фонотипов: глухая смычка, гласная, назализованная согласная, согласная шумная. Более детальное описание, например кепстральный анализ, даст словарь фонем - приблизительно 32 звука. Еще более детальное описание на основе дискриминантных признаков, позволяющих разделить не только отдельные звуки, но и отдельные варианты звуков по месту в слове - даст словарь аллофонов (около 120 элементов).

Наличие сформированного словаря фонетического уровня позволяет использовать АФУ как структуру для выделения в явном виде фонологической информации. Взаимодействие произвольной выборки, поступающей на вход акустико-фонетического уровня, со сформированным в нем словарем приводит к выделению из входной информации последовательности транзем.

Следующий уровень представления речевых акустических знаний - лексический (ЛУ).

Лексический уровень. Подавая на вход АФУ обучающую выборку, содержащую множество реализаций слов оперативного словаря, на его выходе мы получаем ту же выборку, но уже в виде последовательности транзем с пробелами. Из этой последовательности на ЛУ формируется словарь слов, соответствующий оперативному словарю (наиболее часто встречающихся слов).

Параллельно словарю слов формируются дополнительно следующие подсловари: корневых морфем и флективных морфем.

Синтаксический уровень. Подавая на вход АФУ обучающую выборку, состоящую уже из множества типовых словосочетаний или фраз, на входе синтаксического уровня (СУ), после их взаимодействия со словарем фонем на АФУ и словарем корневых морфем на ЛУ, мы получим множество структур фраз, состоящих из последовательностей флективных морфем. Эти структуры в сигнальном пространстве СУ формируют словарь фразовых структур: в основе организации единиц этого уровня лежит общность звуковой формы - флективной структуры [11].

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]