- •Новые информационные технологии (3)
- •3.6.1. Промышленные системы распознавания речи
- •Ibm Voice Type Dictation – фонетическая пишущая машинка фирмы ibm
- •1.1.2.4.2. Системы клонирования голоса
- •1.1.2.4.1. Системы синтеза видеоряда по тексту
- •Системы обработки связных текстов
- •Системы фразового перевода
- •Системы контекстного перевода
- •1.1.2.5.3. Системы понимания речи (текстов)
- •Онтологии и тезаурусы
- •Речевые и текстовые базы
- •Сравнительная характеристика естественно-языковых систем
Системы контекстного перевода
В отличие от систем фразового перевода, системы контекстного перевода позволяют увязывать смысл отдельных предложений. Для этого в структуру системы вводится блок семантического анализа, формирующий и использующий модель предметной области, описываемой в переводимом тексте. Модель предметной области включает основные понятия, представленные в тексте, и связи между ними. Модель предметной области может быть представлена семантической сетью. При использовании семантической сети в качестве контекста на выбор лексических единиц на языке перевода влияет их вхождение в модель предметной области.
1.1.2.5.3. Системы понимания речи (текстов)
Системы по распознаванию речи основаны на поиске наиболее точного соответствия между определенными произнесенными словами и словарем акустических образцов слов. Однако такой подход, работающий в случае распознавания изолированных слов, неприемлем для непрерывной речи, так как входной акустической сигнал в этом случае не может быть эффективно смоделирован как простое сочетание произнесенных частей лексических единиц. Тем не менее, необходимо начинать с основных лингвистических единиц, таких как фонемы, и сохранять информацию о ритме и длительности речевого высказывания.
Если следовать таким путем, то подход к обработке речи, основанный скорее на знаниях, чем на сопоставлении с образцами, становится неизбежным, так как, чтобы извлекать преимущества из распознавания конкретных лингвистических единиц в сигнале, необходимо знать, как данная единица связана с остальными частями языка.
СПР имеют дело со слитно произнесенной речью, фразами, предложениями и даже параграфами, так как «понимание» изолированных слов может означать только тривиальный процесс сопоставления некоторого значения каждому слову словаря системы. Понимание связанной речи - сложная задача, и на проектирование СПР повлияли исследования в таких разных областях, как акустическая обработка сигнала, нейрофизиология, психолингвистика, психология, а также математика.
Посредником при преобразовании речи в ее значение должны служить определенные языковые и неязыковые компоненты различных уровней, которые используют разнообразные источники знания (ИЗ), т.к. речевой сигнал кодирует много различной информации, необходимой для восстановления значения. Единственной возможной архитектурой СПР и основных ИЗ является следующая:
РЕЧЬ — ОБРАБОТКА АКУСТИЧЕСКОГО СИГНАЛА — ФОНЕТИЧЕСКИЙ АНАЛИЗ — ФОНОЛОГИЧЕСКИЙ АНАЛИЗ — МОРФОЛОГИЧЕСКИЙ АНАЛИЗ — ЛЕКСИЧЕСКИЙ АНАЛИЗ — СИНТАКСИЧЕСКИЙ АНАЛИЗ — СЕМАНТИЧЕСКИЙ АНАЛИЗ —ПРАГМАТИЧЕСКИЙ АНАЛИЗ — ЗНАЧЕНИЕ.
При такой организации СПР информация течет вверх по мере того, как каждый элемент создает промежуточные представления, кодируя (частичные) гипотезы относительно ввода на основе ему доступного знания.
В процессе акустической обработки речевой сигнал оцифровывается, трансформируется так, чтобы его можно было представить в той форме, которая поддается фонетическому декодированию. Параметризованный сигнал может затем быть размечен как дискретная последовательность фонем.
Фонологический анализ выполняется на фонетическом представлении, которое определяет лингвистически важные различия, имеющиеся в фонетическом представлении произнесения, например, уровни и расположение ударения, интонационный контур, структуры слога, последовательности фонем, лежащих в основе произнесения. Фонологический анализ необходим для лексического анализа, т.е. процесса, который сопоставляет фонетическую форму произнесения с каноническими фонемными представлениями слов в словаре, чтобы восстановить информацию, хранящуюся там относительно их морфологических, синтаксических, и семантических свойств. Фонологическое знание относительно допустимых последовательностей фонем в слогах может использоваться, чтобы распознать слог, и, следовательно, границы слова.
Как только фонологический анализ завершен, дальнейшая обработка будет подобна пониманию текста. Дальнейшие этапы морфологического, синтаксического, семантического и прагматического анализа способствуют распознаванию, эксплуатируя избыточность речи, в информационно-теоретическом смысле.
Прежде, чем слова, выделенные в речевом сигнале, будут сопоставлены с лексическими входами в словаре системы, необходимо провести морфологический анализ, который приведет слова к их основной форме.
После морфологического анализа возникшее морфофонологическое представление речевого ввода может быть найдено в словаре системы, чтобы получить синтаксическую, семантическую и прагматическую информацию относительно гипотезы последовательности слов. Задача синтаксического анализа - исключить гипотезы лексической комбинаторики на основе правил извлечения синтаксически недопустимых последовательностей.
На этапе семантического анализа гипотезы подвергаются дальнейшей обработке с учетом смыслового фактора с применением системы семантических отношений.
Учет прагматики приводит к выявлению некорректных комбинаций уже на этом уровне.
При создании систем, обрабатывающих текст, к числу которых относятся СМП, и систем, обрабатывающих и понимающих речь, активно используются знания об уровнях языка, тесно связанные с этапами анализа в этих системах.