
- •Билет 1 – понятие «уровня» в лингвистических моделей
- •Границы предмета лингвистики, язык как система систем
- •Билет 2 - Общее представление о языковых системах и автоматизированных системах обработки текстовой информации
- •Использование лингвистической информации в системах распознавания речи.
- •Билет 3 – проблема компьютерной реализации лингвистических моделей
- •Билет 7 – современная роботехника и использование в ней лингвистических знаний
- •Методы других наук в пл
- •Билет 10 – Лингвистика и семиотика
- •Исследовательские методы науки о языке
- •Билет 11 – проблемы и перспективы развития компьютерных обучающих систем
- •Прикладная эффективность лингвистических моделей
- •Билет 13 – асу и лингвистика
- •Традиционные и нетрадиционные задачи пл
- •Билет 18 – Основные направления развития систем ии
- •Взгляды на объект лингвистики и отдельные лингвистические дисциплины
- •Билет 19 – Дефиниции пл и их различия
- •Проблемы компьютерного воплощения лингвистических моделей
- •Билет 20 – Различное понимание пл и взгляды на ее соотношение с теоретической лингвистикой
- •Семиотическая типология знаков
- •Билет 22 – существующий подходы к выделению функций языка
- •Универсальные проблемы современной пл
- •Наличествует также связь лингвистики с медицинскими и естественными, физико-математическими и техническими науками.
- •Функции языка
- •Моделирование понимания языка как научная задача
- •Билет 25 – структурное описание естественного языка
Использование лингвистической информации в системах распознавания речи.
На сегодняшний момент распознавание слитной речи является сложнейшей и почти н1евыполнимой задачей. Поэтому происходит распознавание изолированных слов, разделяемых оператором паузой, но и в этом процессе существуют определенные нюансы.
Лингвистическая информация при распознавании речи (РР) используется по-разному.
Ряд признаков и источников информации, используемый машиной, группируются во фреймы. Это могут быть и признаки/источники, не связанные с распознаванием речи напрямую: это может быть некоторая «косвенная» информация, e.g. фонологические правила. Лингвистические знания помогают также произвести необходимую сегментацию на дискретные акустические инвариантные элементы.
Вследствие лингвистического анализа из речевого потока также выделяются фразы, синтагмы, словоформы, морфемы, фонемы и их признаки.
Использование лингвистической информации является необходимым условием повышения эффекта машинного распознавания слитной речи. Однако, так или иначе, вследствие недостаточной степени изученности лингвистического аспекта в рамках проблемы РР и понимания слитной речи в имеющихся устройствах чаще всего используются данные какого-либо одного языкового уровня и практически отсутствуют алгоритмы, включающие комплекс данных разноуровневого характера.
Билет 3 – проблема компьютерной реализации лингвистических моделей
Компьютерная лингвистика – направление в ПЛ, которое сориентировано на использование компьютерного инструментария (совокупности программ и ПО), служащего для организации и обработки лингвистических данных, а также для моделирования функционирования ЕЯ в тех или иных ситуациях, проблемных сферах и смежных дисциплинах. Компьютерное моделирование ЕЯ рассматривается как сфера приложения информатики и теоретического программирования к решению различных задач науки о языке. КЛ тесно связана с обработкой ЕЯ.
Проблемы компьютерной реализации лингвистических моделей связаны с:
(с т.з. обработки/распознавания)
отсутствием в ЕЯ строгих правил, определяющих порядок слов в предложении, т.е. трудности, связанные с обработкой информации, где допустимы: инверсия, тропы и прочие средства, которые способен проанализировать только человеческий мозг.
огромным количеством языковых единиц и средств ЕЯ, значений слов, использующихся людьми в повседневной устной и письменной речи, т.е. не существует совокупности всех значений и приемов, понятных человеку, т.к. их список был бы практически бесконечным.
структурой предложений (придаточные) и текстов (логическая/грамматическая связь единиц), не воспринимаемых машиной в силу сложности законов построения в ЕЯ.
(с т.з. информационного поиска)
несоответствие между желаемыми и действительными результатами поиска вследствие неспособности машины к логическому анализу структуры запроса: когда мы ищем определенную информацию, мы часто хотим получить материал, который не задается в запросе явно, т.е. задается при помощи синонимов, например.
(с т.з. машинного перевода)
Существует т.н. статистический подход, основанный на переводе фрагментов текста посредством их сопоставления с некими фрагментами других текстов, хранящихся в памяти.
Проблемы этого подхода заключаются в том, что:
набор текстов ограничен
в данном случае происходит механическое сопоставление без какого-либо анализа
Другой подход, предполагающий некоторое «понимание» текста машиной, тоже столкнулся с неразрешимой задачей: модель, имитирующая поведение лингвиста, не способна к анализу, который может провести человеческий мозг.
Глобальная проблема компьютерной лингвистики и реализации лингвистических моделей в частности заключается в том, что компьютерные системы требуют максимальной формализации структуры ЕЯ, т.е. фактически точное математическое описание языка. Это не представляется возможным, хотя бы потому, что ЕЯ слишком многогранен и представляется при помощи различных средств в зависимости от стиля, внешней ситуации/контекста и других факторов.