- •Билет 1 вопрос II
- •ТиПл №2Общее представление о языковых системах и автоматизированных системах обработки текстовой информации
- •Билет 2 вопрос 2 Использование лингвистической информации в системах распознавания речи.
- •Билет 7 вопрос 2 Задачи прикладной лингвистики.
- •Билет 3 вопрос 1
- •Билет 4 вопрос 1
- •Билет 5 вопрос 1
- •Билет 8 вопрос 1
- •Билет 6 вопрос 1
- •Билет 14 вопрос 1
- •Билет 5 вопрос 2
Билет 7 вопрос 2 Задачи прикладной лингвистики.
1)Развитие новых ИТ на базе информации о языке 2)разработка и усовершенствование систем информационного поиска 3)разработка программ о реферировании текста4)разработка словарей(копм.лексикография)5)создание искусственных языков6)упорядочение, стандартизация,унификация научной технической терминологии7)организация библиографической информации8)автоматическое распознавание устной и письменной речи9)автомат.обработка текстов на ест.языке10)автомат.анализ и синтез речи11)формирование базы данных на родном и иностр.языках(корпусная лингвистика)12)лингвокриминалистика13)разработка обучающих языкам систем(русск для иностранцв)14)разработка систем автоматизированного перевода15)разработка языков,автоматизация информационных работ16)проведение квантитативных исследований применительно к различным видам текстов
Билет 3 вопрос 1
Поскольку мы говорим о компьютерной реализации неких лингвистических моделей, прежде всего, необходимо определить понятие компьютерной лингвистики.Компьютерная лингвистика – направление в ПЛ, которое сориентировано на использование компьютерного инструментария (совокупности программ и ПО), служащего для организации и обработки лингвистических данных, а также для моделирования функционирования ЕЯ в тех или иных ситуациях, проблемных сферах и смежных дисциплинах. Компьютерное моделирование ЕЯ рассматривается как сфера приложения информатики и теоретического программирования к решению различных задач науки о языке. КЛ тесно связана с обработкой ЕЯ.
Проблемы компьютерной реализации лингвистических моделей связаны с:
-отсутствием в ЕЯ строгих правил, определяющих порядок слов в предложении, т.е. трудности, связанные с обработкой информации, где допустимы: инверсия, тропы и прочие средства, которые способен проанализировать только человеческий мозг.
-огромным количеством языковых единиц и средств ЕЯ, значений слов, использующихся людьми в повседневной устной и письменной речи, т.е. не существует совокупности всех значений и приемов, понятных человеку, т.к. их список был бы практически бесконечным.
-структурой предложений (придаточные) и текстов (логическая/грамматическая связь единиц), не воспринимаемых машиной в силу сложности законов построения в ЕЯ.
-несоответствие между желаемыми и действительными результатами поиска вследствие неспособности машины к логическому анализу структуры запроса: когда мы ищем определенную информацию, мы часто хотим получить материал, который не задается в запросе явно, т.е. задается при помощи синонимов, например.
Существует т.н. статистический подход, основанный на переводе фрагментов текста посредством их сопоставления с некими фрагментами других текстов, хранящихся в памяти.
Проблемы этого подхода заключаются в том, что:
набор текстов ограничен
в данном случае происходит механическое сопоставление без какого-либо анализа
Другой подход, предполагающий некоторое «понимание» текста машиной, тоже столкнулся с неразрешимой задачей: модель, имитирующая поведение лингвиста, не способна к анализу, который может провести человеческий мозг.
Глобальная проблема компьютерной лингвистики и реализации лингвистических моделей в частности заключается в том, что компьютерные системы требуют максимальной формализации структуры ЕЯ, т.е. фактически точное математическое описание языка. Это не представляется возможным, хотя бы потому, что ЕЯ слишком многогранен и представляется при помощи различных средств в зависимости от стиля, внешней ситуации/контекста и других факторов.
