Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТИПЛ.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
173.57 Кб
Скачать

Билет 7 вопрос 2 Задачи прикладной лингвистики.

1)Развитие новых ИТ на базе информации о языке 2)разработка и усовершенствование систем информационного поиска 3)разработка программ о реферировании текста4)разработка словарей(копм.лексикография)5)создание искусственных языков6)упорядочение, стандартизация,унификация научной технической терминологии7)организация библиографической информации8)автоматическое распознавание устной и письменной речи9)автомат.обработка текстов на ест.языке10)автомат.анализ и синтез речи11)формирование базы данных на родном и иностр.языках(корпусная лингвистика)12)лингвокриминалистика13)разработка обучающих языкам систем(русск для иностранцв)14)разработка систем автоматизированного перевода15)разработка языков,автоматизация информационных работ16)проведение квантитативных исследований применительно к различным видам текстов

Билет 3 вопрос 1

Поскольку мы говорим о компьютерной реализации неких лингвистических моделей, прежде всего, необходимо определить понятие компьютерной лингвистики.Компьютерная лингвистика – направление в ПЛ, которое сориентировано на использование компьютерного инструментария (совокупности программ и ПО), служащего для организации и обработки лингвистических данных, а также для моделирования функционирования ЕЯ в тех или иных ситуациях, проблемных сферах и смежных дисциплинах. Компьютерное моделирование ЕЯ рассматривается как сфера приложения информатики и теоретического программирования к решению различных задач науки о языке. КЛ тесно связана с обработкой ЕЯ.

Проблемы компьютерной реализации лингвистических моделей связаны с:

-отсутствием в ЕЯ строгих правил, определяющих порядок слов в предложении, т.е. трудности, связанные с обработкой информации, где допустимы: инверсия, тропы и прочие средства, которые способен проанализировать только человеческий мозг.

-огромным количеством языковых единиц и средств ЕЯ, значений слов, использующихся людьми в повседневной устной и письменной речи, т.е. не существует совокупности всех значений и приемов, понятных человеку, т.к. их список был бы практически бесконечным.

-структурой предложений (придаточные) и текстов (логическая/грамматическая связь единиц), не воспринимаемых машиной в силу сложности законов построения в ЕЯ.

-несоответствие между желаемыми и действительными результатами поиска вследствие неспособности машины к логическому анализу структуры запроса: когда мы ищем определенную информацию, мы часто хотим получить материал, который не задается в запросе явно, т.е. задается при помощи синонимов, например.

Существует т.н. статистический подход, основанный на переводе фрагментов текста посредством их сопоставления с некими фрагментами других текстов, хранящихся в памяти.

Проблемы этого подхода заключаются в том, что:

  • набор текстов ограничен

  • в данном случае происходит механическое сопоставление без какого-либо анализа

Другой подход, предполагающий некоторое «понимание» текста машиной, тоже столкнулся с неразрешимой задачей: модель, имитирующая поведение лингвиста, не способна к анализу, который может провести человеческий мозг.

Глобальная проблема компьютерной лингвистики и реализации лингвистических моделей в частности заключается в том, что компьютерные системы требуют максимальной формализации структуры ЕЯ, т.е. фактически точное математическое описание языка. Это не представляется возможным, хотя бы потому, что ЕЯ слишком многогранен и представляется при помощи различных средств в зависимости от стиля, внешней ситуации/контекста и других факторов.