Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика_билеты2.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
214.53 Кб
Скачать
  1. Прикладная и математическая лингвистика. Лексикостатистика.

Прикладна́я лингви́стика (прикладное языкознание - applied linguistics) — наряду с теоретической лингвистикой является частью науки, занимающейся языком. Специализируется на решении практических задач, связанных с изучением языка, а также на практическом использовании лингвистической теории в других областях.

Термин прикладная лингвистика появился в конце 20 гг. 20 в., когда была осознана необходимость строгого научного решения прикладных задач с использованием методов формального лингвистического анализа письменных и акустико-лингвистического анализа устных сообщений.

За рубежом под ПЛ часто понимают совершенствование методов преподавания языка (дидактическая лингвистика). В нашей стране ПЛ понимают как компьютерную лингвистику, которая становится сейчас все более широкой дисциплиной почти синонимом ПЛ.

Основные направления ПЛ, связанные с изучением языка:

  • лексикография — теория и практика составления словарей;

  • лингводидактика — наука о разработках методик обучения иностранному языку;

  • усвоение второго языка — наука о процессе усвоения языка (в отличие от лингводидактики — с точки зрения обучаемого);

  • терминоведение — наука об упорядочении и стандартизации научно-технической терминологии;

  • переводоведение — теория перевода.

Основные направления ПЛ, связанные с практическими приложениями:

  • Компьютерная лингвистика (англ. computational linguistics):

    • Машинный перевод

    • Автоматическое распознавание символов (англ. OCR)

    • Автоматическое распознавание речи (англ. ASR)

    • Автоматическое извлечение данных (англ. Data Mining)

    • Информационный поиск

      • Извлечение информации

    • Автоматическое реферирование текстов

    • Построение систем управления знаниями

    • Создание электронных словарей, тезаурусов, онтологий

    • Корпусная лингвистика, создание и использование электронных корпусов текстов

  • Лингвистическая экспертиза (например, в судебной практике)

Эти и другие приложения традиционной лингвистики в машинных средах - задачи компьютерной лингвистики, которая помогает разрабатывать вычислительные алгоритмы и программы на основе формальных языковых моделей, созданных в рамках математической лингвистики.

Математи́ческая лингви́стика (также вычисли́тельная или компью́терная лингви́стика) — направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Как особое научное направление компьютерная лингвистика оформилась в 1960-е годы. Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поскольку прилагательное computational по-русски может переводиться и как «вычислительный», в литературе встречается также термин «вычислительная лингвистика», однако в отечественной науке он приобретает более узкое значение, приближающееся к понятию «квантитативной лингвистики».

Лексикостатистика – квантитативный подход к исторической лингвистике, предложенный в середине XX века американским лингвистом Сводешем и основанный на той гипотезе, что имеется набор базовых понятий, слова для которых существуют во всех языках мира и наименее подвержены изменению с течением времени. Наиболее употребителен список из 100 слов, составленный Сводешем и включающий такие слова, как личные местоимения, обозначения частей тела, основных природных явлений, и проч. Основная идея лексикостатистики состоит в том, что степень родства пары языков определяется тем, какая доля слов из этого списка имеет в этих языках общее происхождение. Так, доля общей лексики в немецком и голландском языках составляет 95%, в немецком и английском – 82%, в немецком и исландском – 74%, что отражает разную степень родства немецкого языка с этими языками. Таким образом, лексикостатистика позволяет дать формальные определения таким традиционным понятиям, как «язык», «диалект», «говор» и проч., а также на основании процентов схождений построить внутреннюю классификацию языковой семьи.