- •Прикладная и математическая лингвистика. Лексикостатистика.
- •Основные понятия квантитативной лингвистики и статистики речи.
- •4. Максимальная лексическая система и генеральная совокупность текстов.
- •Лексическая подсистема языка и внутренний лексикон
- •6. Слово в словаре и тексте. Употребительность слова в речи.
- •Частотные словари: структура, функции, составление.
- •Закон Ципфа и его интерпретации. Частотно-ранговые распределения.
- •Квантитативные исследования в области стилистики.
- •Возраст слова и языковая диахрония. Глоттохронология.
- •Лингвистическая статистика
Прикладная и математическая лингвистика. Лексикостатистика.
Прикладна́я лингви́стика (прикладное языкознание - applied linguistics) — наряду с теоретической лингвистикой является частью науки, занимающейся языком. Специализируется на решении практических задач, связанных с изучением языка, а также на практическом использовании лингвистической теории в других областях.
Термин прикладная лингвистика появился в конце 20 гг. 20 в., когда была осознана необходимость строгого научного решения прикладных задач с использованием методов формального лингвистического анализа письменных и акустико-лингвистического анализа устных сообщений.
За рубежом под ПЛ часто понимают совершенствование методов преподавания языка (дидактическая лингвистика). В нашей стране ПЛ понимают как компьютерную лингвистику, которая становится сейчас все более широкой дисциплиной почти синонимом ПЛ.
Основные направления ПЛ, связанные с изучением языка:
лексикография — теория и практика составления словарей;
лингводидактика — наука о разработках методик обучения иностранному языку;
усвоение второго языка — наука о процессе усвоения языка (в отличие от лингводидактики — с точки зрения обучаемого);
терминоведение — наука об упорядочении и стандартизации научно-технической терминологии;
переводоведение — теория перевода.
Основные направления ПЛ, связанные с практическими приложениями:
Компьютерная лингвистика (англ. computational linguistics):
Машинный перевод
Автоматическое распознавание символов (англ. OCR)
Автоматическое распознавание речи (англ. ASR)
Автоматическое извлечение данных (англ. Data Mining)
Информационный поиск
Извлечение информации
Автоматическое реферирование текстов
Построение систем управления знаниями
Создание электронных словарей, тезаурусов, онтологий
Корпусная лингвистика, создание и использование электронных корпусов текстов
Лингвистическая экспертиза (например, в судебной практике)
Эти и другие приложения традиционной лингвистики в машинных средах - задачи компьютерной лингвистики, которая помогает разрабатывать вычислительные алгоритмы и программы на основе формальных языковых моделей, созданных в рамках математической лингвистики.
Математи́ческая лингви́стика (также вычисли́тельная или компью́терная лингви́стика) — направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Как особое научное направление компьютерная лингвистика оформилась в 1960-е годы. Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поскольку прилагательное computational по-русски может переводиться и как «вычислительный», в литературе встречается также термин «вычислительная лингвистика», однако в отечественной науке он приобретает более узкое значение, приближающееся к понятию «квантитативной лингвистики».
Лексикостатистика – квантитативный подход к исторической лингвистике, предложенный в середине XX века американским лингвистом Сводешем и основанный на той гипотезе, что имеется набор базовых понятий, слова для которых существуют во всех языках мира и наименее подвержены изменению с течением времени. Наиболее употребителен список из 100 слов, составленный Сводешем и включающий такие слова, как личные местоимения, обозначения частей тела, основных природных явлений, и проч. Основная идея лексикостатистики состоит в том, что степень родства пары языков определяется тем, какая доля слов из этого списка имеет в этих языках общее происхождение. Так, доля общей лексики в немецком и голландском языках составляет 95%, в немецком и английском – 82%, в немецком и исландском – 74%, что отражает разную степень родства немецкого языка с этими языками. Таким образом, лексикостатистика позволяет дать формальные определения таким традиционным понятиям, как «язык», «диалект», «говор» и проч., а также на основании процентов схождений построить внутреннюю классификацию языковой семьи.
