5. Вероятностное моделирование лингвистических процессов

Имена: Зиндер, Андреев, Алексеев, Пиотровский, Ерофеева, Угланова

Вероятностными методами можно изучать динамические процессы (в них есть и порядок, и беспорядок). Для вер. моделирования каких-либо языковых явлений используются данные, полученные с помощью методов квантитативной лингвистики, в частности, статистических.

Система речевой вероятности – совокупность относительных количественных характеристик, описывающих численное соотношение между элементами в некотором массиве тексов [Зиндер, Андреев] (мат. вероятность – числовая оценка степени возможности какого-либо события). Частота и вероятность связаны примерно так же, как речь и язык: частота есть конкретное выражение абстрактной вероятности [Ерофеева Е.В.] Языковая система представляет собой совокупность языковых элементов и вероятностей их появления в тексте, язык при этом выступает в роли генеральной совокупности, а тексты – в роли выборки. По мнению Зиндера и Андреева, у человека с овладением системой языка выстраивается система вероятности речевых элементов и формируются механизмы вероятностного прогнозирования (представление о вероятностной природе речевого поведения индивида, когда он, опираясь на прошлый речевой опыт и сложившуюся под его влиянием систему закономерностей, легче ориентируется в новой ситуации, при этом снижается риск ошибочных реакций). Речевая вероятность формируется как результат взаимодействия двух факторов: во-первых, места элемента в системе языка, во-вторых, роли его денотата в экстралингвистической действительности. В сознании носителя языка речевые вероятности отражаются не как отдельные единицы, обладающие каждый определенным «индексом частоты», а в соотношении с другими единицами. [Андреев] Исследования И.Г. Овчинниковой и Н.И. Бересневой показали, что вероятностный прогноз как один из механизмов языковой компетенции, обеспечивающий ориентировку в коммуникации и планирование речевого поведения, формируется в дошкольном возрасте. Однако оценка слова как языковой единицы развивается в младшем школьном возрасте.

Виды реч.вероятности по Андрееву:

Языковая (приближенная интуитивная оценка реч.вер-ти в сознания ННЯ, определяется по шкале всегда-часто-неопределенно-редко-никогда)/ речевая (объективная вер-ть появления единицы в речи)/ метаязыковая (исследовательское приближение к реч.вер-ти, находится с помощью экспериментов).

Таким образом, в аспекте современного развития представлений о языке и человеке актуальным представляется привлечение вероятностных оснований для исследований как непосредственно самой функциональной системы, каковой является язык, так и речевого поведения человека в частности. Поскольку вероятность как данность языка является ноуменом (не данным в непосредственном опыте), то единственным источником, приближающим нас к ее познанию, оказывается область эмпирии. Как отмечает П.М. Алексеев, «чем больше сделано наблюдений, чем выше частоты того или иного элемента, чем больше существует и будет сделано частотных словарей, тем ближе мы подойдем к ненаблюдаемой вероятностной организации языковой системы» [Угланова, Субъективная оценка частоты слова и ее категоризация: онтолингвистический аспект : Дис. ... канд. филол. наук]

Вероятностное моделирование тех или иных языковых феноменов должно основываться на поиске вероятностных дифференциальных признаков (существенное превышение или снижение частоты языковой единицы в каком-либо массиве текстов над фоновой, которое не является случайным, а обусловлено какими-либо факторами, например, особенностями индивидуального стиля автора, стилем или жанром речи, принадлежностью индивида к какой-либо социальной группе и т.д.)

Вероятностные аспекты нормы. Лекции Е.В. Ерофеевой

Вероятность родства языков (см вопрос 27.)

Вероятностные подходы в социолингвистике. Вариационная социолингвистика позволяет не только описывать речевое поведение различных социальных групп, но и давать прогноз относительно речи индивида на основе знания его социальных параметров: «в идеале точная спецификация характеристик некоторого говорящего должна вполне коррелировать с осуществляемым им выбором». В работах Т.И. Ерофеевой исследовалось взаимодействие таких социальных факторов, как «место рождения», «пол», «возраст», «уровень образования», «специальность». Показано, что в разных городах Пермской области могут взаимодействовать, способствуя влиянию диалекта на речь информанта, разные градации этих факторов. Таким образом, исследования взаимодействия факторов выявили, что некоторые факторы, объединяясь друг с другом, могут способствовать образованию качественно новых социальных групп. Так, если фактор1 и фактор2 независимо друг от друга способствуют увеличению в речи частоты какого-либо явления, то их одновременное присутствие может значительно повысить использование данного явления в речи. Например, и фактор «образование», и фактор «специальность» оказывают влияние на то, насколько речь индивида близка к литературной норме; когда градации факторов «высшее образование» и «филолог», повышающие близость речи к литературной норме, совпадают, речь информантов приближается к литературной максимально. С точки зрения Ерофеевых, группы факторов можно рассматривать и как один сложный фактор, а говорящих, объединенных по нескольким факторам, как единую социальную группу.

Вероятность на разных уровнях языка.

Фонетический. Вероятность первого порядка – вер-ть появления той или иной фонемы в речи (например, в русском языке на 1 гл. приходится 6 согласных, а в устной речи – 1,3); вер-ть второго порядка – вер-ть появления второй фонемы после первой (зависит от нескольких условий: фонетический состав языка позиция в слове, состав аффиксов языка, их частотность) Вероятностное прогнозирование при восприятии речи подробно описано А.С. Штерн и ее учениками, в том числе Е.В. Ерофеевой (практика с И.А. Углановой). Результаты вероятностного моделирования частотности тех или иных фонем применяются в механизмах распознавании устной речи (марковские цепи, см. вопрос 14).

Лексический уровень. Данные о частотности слов хранятся в частотных словарях (Засориной, Шарова) и корпусе. Частотность слов сильно варьирует в разных типах текста, поэтому в словарях приводится значения частотности слова для разных текстов, как правило для художественных, публицистических, научных.

Грамматический уровень. Морфология. Частотность морфем, частей речи, падежей, глагольного управления и т.д. Наиболее интересные: исследования Гридиной по норме (изучается распределение внутри нормы, когда есть несколько вариантов, - сохранились ли все варианты, или один умер, например, окончания –а и –у в род.падеже ед.числа сохранились оба) и Горьковского ун-та по продуктивным (слова, образованные по таким моделям, встречаются на протяжении всего частотного списка, а их значения легко распознаются) и непродуктивным (отражают историю языка, не встречаются в конце частотного списка) словообразовательным моделям (продуктивность – прогноз, определяющий сходное поведение говорящих при порождении или распознавании новой комбинации морфем).

Грамматический уровень. Синтаксис. Вероятностное моделирование лежит в основе метода для анализа стилей речи и идиостиля. Текст разбивается по методу дерева зависимостей и идет подсчет количества узлов, длины дерева, густота дерева (количество узлов без стрелок зависимости), ширина узла (кол-во выходящих из узла стрелок) и т.д. Также измеряются разнообразие лексики, повторяемость слов, уникальность лексики. Подробнее в лекциях Е.В. Ерофеевой.

Перспективы исследований в области вероятностного моделирования линг.процессов заключается в поиске причин того или иного частотного распределения элементов

<<< < Предыдущая 1 2 34 / 454 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.03.2015165.8 Кб9ООП.pdf
#
01.07.2025157.18 Кб0Опасность.doc
#
30.09.2019458.75 Кб7Описание выборки экспертной группы ПЕЧАТЬ.doc
#
23.08.201929.03 Mб60Описание осадочных пород ПГУ.doc
#
17.09.201962.98 Кб3Описание профиля почв.doc
#
01.05.20251.07 Mб0ОПЛ_ответы.doc
#
01.05.20251.16 Mб1Опред интегралы.doc
#
01.03.2025257.54 Кб1Определение биологического возраста.doc
#
01.05.20251.33 Mб0Определение плотности скелета грунта.doc
#
18.07.2019319.19 Кб7Оптовая торговля.rtf
#
01.05.202586.53 Кб0Опыт работы.doc