Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Психосемантика слова и лингвостатистика текста - Варфоломеев А.П..doc
Скачиваний:
120
Добавлен:
24.05.2014
Размер:
665.09 Кб
Скачать

Коэффициенты разнообразия речи

Расчет коэффициента речевого разнообразия должен предполагать взаимосвязь, как минимум, двух параметров: лексического разнообразия и степени синтаксической сложности. На этих уровнях легко достигнуть формальной соотносимости коэффициентов. Поскольку коэффициент – величина не абсолютная, а относительная (в определенном промежутке величин), можно в известных границах пренебречь длиной сопоставляемых текстов. Теоретический интерес представляет и исследование внутренней "динамики" текста с точки зрения сопоставления коэффициентов на разных его участках и в их отношении к общему для всего текста коэффициенту.

Лексическое разнообразие

Коэффициент лексического разнообразия речи формируется из отношения числа лексем к общему числу слов текста, т.е.:

, (13)

где Клекс - коэффициент лексического разнообразия;

Л- число лексем в данном тексте;

С- общее число слов (единицы между пробелами) этого текста.

Значения коэффициента располагаются в промежутке от 0 до 1. Чем больше получаемая десятичная дробь, тем выше лексическое разнообразие.

Синтаксическое разнообразие

Коэффициент синтаксического разнообразия вытекает из отношения числа предложений к числу слов данного текста:

, (14)

где Ксинт - коэффициент сложности;

П - число предложений;

С -число слов во всем тексте.

Пограничными значениями, как и в (13), будут 0 и 1, и чем больше дробь, тем многословнее в целом предложения данного текста, а следовательно – выше возможность разнообразия синтаксических отношений между словами в составе отдельного предложения.

Стандартная величина коэффициентов

Официальных стандартов для коэффициентов разнообразия речи ни лексического, ни синтаксического уровня не существует, но ориентиром для сопоставления и, следовательно, оценки какого-либо текста в однородной группе текстов вполне может служить среднестатистическая норма величины коэффициента для равных по длине отрывков. Оптимальный размер (длина) отрывка – 100 слов, так как здесь коэффициенты уже стабилизируются, отражая действительные особенности речи автора, и написание текста длиной в 100 – 150 слов не требует особых временных затрат, что особенно важно для проведения группового или индивидуального экспресс-анализа богатства речи.

Показателем нормы выступает среднеарифметическая величина коэффициента (либо лексического, либо синтаксического – для каждого свое вычисление) в группе текстов (точнее – их отрывков одинаковой длины). Близость или удаленность отдельного индивидуального коэффициента от среднего служит основанием для вынесения оценки разнообразия речи в соответствующем тексте.

Удовлетворительными считаются тексты, коэффициенты разнообразия которых попадают в зону стандартных отклонений от данной средней. Стандартное отклонение рассчитывается по формуле:

, (15)

где dst стандартное отклонение (как в большую, так и в меньшую сторону) от средней,

x – каждый конкретный коэффициент данной совокупности,

n– общее число коэффициентов (текстов).

Пределы зоны стандартных отклонений вычисляются как промежуток в пределах dst.

Соседние файлы в предмете Лингвистика