
- •Глава 1.
- •Глава 1 Статистическое исследование мифообрядовых истоков волшебной сказки
- •Глава 2 Компьютерное моделирование пословицы
- •Структура пословицы изучаемого класса
- •Алгоритм порождения пословицы
- •Обсуждение результатов и выводы
- •Глава 3 Структура стихотворного поэтического текста
- •Глава 4 На пути к единой теории поэтической фоники
- •1. Программа буква фонема
- •2. Пять точек зрения на поэтическую фонику
- •3. Теория анаграмм 9
- •4. Методика исследования
- •5. Анаграммы в лирике а. Блока. «Аnte Lucem». «Стихи о Прекрасной Даме».
- •6. Лирика зрелого Блока
- •7. Переводы
- •8. Итог анализа анаграмм у Блока
- •9. Частотный аспект фонологической структуры поэтического текста
- •10. Ономатопея
- •Глава 5. Вероятностные модели стихотворного ритма.
- •Глава 6 Вероятностная модель силлаботоники
- •Глава 7 Стихотворный ритм как процесс
- •Глава 8 Статистическое исследование хорея и ямба
- •Слоговой ритм.
- •Метрическая отчетливость ритма
- •Средняя выделенность слога
- •Ритмическая характеристика строки
- •Изменчивость ритма
- •Глава 9 Деструктивно-конструктивный анализ онегинской строфы
- •Результаты первого эксперимента
- •Глава 10 Исследование бытия и распада жанровой системы русской поэзии XVIII—начала XIX века
- •Глава 11 Темы и вариации русской поэзии
- •XIX и XX веков
- •Глава 12 Структура историко-литературной ситуации в области поэзии
- •Глава 13
- •Периодизация творческого пути поэта:
- •Пушкин, Гумилев, Пастернак
- •Гумилев
- •Пастернак
- •Глава 14 Компьютерная энциклопедия одного поэта
- •Глава 15 Синтаксические этюды
- •Синтаксические паузы в стихе
- •Синтаксический перенос
- •Синтаксическое развертывание
- •Синтаксическое развертывание в «Фаусте» Гёте и Пастернака
- •Введение
- •Глава 1
- •Глава 2
- •Глава 3
- •Глава 4
- •Глава 5
- •Глава 6
- •Глава 7
- •Глава 8
- •Глава 9
- •Глава 10
- •Глава 11
- •Глава 12
- •Глава 13
- •Глава 14
- •Глава 15
- •Заключение
4. Методика исследования
Хотя уже в 1900-х гг. началось успешное изучение стиха средствами математической статистики, оно не было распространено на область фоники. Между тем, при анализе естественно принимать во внимание как объективную особенность поэтики в первую очередь те повторы, которые существенно повышают частоты участвующих в повторах элементов по сравнению со среднеречевыми их частотами. Еще Ф. де Соссюр думал над применением теоретико-вероятностных вычислений для более строгого изучения анаграмм (JS 132). Пока утверждения о наличии анаграмм не сформулированы так, что в принципе допускают опровержение 23, они не могут считаться и доказанными.
Стремясь оградить себя от собственного исследовательского произвола, Ф. де Соссюр ограничивал признание наличия анаграмм рядом требований. Он учитывал то лишь начальные согласные фонемы, то лишь гласные, следующие в тексте в том же самом порядке, что и в ключевом слове, то лишь фонемы одного отдельно взятого стиха, то лишь сочетания по две-три фонемы (РW 16, 19—20, 22, 26). В нашем исследовании эти соображения играют вспомогательную роль. Главным свидетельством наличия анаграммы мы считаем статистически значимое преобладание частот фонем ключевого слова над их частотами в речи.
Специальными исследованиями продемонстрировано, что «подобно тому, как человек создает вероятностный образ окружающей его среды, он создает и представления о вероятностной организации речи», в том числе хранит субъективные оценки речевых частот слов и элементов речи, меньших чем слово, весьма близкие к данным объективных подсчетов по текстам 24. Так что существование нейтрального фона, на котором воспринимается колебание частот элементов в поэтическом тексте, несомненно. Остается найти корректный способ их учесть.
Для сравнения частот фонем в текстах с частотами в речи использовалась таблица распределения фонем, составленная на основе 100 выборок по 1000 фонем из современной прозы 25; частоты парных твердых и мягких фонем в текстах и в таблице распределения объединялись. Для полноты картины примерно в четверти анализов мы провели подсчеты по звукам и буквам тоже, обращаясь к известным таблицам распределения 26. Случаев, когда бы подсчеты по фонемам, звукам, буквам давали противоположный результат, не встретилось. Расхождения касались иногда факта участия в организации поэтической фоники отдельных фонем (звуков), иногда уровней значимости.
Почти все исследователи анаграмм определяющими фонемами считают согласные, что хорошо объясняется сравнительно большей их информативностью по сравнению с гласными 27. В силу малого их числа возможности варьирования гласных по частоте на значительном протяжении текста весьма ограничены. Почти во всех рассмотренных нами примерах статистический критерий не уловил значимых отклонений относительной частоты гласных в тексте от их частот в речи.
Исследуемое произведение делилось, если это требовалось из общих соображений, на несколько частей, и каждая часть рассматривалась как особый текст. Подсчитывалось количество n фонем текста. Подсчитывалось количество употреблений первой согласной фонемы х1 анаграммированного слова и количество употреблений всех остальных фонем х2. Принималась гипотеза Н0 (нулевая гипотеза), согласно которой вероятность появления фонемы в исследуемом тексте равна эмпирически найденной Г. Кучера частоте р этой фонемы в речи. Для проверки этой гипотезы мы полагали q =1 — р, где q — вероятность появления в речи любой другой фонемы, и образовали 28
(х1 — np)2
χ2 = ________________
npq
Так как число степеней свободы равно количеству классов, на которые разбивается число n, без одного, и так как х1 и х2 связаны одним линейным уравнением х1+ х2 = n, то число степеней свободы равно 1. По таблице 29 мы определяли вероятность Р(Н0) гипотезы Н0. Если Р(Н0) < 0.1, мы отвергали нулевую гипотезу как маловероятную. И с вероятностью более 0.9 утверждали, что частоту появления данной фонемы в тексте следует оценивать вероятностью, превышающей р. При этом для каждого рассмотренного случая мы определили индивидуальную верхнюю границу вероятности Р(Н0), с которой допускается Н0. Приемлемая вероятность для оценки частоты фонемы в тексте оказывается обязательно больше отвергаемой, так как мы рассматриваем только те случаи, когда относительная частота фонемы (звука, буквы) в тексте превышает табличную. То же самое мы выполняли для каждой другой фонемы ключевого слова.
Критерий χ2 при одной степени свободы применим тогда, когда математическое ожидание nр ≥ 4 30. В случае, когда произведение nр оказывалось недостаточно велико, чтобы данное неравенство было справедливо, мы увеличивали число n до необходимого значения, полагая при этом, что х1 осталось прежним. Ясно, что получаемый результат увеличивает Р(Н0). Округление чисел производилось также в сторону увеличения Р (Н0).
Описанные особенности методики отражаются на результатах следующим образом. Вероятность того, что гипотеза Н0 не верна и что противоположная, утверждающая наличие анаграммы, справедлива, в действительности больше, чем в наших вычислениях. Поэтому отклонение нулевой гипотезы со значительно большей уверенностью подтверждает наличие анаграммы, чем ее принятие — отвергает. Реальный же механизм восприятия поэтического произведения, наоборот, зачастую побуждает адресата воспринимать анаграмму при отсутствии статистически значимого значения частот соответствующих фонем, например, при однократном гипограммировании ключевого слова. Так, мы ощущаем правоту исследователя, который в стихе:
Оно покрыло жаркой охрою
(Б. Пастернак. «Август»)
указывает гипограмму похороны, подготовляющую появление этого ключевого слова 31, хотя критерий согласия значимого преобладания соответствующих фонем не выявляет. Применяемый нами способ статистического контроля ограждает от исследовательского произвола (к чему просто обязывает научная щепетильность Ф. де Соссюра), но не заменяет исследовательской инициативы. Все же в дальнейшем среди бесчисленного множества анаграмм мы будем выделять и рассматривать преимущественно те, наличие которых подтверждает критерий χ2.
Его применение требует некоторого комментария. Приходится принять заведомо неверное допущение о том, что появление в стихотворной речи какой-либо фонемы не изменяет вероятностей появления всех фонем на любом месте текста. Однако слабость этого допущения элиминируется двумя ограничивающими обстоятельствами. Первое заключается в том, что вероятность появления некоторых фонем в стихотворной речи больше, чем в модели, используемой в расчете (например, благодаря явлению рифмы). Второе действует в обратном направлении: невозможно существование стихотворения, состоящего из многократно повторенной единственной фонемы, тогда как гипотеза о независимости появления фонем допускает этот и подобные случаи.
Два обозначенных обстоятельства полагают жесткие рамки количеству употреблений каждой фонемы, не позволяя ему значительно уклоняться от математического ожидания. Экспериментальным подтверждением такого процесса «автоматической регулировки» частот фонем в стихотворном тексте может служить следующее наблюдение. Подавляющее большинство фонем в подавляющем большинстве исследованных текстов самых разных поэтов дает распределение частот, весьма близкое к теоретическому (см. раздел 9 настоящей главы).
По сравнению с другими возможными моделями (например, марковскими цепями) критерий χ2 имеет ряд преимуществ: простоту, наглядность сопоставления исследуемого феномена и модели, устойчивую традицию плодотворного применения в лингвистике и теории стиха.