
- •Математический анализ углубляет понимание революционного движения в России 70-х годов
- •6 Ленин в. И. Поли. Собр. Соч., т. 21, с. 261. 142
- •Что могут и чего не могут сделать коэффициенты регрессии и корреляции
- •Ложные зависимости
- •И Заказ № 294
- •Корреляция помогает историку найти причину
- •Годовой доход помещиков в 50-е годы XIX в. (в серебряных рублях на мужскую душу)
четыре последующие группы, чей ранг по абсолютному значению больше: это 4-я, 5-я, 6-я и 7-я группы и т. д. В последней строке графы 6 всегда будет стоять нуль, поскольку это последняя группа. Сумма чисел, записанных в графе 6, обозначаемых $2, составила 20.
В графу 7 заносятся числа, показывающие, сколько по зависимому признаку в графе 5 имеется групп в последующей записи, чей ранг по абсолютному значению меньше, чем ранг данной группы. В первую строку графы 7 заносим 0, так как ни одна последующая группа не имеет ранга, меньшего, чем 1. Во второй строке записываем 1, так как из последующих групп только в одной, в 3-й группе, ранг меньше. В третьей строке ставим 0, так как все последующие группы имеют больший ранг, чем эта 3-я группа, и т. д. Сумма же чисел, записанных в графе 7, обозначаемых $2, равняется 1.
Знакомство с коэффициентами корреляции рангов Спирмена (р) и Кендэла (т) показало, что каждый из коэффициентов имеет свои достоинства. Главное достоинство коэффициента Спирмена в том, что вычисляется он проще и быстрее. Однако хотя вычисление коэффициента т более трудоемко, чем вычисление коэффициента р, т имеет ряд существенных преимуществ. Он более осторожно оценивает корреляцию, поэтому его численное значение всегда меньше (в нашем примере 0.91 и 0.97); для оценки его математической значимости разработаны специальные критерии; его легче пересчитать, если к ряду добавляется новый член.
Важное достоинство коэффициента рангов Спирмена состоит в том, что он может быть применен к чистой корреляции, т. е. в тех случаях, когда действует несколько факторов и исследователь желает выяснить влияние одного фактора в чистом виде, устранив влияние прочих.
Так, коэффициент рангов Кендэла составил между революционной активностью и учением т12 = 0.91, революционной активностью и возрастом — т13 = 0.89, учением и возрастом — т23 = 1.00.
Чистый коэффициент рангов Спирмена между учением и революционной активностью, определенный по формуле
т12 — т13т23 0.91 — 0.89 . 1.0 __ 0
Т12-8 ~ ^(1—т23)(1—т|3) ~ <4 - °>892) (1 - 1) ~
139
оказался равным нулю. Точно так же и чистый коэффициент рангов Спирмена между возрастом и революционной активностью составил нуль. Причина этого в том, что между возрастом и учением в 70-е годы XIX в. существовала полная корреляция, отразившая следующую закономерность: в России того времени училась в основном молодежь. Интерпретировать полученные коэффициенты можно следующим образом. Революционная активность в изучаемое время решающим образом зависела одновременно от двух тесно связанных друг с другом факторов — от принадлежности к учащимся и возраста. Взятые в отдельности, независимо один от другого, эти факторы не имели серьезного значения. Чтобы быть революционером, мало быть только молодым или только учащимся, необходимо быть одновременно и молодым, и учащимся. Здесь нашел отражение тот факт, что в авангарде революционной борьбы 70-х годов XIX в. шла учащаяся молодежь, главным образом студенты высших учебных заведений.
Из анализа достоинств обоих коэффициентов можно сделать следующий вывод. Для более детального и углубленного анализа связей целесообразнее использовать коэффициент Кендэла, а для быстрой прикидочной оценки корреляции — коэффициент Спирмена.
Вышеприведенные примеры показали, то для применения коэффициентов корреляции рангов необходимо провести балльную или ранговую оценку изучаемых объектов. Как она происходит? Каждому изучаемому объекту присваиваются баллы в соответствии с возрастанием или убыванием значения изучаемого признака. Признаки с присвоенными им баллами располагаются в порядке убывания или возрастания баллов. Затем упорядоченные таким образом объекты следует объединить в несколько групп по сходству балльных оценок. Порядковый номер каждой группы и будет ее рангом. Количество рангов зависит от количества групп. Если выделяется 11 групп, то используется 11 ранговая оценка, если 15, — 15-ранговая и т. д. Группа с максимальным значением признака получает 1-й ранг, а с минимальным — наибольший ранг, промежуточным группам присваиваются ранги от 2-го до К (К — общее количество рангов).
Например, 50 губерний Европейской России можно упорядочить по размаху в них революционного движения
140
в 1905 г., опираясь не на точное статистическое измерениег а на приблизительные оценки современников, на донесения губернаторов, полицмейстеров и т. д. Затем, выделив несколько (5, 10 и т. д.) групп губерний по интенсивности революционного движения, присвоим каждой группе ранг. Так, все 50 губерний будут ранжированы на 5, 10 и т. д. рангов.
Ранжирование может быть проведено и иным способом. Именно этот способ и был использован в предыдущем анализе. Сначала выделялись группы объектов в соответствии с определенным значением изучаемого признака и присваивались им ранги. Затем без балльной оценки каждого объекта они распределялись по группам. Например, любой из русских революционеров 70-х годов XIX в. принадлежал к какому-либо сословию, каждое из которых имело официальный статус, или престиж. В зависимости от официального статуса сословий последние были ранжированы. Затем, распределив всех революционеров в выделенные «престижные» группы, мы получили готовый ранжированный ряд революционеров по социальному положению. Аналогичным образом ранжировались революционеры по степени образованности, возрасту.
Математический анализ углубляет понимание революционного движения в России 70-х годов
Применив почти весь набор существующих в математической статистике методов оценки корреляции между качественными признаками для анализа факторов революционного движения в России 70-х годов XIX в. (табл. 24), можно сделать следующие выводы.
Решающее влияние на революционные настроения оказывали образование и возраст. Учащаяся молодежь в возрасте до 25 лет и главным образом студенты высших учебных заведений были в авангарде борьбы с самодержавием. Вероисповедание, национальность и социальное положение не имели сколько-нибудь существенного значения для революционной активности молодежи.
Это чрезвычайно расширило социальную базу революционного движения и подготовило почву для перехода к третьему — пролетарскому — этапу борьбы с самодержавием. Вот почему, характеризуя революционеров
Ш
ТАБЛИЦА 24 Факторы революционной активности в России 70-х годов XIX в.
|
Коэффициенты |
|||||
|
о- |
|
О &н |
• |
• |
еб |
Признак |
Я |
I О «О |
Я 1 ^> «ко |
|
§8 |
О » |
|
во К м о |
я я |
взаш сопр женн С |
пока тель зи, г |
к 3 - <П Ьг ей ао я |
я я ай е |
Социальное положе- |
|
|
|
|
|
|
|
0.95 |
0.04 |
.— |
*— |
0.72 |
0.67 |
Образование .... |
0.99 |
0.20 |
0.97 |
|—■ |
0.96 |
0.91 |
|
—0.99 |
0.43 |
0.98 |
—0.55 |
—0.98 |
—0.89 |
Вероисповедание . . |
— |
-^ |
0.09 |
— |
*— |
— |
Национальность . . |
|
■ |
0.11 |
1 ■' |
' ' |
|
Примечание. Все коэффициенты, кроме коэффициента взаимной -сопряженности, который всегда положителен, имеют либо енак плюс, либо знак минус.
70-х годов, В. И. Ленин писал: «Шире стал круг борцов, ближе их связь с народом».6
Статистические закономерности революционного движения 70-х годов XIX в. в России дают исследователю направление для углубленного конкретно-исторического анализа, который только и в состоянии объяснить, почему бунтовала студенческая молодежь, почему образование и возраст имели решающее значение для революционной активности, а социальное происхождение, вероисповедание и национальность — нет.
Необходимо обратить внимание на то, что для оценки значения факторов, часто одних и тех же, использовались разные коэффициенты, которые иногда давали сходные, иногда различные результаты (см. табл. 24). Применение разных коэффициентов связи в нашем случае объясняется двумя причинами: во-первых, природой данных и, во-вторых, последовательностью анализа. Для анализа связи между некоторыми признаками можно было применить только один коэффициент. Так, для анализа влияния вероисповедания и национальности можно было использовать лишь коэффициент взаимной сопряженности, поскольку каждый из этих признаков имеет