
- •Математический анализ углубляет понимание революционного движения в России 70-х годов
- •6 Ленин в. И. Поли. Собр. Соч., т. 21, с. 261. 142
- •Что могут и чего не могут сделать коэффициенты регрессии и корреляции
- •Ложные зависимости
- •И Заказ № 294
- •Корреляция помогает историку найти причину
- •Годовой доход помещиков в 50-е годы XIX в. (в серебряных рублях на мужскую душу)
Ложные зависимости
Особенно большое значение в корреляционном и регрессионном анализах имеет предварительный конкретно-исторический содержательный анализ отношений между изучаемыми переменными. Дело в том, что сама по себе устойчивая согласованность в изменениях переменных и, следовательно, высокий коэффициент корреляции не могут служить достаточным основанием для заключения о наличии между ними причинно-следственной связи. Две переменные, которые выглядят как взаимосвязанные, фактически могут не иметь между собой существенной связи, кроме отношения каждой из них в отдельности к третьей величине, подобно тому как теща является родственницей зятя только через свою родственную связь с его женой. С подобной зависимостью, когда обе переменные являлись следствием третьей причины, мы встречались при анализе связи между участием в революционном движении и социальным происхождением. Тесная связь между революционной активностью и дворянским происхождением в действительности отражала не влияние происхождения, а влияние образования, поскольку получение образования являлось привилегией дворян-
152
ства. Образование вследствие этого и оказалось тем третьим фактором, который оказывал влияние на революционную активность и был тесно связан с дворянским статусом.
Итак, тесная корреляция может предполагать существование причинно-следственной взаимосвязи между переменными, но может указывать и на такую связь между ними, когда они обе являются следствием третьей причины. Только конкретно-исторический логический анализ отношений между переменными в состоянии установить наличие между ними причинно-следственной связи и выбрать одну переменную как зависимую, или результирующую, а другую — как независимую, или фактор.
Тесная корреляция между переменными иногда получается и в результате случайных совпадений значений переменных. В таком случае говорят о бессмысленной корреляции. Примером подобной корреляции может быть связь между количеством телефонных аппаратов и числом больничных коек в СССР в 1913—1970 гг.
Между динамикой количества телефонных аппаратов и числа больничных коек обнаруживается высокая корреляция — коэффициент корреляции равен 0.95. Но только в шутку можно утверждать, что разговоры по телефону фатально влекут за собой увеличение числа больных и больничных коек или наоборот. Корреляция здесь лишена смысла. Впрочем, прежде чем признать ее бессмысленной, необходимо все-таки выяснить, нет ли отдаленной косвенной причинной связи между телефонными разговорами и числом больничных коек. Например, можно полагать, что существовала третья причина — технический прогресс, которая способствовала, с одной стороны, увеличению количества телефонных аппаратов, а с другой— более полному удовлетворению потребности в больничных койках. Однако, если даже подобное объяснение и не лишено совершенно смысла, очевидно, что динамика числа больничных коек не может на 90% (0.952) обусловливаться динамикой количества телефонных аппаратов. Данную корреляцию следует рассматривать как случайность, так как связи между обоими явлениями в действительности не существует.
Бессмысленную корреляцию можно наблюдать не только во временных, но и в пространственных рядах. Например, наблюдалась довольно тесная прямая связь между це-