Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
20
Добавлен:
21.03.2015
Размер:
582.12 Кб
Скачать

Для задачи с помещичьими имениями конца XIX в. способ наименьших квадратов дает следующее уравнение теоретической линии регрессии, описывающее связь между доходом имения (у) и его размерами (х) : уг*= =—0.14379+0.00606л;. Подставив в это уравнение значе­ния размеров имения (х), получим теоретические значе­ния дохода имения (г/х) и сравним их с доходом имения по среднеарифметическому соотношению между доходом и размером имения (табл. 6).

Выше было отмечено, что коэффициент регрессии по­зволяет наилучшим образом определить отношение между переменными, а уравнение регрессии помогает сделать наилучшее из возможных предсказаний зависимой пере­менной по независимой. Проверим это на примере с дво­рянскими имениями.

Если среднее соотношение между доходом и размером имения определить простым арифметическим путем на основании данных по 10 имениям, то это соотношение составит 5.56 руб. на десятину. На основе среднего со­отношения дохода и размера имения подсчитаем пример­ный доход 10 имений и определим его расхождения с фак­тическим доходом (см. табл. 6).

Сравнение расхождений фактического дохода имения с доходом, вычисленным по среднему соотношению 5.56 и по уравнению регрессии уг=—0.14379+0.00606.Г, обнаруживает, что доход, определенный по уравнению регрессии, в 7 случаях из 10 ближе к фактическому до­ходу, чем доход, установленный по соотношению 5.56. В данном примере наглядно видно преимущество анали­тического способа установления отношения между за­висимой и независимой переменными по сравнению со среднеарифметическим способом, который обычно исполь­зуют историки.

Таким образом, по своему существу коэффициент регрессии, показывающий среднее изменение зависимой переменной при изменении независимой переменной на единицу, не является для историков открытием. Можно сказать, что применение историком коэффициента регрес­сии, во-первых, обобщает его исследовательскую практику, во-вторых, повышает точность среднего отношения между зависимой и независимой переменными и, в-третьих, полнее устраняет влияние нежелательных факторов на результирующую переменную.

Как коэффициент регрессии помогает историкам

Коэффициент регрессии имеет большое значение в исто­рическом исследовании, так как дает возможность опре­делять какой-либо показатель в зависимости от другого, что позволяет предсказывать отсутствующие данные. Для историка это особенно важно, поскольку нередко интересующие его данные отсутствуют, и хотя бы прибли­зительное их определение может помочь в решении стоя­щей задачи.

Так, за 1801—1860 гг. не сохранились данные о хлеб­ных ценах по ряду российских губерний. Однако на осно­вании данных об урожайности (х) и хлебных ценах (у)в губер­ниях, по которым подобные сведения имеются, были вычи­слены уравнения регрессии, показывающие среднее измене­ние хлебных цен по губерниям в зависимости от изменения в них уровня урожайности. По данным за 1801—1810 гг., коэффициент регрессии цен по урожаю оказался равным —0.594, за 1851—1860 гг. —0.4077 и т. д. Имея данные об урожайности в губерниях, по которым не сохранились сведения о ценах, можно (конечно, приблизительно) определить, какова могла быть вероятная цена хлеба в этих губерниях за 1801—1810, 1851—1860 гг. и т. д., т. е. за те годы, для которых подсчитано уравнение регрес­сии. Цены, установленные по уравнению регрессии, откло­няются от действительных цен на 10—20%, это показали сравнения действительных и предполагаемых цен.

Точно так же в примере о доходах и размерах дворян­ских имений вычисленное уравнение регрессии позволяет по размерам имения предсказывать его приблизительный доход в тех случаях, когда сведения о доходе отсут­ствуют.

К. В. Хвостова, изучая положение крестьян в Визан­тии XIV в., с помощью регрессионного анализа установила зависимость высоты налога от размеров имущества и числа налогоплательщиков в деревне, что позволило ей предсказывать примерную налоговую ставку в тех де­ревнях и хозяйствах, по которым источники не сохранили сведений.

2

2 Хвостова К. В. Особенности аграрно-правовых отношений в поздней Византии (XIV—XV вв.). М., 1968, с. 121—123.

Но значение коэффициента регрессии не ограничивается возможностью предсказания с его помощью отсутствую­щих данных. Коэффициент важен еще и потому, что в сжа­той и предельно обобщенной форме дает представление о фактах, на основе которых он получен. Так, коэффи­циент регрессии в примере зависимости цены от урожая, равный —0.594, обобщая многочисленные статистические данные, свидетельствует о том, что в 1801—1810 гг. при изменении в губернии средней урожайности на 1 сам — на величину того, что обычно высевается, цена хлеба изменяется примерно на 59.4 коп. за четверть, или при изменении в губернии среднего сбора хлеба с десятины на 1 пуд цена хлеба изменяется приблизительно на 7 коп.

Аналогичным способом И. Д. Ковальченко удалось установить, что в барщинных земледельческих имениях России в первой половине XIX в. уровень крестьянского хозяйства (у) и размеры крестьянских повинностей (х) находились в зависимости, которая может быть выражена уравнением: у=0.56—2.37д\ Коэффициент регрессии —2.37 свидетельствует о том, что с ростом повинностей с крестьянского хозяйства на единицу, т. е. на 1 руб., уровень крестьянского хозяйства снижался на 2.37 еди­ницы, т. е. на 2.37 голов скота.Коэффициент регрессии раскрывает характер коли­чественных отношений между независимой и зависимой переменными и позволяет предсказывать значения одной переменной по значению другой.

Расхождения фактических и теоретических значений дохода (они называются остаточными разностями или остаточными величинами) обусловлены остаточными при­чинами, т. е. иными, чем размер имения, факторами. Последние в конкретных условиях России конца XIX в. тоже оказывали влияние на доход имения, но нами спе­циально не учитывались, поскольку цель как раз и со­стояла в том, чтобы устранить прямое воздействие на доход имений всех, кроме размера имения, факторов и посмотреть, как изменяется доход имения в зависимости только от его размера. В действительности же доход име­ния находился также под влиянием и качества земли, и уровня агротехники, и многих других факторов, которые мы намеренно игнорировали. Поэтому совершенно есте­ственно, что теоретический доход имения, определенный только по его размеру, отличается от фактического до­хода, обусловленного многими факторами.

В корреляционных зависимостях в отличие от функ­циональных по одной независимой переменной почти никогда нельзя абсолютно точно предсказать значение зависимой переменной, и одна независимая переменная, или признак-фактор, не может объяснить все колебания, всю вариацию зависимой переменной. Вследствие этого, естественно, возникают два вопроса: насколько точно оценены или предсказаны значения зависимой перемен­ной по значениям независимой переменной в выборке, т. е. на основании имеющихся в распоряжении историка дан­ных, и какая часть изменения, или вариации, зависимой переменной связана с изменением значений независимой переменной, или какова степень влияния независимой (причинной) переменной на зависимую (результирующую) переменную?

На поставленные вопросы отвечают специальные мате­матические показатели — стандартная (средняя) ошибка оценки (sy. х) и коэффициент корреляции (г). Стандартная ошибка оценки (в нашем примере измеряет точность, надежность предсказания значения дохода имения по его размеру) в общем виде показывает точность предсказания зависимой переменной по независимой переменной в вы­борочных данных. Тем самым стандартная ошибка оценки проверяет и приемлемость составленного уравнения регрес­сии. Коэффициент корреляции (в нашем конкретном при­мере указывает на ту часть дохода имения, которая обус­ловливается влиянием размера имения, и ту часть, кото­рая связана с прочими неучтенными, остаточными фак­торами) в общем виде измеряет долю вариации зависимой переменной, которая обусловливается влиянием неза­висимой переменной. Коэффициент корреляции будет подробно рассмотрен в следующей главе. А сейчас оста­новимся на стандартной ошибке оценки.

В выборке стандартная ошибка оценки значений за­висимой переменной (у), вычисленных по линейному урав­нению у = а-\-Ьх, определяется по формуле:

Как видим, стандартная ошибка оценки — не что иное, как среднее квадратичное отклонение остаточных, не объясненных уравнением регрессии величин дохода име­ния от своей средней, или среднее квадратичное отклоне­ние фактических значений дохода от теоретических, т. е. вычисленных по уравнению регрессии у——0.1438 + + 0.00606 х.

Таким образом, в выборке из десяти имений стандарт­ная ошибка оценки дохода имений по уравнению регрес­сии составила 0.0994 тыс. руб. По уравнению регрессии у = —0.1438+0.00606 х можно определять примерный доход имения по его размеру и для всех имений, не вошед­ших в выборку из 10 имений. Однако для не вошедпшх в выборку имений доход, предсказанный по этому урав­нению, в среднем будет отличаться от фактического

Соседние файлы в папке Матметоды в гуманит0