
- •Статистическое изучение взаимосвязи социально-экономических явлений
- •Часть II однофакторный и многофакторный регрессионный анализ
- •1. Нахождение уравнений регрессии между двумя признаками
- •1.1. Парная линейная регрессия. Расчет параметров уравнения регрессии по индивидуальным данным
- •1.2. Парная линейная регрессия. Расчет параметров уравнения регрессии по сгруппированным данным
- •Поясним, как вычислялись суммы :
- •1.3. Парная линейная регрессия. Сопряженные уравнения
- •1.4. Парная линейная регрессия. Параболическая и гиперболическая корреляция
- •2. Многофакторная (множественная) регрессия. Общие положения
- •2) Выбор типа урвнения.
- •2.1. Мультиколлинеарность и коллинеарность.
- •5.1. Построение и статистический анализ многофакторной линейной модели
- •5.1. Построение и статистический анализ двухфакторной линейной модели (трехмерной регрессии)
- •5.1.1. Парные коэффициенты корреляции
- •5.1.2. Частные коэффициенты корреляции
- •5.1.3. Совокупный коэффициент множественной корреляции
- •5.1.4. Совокупный коэффициент множественной детерминации
- •5.1.5. Частные коэффициенты эластичности
- •3. Пример на экономическую интерпретацию многофакторной регрессионной модели
1.1. Парная линейная регрессия. Расчет параметров уравнения регрессии по индивидуальным данным
Линейная зависимость – наиболее часто используемая форма связи между коррелируемыми признаками, и выражается она, как указывалось ранее, при парной корреляции уравнением прямой:
.
(22)
Гипотезу о линейной зависимости между х и у выдвигается в том случае, если значения результативного и факторного признаков возрастаю (или убывают) примерно в арифметической прогрессии.
Параметры
и
отыскиваются по МНК следующим образом:
Согласно
требованию МНК при линейной зависимости
в (21) вместо
записываем его конкретное выражение
,
т.е.:
=
.
(23)
Дальнейшее
решение сводится к задаче
на экстремум
, т.е. к определению того, при каких
значения
и
функция двух переменныхU
может
достигнуть минимума. Для этого надо
найти частные производные U
по
и
,
приравнять их нулю и после элементарных
преобразований решить систему двух
уравнений с двумя неизвестными.
В соответствии с изложенным найдем частные производные
(24)
Сократив каждое уравнение на –2, раскрыв скобки и перенося члены с х в одну сторону, а с у – в другую, получим (так как пределы суммирования везде одинаковы, в дальнейшем их не указываем)
(25)
Система (25) называется системой нормальных уравнений МНК для линейного уравнения регрессии.
Рассмотренный способ расчета параметров уравнения регрессии называется расчетом по индивидуальным данным, поскольку участвуют данные о значениях х и у каждой единицы совокупности (по списку).
Формулы
для расчета параметров
и
на основе определителя 2-го порядка
следующие:
(26,
а)
или (если в (2.25) все уравнения разделить на n)
=
,
(26, б)
,
(27)
где
,
.
Коэффициент
регрессии ()
показывает, на сколько единиц (вабсолютном
выражении) изменяется значение
результативного признака относительного
факторного.
Коэффициент эластичности (Э – часто используется в экономическом анализе) показывает, на сколько процентов изменяется в среднем результативный признак у при изменении факторного признака х на 1%. Обычно рассчитывается как отношение прироста (в %) результативного признака к приросту (в %) факторного признака.
=
.
(28)
Пример.
Уравнение регрессии
выражает зависимость объема валового
выпуска от стоимости основных фондов,
тогда коэффициент эластичности выразится
так:
Э
=
.
Подставляя в данное выражение разные значения х, получаем и разные значения Э. Так, например, при х = 50 коэффициент эластичности Э = 1,11, а при х = 80 соответственно Э = 1.09 и т.д. Это значит, что при увеличении основных фондов х с 50 до 50,5 млн. руб., т.е. на 1%, валовой выпуск у возрастает в среднем на 1,11% прежнего уровня; при увеличении х с 80 до 80,8 млн. руб., т.е. на 1%, у возрастает на 1,09%.
1.2. Парная линейная регрессия. Расчет параметров уравнения регрессии по сгруппированным данным
Когда
наблюдение ведется над большим числом
пар значений х
и у,
то, как уже отмечалось, данные удобнее
располагать в виде корреляционной
таблицы (см., например, табл. 9.3), где
указаны распределения по х
и по у
и соответственно, их частоты
и
.
При этом
=
=n
– общее число наблюдений.
При составлении и решении системы нормальных уравнений в этих случаях все суммы значений х и у, их произведений должны учитываться вместе с их весом, а именно:
(29)
Пример. Используя данные табл. 3, составим таблицу (табл. 7) исходных условных данных для обработки по формуле (29).