- •3.1. Простая линейная регрессия.
- •Пример построения линейной регрессии.
- •3.1.1. Определение параметров уравнения регрессии с помощью метода наименьших квадратов.
- •3.1.2. Критерии значимости коэффициентов и в уравнении регрессии.
- •Коэффициент детерминации .
- •Гетероскедастичность.
- •Автокорреляция.
- •Мультиколлинеарность.
- •Фиктивные переменные.
- •Исходные данные
- •Результаты вычислений.
- •3.4. Использование регрессии для прогнозирования.
- •Матрица коэффициентов парной корреляции
- •Множественный коэффициент корреляции
- •Частный коэффициент корреляции
- •Исходные данные.
- •Результаты расчета.
- •Проверка точности.
- •Проверка адекватности и оценка точности модели парной линейной регрессии.
- •Проверка адекватности.
- •Курс доллара сша и предположительно влияющие на него факторы.
- •Корреляционная матрица системы показателей.
- •Параметры модели зависимости курса доллара от цены золота и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота и dj-индекса и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота, dj-индекса и тn-индекса и ее статистические характеристики.
- •Результаты моделирования зависимости курса доллара от цены золота и dj-индекса.
- •Исходные данные.
- •Коэффициенты корреляции.
- •Исходные данные.
- •Исходные данные.
Исходные данные.
Объем реализации акций, (в млн руб.) |
Месяц |
Расходы на рекламу, тыс. руб. |
Цена акции, руб. |
Цена аналогичных акций, руб. |
Индекс потребительских расходов, % |
126 |
1 |
4 |
15 |
17 |
100 |
137 |
2 |
4,8 |
14,8 |
17,3 |
98,4 |
148 |
3 |
3,8 |
15,2 |
16,8 |
101,2 |
191 |
4 |
8,7 |
15,5 |
16,2 |
103,5 |
274 |
5 |
8,2 |
15,5 |
16 |
104,1 |
370 |
6 |
9,7 |
16 |
18 |
107 |
432 |
7 |
14,7 |
18,1 |
20,2 |
107,4 |
445 |
8 |
18,7 |
13 |
15,8 |
108,5 |
367 |
9 |
19,8 |
15,8 |
18,2 |
108,3 |
367 |
10 |
10,6 |
16,9 |
16,8 |
109,2 |
321 |
11 |
8,6 |
16,3 |
17 |
110,1 |
307 |
12 |
6,5 |
16,1 |
18,3 |
110,7 |
331 |
13 |
12,6 |
15,4 |
16,4 |
110,3 |
345 |
14 |
6,5 |
15,7 |
16,2 |
111,8 |
364 |
15 |
5,8 |
16 |
17,7 |
112,3 |
384 |
16 |
5,7 |
15,1 |
16,2 |
112,9 |
Решение.
Выберем факторные
признаки для построения двухфакторной
регрессионной модели.
Объем
реализации - это зависимая переменная
Y.
В
качестве независимых, объясняющих
переменных выбраны:
время Х1,
расходы
на рекламу Х2,
цена
товара Х3,
средняя
цена
аналогичных акций Х4,
индекс
потребительских расходов
.
Для проведения корреляционного анализа используем инструмент «Корреляция» (Анализ данных в Excel):
Введите данные для корреляционного анализа, расположив их в смежных диапазонах ячеек.
Выберите команду Сервис => Анализ данных.
В диалоговом окне Анализ данных выберите инструмент «Корреляция», затем нажмите кнопку ОК.
В диалоговом окне «Корреляция» в поле «Входной интервал» введите диапазон ячеек, содержащих исходные данные. Если выделены и заголовки столбцов, то установите флажок Метки в первой строке.
Выберите параметры вывода (в данном примере - Новый рабочий лист).
Нажмите кнопку ОК.
В результате перечисленных действий будет получена матрица коэффициентов парной корреляции (табл. 3.15).
Таблица 3.15.
Коэффициенты корреляции.
|
Объем реализации
Y |
Время
|
Реклама
Х2 |
Цена
|
Цена аналогичных акций
|
Индекс потребительских расходов
|
Объем реализации Y |
1 |
|
|
|
|
|
Время Х1 |
0,678 |
1 |
|
|
|
|
Реклама Х2 |
0,646 |
0106 |
1 |
|
|
|
ЦенаХ3 |
0,233 |
0,174 |
-0,003 |
1 |
|
|
Цена аналогичных акций Х4 |
0,226 |
-0,051 |
0,204 |
0,698 |
1 |
|
Индекс потребительских расходов Х5 |
0,816 |
0,960 |
0,273 |
0,235 |
0,03 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная (т.е. объем реализации) имеет тесную связь с индексом потребительских расходов (коэффициент корр. = 0.816), с расходами на рекламу (коэффициент корр. = 0.646) и со временем (коэффициент корр. = 0.678). Однако факторы Х1 и Х5 тесно связаны между собой (коэффициент корр. = 0.96 > 0.8), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х5 - индекс потребительских расходов. В этом примере n = 16, m = 5, после исключения незначимых факторов n = 16, k = 2.
Рассчитаем параметры модели. Оценка параметров регрессии осуществляется методом наименьших квадратов по формулам, приведенным выше с использованием данных, записанных в табл. 3.14. Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:
Y = -1471.314 + 9.568 + 15.754 X2.
Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения. Самостоятельно оценить качество этой модели!
Пример. На основании информации о норме безработицы и темпах инфляции (табл. 3.16) построить: 1) диаграмму рассеяния; 2) модель регрессии зависимости темпов инфляции от нормы безработицы. Результаты расчетов отобразить на графике. 3) Оценить качество построенной Вами модели.
Таблица 3.16.
Исходные данные.
Темпы инфляции У |
1,1 |
1,1 |
1,2 |
1,3 |
1,7 |
2,9 |
2,9 |
4,2 |
5,4 |
Норма безработицы X |
6,5 |
5,4 |
5,5 |
5,0 |
4,4 |
3,7 |
3,7 |
3,5 |
3,4 |
Решение. Построим диаграмму рассеяния для переменных X (процент безработных в общей численности рабочей силы) и Y (темпы инфляции) по данным табл. 3.16. Характер диаграммы рассеяния явно указывает на наличие нелинейной связи между рассматриваемыми переменными. Воспользуемся уравнением гиперболы, построим модель в виде:
Коэффициент детерминации этого уравнения равен 0.83.
Однако можно получить еще более точную модель аппроксимации этих данных:
с коэффициентом детерминации 0.985. Самостоятельно оценить качество этой модели!
Пример. По 12 областям получена информация, характеризующая зависимость потребительских расходов Y на душу населения от денежных доходов населения X (табл. 3.17).
Таблица 3.17.
