- •Компьютерный практикум
- •1. Типы роста и трендовые модели
- •2. Множественная регрессия
- •Independent variable list – независимые переменные )
- •3. Обобщенный регрессионный анализ
- •4. Регрессионные модели
- •5. Регрессионные модели
- •6. Авторегрессионные процессы и их модели
- •7. Адаптивные модели прогнозирования
- •Объем продаж новых автомобилей в сша, шт.
- •8. Прогнозирование сезонных колебаний
Independent variable list – независимые переменные )
После нажатия кнопки «ОК» появится окно, представленное на рис. 4. В нем использованы следующие обозначения: Multiple R – множественный R (множественный коэффициент корреляции); R? – R-квадрат (множественный коэффициент детерминации); adjusted R? – скорректированный R-квадрат; F – F-критерий (дисперсионное отношение Фишера); p – значимость F; df – число степеней свободы числителя (в данном случае – 3) и знаменателя (в данном случае – 26); Standard error of estimate – стандартная ошибка; Intercept – свободный члена (); Std. Error – стандартная ошибка коэффициента ; далее показана t-статистика и p-значение, позволяющие определить степень статистической значимости . Под чертой приводятся значения бета-коэффициентов. Красный шрифт свидетельствует об их значимости.
Рис. 4. Вкладка Multiple Regression Results
(Результаты множественного регрессионного анализа)
-
Переход на вкладку Summary: Regression results (Результаты быстрого регрессионного анализа, см. рис. 8). На ней представлены: бета-коэффициенты (Beta), стандартные ошибки бета-коэффициентов (Std. Err. of Beta), оценки коэффициентов регрессионного уравнения b (B), стандартные ошибки оценок коэффициентов b (Std. Err. of B), t-статистики Стьюдента (t (15)), p-значения (p-level). Красный шрифтом свидетельствует о значимости коэффициентов регрессии.
Рис. 5. Вкладка Regression Summary for Dependent Variable: Y
(Результаты регрессионного анализа для переменной Y)
5. Переход на вкладку Advanced / Descriptive statistics / Correlations (Расширенный анализ / Описательные статистики / Корреляция, см. рис. 6– 8). В результате появится матрица корреляций между переменными модели.
Рис. 6. Вкладка Advanced (Расширенный анализ)
Рис. 7. Вкладка Review Descriptive Statistics
(Просмотр описательных статистик)
Рис. 8. Матрица корреляций
6. Переход на вкладку Summary: Predicted & Residual Values (Предсказанные значения и остатки, см. рис. 9). Здесь использованы следующие обозначения: Observed Value – наблюдаемые (фактические) значения, Predicted Value – предсказанные (расчетные) значения, Residual – остатки; Minimum – минимальное значение, Maximum – максимальное значение, Mean – среднее, Median – медиана. Графическое отображение фактических и расчетных значений можно получить, выполнив следующий пункт.
Рис. 9. Вкладка Predicted & Residual Values (Предсказанные значения и остатки)
7. Переход на вкладку Scatterplots (Графики, см. рис. 10), выбор Predected vs. Observed (Предсказанные и фактические значения, см. рис. 11).
Пример 4. Известно, что стоимость выпуска газеты в значительной степени определяется величиной типографских расходов. Для того чтобы иметь возможность воздействовать на эту стоимость, издатели наиболее популярных газет решили изучить факторы, определяющие сумму годовых затрат на печать газет, и оценить степень их влияния. С этой целью для 20 городов России были собраны данные о годовых расходах на печать (, млн. руб.), объемах розничной продажи газет в городе (млн. руб.) и количества семей в городе (в тысячах). Заметим, что для факторов были взяты их логарифмы ( и , соответственно) с целью уменьшения разброса данных, а, следовательно, и упрощения их обработки. Все эти данные представлены в табл. 15. Постройте модель множественной регрессии, отражающую зависимость среднегодовых расходов на издание газеты от соответствующих факторов.
Рис. 10. Вкладка Scatterplots (Графики)
Рис. 11. Предсказанные и фактические значения зависимой переменной Y
Т а б л и ц а 15
№ п.п. |
№ п.п. |
||||||
1. |
2,8 |
4,4 |
3,00 |
11. |
2,7 |
4,24 |
2,89 |
2. |
2,3 |
3,68 |
2,51 |
12. |
2,9 |
4,72 |
3,22 |
3. |
2,5 |
3,92 |
2,67 |
13. |
3,3 |
5,28 |
3,6 |
4. |
2,7 |
4,32 |
2,94 |
14. |
2,7 |
4,24 |
2,89 |
5. |
2,6 |
4,24 |
2,89 |
15. |
1,8 |
3,04 |
2,07 |
6. |
2,4 |
3,76 |
2,56 |
16. |
1,9 |
3,12 |
2,13 |
7. |
3,5 |
5,52 |
3,76 |
17. |
2,2 |
3,6 |
2,46 |
8. |
2,1 |
3,36 |
2,29 |
18. |
2,3 |
3,68 |
2,51 |
9. |
1,9 |
3,04 |
2,07 |
19. |
3,6 |
5,76 |
3,92 |
10. |
3,8 |
5,92 |
4,03 |
20. |
2,2 |
3,6 |
2,45 |
Решение с помощью табличного процессора Excel
-
Ввод исходных данных.
-
Построение регрессионного уравнения с использованием «Пакета анализа» (см. Вывод итогов 5) и анализ полученных результатов.
ВЫВОД ИТОГОВ 5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
Множественный R |
0,997299 |
|
|
|
|
|
R-квадрат |
0,994606 |
|
|
|
|
|
Нормированный R-квадрат |
0,993972 |
|
|
|
|
|
Стандартная ошибка |
0,044773 |
|
|
|
|
|
Наблюдения |
20 |
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
2 |
6,283922 |
3,141961 |
1567,374 |
5,26E-20 |
|
Остаток |
17 |
0,034078 |
0,002005 |
|
|
|
Итого |
19 |
6,318 |
|
|
|
|
|
|
|
|
|
|
|
|
Коэффи-циенты |
Стандартная ошибка |
t-статис-тика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
-0,10201 |
0,052759 |
-1,93359 |
0,069992 |
-0,21333 |
0,009298 |
Переменная X 1 |
2,653207 |
2,446084 |
1,084675 |
0,293209 |
-2,50759 |
7,814002 |
Переменная X 2 |
-2,93956 |
3,595708 |
-0,81752 |
0,424942 |
-10,5258 |
4,646732 |
Анализ Вывода итогов 5 свидетельствует о том, что полученные стандартные ошибки значительно больше самих расчетных коэффициентов. Коэффициенты при факторах и незначимы, так как для них P-значения больше 0,05. В то же время сравнение расчетного значения -критерия с табличным (2, 17) = 3,59 позволяет сделать вывод об адекватности рассматриваемой модели.
Коэффициенты корреляции говорят о существенной взаимосвязи моделируемого показателя с факторами (см. табл. 26, полученную в результате использования функции КОРРЕЛ). Одной из причин противоречивости результатов модели является тесная взаимосвязь между факторами. Все эти факты говорят о том, что изучаемая модель требует более детального анализа.
Т а б л и ц а 16
Корреляционная матрица
|
|||
1 |
0,9972 |
0,9971 |
|
0,9972 |
1 |
0,9999 |
|
0,9971 |
0,9999 |
1 |
-
Проверка условия невырожденности матрицы .
-
Формирование матрицы с помощью функций ТРАНСП и МУМНОЖ
.
-
Вычисление определителя матрицы с помощью функции МОПРЕД
0,0633.
Близость определителя к нулю, а также проведенный выше анализ позволяют сделать вывод о наличии частичной мультиколлинеарности.
4. Устранение эффекта мультиколлинеарности с помощью ридж-оценивания.
4.1. Включение в модель дополнительной переменной , принимающей единственное значение, равное 1.
-
Расчет коэффициентов регрессии с использованием матричных функций Excel.
4.2.1. Формирование матрицы, обратной к матрице системы нормальных уравнений с помощью функций ТРАНСП, МУМНОЖ и МОБР при .
;
;
;
.
-
Получение вектора оценок коэффициентов регрессии путем умножения обратной матрицы на матрицы и при различных значениях . Оформление результатов виде табл. 17.
Т а б л и ц а 17
Оценки коэффициентов регрессии при разных значениях
|
||||
-0,0937 |
-0,0745 |
-0,0588 |
-0,0458 |
|
0,4454 |
0,4411 |
0,4381 |
0,4358 |
|
0,2975 |
0,2972 |
0,2961 |
0,2950 |
5. Расчет стандартных ошибок коэффициентов регрессии.
5.1. Вычисление остаточной дисперсии при различных значениях и оформление результатов расчетов в виде табл. 18.
Т а б л и ц а 18
Квадраты отклонений расчетных от фактических значений |
|||
1 |
2 |
3 |
4 |
0,001703 |
0,001766 |
0,001826 |
0,001884 |
0,000060 |
0,000028 |
0,000011 |
0,000003 |
0,002836 |
0,002686 |
0,002576 |
0,002493 |
0,000028 |
0,000024 |
0,000020 |
0,000016 |
0,002997 |
0,002993 |
0,002980 |
0,002961 |
0,003277 |
0,003036 |
0,002854 |
0,002715 |
0,000265 |
0,000489 |
0,000728 |
0,000970 |
0,000248 |
0,000139 |
0,000074 |
0,000037 |
0,000564 |
0,000336 |
0,000195 |
0,000109 |
0,003337 |
0,004280 |
0,005152 |
0,005956 |
0,002048 |
0,002051 |
0,002062 |
0,002078 |
0,004453 |
0,004163 |
0,003920 |
0,003714 |
0,000854 |
0,000599 |
0,000420 |
0,000292 |
0,002048 |
0,002051 |
0,002062 |
0,002078 |
0,005815 |
0,006670 |
0,007400 |
0,008024 |
0,000885 |
0,001211 |
0,001509 |
0,001776 |
0,001742 |
0,001989 |
0,002196 |
0,002368 |
0,000060 |
0,000028 |
0,000011 |
0,000003 |
Окончание табл. 18
1 |
2 |
3 |
4 |
0,001462 |
0,000980 |
0,000653 |
0,000426 |
0,001502 |
0,001733 |
0,001927 |
0,002090 |
Сумма квадратов отклонений расчетных от фактических значений |
|||
0,036183 |
0,037251 |
0,038577 |
0,039994 |
Остаточная дисперсия |
|||
0,002128 |
0,002191 |
0,002269 |
0,002353 |
-
Получение стандартных ошибок в виде корня квадратного из произведения диагональных элементов обратной матрицы на остаточную дисперсию при различных значениях . Оформление результатов расчетов в виде табл. 19.
Т а б л и ц а 19
Стандартные ошибки коэффициентов регрессии при разных значениях
|
|
|||
0,0483 |
0,0464 |
0,0450 |
0,0438 |
|
0,0824 |
0,0593 |
0,0495 |
0,0437 |
|
0,1207 |
0,0867 |
0,0721 |
0,0636 |
Таким образом, наименьшая стандартная ошибка получена при .Следовательно, построенная модель может быть записана в виде
.
6. Проверка значимости полученных коэффициентов регрессии
; ; .
Сравнение расчетных значений t-статистик с табличным свидетельствует о значимости включенных в модель факторов и . Таким образом, построенную модель можно использовать для целей анализа и прогнозирования.
Задание 2. Начальник отдела маркетинга кинотеатра «Отражение» поручил своим сотрудникам провести исследование, в результате которого необходимо: 1) выявить фактор, в наибольшей степени влияющий на среднее число зрителей за первые три дня проката фильма; 2) построить прогнозную модель в виде линейной функции; 3) с помощью построенной модели получить прогнозные оценки среднего числа зрителей на первые три дня проката следующих двух фильмов. Специалисты отдела маркетинга экспертным путем в качестве фактора, в наибольшей степени влияющего на посещение киносеансов, установили расходы на рекламу фильма, (см. табл. 20). Выполните 2-е и 3-е задание начальника отдела маркетинга.
Т а б л и ц а 20
Показатели, характеризующие деятельность кинотеатра «Отражение»
Среднее число зрителей за первые три дня проката фильма |
Расходы на рекламу фильма, руб. |
Среднее число зрителей за первые три дня проката фильма |
Расходы на рекламу фильма, руб. |
282 |
2750 |
305 |
4565 |
263 |
2430 |
328 |
5987 |
295 |
3700 |
335 |
6100 |
276 |
2860 |
251 |
2375 |
285 |
3180 |
292 |
3480 |
342 |
4270 |
290 |
3295 |
276 |
2875 |
387 |
7500 |
328 |
5295 |
326 |
5430 |
321 |
5140 |
347 |
6310 |
326 |
4870 |
234 |
2100 |
Задание 3. Предприниматель желает сдать в аренду на один год принадлежащий ему отель*** «Блаженство жизни» (80 комнат), расположенный в престижной курортной зоне, обладающий собственным пляжем, общая площадь территории отеля составляет 3,42 кв.м.
Для того чтобы определить величину платы, которую он сможет установить за аренду своего отеля, предприниматель решил проанализировать ситуацию на соответствующей рыночной нише. Изучение объявлений, размещенных в газетах владельцами трехзвездных отелей, позволило ему сформировать небольшую базу данных, представленную в виде табл. 21.
Т а б л и ц а 21
Данные о трехзвездных отелях
Величина годовой платы за аренду отеля, тыс. руб. |
Число комнат в отеле |
Престижность района, в котором расположен отель |
Наличие у отеля собственного пляжа |
Общая площадь территории, принадлежащей отелю, кв. км. |
1 |
2 |
3 |
4 |
5 |
123 |
25 |
1 |
1 |
1,00 |
115 |
25 |
0 |
0 |
0,80 |
126 |
30 |
1 |
1 |
1,20 |
130 |
30 |
0 |
1 |
1,50 |
125 |
30 |
1 |
0 |
1,40 |
134 |
45 |
0 |
0 |
2,00 |
142 |
45 |
1 |
0 |
2,50 |
140 |
45 |
0 |
1 |
2,20 |
143 |
45 |
0 |
0 |
2,70 |
150 |
60 |
0 |
1 |
2,80 |
153 |
60 |
0 |
1 |
3,00 |
158 |
60 |
1 |
0 |
3,60 |
Окончание табл. 21
1 |
2 |
3 |
4 |
5 |
160 |
75 |
1 |
1 |
3,50 |
163 |
75 |
0 |
0 |
3,80 |
164 |
75 |
1 |
1 |
3,60 |
168 |
75 |
0 |
0 |
3,75 |
172 |
100 |
0 |
1 |
4,10 |
180 |
100 |
1 |
1 |
4,70 |
177 |
120 |
1 |
1 |
4,25 |
182 |
120 |
0 |
1 |
4,65 |
На основе данных этой базы предприниматель решил построить модель множественной регрессии, отражающую зависимость величины годовой арендной платы от числа комнат, престижности района расположения отеля (1 – престижный район, 0 – нет), наличия у отеля собственного пляжа (1 – есть собственный пляж, 0 – нет), а также общей площади территории, принадлежащей отелю, и с помощью построенной модели определить примерный размер платы, которую он может получать за предоставление в аренду своего отеля. На данный момент выбор предпринимателя колеблется между 162 тыс. руб. и 165 тыс. руб. Определите наиболее приемлемый размер арендной платы.
Задание 4. Фирма «Ваше очарование» довольно успешно осуществляет торговлю косметическими товарами на российском рынке. Ее успех определяется, в частности, человеческим фактором. С целью изучения его влияния на среднеквартальный объем продаж (млн. руб., ) через такие показатели, как фонд оплаты труда (млн. руб., ) и численность работников фирмы (чел., ), была сформирована табл. 22. В этой таблице приведены данные по этим показателям за последние 18 кварталов. Постройте двухфакторную регрессионную модель, отражающую зависимость объема продаж от указанных факторов.
Т а б л и ц а 22
Показатели деятельности фирмы «Ваше очарование»
1 |
39832 |
3975 |
1986 |
10 |
43671 |
4344 |
2171 |
2 |
33527 |
3337 |
1668 |
11 |
39518 |
3895 |
1946 |
3 |
36181 |
3586 |
1792 |
12 |
47639 |
4941 |
2469 |
4 |
42873 |
4065 |
2031 |
13 |
39518 |
3895 |
1946 |
5 |
28279 |
2859 |
1429 |
14 |
29376 |
2919 |
1458 |
6 |
52256 |
5001 |
2499 |
15 |
28215 |
2809 |
1404 |
7 |
36425 |
3611 |
1805 |
16 |
33193 |
3298 |
1648 |
8 |
27734 |
2760 |
1379 |
17 |
33927 |
3377 |
1688 |
9 |
54547 |
5419 |
2708 |
18 |
57736 |
5250 |
2624 |