- •Контрольная работа
- •Москва, 2017 Лабораторная работа №1. Определение показателей выборочной ковариации и корреляции. Теоретическая часть.
- •Выполнение работы:
- •Лабораторная работа №2. «Парный корреляционно-регрессионный анализ» Теоретическая часть.
- •Выполнение работы:
- •Лабораторная работа №4. «Построение парной линейной модели регрессии с использованием инструмента «Регрессия» ms excel Теоретическая часть.
- •Выполнение работы:
- •Лабораторная работа №4. «Множественная линейная регрессия» Теоретическая часть.
- •Выполнение работы:
Лабораторная работа №4. «Построение парной линейной модели регрессии с использованием инструмента «Регрессия» ms excel Теоретическая часть.
Как известно из курса математической статистики нулевая гипотеза принимается, если фактическое значение критерия не превышает его критическое значение при выбранном уровне его (теоретического значения критерия) значимости. С другой стороны, если известна значимость фактического значения критерия (выводится при реализации инструмента «Регрессия» MS EXCEL), тогда статистический вывод нужно делать следующим образом:
задать теоретический уровень значимости
(наиболее
часто применяются уровни – 1%, 5%, 0,01%)сравнить фактическую значимость
с
теоретической:
если < – принимается альтернативная,
– нулевая
гипотеза.
В регрессионном анализе при проверке значимости уравнения в целом или его параметров в качестве нулевой гипотезы выдвигается предположение об их недостоверности – равенстве нулю коэффициента корреляции (при оценке значимости уравнения в целом) или параметров. Следовательно, параметры или уравнение в целом будут значимы, только в том случае, если < .
Одним из показателей качества модели является средняя ошибка аппроксимации:
,
где
- рассчитанные по уравнению регрессии
прогнозные (предсказанные значения)
для каждого значения независимой
переменной.
Для прогнозирования считается приемлемым уровень средней ошибки аппроксимации 8-10%.
Выполнение работы:
Требуется по исходным данным лабораторных работ №2 «Парный корреляционно-регрессионный анализ» построить уравнение линейной регрессии с использованием встроенного инструмента «Регрессия».
Таблица 6. Исходные данные
№ п/п |
Регион |
1 вариант |
|
ВРП, тыс. руб. у |
Инвестиции в основной капитал, руб.х |
||
1998 |
1997 |
||
|
Центральный федеральный округ |
|
|
1 |
Белгородская область |
11,4 |
2444 |
2 |
Брянская область |
7,6 |
933 |
3 |
Владимирская область |
9,0 |
1293 |
4 |
Воронежская область |
9,4 |
1414 |
5 |
Ивановская область |
6,4 |
741 |
6 |
Калужская область |
9,5 |
1541 |
7 |
Костромская область |
10,4 |
1602 |
8 |
Курская область |
10,8 |
1550 |
9 |
Липецкая область |
12,2 |
2715 |
10 |
Московская область |
11,9 |
2055 |
11 |
Орловская область |
9,1 |
1491 |
12 |
Рязанская область |
10,9 |
1286 |
13 |
СмоленскаяОбласть |
9,6 |
1194 |
14 |
Тамбовская область |
6,9 |
976 |
15 |
Тверская область |
9,4 |
1414 |
16 |
Тульская область |
9,0 |
1533 |
17 |
Ярославская область |
13,6 |
1472 |
1. Для построения модели парной линейной регрессии выберите инструмент анализа Регрессия (пункт Главного меню Сервис →Анализ данных →Регрессия) и нажмите ОК. В появившемся окне «Регрессия» щелкните флажок напротив «Входной интервал У:» и выделите соответствующий числовой диапазон данных, аналогично заполните «Входной интервал Х:», поставьте галочку «Остатки» и нажмите «ОК».
В итоге появится новый лист со следующей информацией (рисунок 2)
Рисунок
2
Продолжение
рисунка 2
Вывод: В результате использования инструмента «Регрессия» получены те же параметры уравнения, ошибки, значения критериев F, t, получены аналогичные интервальные оценки для параметров в генеральной совокупности.
Уравнение регрессии: ỹ=5,75+0,003х. Уравнение в целом значимо F=16,38, а значимость критерия (Значимость F на листе итогов) составила 0,001*100=0,1%, что гораздо меньше обычно принимаемой 5% области (если значимость критерия находится в пределах выбранной исследователем критической области, в нашем случае 5%, то принимается альтернативная гипотеза, если больше – нулевая), следовательно, уравнение будет значимо для генеральной совокупности.
Значим параметр а: P-Значение для критерия t-Стьюдента (t-Статистика) составило 0,00007 (0,007%<5%, следовательно модель достоверная, принимается На). Коэффициент полной регрессии оказался также значимым (0,01%<5%), возможна его интерпретация: при увеличении (уменьшении) инвестиций в расчете на душу населения на 1 рубль валовой региональный продукт на душу населения увеличится (уменьшится) на 3 рубля.
Поскольку параметры выборочного уравнения регрессии значимы, то можно дать интервальную оценку параметров генерального уравнения. Нижние и верхние границы параметров на листе вывода итогов обозначены как «Нижние 95%» и «Верхние95%».
Параметр α находится в пределах от 3,49 до 8,01 : 3,49≤α ≤8,01; параметр β: 0,001≤β≤0,004 при уровне доверия данных суждений 95%.
Оценим тесноту связи между переменными. Коэффициент корреляции r=0,874, что свидетельствует о сильной тесноте связи, коэффициент детерминации позволяет сделать вывод, что 52,2% вариации ВВП связано с изменением уровня инвестиций в расчете на душу населения.
Поскольку получено значимое уравнение по критерию Фишера, с высоким коэффициентом детерминации, значимыми параметрами, то можно сделать вывод о достаточно высоком качестве модели и возможности построения прогнозов на ее основе.
