
- •Основы регрессионного анализа. Множественная регрессия
- •4. Вычислить коэффициент детерминации и проверить на значимость построенное регрессионное уравнение. Сделать выводы.
- •5. Построить 95%-ый доверительный интервал для уравнения регрессии на всём диапазоне исходных данных.
- •6. Изобразить в одной системе координат исходные данные, линию регрессии, 95%-ый доверительный интервал.
- •Выводы:
- •Рекомендации:
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
Новосибирский Государственный Технический Университет
Кафедра теории рынка
Практическое занятие №4
По предмету «эконометрика».
Основы регрессионного анализа. Множественная регрессия
Вариант №7.
Факультет: ФЭН
Группа: ЭК-91
Студенты: Владимирова О.А.
Клевцова В.В.
Преподаватель:
Щеколдин В.Ю.
Новосибирск 2011г.
Ситуация 2: «Орехи и виноград».
В соответствии с рекомендациями книги о вкусной и здоровой пище, спасённой Робинзоном с корабля, он решил разнообразить своё меню. Для этого кроме охоты на уток Робинзон стал заниматься сбором дикого винограда и орехов. В период сбора урожая он с утра выходил в лес с большой корзиной, собирал орехи с виноградом и к обеду возвращался. Со временем Робинзон заметил, что вес собранного (Y, фунты) зависит от количества обобранных кустов винограда (X1, шт) и количества обобранных кустов орешника (X2, шт). Необходимо построить модель этой зависимости и помочь Робинзону избавиться от алкогольной зависимости.
Цель:ознакомиться с основными положениями, понятиями и методами анализа линейных моделей множественной регрессии.
Исходные данные:
x1 |
x2 |
y |
11 |
7 |
38 |
4 |
10 |
29 |
15 |
7 |
44 |
4 |
10 |
37 |
6 |
6 |
36 |
6 |
10 |
39 |
5 |
10 |
43 |
3 |
10 |
30 |
8 |
10 |
50 |
14 |
6 |
42 |
10 |
10 |
50 |
15 |
7 |
35 |
7 |
10 |
41 |
8 |
10 |
51 |
3 |
7 |
31 |
14 |
5 |
39 |
11 |
7 |
39 |
8 |
8 |
39 |
7 |
8 |
37 |
13 |
9 |
52 |
14 |
10 |
45 |
9 |
10 |
45 |
12 |
8 |
43 |
14 |
9 |
48 |
9 |
8 |
31 |
Задание №1. Записать уравнение зависимости веса собранного урожая от количества обобранных кустов винограда и орешника. Пояснить введенные обозначения.
Уравнение парной регрессии выглядит следующим образом:
–
значение признака Y
(выходной переменной ) в i-том наблюдении
– вес собранного урожая в фунтах.
–
значение признака X1
(входной переменной ) в i-том наблюдении
– количество обобранных кустов винограда.
–
значение признака X2
(входной переменной ) в i-том наблюдении
– количество обобранных кустов орешника.
-случайная
величина (ошибка наблюдения).
-
неизвестные параметры
Основные предположения модели:
, - детерминированные величины
-
вектор значений отклика
-
вектор неизвестных параметров модели
-
вектор случайных ошибок
-
матрица значений независимых переменных
в Nэкспериментах
- вид модели
При этом:
;
;
.
Задание №2. С помощью метода наименьших квадратов найти оценки всех неизвестных параметров уравнения регрессии. Проинтерпретировать результаты.
Вычислим оценки неизвестных параметров, используя технику метода наименьших квадратов.
Техника МНК состоит в решении системы нормальных уравнений:
Вычислим величину остаточной суммы квадратов
,
Где
.
Найдем оценки неизвестных параметров с помощью метода наименьших квадратов.
Определим матрицу значений неизвестных параметров, исходя из того, что:
,
отсюда
.
Таким образом,
,
,
.
Уравнение линейной множественной
регрессии имеет вид:
=
8.855+1.208
Интерпретируем полученные коэффициенты регрессии для этой зависимости:
Так как
>0, то сделаем вывод: относительное изменение веса собранного урожая происходит,быстрее чем изменение количества обобранных кустов винограда и орешника. Значение оценки 8,855означает вес собранного при случае, когда не обобрано ни одного куста. Но интерпретация этого параметра не имеет экономического содержания.
Так как, при изменении количества обобранных кустов винограда на 1 штуку, общий вес собранного урожая изменяется в среднем на 1,208 фунтов, т.е. с увеличением количества обобранных кустов винограда, общий вес собранного Робинзоном урожая увеличивается.
Так как, при изменении количества обобранных кустов орешника на 1 штуку, общий вес собранного урожая изменяется в среднем на 2,428 фунтов, т.е. с увеличением количества обобранных кустов орешника, общий вес собранного Робинзоном урожая увеличивается.
Задание №3. Проверить значимость параметров уравнения по критерию Стьюдента. Для значимых коэффициентов построить доверительные интервалы. Сделать выводы.
Проверим на значимость параметр
:
Уровень значимости:
=0,05.
Вычислим
– несмещенную оценку дисперсии ошибок,
равную
=
32.79247
Найдём
–
среднеквадратическое отклонение оценки
по формуле
,
где
– соответствующий элемент матрицы
.
=
32.79247 × 0.0033 = 0,108215151
Критическая статистика:
.
Предельное распределение критической
статистики стремится к t-распределению
Стьюдента с N-3 числом
степеней свободы.
t=4,31
Основная гипотеза отвергается, если
,
где
–
критическое значение, найденное по
таблицам квантилей распределения
Стьюдента.
=2,074.
Сравнив, видим 4,31> 2,074, т.е. гипотеза о
незначимости параметра
отвергается при данном уровне значимости
оценка параметра
подходит
для описания скорости изменения веса
собранного урожая при изменении
количества обобранных кустов винограда.
Проверим на значимость параметр
:
Уровень значимости: =0,05.
Найдём
–
среднеквадратическое отклонение оценки
по формуле
,
где
– соответствующий элемент матрицы
.
=
32.79247 × 0,0196=0,642732412
Критическая статистика:
.
Предельное распределение критической
статистики стремится к t-распределению
Стьюдента с N-3 числом
степеней свободы.
t=3,54
Основная гипотеза отвергается, если , где – критическое значение, найденное по таблицам квантилей распределения Стьюдента.
=2,074.
Сравнив, видим 3,54>> 2,074, т.е. гипотеза
о незначимости параметра
отвергается при данном уровне значимости
оценка параметра
подходит
для описания скорости изменения веса
собранного урожая при изменении
количества обобранных кустов орешника.
Проверим на значимость параметр
:
Уровень значимости: =0,05.
Найдём
–
среднеквадратическое отклонение оценки
по формуле
,
где
– соответствующий элемент матрицы
.
=
32.79247 × 2,253=73,88143491
Критическая статистика:
.
Предельное распределение критической
статистики стремится к t-распределению
Стьюдента с N-3 числом
степеней свободы.
t=1.20
Основная гипотеза отвергается, если , где – критическое значение, найденное по таблицам квантилей распределения Стьюдента.
=2,074.
Сравнив, видим 1,2< 2,074, т.е. гипотеза о
незначимости параметра
не отвергается при данном уровне
значимости оценка
параметра
не
является корректной для использования
в данной модели.
Заметим, что для
расчётное
значение статистики Стьюдента превосходит
критическое в 2,078 раза, для
-
в 1,706 раза. Исходя из этого, можно сказать,
что сильнее отвергается гипотеза о
незначимости параметра.
.
Гипотеза о незначимости параметра
не отвергается, причём критическое
значение статистики Стьюдента превосходит
расчётное в 1,73 раза.
Для значимых параметров построим доверительные 95% интервалы:
Для параметра
Параметр с 95% вероятностью может принимать значения, лежащие в диапазоне от 0,53до 1,88
0,53
1,88



Истинное значение параметра
с 95%-ой вероятностью не будет отклоняться
от значения оценки этого параметра
более чем на 61% от её значения.
Для параметра
П
араметр
с 95% вероятностью может принимать
значения, лежащие в диапазоне от 0,77
до 4,08
0,77
4,08
Истинное значение параметра
с 95%-ой вероятностью не будет отклоняться
от значения оценки этого параметра
более чем на 54% от её значения.
Выводы:
Проверив на значимость параметры модели,
получили, что параметры
и
значимы, а для параметра
гипотеза
об отсутствии значимости не отвергается.
Значит, независимые переменные оказывают влияние на отклик. Т.е. влияние количества обобранных кустов винограда и орешника на вес собранного существенно. Построенные интервалы позволяют говорить о том, что при увеличении количества обобранных кустов винограда на 1 ожидаемое изменение веса собранного (с вероятностью 95%) может принимать любые значение в диапазоне от 0,53 до 1,88 фунтов. А при увеличении количества обобранных кустов орешника на 1 ожидаемое изменение веса собранного (с вероятностью 95%) может принимать любые значение в диапазоне от 0,77до 4,08фунтов.