- •Содержание
- •Лабораторная работа № 1 «Математическое моделирование экономических процессов с помощью парных регрессионных моделей»
- •Решение типового примера
- •Лабораторная работа № 2 «Математическое моделирование экономических процессов с помощью моделей множественной регрессии»
- •Решение типового примера
- •Лабораторная работа № 3 «Анализ и прогнозирование временных рядов»
- •Решение типового примера
- •Рекомендуемый список литературы для выполнения практических работ
- •Приложение а Функция Лапласа (стандартизированное нормальное распределение)
- •Приложение б Распределение Стьюдента (t - распределение)
- •Приложение в
- •Приложение г Распределение Фишера (f – распределение)
- •Приложение д
Решение типового примера
Пусть имеются следующие данные:
x |
83 |
72 |
69 |
90 |
90 |
95 |
95 |
91 |
75 |
70 | ||||||||
y |
56 |
42 |
18 |
84 |
56 |
107 |
90 |
68 |
31 |
48 | ||||||||
x* = 85 |
|
|
|
|
|
|
|
|
|
1. Вычисление коэффициента корреляции rxy проведем по формуле:
,
а расчёт параметров b1 и b0 выборочного уравнения парной регрессии соответственно по формулам:
, ,
где ,, аn – объём выборки.
Для расчётов удобно использовать следующую таблицу:
Таблица 1 – Вспомогательная таблица для расчета параметров уравнения парной регрессии
№ | ||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
83 |
56 |
6889 |
3136 |
4648 |
60,000 |
4,000 |
16,000 |
2 |
72 |
42 |
5184 |
1764 |
3024 |
34,678 |
-7,322 |
53,612 |
3 |
69 |
18 |
4761 |
324 |
1242 |
27,772 |
9,772 |
95,492 |
4 |
90 |
84 |
8100 |
7056 |
7560 |
76,114 |
-7,886 |
62,189 |
5 |
90 |
56 |
8100 |
3136 |
5040 |
76,114 |
20,114 |
404,573 |
6 |
95 |
107 |
9025 |
11449 |
10165 |
87,624 |
-19,376 |
375,429 |
7 |
95 |
90 |
9025 |
8100 |
8550 |
87,624 |
-2,376 |
5,645 |
8 |
91 |
68 |
8281 |
4624 |
6188 |
78,416 |
10,416 |
108,493 |
9 |
75 |
31 |
5625 |
961 |
2325 |
41,584 |
10,584 |
112,021 |
10 |
70 |
48 |
4900 |
2304 |
3360 |
30,074 |
-17,926 |
321,341 |
830 |
600 |
69890 |
42854 |
52102 |
600,00 |
0,000 |
1554,796 |
Замечание. Столбцы 7 – 9 таблицы 1 заполняются после получения выборочного уравнения прямой регрессии и будут необходимы для выполнения последующих пунктов задания.
Используя результаты вычислений, представленные в таблице 1, найдём значение выборочного коэффициента корреляции:
.
Полученное значение коэффициента корреляции свидетельствует о том, что между переменными иимеется высокая корреляционная связь. Данная связь характеризуется как положительная, т. е. с увеличением одной из переменных значения другой переменной также увеличиваются.
2. Для оценки значимости коэффициента корреляции следует использовать статистику
,
которая в условиях нулевой гипотезы H0 : ρxy = 0 имеет распределение Стьюдента с числом степеней свободы, равным n – 2. В нашем случае получаем следующее расчётное значение статистики:
.
Используя таблицы распределения Стьюдента при заданном уровне надёжности γ = 0,95 (γ = 1 – α) и числе степеней свободы, равном 8, определим критическое значение статистики:
tкрит = t(0,95;8) = 2,31.
Поскольку |tрасч| > tкрит, то нулевую гипотезу о равенстве нулю коэффициента корреляции отвергаем с вероятностью ошибки меньше 5% и делаем вывод о значимости коэффициента корреляции.
3. Для того чтобы составить выборочное уравнение прямой регрессии, необходимо вычислить коэффициенты b1 и b0. Используя результаты расчётов, представленных в таблице 1, находим:
,
b0 = 60 – 2,302*83 = –131,066.
Таким образом, получаем следующее регрессионное уравнение:
Y = 131,066 + 2,302*X.
4. Прямая регрессии представлена на рисунке 1.
Рисунок 1 – График линейной регрессионной модели
5. Качество регрессионной модели может быть оценено с помощью коэффициента детерминации R2, который определяется формулой:
,
где ŷi = b0 + b1xi, – расчётные (прогнозные) значения величины, полученные подстановкой соответствующих значенийX в уравнение регрессии. Для вычисления этих значений используются столбцы 7 – 9 таблицы 1. В нашем случае имеем:
.
Коэффициент детерминации показывает, какую часть вариации (дисперсии) зависимой переменной Y воспроизводит (объясняет) построенное уравнение регрессии. В нашем случае построенное уравнение регрессии на 77,3% объясняет зависимость переменной от переменнойX.
Замечание. Для проверки правильности расчётов можно воспользоваться соотношением .
6. Проверка значимости уравнения регрессии заключается в установлении его существенности. Другими словами эта проверка даёт ответ на вопрос о том, насколько можно быть уверенным, что рассматриваемая регрессионная зависимость действительно наличествует в генеральной совокупности, а не является результатом случайного отбора наблюдений.
Проверка значимости регрессионной зависимости производится методом однофакторного дисперсионного анализа, где в качестве фактора выступает построенное уравнение регрессии. Результаты дисперсионного анализа принято представлять в виде стандартной таблицы 2.
Таблица 2 – Результаты дисперсионного анализа
Компоненты вариации |
Сумма квадратов |
Число степеней свободы |
Средние квадраты |
F -отношение |
Регрессия |
1 | |||
Остаточная |
n – 2 | |||
Общая |
n – 1 |
|
В нашем случае при расчёте сумм квадратов следует принять во внимание следующие равенства:
;
RSS = TSS – ESS.
С учётом результатов, представленных в таблице 1, получим следующие значения:
TSS = 42854 – 10*602 = 6854; ESS = 1554,796; RSS = 6854 – 1554,796 = 5299,204.
Тогда таблица дисперсионного анализа примет вид таблицы 3.
Таблица 3 – Результаты дисперсионного анализа
Компоненты вариации |
Сумма квадратов |
Число степеней свободы |
Средние квадраты |
F -отношение |
Регрессия |
5299,204 |
1 |
5299,204 | |
Остаточная |
1554,796 |
8 |
194,350 | |
Общая |
6854,000 |
9 |
|
При отсутствии линейной зависимости между переменными X и Y статистика имеет распределение Фишера с числом степеней свободыv1 = 1; v2 = n – 2 = 8.
Принимая стандартный 5% уровень значимости, в таблице критических точек распределения Фишера находим Fкрит = F(0,05;1;8) = 5,32.
Поскольку Fрасч = 27,267 превышает Fкрит = 5,32, то делаем вывод о значимости уравнения регрессии.
7. Исправленные выборочные оценки стандартных отклонений (ошибок) МНК-коэффициентов регрессии вычисляются по формулам:
Используя результаты вычислений из предыдущих пунктов, получаем:
;
.
Отсюда:
;
.
Доверительные интервалы для коэффициентов регрессии β1 и β0 имеют соответственно вид:
[b1 – tкрит*S(b1);b1 + tкрит*S(b1)]; [b0 – tкрит*S(b0);b0 + tкрит*S(b0)].
Если окажется, что доверительный интервал включает 0, то соответствующий коэффициент регрессии объявляется незначимым.
При заданном уровне значимости = 0,05 и числе степеней свободы, равном n – 2, где n – заданный объем выборки (у нас n = 10) критическое значение статистики Стьюдента tкрит = 2,31.
Теперь строим доверительные интервалы для β1 и β0 соответственно:
[2,302 – 2,31*0,441; 2,302 + 2,31*0,441] = [1,28; 3,32];
[–131,066 – 2,31*36,88; –131,066 + 2,31*36,88] = [–216,26; –45,87].
Поскольку ни один из полученных интервалов не включает нулевое значение, делаем вывод о значимом отличии от нуля коэффициентов β1 и β0.
8. Интервал для прогноза среднего значения зависимой переменной при значении объясняющей переменной x* (точнее, прогноза ) по линейному уравнению регрессии имеет вид:
,
где tγ находят по таблицам критических точек распределения Стьюдента для заданных значений и числа степеней свободы v = n – 2 (в случае парной регрессии). Мы уже знаем, что при n = 10 и = 0,95 (т.е. α = 0,05) tγ = 2,31.
Вычисляем с учетом полученных ранее результатов:
.
Из выборочного уравнения прямой регрессии имеем:
.
Получаем окончательный вид искомого доверительного интервала:
или
[54,21; 75,00].
Для расчета доверительного интервала возможных индивидуальных значений наблюдений при значении объясняющей переменной x* применяется формула:
,
где
.
Окончательно получаем:
=
=.