Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уфимский Государственный Нефтяной Технический Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

9_UMP_Ekonometrika_lab_GOS-3.docx

Скачиваний:

Добавлен:

17.03.2015

Размер:

411.58 Кб

Скачать

☆

<<< < Предыдущая 12 / 102 3 4 5 6 7 8 9 10 > Следующая >>>

Решение типового примера

Пусть имеются следующие данные:

x	83	72	69	90	90	95	95	91	75	70
y	56	42	18	84	56	107	90	68	31	48
x^* = 85

1. Вычисление коэффициента корреляции r_xy проведем по формуле:

а расчёт параметров b₁ и b₀ выборочного уравнения парной регрессии соответственно по формулам:

, ,

где ,, аn – объём выборки.

Для расчётов удобно использовать следующую таблицу:

Таблица 1 – Вспомогательная таблица для расчета параметров уравнения парной регрессии

№
1	2	3	4	5	6	7	8	9
1	83	56	6889	3136	4648	60,000	4,000	16,000
2	72	42	5184	1764	3024	34,678	-7,322	53,612
3	69	18	4761	324	1242	27,772	9,772	95,492
4	90	84	8100	7056	7560	76,114	-7,886	62,189
5	90	56	8100	3136	5040	76,114	20,114	404,573
6	95	107	9025	11449	10165	87,624	-19,376	375,429
7	95	90	9025	8100	8550	87,624	-2,376	5,645
8	91	68	8281	4624	6188	78,416	10,416	108,493
9	75	31	5625	961	2325	41,584	10,584	112,021
10	70	48	4900	2304	3360	30,074	-17,926	321,341
	830	600	69890	42854	52102	600,00	0,000	1554,796

Замечание. Столбцы 7 – 9 таблицы 1 заполняются после получения выборочного уравнения прямой регрессии и будут необходимы для выполнения последующих пунктов задания.

Используя результаты вычислений, представленные в таблице 1, найдём значение выборочного коэффициента корреляции:

Полученное значение коэффициента корреляции свидетельствует о том, что между переменными иимеется высокая корреляционная связь. Данная связь характеризуется как положительная, т. е. с увеличением одной из переменных значения другой переменной также увеличиваются.

2. Для оценки значимости коэффициента корреляции следует использовать статистику

которая в условиях нулевой гипотезы H₀ : ρ_xy = 0 имеет распределение Стьюдента с числом степеней свободы, равным n – 2. В нашем случае получаем следующее расчётное значение статистики:

Используя таблицы распределения Стьюдента при заданном уровне надёжности γ = 0,95 (γ = 1 – α) и числе степеней свободы, равном 8, определим критическое значение статистики:

t_крит = t_(0,95;8) = 2,31.

Поскольку |t_расч| > t_крит, то нулевую гипотезу о равенстве нулю коэффициента корреляции отвергаем с вероятностью ошибки меньше 5% и делаем вывод о значимости коэффициента корреляции.

3. Для того чтобы составить выборочное уравнение прямой регрессии, необходимо вычислить коэффициенты b₁ и b₀. Используя результаты расчётов, представленных в таблице 1, находим:

b₀ = 60 – 2,302*83 = –131,066.

Таким образом, получаем следующее регрессионное уравнение:

Y = 131,066 + 2,302*X.

4. Прямая регрессии представлена на рисунке 1.

Рисунок 1 – График линейной регрессионной модели

5. Качество регрессионной модели может быть оценено с помощью коэффициента детерминации R², который определяется формулой:

где ŷ_i = b₀ + b₁x_i, – расчётные (прогнозные) значения величины, полученные подстановкой соответствующих значенийX в уравнение регрессии. Для вычисления этих значений используются столбцы 7 – 9 таблицы 1. В нашем случае имеем:

Коэффициент детерминации показывает, какую часть вариации (дисперсии) зависимой переменной Y воспроизводит (объясняет) построенное уравнение регрессии. В нашем случае построенное уравнение регрессии на 77,3% объясняет зависимость переменной от переменнойX.

Замечание. Для проверки правильности расчётов можно воспользоваться соотношением .

6. Проверка значимости уравнения регрессии заключается в установлении его существенности. Другими словами эта проверка даёт ответ на вопрос о том, насколько можно быть уверенным, что рассматриваемая регрессионная зависимость действительно наличествует в генеральной совокупности, а не является результатом случайного отбора наблюдений.

Проверка значимости регрессионной зависимости производится методом однофакторного дисперсионного анализа, где в качестве фактора выступает построенное уравнение регрессии. Результаты дисперсионного анализа принято представлять в виде стандартной таблицы 2.

Таблица 2 – Результаты дисперсионного анализа

Компоненты вариации	Сумма квадратов	Число степеней свободы	Средние квадраты	F -отношение
Регрессия		1
Остаточная		n – 2
Общая		n – 1

В нашем случае при расчёте сумм квадратов следует принять во внимание следующие равенства:

;

RSS = TSS – ESS.

С учётом результатов, представленных в таблице 1, получим следующие значения:

TSS = 42854 – 10*60² = 6854; ESS = 1554,796; RSS = 6854 – 1554,796 = 5299,204.

Тогда таблица дисперсионного анализа примет вид таблицы 3.

Таблица 3 – Результаты дисперсионного анализа

Компоненты вариации	Сумма квадратов	Число степеней свободы	Средние квадраты	F -отношение
Регрессия	5299,204	1	5299,204
Остаточная	1554,796	8	194,350
Общая	6854,000	9

При отсутствии линейной зависимости между переменными X и Y статистика имеет распределение Фишера с числом степеней свободыv₁ = 1; v₂ = n – 2 = 8.

Принимая стандартный 5% уровень значимости, в таблице критических точек распределения Фишера находим F_крит = F(0,05;1;8) = 5,32.

Поскольку F_расч = 27,267 превышает F_крит = 5,32, то делаем вывод о значимости уравнения регрессии.

7. Исправленные выборочные оценки стандартных отклонений (ошибок) МНК-коэффициентов регрессии вычисляются по формулам:

Используя результаты вычислений из предыдущих пунктов, получаем:

;

Отсюда:

;

Доверительные интервалы для коэффициентов регрессии β₁ и β₀ имеют соответственно вид:

[b₁ – t_крит*S(b₁);b₁ + t_крит*S(b₁)]; [b₀ – t_крит*S(b₀);b₀ + t_крит*S(b₀)].

Если окажется, что доверительный интервал включает 0, то соответствующий коэффициент регрессии объявляется незначимым.

При заданном уровне значимости  = 0,05 и числе степеней свободы, равном n – 2, где n – заданный объем выборки (у нас n = 10) критическое значение статистики Стьюдента t_крит = 2,31.

Теперь строим доверительные интервалы для β₁ и β₀ соответственно:

[2,302 – 2,31*0,441; 2,302 + 2,31*0,441] = [1,28; 3,32];

[–131,066 – 2,31*36,88; –131,066 + 2,31*36,88] = [–216,26; –45,87].

Поскольку ни один из полученных интервалов не включает нулевое значение, делаем вывод о значимом отличии от нуля коэффициентов β₁ и β₀.

8. Интервал для прогноза среднего значения зависимой переменной при значении объясняющей переменной x^* (точнее, прогноза ) по линейному уравнению регрессии имеет вид:

где t_γ находят по таблицам критических точек распределения Стьюдента для заданных значений  и числа степеней свободы v = n – 2 (в случае парной регрессии). Мы уже знаем, что при n = 10 и  = 0,95 (т.е. α = 0,05) t_γ = 2,31.

Вычисляем с учетом полученных ранее результатов: