Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
9_UMP_Ekonometrika_lab_GOS-3.docx
Скачиваний:
56
Добавлен:
17.03.2015
Размер:
411.58 Кб
Скачать

Решение типового примера

Пусть имеются следующие данные:

x

83

72

69

90

90

95

95

91

75

70

y

56

42

18

84

56

107

90

68

31

48

x* = 85

1. Вычисление коэффициента корреляции rxy проведем по формуле:

,

а расчёт параметров b1 и b0 выборочного уравнения парной регрессии соответственно по формулам:

, ,

где ,, аn – объём выборки.

Для расчётов удобно использовать следующую таблицу:

Таблица 1 – Вспомогательная таблица для расчета параметров уравнения парной регрессии

1

2

3

4

5

6

7

8

9

1

83

56

6889

3136

4648

60,000

4,000

16,000

2

72

42

5184

1764

3024

34,678

-7,322

53,612

3

69

18

4761

324

1242

27,772

9,772

95,492

4

90

84

8100

7056

7560

76,114

-7,886

62,189

5

90

56

8100

3136

5040

76,114

20,114

404,573

6

95

107

9025

11449

10165

87,624

-19,376

375,429

7

95

90

9025

8100

8550

87,624

-2,376

5,645

8

91

68

8281

4624

6188

78,416

10,416

108,493

9

75

31

5625

961

2325

41,584

10,584

112,021

10

70

48

4900

2304

3360

30,074

-17,926

321,341

830

600

69890

42854

52102

600,00

0,000

1554,796

Замечание. Столбцы 7 – 9 таблицы 1 заполняются после получения выборочного уравнения прямой регрессии и будут необходимы для выполнения последующих пунктов задания.

Используя результаты вычислений, представленные в таблице 1, найдём значение выборочного коэффициента корреляции:

.

Полученное значение коэффициента корреляции свидетельствует о том, что между переменными иимеется высокая корреляционная связь. Данная связь характеризуется как положительная, т. е. с увеличением одной из переменных значения другой переменной также увеличиваются.

2. Для оценки значимости коэффициента корреляции следует использовать статистику

,

которая в условиях нулевой гипотезы H0 : ρxy = 0 имеет распределение Стьюдента с числом степеней свободы, равным n – 2. В нашем случае получаем следующее расчётное значение статистики:

.

Используя таблицы распределения Стьюдента при заданном уровне надёжности γ = 0,95 (γ = 1 – α) и числе степеней свободы, равном 8, определим критическое значение статистики:

tкрит = t(0,95;8) = 2,31.

Поскольку |tрасч| > tкрит, то нулевую гипотезу о равенстве нулю коэффициента корреляции отвергаем с вероятностью ошибки меньше 5% и делаем вывод о значимости коэффициента корреляции.

3. Для того чтобы составить выборочное уравнение прямой регрессии, необходимо вычислить коэффициенты b1 и b0. Используя результаты расчётов, представленных в таблице 1, находим:

,

b0 = 60 – 2,302*83 = –131,066.

Таким образом, получаем следующее регрессионное уравнение:

Y = 131,066 + 2,302*X.

4. Прямая регрессии представлена на рисунке 1.

Рисунок 1 – График линейной регрессионной модели

5. Качество регрессионной модели может быть оценено с помощью коэффициента детерминации R2, который определяется формулой:

,

где ŷi = b0 + b1xi, – расчётные (прогнозные) значения величины, полученные подстановкой соответствующих значенийX в уравнение регрессии. Для вычисления этих значений используются столбцы 7 – 9 таблицы 1. В нашем случае имеем:

.

Коэффициент детерминации показывает, какую часть вариации (дисперсии) зависимой переменной Y воспроизводит (объясняет) построенное уравнение регрессии. В нашем случае построенное уравнение регрессии на 77,3% объясняет зависимость переменной от переменнойX.

Замечание. Для проверки правильности расчётов можно воспользоваться соотношением .

6. Проверка значимости уравнения регрессии заключается в установлении его существенности. Другими словами эта проверка даёт ответ на вопрос о том, насколько можно быть уверенным, что рассматриваемая регрессионная зависимость действительно наличествует в генеральной совокупности, а не является результатом случайного отбора наблюдений.

Проверка значимости регрессионной зависимости производится методом однофакторного дисперсионного анализа, где в качестве фактора выступает построенное уравнение регрессии. Результаты дисперсионного анализа принято представлять в виде стандартной таблицы 2.

Таблица 2 – Результаты дисперсионного анализа

Компоненты вариации

Сумма квадратов

Число степеней свободы

Средние квадраты

F -отношение

Регрессия

1

Остаточная

n – 2

Общая

n – 1

В нашем случае при расчёте сумм квадратов следует принять во внимание следующие равенства:

;

RSS = TSSESS.

С учётом результатов, представленных в таблице 1, получим следующие значения:

TSS = 42854 – 10*602 = 6854; ESS = 1554,796; RSS = 6854 – 1554,796 = 5299,204.

Тогда таблица дисперсионного анализа примет вид таблицы 3.

Таблица 3 – Результаты дисперсионного анализа

Компоненты вариации

Сумма квадратов

Число степеней свободы

Средние квадраты

F -отношение

Регрессия

5299,204

1

5299,204

Остаточная

1554,796

8

194,350

Общая

6854,000

9

При отсутствии линейной зависимости между переменными X и Y статистика имеет распределение Фишера с числом степеней свободыv1 = 1; v2 = n – 2 = 8.

Принимая стандартный 5% уровень значимости, в таблице критических точек распределения Фишера находим Fкрит = F(0,05;1;8) = 5,32.

Поскольку Fрасч = 27,267 превышает Fкрит = 5,32, то делаем вывод о значимости уравнения регрессии.

7. Исправленные выборочные оценки стандартных отклонений (ошибок) МНК-коэффициентов регрессии вычисляются по формулам:

Используя результаты вычислений из предыдущих пунктов, получаем:

;

.

Отсюда:

;

.

Доверительные интервалы для коэффициентов регрессии β1 и β0 имеют соответственно вид:

[b1tкрит*S(b1);b1 + tкрит*S(b1)]; [b0tкрит*S(b0);b0 + tкрит*S(b0)].

Если окажется, что доверительный интервал включает 0, то соответствующий коэффициент регрессии объявляется незначимым.

При заданном уровне значимости = 0,05 и числе степеней свободы, равном n – 2, где n – заданный объем выборки (у нас n = 10) критическое значение статистики Стьюдента tкрит = 2,31.

Теперь строим доверительные интервалы для β1 и β0 соответственно:

[2,302 – 2,31*0,441; 2,302 + 2,31*0,441] = [1,28; 3,32];

[–131,066 – 2,31*36,88; –131,066 + 2,31*36,88] = [–216,26; –45,87].

Поскольку ни один из полученных интервалов не включает нулевое значение, делаем вывод о значимом отличии от нуля коэффициентов β1 и β0.

8. Интервал для прогноза среднего значения зависимой переменной при значении объясняющей переменной x* (точнее, прогноза ) по линейному уравнению регрессии имеет вид:

,

где tγ находят по таблицам критических точек распределения Стьюдента для заданных значений и числа степеней свободы v = n – 2 (в случае парной регрессии). Мы уже знаем, что при n = 10 и = 0,95 (т.е. α = 0,05) tγ = 2,31.

Вычисляем с учетом полученных ранее результатов:

.

Из выборочного уравнения прямой регрессии имеем:

.

Получаем окончательный вид искомого доверительного интервала:

или

[54,21; 75,00].

Для расчета доверительного интервала возможных индивидуальных значений наблюдений при значении объясняющей переменной x* применяется формула:

,

где

.

Окончательно получаем:

=

=.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]