Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭКОНОМЕТРИКА.doc
Скачиваний:
17
Добавлен:
30.04.2019
Размер:
3.68 Mб
Скачать

3.4. Коэффициент детерминации многомерной млр

Коэффициент детерминации определяется аналогично случаю двухмерной модели. Выборочная дисперсия показателя может быть представлена в виде суммы

.

Последняя составляющая согласно (3.11), (3.12) равна 0 и, следовательно,

.

Здесь дисперсии модели и ошибок определены согласно (2.19), (2.20). Как и для двухмерной модели, коэффициент детерминации определяется относительной долей дисперсии модели в общей дисперсии

(3.26)

Его также можно выразить через векторные произведения

(3.27)

Из того факта, что , при прогнозах всегда выгодней брать результаты моделирования , а не наблюдаемые значения yi.

Положительный корень квадратный из коэффициента детерминации может быть определен как коэффициент корреляции rxy = R множественной регрессии. Существенным отличием от парной регрессии является то, что из-за утраты геометрического смысла направления связи (положительной или отрицательной) коэффициент корреляции многомерной модели теряет знак и менее информативен, чем при парной регрессии.

С ростом числа факторов (регрессоров) имеется тенденция увеличения коэффициента детерминации. Поэтому часто вводят скорректированный коэффициент детерминации

(3.28)

Эта коррекция, снижающая значение коэффициента детерминации, компенсирует эффект наращивания числа факторов.

Пример 3.3. Определим коэффициент детерминации для данных и модели примера 3.1. Входящие в (3.27) составляющие рассчитаны и приведены в последних строках таблицы 3.2, при этом

Коэффициент детерминации достаточно близок к единице, что, казалось бы, свидетельствует о высокой корреляции между факторами и показателем. Однако обоснованный ответ на вопрос о существенности статистической связи с учетом числа степеней свободы (т.е. информации о числе факторов и объеме выборки), а также вероятности верного решения дает теория статистической проверки гипотез. Мы вернемся к этому примеру в следующем параграфе.

3.5. Определение существенности статистической связи между факторами и показателем

Существенность связи между Y и Х определяется на основе метода статистической проверки гипотез по отношению ко всей совокупности факторов. Влияние отдельных факторов можно исследовать, переходя к двухмерным моделям.

Для нормальной модели нормированные несмещенные оценки – стандартные нормальные СВ с нулевым средним и единичной дисперсией. Так как число факторов (без постоянной составляющей b1) равно k – 1, то сумма

имеет 2-распределение с (k – 1) степенями свободы. С учетом (3.21) сформируем F-статистику как отношение

(3.29)

Предположим, что верна гипотеза Н0 об отсутствии связи между показателем Y и всеми факторами:

2 = 3 =…= k = 0.

В этом случае F-статистика (3.29) становится равной

(3.30)

Очевидно, при k = 2 она равна (2.52).

Зададим малую вероятность

как вероятность того, что при превышении расчетным значением (3.31) F некоторого критического значения Fкр гипотеза об отсутствии связи Н0 верна. Тогда можно численно (с использованием распределения Фишера) найти критические значения Fкр и табулировать их (они даются в Приложении 2 и в работах [13]. Входными параметрами при обращении к таблицам являются вероятность отсутствия связи  при F > Fкр (обычно  = 0,05 или  = 0,01), k1 = k – 1 (столбец таблицы) и k2 = nk (строка таблицы). С обратной (близкой к 1) вероятностью 1 –  можно утверждать, что при F >Fкр (или R2 > R2кр) связь между факторами и показателем Y существенна (статистически значима). В противном случае говорят, что связь не установлена.

Пример 3.4. Определим существенность (с вероятностью 95%) статистической связи между зарплатой работников, их тарифным разрядом и уровнем доходов предприятия для данных примера 3.1. В примере 3.3 мы рассчитали коэффициент детерминации линейной модели R2 = 0,787. Расчетное значение F-статистики согласно (3.30)

.

Для определения критического значения F-распределения обратимся к таблице (Приложение 2) при входных данных:  = 0,05, k1 = k – 1 = 2, k2 = nk = 2. Из 2-й строки и второго столбца таблицы выписываем критическое значение Fкр = 19,0. Поскольку рассчитанное для модели значение меньше критического, заключаем, что связь не установлена (с вероятностью 95%).

Вместе с тем не следует забывать, что приведенные здесь примеры носят иллюстративный характер, так как для простоты и наглядности расчетов мы отобрали очень малую выборку (n = 5). Она не репрезентативна, ошибки в ней могут быть далеки от нормальных, поэтому сделанные в примерах выводы условны.

Задачи

1. Доходность 5 предприятий Y (оценивается по 5-балльной шкале) в зависимости от числа работников Х2 (тыс. чел.) и расходов на рекламу товаров Х3 (в у.е.) определяется выборочными данными:

Номер предприятия

1

2

3

4

5

Y, баллы

1

1

3

5

5

Х2, тыс. чел.

2

3

4

6

5

Х3, у.е.

4

4

5

7

5

Построить трехмерную МЛР (определить параметры b1, b2 и b3 модели), найти остатки регрессии в выборочных точках и среднее значение прогноза доходности предприятия с 8 тыс. работников и затратами на рекламу в 3 у.е.

  1. Уравнение для 4-мерной МЛР имеет вид

y* = 3,5 + 1,2x2 – 0,8x3 + 2,4x4.

Определить доверительный интервал прогноза показателя в точке прогноза хр = (1; 24; 12,5; 2), если СКО прогноза равна 1,5, а доверительная вероятность 95%.

  1. Коэффициент детерминации 4-мерной МЛР равен 0,8.

Определить объем выборки, при которой значение F-статистики не меньше 6.

4. Дана выборка объема n = 20 с двумя факторами Х2 и Х3 определены значения

Построить уравнение модели, определить среднее значение прогноза в точке хр = (1; 9; 12).

5. Для выборки объема n = 20 с двумя факторами Х2 и Х3 определены значения

Определить параметры b1, b2 и b3 модели, коэффициент детерминации и среднее значение прогноза трехмерной МЛР в точке хр = (1; 5; 8).

6. Как изменится стандартная (среднеквадратичная) ошибка в определении прогноза показателя трехмерной МЛР, если:

1) в 2 раза возросли все выборочные значения показателя Y;

2) в 2 раза возросли все выборочные значения фактора X2;

3) в 2 раза возросли все выборочные значения двух факторов: X2 и Х3?

7. Как изменятся параметры (b1, b2, b3) трехмерной МЛР и коэффициент детерминации, если:

1) в 2 раза возросли все выборочные значения показателя Y;

2) в 2 раза возросли все выборочные значения фактора X2;

3) в 2 раза возросли все выборочные значения двух факторов: X2 и Х3?

8. Доказать, что оценка (3.9) параметров МЛР при k = 2 совпадает с оценками (2.8), (2.9) параметров модели парной линейной регрессии.