Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книжка----11.06-2.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
5.5 Mб
Скачать

Оценка качества модели линейной парной регрессии в целом (f-тест)

Для этой оценки используется так называемый F-тест. Для построения соответствующей статистики введем вспомогательные переменные:

1) , (3.91)

2) , (3.92)

3) . (3.93)

Непосредственной проверкой можно убедиться в справедливости равенства

, (3.94)

откуда после деления обеих частей равенства на получаем

. (3.95)

Так называемый коэффициент детерминации определяется равенством

. (3.96)

При этом статистика

(3.97)

имеет распределение Фишера со степенями свободы 1 и .

Сформулируем правила проверки гипотез. При заданном уровне значимости в случае > принимается гипотеза о значимости модели в целом, в случае < гипотеза отклоняется в пользу альтернативной гипотезы. Здесь – правосторонняя критическая граница распределения Фишера со степенями свободы 1 и .

Применение этих правил обосновано в предположении, что в модели наблюдений для всех .

Замечание. Для линейной парной регрессии -тест и -тест эквивалентны.

Коэффициент детерминации является одной из оценок адекватности регрессионной модели, мерой качества уравнения регрессии, характеристикой прогностической силы анализируемой регрессионной модели.

Чем ближе к 1, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии. Если , то эмпирические точки лежат на линии регрессии и между переменными и существует линейная функциональная зависимость. Если , то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных. Чем меньше разброс значений остатков около линии регрессии по отношению к общему разбросу значений, тем, очевидно лучше прогноз.

Отметим два свойства коэффициента детерминации, связывающие его с выборочными коэффициентами парной корреляции и :

(3.98)

и

. (3.99)

Действительно, для первого случая имеем

.

Здесь использовано равенство , вытекающее из свойств остатков: и (см. систему нормальных уравнений (3.14)).

Таким образом, коэффициент детерминации является характеристикой линейной связи между наблюдаемыми и выровненными значениями объясняемой переменной. Эта связь тем сильнее, чем ближе к единице значение .

Аналогично для случая (3.99) имеем

.

Здесь использованы равенства Далее

,

или

Прогнозирование с помощью модели линейной парной регрессии, оценка качества прогноза Точечный прогноз

Если задано прогнозное значение независимой переменной , то прогноз зависимой переменной осуществляется подстановкой этого значения в оценку детерминированной составляющей:

(3.100)

Вследствие несмещенности оценок параметров регрессии этот прогноз также является несмещенным:

. (3.101)

Интервальный прогноз

Из предположения , следует, что для любого

, (3.102)

где – детерминированная составляющая.

В силу несмещенности оценок и имеем

. (3.103)

Таким образом,

(3.104)

Найдем :

(3.105)

Заметим, что и независимы, т.е.

, (3.106)

поэтому

= . (3.107)

В итоге получаем

и , (3.108)

где оценка определяется из равенства

. (3.109)

Из этой формулы видно, что чем больше объем выборки, тем точнее прогноз. При фиксированном объеме выборки прогноз тем точнее, чем больше «разнесены» выборочные данные по переменной и чем ближе прогнозное значение независимой переменной к среднему выборочному значению.

Из (3.102) при заданном уровне значимости α получаем доверительный интервал для :

. (3.110)

Серединой доверительного интервала является точечный прогноз зависимой переменной, длина доверительного интервала пропорциональна стандартному отклонению точечного прогноза, – двусторонняя критическая граница распределения Стьюдента с степенями свободы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]